來(lái)源:中國基金報
中國基金報記者 邱德坤
記者11月16日獲悉,華為華為將在11月21日發(fā)布AI領(lǐng)域的突破突破性技術(shù),有望解決算力資源利用效率的華為難題。
具體來(lái)看,突破華為即將發(fā)布AI領(lǐng)域的華為突破性技術(shù),可將GPU(圖形處理器)、突破NPU(神經(jīng)網(wǎng)絡(luò )處理器)等算力資源的華為利用率,從行業(yè)平均的突破30%至40%提升至70%,顯著(zhù)釋放算力硬件潛能。華為
據透露,突破華為即將發(fā)布AI領(lǐng)域的華為突破性技術(shù),是突破通過(guò)軟件創(chuàng )新實(shí)現英偉達、昇騰及其他三方算力的華為統一資源管理與利用,屏蔽算力硬件差異,突破為AI訓練推理提供更高效的華為資源支撐。
同時(shí),華為即將發(fā)布AI領(lǐng)域的突破性技術(shù),與以色列AI初創(chuàng )公司Run:ai的核心技術(shù)路線(xiàn)有共同性,后者在2024年底被英偉達以7億美元資金收購。
公開(kāi)資料顯示,Run:ai自2018年成立以來(lái),一直專(zhuān)注于GPU調度技術(shù),并致力于打造一個(gè)能將AI模型拆分并行運行的平臺,無(wú)論硬件位于本地、云端還是邊緣。
據悉,管理生成式AI、推薦系統、搜索引擎等工作負載,需要復雜的調度來(lái)優(yōu)化系統和底層硬件的性能。
Run:ai的核心產(chǎn)品是基于kubernetes(開(kāi)源容器編排平臺)構建的軟件平臺,用于調度GPU的計算資源,通過(guò)動(dòng)態(tài)調度、池化、分片等技術(shù),實(shí)現GPU資源利用率的優(yōu)化,讓深度學(xué)習訓練與推理任務(wù)在企業(yè)級環(huán)境中高效運行。
校對:王玥
制作:小茉
審核:木魚(yú)