在人工智能技術的浩瀚宇宙中,深度學習框架猶如一座橋梁,連接著多樣化的算力資源與層出不窮的算法模型,是推動大模型產業(yè)發(fā)展的核心要素。全球舞臺上,TensorFlow與PyTorch早已占據(jù)領先地位,而在中國市場,這一格局正迎來新的挑戰(zhàn)者。
近年來,華為推出的昇思MindSpore與百度打造的飛槳PaddlePaddle等本土深度學習框架,正以驚人的速度迎頭趕上。在最近的昇思人工智能框架峰會上,這一趨勢得到了生動展現(xiàn):18家單位宣布了基于昇思的原生開發(fā)大模型成果,預示著國產AI框架的崛起。
會上,華為ICT戰(zhàn)略與業(yè)務發(fā)展部總裁彭紅華強調,人工智能框架不僅是AI時代的操作系統(tǒng),更是軟件生態(tài)的基石。一個領先的AI框架,必須具備高效、敏捷、開放的特性。華為將持續(xù)加大對昇思MindSpore的投入,通過開源的方式,推動中國人工智能框架生態(tài)的健康發(fā)展。
隨著硬件資源的日益豐富,如何高效利用這些資源成為行業(yè)關注的焦點。智譜AI CEO張鵬在會上指出,當前的關鍵在于提升大模型的訓練性能,這需要深度學習框架不斷優(yōu)化,實現(xiàn)軟件與硬件、上層算法的完美適配。張鵬還透露,智譜自2020年起便與包括昇騰系列硬件在內的多家國產生態(tài)伙伴展開合作,共同推進國產大模型訓練的創(chuàng)新。
昇思MindSpore開源社區(qū)理事長丁誠則從大模型技術的演進角度出發(fā),提出了兩個重點關注的方向。一是大模型的參數(shù)量、序列長度和模態(tài)結構正以指數(shù)級速度增長,這對深度學習框架提出了更高的計算要求。二是OpenAI的o1模型推動了計算過程從單任務、單模型向多任務、多模型的轉變,深度學習框架需要解決多模型協(xié)同交互下的復雜編程問題。
開源策略是昇思快速追趕的關鍵。通過從社區(qū)論壇收集技術問題,進行技術預研和規(guī)劃,昇思得以迅速響應大模型爆發(fā)帶來的新需求。自2020年開源以來,昇思已孵化、支持了50多個國內外主流大模型,開源版本累計下載量突破1100萬次,覆蓋全球130多個國家和地區(qū)。
昇思的成功不僅體現(xiàn)在市場份額上。目前,已有超過3.7萬名開發(fā)者參與昇思社區(qū)貢獻,與360多所高校科研院所展開教學及科研合作,聯(lián)合1700多位生態(tài)伙伴打造了超過2000個解決方案。PaperwithCode網(wǎng)站顯示,基于昇思發(fā)表的原創(chuàng)論文數(shù)量累計超過1700篇,位列全球第二、中國第一。
昇思還在不斷優(yōu)化開發(fā)者編程體驗,提供豐富的分布式并行策略,降低遷移學習成本。面對類o1模型帶來的技術挑戰(zhàn),昇思正在完善多模型多任務調度、訓推無縫轉換能力,加速類o1模型的演進升級。在AI for Science場景方面,昇思也在持續(xù)升級底層函數(shù)式編程體驗,并打造高性能AI for Science使能套件,推動科研創(chuàng)新。
在昇思人工智能框架峰會上,昇思的快速發(fā)展得到了業(yè)界的廣泛認可。未來,隨著技術的不斷進步和生態(tài)的持續(xù)完善,昇思有望在中國乃至全球AI框架市場中占據(jù)更加重要的地位。