在科技界的新篇章中,DeepSeek無疑成為了萬眾矚目的焦點(diǎn)。自其問世以來,不僅在全球范圍內(nèi)引發(fā)了AI產(chǎn)業(yè)鏈的連鎖反應(yīng),還令OpenAI、英偉達(dá)等科技巨頭為之震動(dòng),仿佛一場(chǎng)科技風(fēng)暴悄然席卷而來。
DeepSeek的表現(xiàn)確實(shí)令人矚目。數(shù)據(jù)顯示,僅上線五天,其日活躍用戶便超越了ChatGPT,而到了第二十天,日活更是突破了2000萬人次大關(guān),占據(jù)了ChatGPT日活的23%。這一增速,無疑使DeepSeek成為了全球范圍內(nèi)增長(zhǎng)最快的AI應(yīng)用。
國(guó)外AI領(lǐng)域的驚訝之余,國(guó)內(nèi)AI圈則是一片歡騰。阿里云、百度云、騰訊云、字節(jié)火山引擎等國(guó)內(nèi)科技巨頭紛紛宣布支持DeepSeek,同時(shí),百度昆侖芯、天數(shù)智芯、摩爾線程等企業(yè)也相繼表態(tài),將支持DeepSeek模型。這無疑標(biāo)志著,在全球AI競(jìng)賽的賽道上,國(guó)產(chǎn)廠商再次邁出了堅(jiān)實(shí)的一步。
然而,DeepSeek的成功并非毫無爭(zhēng)議。關(guān)于其是否真正實(shí)現(xiàn)了大模型的技術(shù)突破,業(yè)界存在著諸多質(zhì)疑。有觀點(diǎn)認(rèn)為,DeepSeek之所以能實(shí)現(xiàn)低成本訓(xùn)練,是因其大幅縮減了模型參數(shù)規(guī)模,或是依賴于其母公司幻方早期囤積的廉價(jià)算力。這些質(zhì)疑,雖不無道理,但卻難以掩蓋DeepSeek所展現(xiàn)出的獨(dú)特魅力。
事實(shí)上,DeepSeek在縮減模型參數(shù)的同時(shí),也展現(xiàn)出了驚人的性能。例如,DeepSeek-R1在參數(shù)量?jī)H為1.5億的情況下,便在數(shù)學(xué)基準(zhǔn)測(cè)試中超越了GPT-4等大模型。輕量化模型在推理能力與性能方面本就更為出色,且訓(xùn)練和運(yùn)行成本更低。DeepSeek以不到GPT-4五十分之一的價(jià)格提供了相似的性能,從而在中小型企業(yè)和個(gè)人開發(fā)者中贏得了市場(chǎng)。
幻方對(duì)DeepSeek的助力,與其說是偶然的資本游戲,不如說是國(guó)產(chǎn)大模型發(fā)展的必然結(jié)果。作為國(guó)內(nèi)首批闖入大模型賽道的企業(yè),幻方早在2017年便宣稱要實(shí)現(xiàn)投資策略的全面AI化。此后,幻方在AI領(lǐng)域的投入持續(xù)增長(zhǎng),從“螢火一號(hào)”到“螢火二號(hào)”,其自研的深度學(xué)習(xí)訓(xùn)練平臺(tái)不斷升級(jí),為DeepSeek的誕生奠定了堅(jiān)實(shí)的基礎(chǔ)。
不可否認(rèn),當(dāng)前國(guó)內(nèi)已具備培育DeepSeek式AI應(yīng)用的客觀條件。數(shù)據(jù)顯示,國(guó)內(nèi)人工智能相關(guān)企業(yè)已超過4500家,核心產(chǎn)業(yè)規(guī)模接近6000億元人民幣。芯片、算法、數(shù)據(jù)、平臺(tái)、應(yīng)用等各個(gè)環(huán)節(jié)均在快速發(fā)展,人工智能的普及率也達(dá)到了16.4%。
然而,DeepSeek的技術(shù)路徑依賴風(fēng)險(xiǎn)依然存在。尤其是其“數(shù)據(jù)蒸餾技術(shù)”,更是飽受爭(zhēng)議。雖然DeepSeek并非首個(gè)使用數(shù)據(jù)蒸餾的大模型,但“過度蒸餾”已成為當(dāng)前人工智能賽道的一大問題。有專家指出,過度依賴蒸餾可能導(dǎo)致基礎(chǔ)研究停滯,降低模型多樣性。因此,DeepSeek乃至整個(gè)國(guó)產(chǎn)大模型賽道仍需不斷自我驗(yàn)證。
與此同時(shí),DeepSeek的開源模式也引發(fā)了全球科技圈對(duì)開源、閉源的激烈討論。自meta源代碼泄露風(fēng)波后,LLama 2的開源可商用版本便掀起了一股開源狂潮。國(guó)內(nèi)諸如悟道、百川智能、阿里云等企業(yè)也紛紛加入開源大模型的行列。2024年全年,開源大模型品牌數(shù)量超過10個(gè),2025年初更是層出不窮。
開源模型能在短時(shí)間內(nèi)獲得大量關(guān)注,這一點(diǎn)毋庸置疑。LLama 2發(fā)布之初,便在Hugging Face檢索模型上獲得了超6000個(gè)結(jié)果。而DeepSeek的快速走紅,也與其開源模式密不可分。當(dāng)前,接入DeepSeek系列模型的企業(yè)數(shù)不勝數(shù),云廠商、芯片廠商、應(yīng)用端企業(yè)紛紛涌入這一領(lǐng)域。在AI需求日益旺盛的當(dāng)下,大模型開源似乎更能促進(jìn)AI生態(tài)的繁榮。
然而,開源與否并非絕對(duì)。在全球科技領(lǐng)域,開源AI公司往往不受資本歡迎,反而是閉源AI企業(yè)在融資方面更具優(yōu)勢(shì)。開源AI的定義也日益復(fù)雜。全球開放源代碼促進(jìn)會(huì)發(fā)布的新定義指出,AI大模型若要被視為開源,需滿足訓(xùn)練數(shù)據(jù)透明性、完整代碼、模型參數(shù)等三個(gè)要點(diǎn)。這也使得DeepSeek等模型在開源問題上備受質(zhì)疑。
盡管DeepSeek在某些方面帶來了突破,緩解了全球大模型賽道的“壟斷詛咒”,但算力需求依然不可忽視。即便DeepSeek目前僅支持文字問答、讀圖、讀文檔等功能,其服務(wù)器也已接近崩潰邊緣。一旦涉足圖片、音頻和視頻生成領(lǐng)域,算力需求將呈爆炸式增長(zhǎng)。視頻生成類模型與語言模型之間的算力需求差距巨大,這一點(diǎn)不容忽視。
數(shù)據(jù)顯示,2010年至2023年間,AI算力需求翻了數(shù)十萬倍,遠(yuǎn)超摩爾定律的增長(zhǎng)速度。進(jìn)入2025年,隨著OpenAI發(fā)布首個(gè)AI Agent產(chǎn)品Operator,超級(jí)算力場(chǎng)景或?qū)⒁?。這將進(jìn)一步推動(dòng)全球各大AI企業(yè)對(duì)算力的建設(shè)。
DeepSeek雖繞開了“芯片大關(guān)”,但優(yōu)質(zhì)的算力基礎(chǔ)設(shè)施在相同投入下往往會(huì)提供更高的算力效率與商業(yè)回報(bào)。因此,大模型賽道的“追芯”游戲并未結(jié)束。英偉達(dá)下一代GPU GB300可能出現(xiàn)關(guān)鍵硬件規(guī)格變化,而國(guó)內(nèi)AI芯片國(guó)產(chǎn)化進(jìn)程也在加速推進(jìn)。種種跡象表明,算力建設(shè)依然任重道遠(yuǎn)。