DeepSeek能否引領(lǐng)大模型賽道新變革？

發(fā)布時(shí)間：2025-02-09 10:16 來源：鈦媒體APP 作者：顧青青

在科技界的新篇章中，DeepSeek無疑成為了萬眾矚目的焦點(diǎn)。自其問世以來，不僅在全球范圍內(nèi)引發(fā)了AI產(chǎn)業(yè)鏈的連鎖反應(yīng)，還令OpenAI、英偉達(dá)等科技巨頭為之震動(dòng)，仿佛一場(chǎng)科技風(fēng)暴悄然席卷而來。

DeepSeek的表現(xiàn)確實(shí)令人矚目。數(shù)據(jù)顯示，僅上線五天，其日活躍用戶便超越了ChatGPT，而到了第二十天，日活更是突破了2000萬人次大關(guān)，占據(jù)了ChatGPT日活的23%。這一增速，無疑使DeepSeek成為了全球范圍內(nèi)增長(zhǎng)最快的AI應(yīng)用。

國(guó)外AI領(lǐng)域的驚訝之余，國(guó)內(nèi)AI圈則是一片歡騰。阿里云、百度云、騰訊云、字節(jié)火山引擎等國(guó)內(nèi)科技巨頭紛紛宣布支持DeepSeek，同時(shí)，百度昆侖芯、天數(shù)智芯、摩爾線程等企業(yè)也相繼表態(tài)，將支持DeepSeek模型。這無疑標(biāo)志著，在全球AI競(jìng)賽的賽道上，國(guó)產(chǎn)廠商再次邁出了堅(jiān)實(shí)的一步。

然而，DeepSeek的成功并非毫無爭(zhēng)議。關(guān)于其是否真正實(shí)現(xiàn)了大模型的技術(shù)突破，業(yè)界存在著諸多質(zhì)疑。有觀點(diǎn)認(rèn)為，DeepSeek之所以能實(shí)現(xiàn)低成本訓(xùn)練，是因其大幅縮減了模型參數(shù)規(guī)模，或是依賴于其母公司幻方早期囤積的廉價(jià)算力。這些質(zhì)疑，雖不無道理，但卻難以掩蓋DeepSeek所展現(xiàn)出的獨(dú)特魅力。

事實(shí)上，DeepSeek在縮減模型參數(shù)的同時(shí)，也展現(xiàn)出了驚人的性能。例如，DeepSeek-R1在參數(shù)量?jī)H為1.5億的情況下，便在數(shù)學(xué)基準(zhǔn)測(cè)試中超越了GPT-4等大模型。輕量化模型在推理能力與性能方面本就更為出色，且訓(xùn)練和運(yùn)行成本更低。DeepSeek以不到GPT-4五十分之一的價(jià)格提供了相似的性能，從而在中小型企業(yè)和個(gè)人開發(fā)者中贏得了市場(chǎng)。

幻方對(duì)DeepSeek的助力，與其說是偶然的資本游戲，不如說是國(guó)產(chǎn)大模型發(fā)展的必然結(jié)果。作為國(guó)內(nèi)首批闖入大模型賽道的企業(yè)，幻方早在2017年便宣稱要實(shí)現(xiàn)投資策略的全面AI化。此后，幻方在AI領(lǐng)域的投入持續(xù)增長(zhǎng)，從“螢火一號(hào)”到“螢火二號(hào)”，其自研的深度學(xué)習(xí)訓(xùn)練平臺(tái)不斷升級(jí)，為DeepSeek的誕生奠定了堅(jiān)實(shí)的基礎(chǔ)。

不可否認(rèn)，當(dāng)前國(guó)內(nèi)已具備培育DeepSeek式AI應(yīng)用的客觀條件。數(shù)據(jù)顯示，國(guó)內(nèi)人工智能相關(guān)企業(yè)已超過4500家，核心產(chǎn)業(yè)規(guī)模接近6000億元人民幣。芯片、算法、數(shù)據(jù)、平臺(tái)、應(yīng)用等各個(gè)環(huán)節(jié)均在快速發(fā)展，人工智能的普及率也達(dá)到了16.4%。

然而，DeepSeek的技術(shù)路徑依賴風(fēng)險(xiǎn)依然存在。尤其是其“數(shù)據(jù)蒸餾技術(shù)”，更是飽受爭(zhēng)議。雖然DeepSeek并非首個(gè)使用數(shù)據(jù)蒸餾的大模型，但“過度蒸餾”已成為當(dāng)前人工智能賽道的一大問題。有專家指出，過度依賴蒸餾可能導(dǎo)致基礎(chǔ)研究停滯，降低模型多樣性。因此，DeepSeek乃至整個(gè)國(guó)產(chǎn)大模型賽道仍需不斷自我驗(yàn)證。

與此同時(shí)，DeepSeek的開源模式也引發(fā)了全球科技圈對(duì)開源、閉源的激烈討論。自meta源代碼泄露風(fēng)波后，LLama 2的開源可商用版本便掀起了一股開源狂潮。國(guó)內(nèi)諸如悟道、百川智能、阿里云等企業(yè)也紛紛加入開源大模型的行列。2024年全年，開源大模型品牌數(shù)量超過10個(gè)，2025年初更是層出不窮。

開源模型能在短時(shí)間內(nèi)獲得大量關(guān)注，這一點(diǎn)毋庸置疑。LLama 2發(fā)布之初，便在Hugging Face檢索模型上獲得了超6000個(gè)結(jié)果。而DeepSeek的快速走紅，也與其開源模式密不可分。當(dāng)前，接入DeepSeek系列模型的企業(yè)數(shù)不勝數(shù)，云廠商、芯片廠商、應(yīng)用端企業(yè)紛紛涌入這一領(lǐng)域。在AI需求日益旺盛的當(dāng)下，大模型開源似乎更能促進(jìn)AI生態(tài)的繁榮。

然而，開源與否并非絕對(duì)。在全球科技領(lǐng)域，開源AI公司往往不受資本歡迎，反而是閉源AI企業(yè)在融資方面更具優(yōu)勢(shì)。開源AI的定義也日益復(fù)雜。全球開放源代碼促進(jìn)會(huì)發(fā)布的新定義指出，AI大模型若要被視為開源，需滿足訓(xùn)練數(shù)據(jù)透明性、完整代碼、模型參數(shù)等三個(gè)要點(diǎn)。這也使得DeepSeek等模型在開源問題上備受質(zhì)疑。

盡管DeepSeek在某些方面帶來了突破，緩解了全球大模型賽道的“壟斷詛咒”，但算力需求依然不可忽視。即便DeepSeek目前僅支持文字問答、讀圖、讀文檔等功能，其服務(wù)器也已接近崩潰邊緣。一旦涉足圖片、音頻和視頻生成領(lǐng)域，算力需求將呈爆炸式增長(zhǎng)。視頻生成類模型與語言模型之間的算力需求差距巨大，這一點(diǎn)不容忽視。

數(shù)據(jù)顯示，2010年至2023年間，AI算力需求翻了數(shù)十萬倍，遠(yuǎn)超摩爾定律的增長(zhǎng)速度。進(jìn)入2025年，隨著OpenAI發(fā)布首個(gè)AI Agent產(chǎn)品Operator，超級(jí)算力場(chǎng)景或?qū)⒁?。這將進(jìn)一步推動(dòng)全球各大AI企業(yè)對(duì)算力的建設(shè)。

DeepSeek雖繞開了“芯片大關(guān)”，但優(yōu)質(zhì)的算力基礎(chǔ)設(shè)施在相同投入下往往會(huì)提供更高的算力效率與商業(yè)回報(bào)。因此，大模型賽道的“追芯”游戲并未結(jié)束。英偉達(dá)下一代GPU GB300可能出現(xiàn)關(guān)鍵硬件規(guī)格變化，而國(guó)內(nèi)AI芯片國(guó)產(chǎn)化進(jìn)程也在加速推進(jìn)。種種跡象表明，算力建設(shè)依然任重道遠(yuǎn)。

更多>同類內(nèi)容