DeepSeek引領(lǐng)AI浪潮，國(guó)產(chǎn)GPU攜手共進(jìn)創(chuàng)未來(lái)

發(fā)布時(shí)間：2025-02-07 20:16 來(lái)源：鈦媒體APP 作者：沈瑾瑜

在AI領(lǐng)域，一場(chǎng)由DeepSeek引領(lǐng)的風(fēng)暴正席卷全球。自去年12月26日DeepSeek AI發(fā)布其最新大型語(yǔ)言模型DeepSeek-V3以來(lái)，AI界便為之震動(dòng)。這款擁有6710億參數(shù)的MoE架構(gòu)模型，每秒能處理60個(gè)token，處理速度是V2版本的三倍，迅速成為業(yè)界的焦點(diǎn)。

緊接著，在今年1月20日，DeepSeek再推重磅產(chǎn)品——推理大模型DeepSeek-R1，再次驚艷業(yè)界。短短數(shù)日內(nèi)，DeepSeek應(yīng)用便登頂蘋(píng)果中國(guó)區(qū)和美國(guó)區(qū)應(yīng)用商店免費(fèi)App下載排行榜。1月31日，英偉達(dá)、亞馬遜和微軟三大科技巨頭同日宣布接入DeepSeek-R1，進(jìn)一步彰顯了其市場(chǎng)影響力。

DeepSeek-V3與DeepSeek-R1-Distill蒸餾模型各自擁有獨(dú)特的定位。DeepSeek-V3擅長(zhǎng)處理復(fù)雜任務(wù)和高精度場(chǎng)景，如長(zhǎng)文檔分析、多模態(tài)推理、科研計(jì)算等，支持千卡級(jí)訓(xùn)練，滿足超大規(guī)模集群分布式訓(xùn)練需求。而DeepSeek-R1-Distill蒸餾模型則更適合輕量級(jí)部署和資源受限場(chǎng)景，如邊緣設(shè)備推理、中小企業(yè)快速驗(yàn)證AI應(yīng)用，對(duì)顯存和算力要求更為靈活，適配入門(mén)級(jí)硬件。

據(jù)硅谷頂尖風(fēng)險(xiǎn)投資家Marc Andreessen發(fā)文引用SensorTower數(shù)據(jù)，目前DeepSeek日活用戶數(shù)已達(dá)到ChatGPT的23%，應(yīng)用每日下載量接近500萬(wàn)。2月5日，京東云宣布正式上線DeepSeek-R1和DeepSeek-V3模型，支持公有云在線部署、?；焖接谢瘜?shí)例部署兩種模式。此前，阿里云、百度智能云、華為云、騰訊云、火山引擎、天翼云以及海外的亞馬遜AWS、微軟Azure等云巨頭也已接入DeepSeek模型。

DeepSeek之所以受到廣大用戶的青睞，主要得益于其兩大優(yōu)勢(shì)：低成本與高效能，以及開(kāi)源與靈活部署。在低成本與高效能方面，DeepSeek-V3的訓(xùn)練成本僅為557.6萬(wàn)美元，約為GPT-4的二十分之一，卻能在邏輯推理、代碼生成等任務(wù)中達(dá)到與GPT-4、Claude-3.5-Sonnet相近的性能，甚至超越部分開(kāi)源模型。其技術(shù)核心在于算法優(yōu)化和數(shù)據(jù)效率提升，而非依賴算力堆疊。相比之下，GPT-5一次為期6個(gè)月的訓(xùn)練成本就高達(dá)約5億美元。

在開(kāi)源與靈活部署方面，DeepSeek選擇將模型權(quán)重開(kāi)源，并公開(kāi)訓(xùn)練細(xì)節(jié)，這為全球的AI研究者打開(kāi)了通往模型內(nèi)部的大門(mén)。360集團(tuán)創(chuàng)始人周鴻祎指出，DeepSeek真正踐行了開(kāi)放的精神，與OpenAI等封閉模式平臺(tái)相比，DeepSeek允許開(kāi)發(fā)者利用其開(kāi)源模型進(jìn)行技術(shù)挖掘和創(chuàng)新，這是對(duì)技術(shù)共享理念的有力支持。周鴻祎還特別提到DeepSeek的模型蒸餾技術(shù)，認(rèn)為其展示了DeepSeek的自信與無(wú)私。

隨著DeepSeek這類模型的發(fā)展，對(duì)GPU需求持續(xù)攀升。國(guó)產(chǎn)GPU廠商也敏銳捕捉到這一機(jī)遇，積極進(jìn)行適配工作。僅在2月1日至2月7日這短短7天內(nèi)，就有11家國(guó)產(chǎn)AI芯片公司宣布完成對(duì)DeepSeek的適配。包括摩爾線程、海光信息、天數(shù)智芯、壁仞科技、云天勵(lì)飛、太初元碁、燧原科技、昆侖芯、龍芯中科等在內(nèi)的多家企業(yè)，紛紛宣布對(duì)DeepSeek模型的適配和支持。

DeepSeek的橫空出世，不僅打破了AI領(lǐng)域的高昂成本壁壘，更為國(guó)產(chǎn)芯片公司帶來(lái)了新的發(fā)展契機(jī)。隨著大模型應(yīng)用的普及，對(duì)芯片的需求水漲船高。DeepSeek與國(guó)產(chǎn)AI芯片的適配逐步成熟，為國(guó)產(chǎn)芯片提供了一個(gè)更為契合的適配平臺(tái)，加快了國(guó)產(chǎn)AI芯片在國(guó)內(nèi)大模型訓(xùn)練端和推理端的應(yīng)用。同時(shí)，DeepSeek與國(guó)產(chǎn)芯片的協(xié)同作用，將推動(dòng)國(guó)產(chǎn)芯片在人工智能領(lǐng)域的應(yīng)用，加速國(guó)產(chǎn)芯片生態(tài)體系的建設(shè)。

更多>同類內(nèi)容