DeepSeek崛起引全球關注，哪吒精神照進AI世界？

發(fā)布時間：2025-02-03 16:24 來源：鈦媒體APP 作者：顧雨柔

近期，科技界與影視圈的兩個熱門話題意外地交織在一起，引發(fā)了廣泛關注。一方面，電影《哪吒2》以其深刻的劇情和視覺效果成為春節(jié)期間的熱門話題；另一方面，AI領域的后起之秀DeepSeek，憑借其在算法上的突破，成為業(yè)界焦點。

DeepSeek，這家并不為人所熟知的公司，近期因其創(chuàng)新的AI大模型技術而聲名鵲起。與眾多依賴算力堆疊的AI公司不同，DeepSeek選擇了一條獨特的道路——通過優(yōu)化算法結構，實現(xiàn)了在較低算力條件下的高效性能。其MLA（多頭潛在注意力機制）、MoE（混合專家模型）以及多令牌預測（MPT）等技術，針對Transformer架構中的瓶頸問題進行了有效改進，使得DeepSeek-R1模型能夠在相對較少的英偉達H800 GPU上完成預訓練，且成本大幅降低。

DeepSeek v3架構概覽圖

DeepSeek的這一創(chuàng)新策略，不僅打破了AI行業(yè)對于算力的過度依賴，也為后續(xù)的低成本高性能AI模型開發(fā)提供了新的思路。據(jù)DeepSeek公布的跑分數(shù)據(jù)顯示，其在數(shù)學、代碼、自然語言推理等任務上的性能，已與OpenAI的GPT模型相媲美，但價格僅為后者的3%。這一成績，無疑是對DeepSeek技術實力的有力證明。

值得注意的是，DeepSeek并未選擇追求“通用智能”的全面發(fā)展，而是從垂直場景切入，先在數(shù)學、代碼等領域實現(xiàn)突破，再逐步擴展至其他領域。這種策略不僅有助于DeepSeek在細分領域建立差異化優(yōu)勢，也為其快速成長提供了有力保障。同時，DeepSeek還宣布將模型免費開源，這一舉措無疑為AI行業(yè)的生態(tài)發(fā)展注入了新的活力。

然而，DeepSeek的崛起并非一帆風順。自其嶄露頭角以來，便遭受了來自多方面的質疑和攻擊。部分國家和組織以數(shù)據(jù)安全和隱私保護為由，對DeepSeek展開了調查。同時，一些所謂的“極客”也開始對DeepSeek的技術細節(jié)發(fā)起攻擊，試圖證明其涉嫌“抄襲”或“技術不透明”。

更為嚴重的是，DeepSeek的服務器集群在春節(jié)期間遭受了大規(guī)模DDoS惡意攻擊。攻擊總量之大，相當于整個歐洲三天的網(wǎng)絡流量總和。面對這一嚴峻挑戰(zhàn)，中國互聯(lián)網(wǎng)企業(yè)迅速響應，360安全響應中心、華為云、中國紅客聯(lián)盟等多家企業(yè)紛紛加入保衛(wèi)戰(zhàn)，經(jīng)過83個小時的鏖戰(zhàn)，成功將攻擊流量壓制97.2%，捍衛(wèi)住了DeepSeek和中國AI產(chǎn)業(yè)的尊嚴。

盡管DeepSeek在技術和生態(tài)層面取得了顯著成績，但其仍面臨著諸多挑戰(zhàn)。算力作為大模型可持續(xù)發(fā)展的必要條件，仍是DeepSeek需要克服的短板。盡管其通過算法優(yōu)化降低了算力需求，但在實際應用中，算力仍是一個不可忽視的因素。因此，DeepSeek需要在保持技術創(chuàng)新的同時，逐步加強算力建設，以確保其技術的可持續(xù)性和競爭力。

在這場中美AI角力下，DeepSeek的出現(xiàn)無疑為行業(yè)帶來了新的思考和啟示。其以技術突破打破封鎖、用開源生態(tài)重構行業(yè)規(guī)則的理念，無疑為AI行業(yè)的未來發(fā)展提供了新的方向。盡管前路未知且充滿挑戰(zhàn)，但DeepSeek所展現(xiàn)出的勇氣和決心，已足以令人振奮。

更多>同類內(nèi)容