在AI領(lǐng)域的激烈競爭中,大模型的較量正逐步進(jìn)入白熱化階段。近期,一位業(yè)內(nèi)人士在與朋友的交談中,深刻剖析了這一領(lǐng)域的現(xiàn)狀。
他指出,當(dāng)前各大廠商的大模型之間的差距日益縮小,評價它們時,甚至只能使用“遙遙領(lǐng)先”或“遠(yuǎn)超同行”等相對模糊的表述。從基準(zhǔn)測試數(shù)據(jù)來看,許多模型的表現(xiàn)已遠(yuǎn)超早期的DeepSeek R1和GPT-4,但在進(jìn)一步提升性能方面的空間已變得十分有限。真正的差異,更多體現(xiàn)在實際應(yīng)用的方式和效果上。
這一觀察引發(fā)了對于大模型競爭是否已進(jìn)入存量博弈階段的思考。所謂“存量”,必然伴隨著激烈的競爭,即“內(nèi)卷”。那么,這場“內(nèi)卷”究竟體現(xiàn)在哪些方面呢?
算力成本、數(shù)據(jù)質(zhì)量和場景滲透,被認(rèn)為是當(dāng)前大模型競爭中的三大核心要素。在算力成本方面,各廠商紛紛尋求在不犧牲性能的前提下降低成本。例如,阿里家的Qwen3通過“混合推理”技術(shù),實現(xiàn)了對簡單和復(fù)雜問題的差異化處理,顯著降低了部署成本。騰訊的混元T1則通過稀疏激活機(jī)制,提升了算力利用率。百度文心大模型雖然在具體成本上未公開,但其推理速度在工業(yè)級場景中的優(yōu)勢顯而易見。
數(shù)據(jù)質(zhì)量的競爭,則從數(shù)據(jù)的“廣度”轉(zhuǎn)向了“深度”。阿里Qwen3的訓(xùn)練數(shù)據(jù)量高達(dá)36萬億token,支持多種語言和方言,數(shù)據(jù)質(zhì)量具有普適性。百度文心一言則依托搜索、地圖等產(chǎn)品積累了真實用戶行為數(shù)據(jù)。騰訊混元通過開源生態(tài)積累開發(fā)者數(shù)據(jù),在游戲和內(nèi)容生成領(lǐng)域具備獨特優(yōu)勢。字節(jié)跳動則通過抖音、今日頭條等平臺捕捉用戶偏好數(shù)據(jù),使內(nèi)容生成模型更加貼近用戶需求。
場景滲透的競爭,則是從“技術(shù)堆疊”向“價值創(chuàng)造”的轉(zhuǎn)型。Qwen3在電商、金融、醫(yī)療等領(lǐng)域提供定制化解決方案。百度文心一言則嵌入搜索、地圖、智能音箱等產(chǎn)品,形成了閉環(huán)。騰訊混元聚焦游戲和內(nèi)容生產(chǎn),搶占多模態(tài)賽道。字節(jié)跳動則將大模型融入內(nèi)容生產(chǎn)流程,甚至用AI生成短視頻腳本,打通了技術(shù)到內(nèi)容的鏈條。
然而,這場“內(nèi)卷”背后,卻隱藏著一個更深層次的矛盾。當(dāng)技術(shù)突破趨緩時,頻繁的開源和相互“吊打”是否意味著在掩蓋真正的技術(shù)瓶頸?業(yè)內(nèi)人士認(rèn)為,確實存在這種可能性,但并非完全沒有進(jìn)步,而是技術(shù)方向發(fā)生了微調(diào)。
以數(shù)據(jù)為例,阿里Qwen3-235B-A22B雖然總參數(shù)量高達(dá)2350億,但每次實際用到的參數(shù)只有220億,激活效率并不高。這反映出“輕量化”策略已成為一種妥協(xié),單純堆參數(shù)已無法帶來顯著效果。騰訊混元T1同樣面臨這一問題,其總參數(shù)量高達(dá)3890億,但激活參數(shù)量僅為520億。百度文心大模型的4.5 Turbo總參數(shù)量1970億,每次推理最多用到28億參數(shù)。這些都說明,參數(shù)量已不再是唯一衡量標(biāo)準(zhǔn),激活效率成為新的競爭點。
技術(shù)優(yōu)化路線方面,阿里推出的“快慢思考”混合推理,本質(zhì)是對Transformer架構(gòu)的適應(yīng)和改造。騰訊混元的稀疏激活機(jī)制也受限于硬件兼容性和算法復(fù)雜度。這些優(yōu)化更像是在延長現(xiàn)有架構(gòu)的生命周期,而非真正的技術(shù)突破。
因此,短期來看,這些優(yōu)化確實緩解了算力成本壓力,但只是對現(xiàn)有技術(shù)框架的修補(bǔ)。長期來看,技術(shù)瓶頸并未消失,而是轉(zhuǎn)變?yōu)榱恕靶势款i”和“場景適配瓶頸”。真正的突破還需依靠底層架構(gòu)的創(chuàng)新。
面對這一現(xiàn)狀,大廠在“模型卷”的浪潮中該如何找到自身的核心競爭力?是繼續(xù)在技術(shù)細(xì)節(jié)上摳來摳去,還是將精力放在技術(shù)實際應(yīng)用和生態(tài)建設(shè)上?業(yè)內(nèi)人士認(rèn)為,技術(shù)細(xì)節(jié)優(yōu)化只是手段,場景落地和生態(tài)協(xié)同才是根基。
對于大廠而言,價值錨點的核心在于能否真正解決實際問題,而非單純追求技術(shù)指標(biāo)的極致。在這方面,“三重共振”——云廠商、行業(yè)應(yīng)用和MCP協(xié)議——成為關(guān)鍵。MCP協(xié)議本質(zhì)上重新定義了企業(yè)與AI的合作規(guī)則,使AI能夠自動找到企業(yè)的數(shù)據(jù)庫、API和業(yè)務(wù)流程,實現(xiàn)跨系統(tǒng)操作。
以高德地圖為例,如果接入MCP協(xié)議,其導(dǎo)航建議將不再局限于簡單的“繞開擁堵”,而是能結(jié)合用戶消費記錄推薦周邊餐廳,甚至直接跳轉(zhuǎn)到外賣App下單。這背后是MCP協(xié)議將高德的數(shù)據(jù)與阿里云的AI能力打通的結(jié)果。
MCP協(xié)議如何驅(qū)動ToB范式變化?主要有兩點:一是從“模型為中心”轉(zhuǎn)變?yōu)椤皵?shù)據(jù)為中心”,使重點轉(zhuǎn)向數(shù)據(jù)流通;二是從“孤島”轉(zhuǎn)變?yōu)椤皡f(xié)同”,實現(xiàn)企業(yè)內(nèi)部系統(tǒng)的全面打通。
打通后,MCP協(xié)議從一個簡單的工具變成了生產(chǎn)力基礎(chǔ)設(shè)施,讓AI不再局限于參數(shù)規(guī)模和推理速度,而是通過數(shù)據(jù)協(xié)同和場景嵌入,成為企業(yè)運(yùn)營的“操作系統(tǒng)”。這正是企業(yè)的剛需所在。
在這一趨勢下,未來可能會出現(xiàn)新的企業(yè)級平臺,它們或許不具備通訊、協(xié)同功能,但至少能將企業(yè)的各種業(yè)務(wù)流程整合起來,實現(xiàn)高效運(yùn)營。
而這一切的變化,都將在未來的競爭中逐步顯現(xiàn)。DeepSeek R2的推出,或許將成為這一變革的重要節(jié)點。