在人工智能領(lǐng)域,一場激烈的競爭正在悄然上演。近日,OpenAI宣布了其人工智能服務(wù)的重大擴(kuò)展計(jì)劃,而這一切的背景是中國初創(chuàng)企業(yè)DeepSeek的異軍突起,給整個(gè)行業(yè)帶來了前所未有的沖擊。
OpenAI首席執(zhí)行官薩姆·奧特曼在社交媒體平臺上發(fā)布消息稱,公司即將推出GPT-5模型,該模型將在ChatGPT及其API中同步上線。對于免費(fèi)ChatGPT用戶,他們將獲得“在標(biāo)準(zhǔn)智能設(shè)置下的無限聊天訪問權(quán)限”,盡管這一權(quán)限將受到濫用閾值的限制。而對于ChatGPT Plus和Pro訂閱用戶,他們將能夠分別以更高層次的智能水平運(yùn)行GPT-5。奧特曼還透露,這些新模型將集成語音、畫布、搜索、深度研究等功能。
GPT-5系統(tǒng)將整合OpenAI的多項(xiàng)技術(shù),包括尚未發(fā)布的推理模型o3。奧特曼表示,OpenAI將不再將o3作為獨(dú)立模型推出。
除了GPT-5,奧特曼還透露了OpenAI下一代模型GPT-4.5的信息。這款內(nèi)部代號為Orion的模型,被OpenAI視為“最后一個(gè)非思維鏈模型”。奧特曼指出,OpenAI未來的首要目標(biāo)是“通過創(chuàng)建能夠使用我們所有工具、知道何時(shí)進(jìn)行長時(shí)間思考或不思考,并對非常廣泛的任務(wù)有用的系統(tǒng),來統(tǒng)一o系列模型和GPT系列模型”。
奧特曼解釋說,OpenAI希望簡化其產(chǎn)品組合,因?yàn)楣疽庾R到其模型和產(chǎn)品變得越來越復(fù)雜。“我們討厭模型選擇器,就像你一樣,我們希望回到神奇的統(tǒng)一智能時(shí)代?!彼麑懙馈km然他沒有具體說明GPT-4.5和GPT-5的發(fā)布日期,但在回應(yīng)網(wǎng)友提問時(shí),他用“幾周/幾個(gè)月”這一模糊的時(shí)間估算進(jìn)行回答,暗示GPT-4.5將在幾周內(nèi)推出,而GPT-5則可能需要幾個(gè)月。
與此同時(shí),DeepSeek的免費(fèi)應(yīng)用程序在硅谷和華爾街都引起了轟動(dòng)。其基于AI模型的熱門聊天機(jī)器人服務(wù)應(yīng)用在1月26日躍居應(yīng)用商店榜首,取代了OpenAI的ChatGPT,成為美國蘋果應(yīng)用商店下載量最高的免費(fèi)應(yīng)用,并自此保持領(lǐng)先地位。據(jù)Appfigures數(shù)據(jù)顯示(不包括中國第三方應(yīng)用商店),DeepSeek還在同一天登頂全球蘋果應(yīng)用商店下載榜,并持續(xù)保持第一。根據(jù)Sensor Tower的數(shù)據(jù),DeepSeek應(yīng)用在推出后的18天內(nèi)被下載了1600萬次,超過了同期ChatGPT應(yīng)用的900萬次下載量。DeepSeek的AI助手自1月28日起也成為谷歌應(yīng)用商店下載量最高的免費(fèi)應(yīng)用。
DeepSeek應(yīng)用的成功得益于其高效模型的支持,這些模型以相對較少的資金和不太先進(jìn)的芯片進(jìn)行訓(xùn)練。令人震驚的是,DeepSeek僅用558萬美元就訓(xùn)練出了其V3大型語言模型(LLM)。該公司聲稱使用了2048個(gè)Nvidia H800芯片,這是Nvidia H100芯片的降級版本,旨在遵守美國出口限制。DeepSeek僅用260萬H800小時(shí)就訓(xùn)練出了一個(gè)遠(yuǎn)超meta的模型,而meta如果使用其Llama 3模型家族的預(yù)算,至少可以訓(xùn)練出15個(gè)DeepSeek-V3。
1月20日,DeepSeek發(fā)布了開源的DeepSeek-R1推理模型,聲稱其性能可與OpenAI的o1等領(lǐng)先產(chǎn)品相媲美,但成本卻低得多。多次第三方測試發(fā)現(xiàn),DeepSeek的實(shí)際表現(xiàn)甚至超過了OpenAI的最新模型。R1包含6710億個(gè)參數(shù),其“精簡”版本的參數(shù)范圍從15億到700億不等。通過DeepSeek的API獲取完整R1的價(jià)格比o1便宜90%-95%。