近日,人工智能領(lǐng)域的大模型創(chuàng)新者智譜公司宣布了一項(xiàng)重要進(jìn)展,正式推出了其2025年開(kāi)源計(jì)劃的首個(gè)里程碑產(chǎn)品——CogView4,這是一款開(kāi)創(chuàng)性的開(kāi)源文生圖模型,尤為引人注目的是,它首次實(shí)現(xiàn)了對(duì)漢字生成的支持。
CogView4在業(yè)界權(quán)威的DPG-Bench基準(zhǔn)測(cè)試中脫穎而出,綜合評(píng)分位居榜首,標(biāo)志著在開(kāi)源文生圖模型領(lǐng)域達(dá)到了新的技術(shù)高峰(SOTA)。尤為該模型遵循Apache 2.0協(xié)議,這在圖像生成模型中是前所未有的。
智譜公司在GitHub平臺(tái)上分享了CogView-4模型的diffusers版本,這一版本配備了高達(dá)60億的參數(shù),不僅支持中文輸入,還能直接將中文文本轉(zhuǎn)化為圖像,極大地拓寬了文生圖技術(shù)的應(yīng)用場(chǎng)景。
智譜公司還提供了詳盡的技術(shù)文檔和示例代碼,以幫助開(kāi)發(fā)者更好地理解和利用CogView4模型。這一舉措無(wú)疑將加速文生圖技術(shù)在中文環(huán)境下的普及和應(yīng)用。
對(duì)于對(duì)人工智能和文生圖技術(shù)感興趣的開(kāi)發(fā)者而言,CogView4無(wú)疑是一個(gè)不可多得的資源。感興趣的朋友可以通過(guò)以下開(kāi)源地址獲取更多信息: