OpenAI近日推出了一項名為sCM(連續(xù)時間一致性模型)的創(chuàng)新AI文生圖技術(shù),為業(yè)界帶來了革命性的突破。與傳統(tǒng)擴散模型相比,sCM僅需兩個步驟即可生成高質(zhì)量樣本,顯著提升了生成效率。
傳統(tǒng)擴散模型在生成圖片及音視頻時,通常需要數(shù)十到數(shù)百個逐步降噪的過程,效率低下。而sCM則繞開了這一范疇,極大縮短了生成時間,同時保持了樣本的高質(zhì)量。
sCM的訓(xùn)練方法主要利用預(yù)訓(xùn)練擴散模型蒸餾出來的知識,直接打造模型。研究人員使用ImageNet 512x512數(shù)據(jù)集進行訓(xùn)練,生成的圖像細節(jié)豐富且質(zhì)量高。
盡管sCM只有兩個取樣步驟,但其生成的樣本質(zhì)量仍接近業(yè)界最佳的擴散模型,差異不到10%。這一技術(shù)的推出,為AI文生圖提供了新的高效方案。