在自動駕駛技術(shù)的不斷演進(jìn)中,一種更為高效、智能且自適應(yīng)的技術(shù)路徑正逐漸嶄露頭角。近日,商湯絕影的首席執(zhí)行官、商湯科技聯(lián)合創(chuàng)始人及首席科學(xué)家王曉剛,在2025GDC全球開發(fā)者先鋒大會上,向業(yè)界介紹了其最新的研究成果——“R-UniAD”,這是一種與世界模型協(xié)同交互的端到端自動駕駛方案。
王曉剛指出,R-UniAD技術(shù)的核心理念在于通過構(gòu)建一個世界模型,生成一個可以與自動駕駛系統(tǒng)實時交互的仿真環(huán)境。在這個環(huán)境中,自動駕駛系統(tǒng)可以通過強(qiáng)化學(xué)習(xí)的方式,不斷優(yōu)化其端到端的駕駛模型。這一技術(shù)與商湯絕影此前推出的DeepSeek技術(shù)有著異曲同工之妙,都是從模仿學(xué)習(xí)向強(qiáng)化學(xué)習(xí)邁進(jìn),旨在實現(xiàn)自動駕駛系統(tǒng)駕駛能力的超越人類水平。
DeepSeek技術(shù),作為一項基于深度學(xué)習(xí)的圖像搜索與識別技術(shù),已經(jīng)在圖像識別、目標(biāo)檢測等領(lǐng)域取得了顯著成果。在智能駕駛領(lǐng)域,它能夠?qū)崟r檢測并識別道路上的物體,如行人、車輛、交通標(biāo)志等,為自動駕駛系統(tǒng)提供關(guān)鍵的環(huán)境感知信息,輔助系統(tǒng)做出正確的決策。
然而,自動駕駛系統(tǒng)的訓(xùn)練和優(yōu)化需要大量的標(biāo)注數(shù)據(jù),特別是在復(fù)雜的道路環(huán)境中。為了解決這一問題,R-UniAD技術(shù)采用了多階段強(qiáng)化學(xué)習(xí)的方法。首先,通過高質(zhì)量的冷啟動數(shù)據(jù),利用模仿學(xué)習(xí)的方式訓(xùn)練出一個基礎(chǔ)的端到端自動駕駛模型。然后,借助強(qiáng)化學(xué)習(xí),讓云端的大模型與世界模型進(jìn)行協(xié)同交互,持續(xù)提升模型的性能。最后,通過高效蒸餾的方式,將云端的大模型轉(zhuǎn)化為高性能的小模型,實現(xiàn)車端的部署。
這一技術(shù)路線的實施,意味著自動駕駛系統(tǒng)能夠不斷從海量的駕駛數(shù)據(jù)中學(xué)習(xí)和優(yōu)化,通過“仿真+現(xiàn)實”的訓(xùn)練模式,加速系統(tǒng)的學(xué)習(xí)進(jìn)程,更好地應(yīng)對復(fù)雜的道路場景。王曉剛表示,商湯絕影一直在積極推動這一技術(shù)的商業(yè)化進(jìn)程,早在2022年底,就提出了行業(yè)首個感知決策一體化的自動駕駛通用模型UniAD。
在2024年的北京車展上,商湯絕影展示了UniAD技術(shù)的實車上路成果,進(jìn)一步證明了其技術(shù)的可行性和實用性。據(jù)透露,商湯絕影的量產(chǎn)端到端智能駕駛方案預(yù)計將在今年年底交付,而“開悟”世界模型也已經(jīng)正式用于數(shù)據(jù)生產(chǎn)。在即將到來的4月上海車展上,商湯絕影還將展示R-UniAD技術(shù)的實車部署成果。