文 | 定焦One,作者 | 王璐,編輯 | 魏佳
有這樣一款眼鏡,讓你無論身處英國、法國還是意大利,都不用擔(dān)心語言不通,它能將對(duì)方說的任何語言實(shí)時(shí)翻譯成你熟悉的文字,甚至連你目之所及的廣告牌,也能直接將翻譯顯示在鏡片上。
不僅是貼身翻譯,它還能實(shí)時(shí)拍照、錄制視頻,再也不用擔(dān)心滑雪、騎馬、駕駛時(shí)不方便記錄;如果想聽歌或者去某個(gè)地方,只需喊一聲“Hey XX”,便能喚起音樂、導(dǎo)航功能??傊謾C(jī)上的操作幾乎都能在這款眼鏡中實(shí)現(xiàn)。
而且它不笨重,外觀和墨鏡差不多,重量僅比普通墨鏡多十克左右,售價(jià)在2000元上下。
這款黑科技便是國內(nèi)大廠都在搶著做的AI眼鏡。
這股風(fēng)從國外的meta吹來。去年,meta與百年眼鏡老店雷朋聯(lián)合推出了一款名叫「Ray-Ban meta」的智能眼鏡(以下簡稱meta眼鏡),今年4月又新增了AI功能,立刻受到追捧。據(jù)科技媒體The Verge統(tǒng)計(jì),截至2024年5月,這款智能眼鏡的全球銷量已突破100萬副。此前,沒有任何一款智能眼鏡有過如此高的銷量。
這樣的爆款效應(yīng)讓很多人意識(shí)到,AI眼鏡或是現(xiàn)階段AI最佳的落地場景。
于是從今年4月底開始,華為、百度等各大廠商陸續(xù)發(fā)布/發(fā)售了AI眼鏡,這股風(fēng)潮更是在11月到達(dá)了頂峰,有媒體統(tǒng)計(jì),最密集時(shí),國內(nèi)外僅10天就發(fā)布了18副AI眼鏡。
入局者中,既包括互聯(lián)網(wǎng)大廠(百度、字節(jié))、消費(fèi)電子企業(yè)(華為、小米、OPPO、TCL),還有AR類智能硬件科技公司(Rokid、閃極科技、影目科技等),它們或多或少在自研大模型、硬件設(shè)備、銷售渠道等方面具備一到多個(gè)優(yōu)勢,而且這些AR類公司大多有大廠/消費(fèi)電子企業(yè)的投資或合作。
研究機(jī)構(gòu)wellsenn XR預(yù)測,從2025年開始,AI智能眼鏡將在傳統(tǒng)眼鏡銷量保持穩(wěn)定增長的大背景下快速滲透,2029年,AI智能眼鏡年銷量有望達(dá)到5500萬副,到2035年,有望達(dá)14億副。
如今的“百鏡大戰(zhàn)”,堪比去年的“百模大戰(zhàn)”,入局者還在不斷增多,做FA的王立表示,“AI眼鏡是投資機(jī)構(gòu)積極在看的少數(shù)熱門AI賽道?!?/p>
但任何火熱的賽道都可能面臨一定的風(fēng)險(xiǎn),況且各家之前也給AI尋找過包含耳機(jī)在內(nèi)的多種硬件設(shè)備做為載體,都沒有到達(dá)預(yù)想效果,這次選擇難度更高的眼鏡,能成功嗎?
火熱的AI眼鏡:三類公司,三種路線
據(jù)「定焦One」梳理,目前入局AI眼鏡的公司可以分為三類,它們的產(chǎn)品及主要信息如下表:
注:僅統(tǒng)計(jì)確定發(fā)布日期的產(chǎn)品
在對(duì)比這些公司的產(chǎn)品之前,我們先簡單科普一下,國內(nèi)AI眼鏡的基本功能包括語音識(shí)別、音視頻播放錄制和AI調(diào)用(比如語音交互、翻譯、查詢天氣交通信息)。綜合多位從業(yè)者的觀點(diǎn),廠商大部分都是圍繞著“音頻”、“攝像頭”、“AR顯示”三種要素進(jìn)行組合,價(jià)格在500元-5000元之間,功能越多,價(jià)格越高,具體可以主要分為三種路線。
第一種主打音頻,沒有攝像頭、功能較為單一,只能支持語音通話、聽音樂等音頻功能,比如小米生態(tài)鏈企業(yè)蜂巢科技推出的界環(huán)AI音頻眼鏡、華為推出的華為智能眼鏡2等。由于無法支持拍照、錄像、視頻顯示,也有人將這類AI眼鏡定義為音頻眼鏡。
最近,「定焦One」走訪了華為某門店,由于AI眼鏡行業(yè)的火熱,不少顧客對(duì)店內(nèi)在售的華為智能2眼鏡表示好奇,但得知它只能支持音頻功能時(shí),便沒了興趣。一名工作人員更是將這款眼鏡形容為“眼鏡款式的藍(lán)牙耳機(jī)”。
北京某商場展示的華為智能眼鏡2(共五款,價(jià)格在1699-2299元不等) 「定焦One」攝
第二種是音頻+攝像頭,在音頻的基礎(chǔ)上具備了拍照、錄像等視頻功能,今年大火的meta眼鏡,以及百度的小度AI眼鏡就是走的這個(gè)路線。
第三種是音頻+攝像頭+AR(增強(qiáng)現(xiàn)實(shí)),不僅支持音視頻,還具備增強(qiáng)現(xiàn)實(shí)功能,例如,用戶在拍完照后,可直接在眼鏡上看預(yù)覽,AR眼鏡公司Rokid推出的Rokid Glasses屬于這類。
我們再舉個(gè)例子區(qū)別第二種和第三種,比如你在國外看到了一個(gè)外文廣告牌,搭載AR顯示的AI眼鏡可通過攝像頭拍照識(shí)別廣告牌內(nèi)容,并翻譯成中文顯示在眼鏡上,而沒有AR顯示的AI眼鏡,只能將翻譯結(jié)果通過音頻輸出或者支持用戶在手機(jī)上查看。
另外,這三種路線的產(chǎn)品都能夠調(diào)用AI實(shí)現(xiàn)互動(dòng),也都能搭載大模型,有些是靠自研,有些是采用第三方合作伙伴的技術(shù)。
從技術(shù)難度上來說,第一種比較低,國內(nèi)的AI音頻眼鏡已經(jīng)推出了一段時(shí)間,也有了面向市場的代表性產(chǎn)品,第二種和第三種對(duì)技術(shù)的要求更高。具體來說,第一種主要依賴語音和TTS(文本轉(zhuǎn)語音)交互,后兩者是圖像交互,在語音、TTS的基礎(chǔ)上還加入了顯示,且顯示的使用率更高,而帶AR顯示的,還需要具備增強(qiáng)現(xiàn)實(shí)技術(shù)。也因此,絕大多數(shù)這類型的AI眼鏡還處在研發(fā)或者“發(fā)布不發(fā)售”狀態(tài)。
相應(yīng)的,在硬件成本上,也是第一種比較低,只需要在鏡框里加上麥克風(fēng)陣列、耳機(jī)、電池和處理器等,第二種需要加上攝像頭,搭載AR的第三種還需要光學(xué)模塊。配件多了的同時(shí),還需要解決更高的功耗和散熱問題。
目前入局的互聯(lián)網(wǎng)大廠、消費(fèi)電子企業(yè)、AR公司,主要發(fā)力的是后兩種,它們做AI眼鏡的目的也不太一樣。
從業(yè)者小明告訴「定焦One」,百度、字節(jié)這些互聯(lián)網(wǎng)大廠,目前做的是第二種,更多是想通過AI眼鏡跑自己的大模型,而非主要靠賣硬件,相比消費(fèi)電子企業(yè)和AR類公司,它們在硬件上也不具備競爭優(yōu)勢。AR類公司之前也做眼鏡,現(xiàn)在是想通過與AI結(jié)合,找到更多業(yè)務(wù)增量。至于小米這類消費(fèi)電子企業(yè),在產(chǎn)品上跟風(fēng)meta,并通過供應(yīng)鏈優(yōu)勢壓低價(jià)格,特別是小米在智能家居和物聯(lián)網(wǎng)上還具備優(yōu)勢,做AI眼鏡有一定想象空間。
期待中的AI眼鏡,和現(xiàn)實(shí)中的AI眼鏡
目前,各家在音視頻功能上已經(jīng)做得比較完善。
比如在語音喚醒和交互功能上,用戶可以用聲音輕松喚出“XX同學(xué)”等進(jìn)行對(duì)話,或是進(jìn)行音樂播放、天氣播報(bào)、信息推送。
各大廠商還將導(dǎo)航、翻譯、提詞器、速記整理等各種細(xì)化功能接入到AI眼鏡上,實(shí)現(xiàn)讓用戶不用費(fèi)勁在手機(jī)里挨個(gè)打開,只需要簡單發(fā)出語音指令便能輕松完成。
視頻方面,也能實(shí)現(xiàn)比較高的拍攝錄像質(zhì)量。
比如meta智能眼鏡搭載了1200萬像素的超廣角攝像頭(和iPhone11、12差不多),最長錄制時(shí)間三分鐘,國內(nèi)直接在這方面卷了起來,小度AI眼鏡配備了1600萬像素的超廣角攝像頭,Rokid Glasses在攝影時(shí)長上能達(dá)到40分鐘,幾家都具備防抖功能。
現(xiàn)階段,各家企業(yè)真正在比拼的,集中在三點(diǎn)。
首先是重量,要先解決用戶佩戴舒適度的問題。普通眼鏡的重量在三四十克,在此前已經(jīng)面市的VR、AR、MR眼鏡中,即便是相對(duì)較輕的AR眼鏡,大部分也在100g以內(nèi),難以長時(shí)間佩戴,也影響著產(chǎn)品的普及。
因此,這一批AI眼鏡廠商非常重視造型設(shè)計(jì)與舒適度,即在保持一定續(xù)航能力的前提下,將AI眼鏡做到輕量化和小型化。
由于AI眼鏡要加入芯片、主板、電池等元器件,目前大多數(shù)AI智能眼鏡的重量在五十克左右,為了讓AI眼鏡的重量無限趨近于普通眼鏡,廠商想出了各種方法。
比如魅族推出的StarVAir2采用了超小體積的單綠光引擎,體積縮小50%,重量減輕50%,Rokid將左右鏡片上各安裝一個(gè)光機(jī)的雙光機(jī)方案,精簡為鼻梁中間單光機(jī)雙鏡片顯示方案,進(jìn)一步降低重量。
其次是智能體驗(yàn),AI眼鏡最大的噱頭莫過于AI。
用戶對(duì)AI眼鏡的期待是,希望它能超過手機(jī),像人體感官一樣完美捕捉視覺、聲音、位置等信息,從而提供貼心智能服務(wù),但目前AI眼鏡和大模型的結(jié)合程度,還達(dá)不到完全智能化的水平,導(dǎo)致其能實(shí)現(xiàn)的功能都比較基礎(chǔ),例如語音助手、實(shí)時(shí)翻譯、導(dǎo)航提醒、物體識(shí)別等,甚至在捕捉信息的靈敏度和準(zhǔn)確度等方面,都還有很大提升空間。
即便是被大家認(rèn)可的meta眼鏡也存在很多bug,比如在聲音上,meta眼鏡內(nèi)置了5個(gè)麥克風(fēng)陣列系統(tǒng),揚(yáng)聲器也調(diào)大了音量,但在嘈雜環(huán)境中還是會(huì)受到影響;面對(duì)較為復(fù)雜的內(nèi)容回復(fù),其也不會(huì)直接念出來,而是提示用戶在手機(jī)上查看。所以一些用戶對(duì)meta眼鏡的主要定位是,充當(dāng)耳機(jī)、相機(jī)、備忘錄,使用場景有限。
而且“和國外相比,國內(nèi)大模型和國外的GPT-4o還存在一定差距,信息檢索能力和反饋速度等方面都存在不同程度的短板,大多數(shù)AI眼鏡還沒能達(dá)到讓消費(fèi)者買單的程度。”小明表示。
最為關(guān)鍵的一點(diǎn)是,目前AI眼鏡還不能脫離手機(jī)使用。
小明告訴「定焦One」,AI眼鏡本質(zhì)上是硬件部分+大模型,用戶通過眼鏡識(shí)別到圖像或語音信息,然后通過Bluetooth、Wifi等傳遞給手機(jī)扔到云端處理,再反饋到眼鏡上,國內(nèi)AI眼鏡本身里面跑的是Linux系統(tǒng),而非智能安卓,AI功能的實(shí)現(xiàn)需要借助手機(jī)。
換句話說,如果手機(jī)不在身旁,AI眼鏡便不具備高度智能化。
續(xù)航也是用戶擔(dān)心的一大問題。
目前,meta眼鏡只支持三分鐘的視頻錄制,有用戶表示,如果重復(fù)啟動(dòng)連續(xù)拍攝視頻,電量最多只能支撐半小時(shí),即便不錄制視頻,電量也撐不過半天,這離設(shè)想中的長時(shí)間佩戴還存在差距。
不過很多國內(nèi)廠商似乎已經(jīng)找到了解決方案,Rokid Glasses官方表示,在明年發(fā)售時(shí),續(xù)航能達(dá)到4個(gè)小時(shí),并配有充電眼鏡盒,20分鐘充滿電。小度AI眼鏡也宣稱能連續(xù)聽歌或打電話5小時(shí)以上。但這些,都還要等到產(chǎn)品正式發(fā)售后才能見分曉。
AI眼鏡真正爆發(fā),還需要耐心
盡管現(xiàn)實(shí)中的AI眼鏡離想象中的差距不小,但并不影響從業(yè)者和投資人的熱情,他們認(rèn)為,明年會(huì)出現(xiàn)“百鏡大戰(zhàn)”。
綜合從業(yè)者、投資人的說法,大家看好AI眼鏡,主要在于三方面。
王立看好的是眼鏡本身具備的入口優(yōu)勢。
他解釋,現(xiàn)在用戶最主要的消費(fèi)電子產(chǎn)品是手機(jī),而AI 眼鏡被認(rèn)為是最有可能切割手機(jī)10%-20%使用時(shí)長和功能,并能與虛擬世界產(chǎn)生交互的終端形態(tài),能安裝麥克風(fēng)、揚(yáng)聲器、攝像頭、WiFi/藍(lán)牙模塊等硬件,從而進(jìn)行音頻識(shí)別、視頻拍攝、無線通訊、翻譯、導(dǎo)航等功能,而且通過視覺進(jìn)行AI問答、物體識(shí)別,效率和精確性也高于純語音。
“目前,AI眼鏡是AI所有硬件產(chǎn)品里天花板最高的賽道,也是投資機(jī)構(gòu)積極在看的少數(shù)AI熱門賽道?!蓖趿⒈硎尽?/p>
國外已有成功的AI眼鏡案例,也給了大家很大信心。
在交流中,不止一位從業(yè)者提到了meta眼鏡的高銷量。國金證券曾估算,2024年meta眼鏡出貨量或達(dá)200萬臺(tái),而且考慮到目前AI功能僅限美國和加拿大用戶使用,若未來區(qū)域、語言推廣至全球,對(duì)應(yīng)銷量或超600萬臺(tái)。
王立認(rèn)為,meta眼鏡的銷量已經(jīng)證明了用戶對(duì)這一賽道存在需求,相比其他AI硬件,AI眼鏡跑通了從0到1。
AI眼鏡硬件供應(yīng)鏈完善,智能體趨于成熟,也是它被看好的重要原因。
從業(yè)者黃先生告訴「定焦One」,拿比較復(fù)雜的音攝顯(音頻+攝像頭+AR)組合的AI眼鏡來說,其涉及的比較重要的光機(jī)技術(shù),供應(yīng)鏈已逐漸完善,達(dá)到了商業(yè)化程度,應(yīng)用端也迎來了智能體的爆發(fā)。這一方面降低了成本,AI+AR眼鏡的售價(jià)大多能控制在2500元左右,另一方面也有了豐富的應(yīng)用供給,能實(shí)現(xiàn)各類功能。
不過,AI眼鏡目前還處于早期,國內(nèi)還沒有爆款誕生,行業(yè)也存在著一些不確定因素。
首先是市場競爭激烈,但產(chǎn)品差異化不明顯。
不止一位從業(yè)者表示,即便各家分屬于不同領(lǐng)域,但對(duì)AI眼鏡的認(rèn)知上沒有太大差距,都是在模仿meta,而且參與競爭的廠商越多,容錯(cuò)率越低。
王立表示,投資人在選擇一家AI眼鏡公司時(shí),更關(guān)注能不能做出差異化產(chǎn)品,具體看團(tuán)隊(duì)對(duì)用戶的理解度和技術(shù)能力,比如是否了解消費(fèi)者對(duì)AI眼鏡的功能需求、價(jià)格接受區(qū)間、眼鏡外觀等,以及團(tuán)隊(duì)是否具備這些需求的研發(fā)能力。此外渠道也很重要,meta眼鏡能成功的一個(gè)重要原因是選擇與雷朋合作,其生產(chǎn)供應(yīng)渠道非常完善。
其次,攝像頭既是AI眼鏡重要的一環(huán),也是困擾著從業(yè)者的敏感點(diǎn)。
為了更加了解用戶對(duì)AI眼鏡的需求,有部分從業(yè)者在做用戶調(diào)查發(fā)現(xiàn),攝像頭功能可能會(huì)侵犯個(gè)人隱私,降低大家對(duì)AI眼鏡的接受度。
“在日常聚會(huì)或工作會(huì)談中,如果對(duì)方一直帶著一副有攝像頭的眼鏡,就像架了一臺(tái)攝像機(jī),大多數(shù)用戶都會(huì)覺得別扭,產(chǎn)生戒備心,害怕被拍攝或者錄下來。”從業(yè)者程成表示。
為了解決這一問題,meta 想到的解決辦法是,加了一個(gè)顯示提醒,當(dāng)攝像頭開啟時(shí),眼鏡會(huì)亮燈,但程成表示,在實(shí)際操作時(shí),用戶可以通過很多物理和技術(shù)手段將這一提示關(guān)掉。
總結(jié)來看,AI眼鏡雖然入局者眾多,meta眼鏡的銷量也證明了市場接受度,但這個(gè)行業(yè)真正爆發(fā)還需要時(shí)間。究竟誰能夠復(fù)制meta的成功,要等到明年產(chǎn)品大規(guī)模上市后才能揭曉。
*應(yīng)受訪者要求,文中王立、小明、程成為化名。