當前位置: 華文星空 > 知識

為什麽我不看好AR眼鏡?

2020-05-11知識

以下僅代表我個人看法

電影鋼鐵俠中炫酷的AR場景是大部份科幻迷向往的AR未來


很多科技迷對AR眼鏡都有著由衷的癡迷(我也不例外),科幻大片也最愛用AR的全像互動界面來營造未來感。如果問一個果粉,最期待蘋果未來能推出什麽重磅產品,可能大多數人的答案會是AR眼鏡。


但今天,我要潑盆冷水,談談我為什麽不看好消費級AR眼鏡。


首先,在開始之前,我要簡要介紹以下我的背景,說說我為什麽談這個話題(長文預警)。我目前在Google AR團隊負責AR Search的互動設計,前段時間全世界非常火的Google AR動物就是我在做的產品(很遺憾國內小夥伴看不到)。從最初接觸和設計AR計畫已經超過4年了,我曾經參與Google AR設計指南,負責Google AR Measure等產品設計。我也發開設計過幾乎所有主流的AR/VR眼鏡平台,包括HoloLens,Magic Leap,Meta 2,Google Glass,HoloKit,Oculus,Vive,Bose AR,Leap Motion等。應該說對各類眼鏡的效能和局限有較深入了解。

曾經紅遍一時的Magic Leap AR眼鏡公司近期也裁員50%,未來堪憂


在設計了這麽多AR計畫和產品後,我對AR眼鏡的發展有一些和業界主流不同的觀點,希望分享出來,既能讓大眾更全面的了解AR眼鏡,也希望與同行交流,深入討論現存的挑戰,並嘗試提出解決方案。歡迎持不同觀點的小夥伴探討。


直接說核心觀點:

短期內(2-3年內)我非常不看好消費級AR眼鏡,尤其是各種AR創業公司宣傳的強技術性AR眼鏡(帶SLAM技術)。而真正能夠推動市場接受的第一代AR眼鏡,大機率將沒有網路攝影機,以耳機、提醒和運動健康為核心模組,透過基本的擡頭顯示(head-up display)和鏡腿的觸控板及語音完成互動。


那麽,接下來做深入分析,先聊聊為什麽我不看好消費級AR眼鏡。


1. 局限的套用場景


就現有的技術能力而言,AR眼鏡的高頻套用場景非常有限,尤其是強技術的AR眼鏡,更是用武之地非常小。這裏稍微展開一下,我所定義的強技術的AR眼鏡,就是有SLAM(空間定位和地圖建構)技術,比如大部份AR宣傳片中炫酷的技術效果,實際上,這種產品在設計上也非常不符合我推崇的Calm Technology的理念。 回到真正高頻的消費級使用場景,聽歌(包括音樂、Podcast,視訊等)和訊息通知提醒(簡訊,通知,日程,導航)其實是最核心的高頻場景,可以理解為是Apple Watch + AirPods覆蓋的主要使用場景

可能你看了這些場景後多少有些失望,沒錯,裏面大部份的功能手表和手機也能完成的不錯,所以AR眼鏡的提升是非常有限的。使用場景的局限實際上是限制AR發展的最核心因素,因為如果一個產品找不到核心的場景,也就不可能有核心賣點。


下面我舉幾個例子,說說一些AR廠商大肆宣傳的大部份場景 為什麽其實非常不適合AR眼鏡

這張圖展示了Hololens(第一代),Magic Leap和 PlayStation VR眼鏡視場角(FoV)區別,可以看到AR眼鏡只有40度左右,相當於把螢幕切成一個小方塊,完全無法提供沈浸體驗


為什麽不是觀看串流媒體和視訊

觀看各種串流媒體視訊應該是我們今天在手機上花費很多時間的場景,無論是YouTube,Neflix,或者是國內的騰訊視訊,B站,也包括抖音、快手一類的短視訊媒體,實際上都不適合AR眼鏡。為什麽呢?

這張圖展示了目前HoloLens 2的上頭體驗,環境會被壓得很暗,AR內容相對比較亮,而且成半透明狀。影像分辨率、顏色保真度和對比度等都不是特別理想。所以並不適合長時間觀看媒體內容


第一,目前的AR眼鏡是不可能完全解決視場角(FoV)的問題的(由於目前主流光導波鏡片的局限),也就是說你看到的不是完全沈浸式的大屏,而是一個被四周切掉的矩形。這樣的一個矩形很難給人多少沈浸感,所以和大屏手機沒太多體驗上的提升。


第二,AR眼鏡是光學疊加成像,只能渲染亮色,不能呈現黑色,這也是為什麽所有的AR眼鏡都和墨鏡一樣,不得不把環境自然光過濾掉來增加亮暗色對比度,誰會願意每天戴著墨鏡,連和周圍人的基本眼神交流都沒有了。即便如此,往往是AR內容依然呈現半透明狀,尤其在環境光亮的場景,成像對比度很差,視覺體驗並不好。手機廠商對螢幕做了無數的叠代來才達到如今的高畫質。而一個AR眼鏡,一夜回到革命前。就好像你適應了蘋果iMac 的5K顯示器,突然換成21寸1080P的宏基顯視器,明顯的顆粒感和顏色失真是有巨大的體驗落差的,尤其是在對於畫質要求很高的串流媒體播放上。

微軟Hololens上的探案解密遊戲Fragment,非常好的運用物理空間設計的一款遊戲,遊戲人物可以真的坐在你家的沙發上和你對話


為什麽不是AR遊戲

很多人會說,AR遊戲是一個重要的AR場景,我們能體驗到全新的遊戲體驗。但是很遺憾,要說遊戲玩家會像玩PS4,玩手遊一樣去玩AR眼鏡,那就是想多了。


遊戲的本質是能帶玩家進入一個全新的世界,扮演全新的角色,完成超驗的體驗,但這種驅動力是和AR的媒介相互矛盾的。一個傳統遊戲或者VR遊戲可以帶使用者去大漠,去森林,去海底,穿越時間回過去、到未來,讓遊戲世界變成一個近乎無限可能的空間。然而,在AR遊戲中,玩家依然能看到現實空間,AR遊戲只能利用使用者有限的物理空間互動,於是所有體驗都被使用者物理空間局限住了,很難盡情發揮想象。這種局限不得不一次次的把遊戲拉回現實,讓玩家時時刻刻意識到自己住在逼仄擁擠的5平米臥室中。相信這種體驗,很難讓玩家長時間投入。

Keiichi Matsuda短片【Hyper Reality】描繪了被AR資訊標註後的世界,呈現出資訊爆炸的一個極端體驗,我相信很少有人真正願意每天生活在這樣的世界

為什麽不是標註現實

在AR概念視訊中總是有各種給現實世界做標註的,比如這個餐館評分怎麽樣,這裏又能提供哪些服務,甚至把世界改變成一個巨大AR遊樂園,仿佛現實就是個遊戲世界,更有Vivo最近的AR眼鏡透過人臉辨識把人做標註。我來談談為什麽不看好這類使用場景:

第一,從使用者角度,把世界標註或者變成一個AR遊樂園作為概念或遊戲體驗一下是不錯的,但擁擠的資訊在眼前爆炸,沒有多少人能長時間享受這種體驗。資訊在今天不是稀缺資源,相反,是過剩資源,產品應該想怎麽剔除不必要的資訊,而不是試圖盲目增加。

第二,從技術角度,實作這個效果本身技術上沒有太大門檻,完全可以幾個人用1-2周時間做個demo。但是這個是需要眼鏡的相機即時開啟的,AR顯示器也要一直亮著,背後CPU,GPU即時做SLAM計算,且不說私密問題,以目前技術,電池續航撐不了多久。

Vivo AR眼鏡概念視訊的一個鏡頭,透過人臉辨識給人做標簽。這個真的是我們想要的未來嗎?每個人的頭上都頂著年齡、身份、甚至社交媒體的打分標簽?

第三,我稍微吐槽一下Vivo AR眼鏡中一個demo,把你身邊每個人用面部辨識做AR標簽,真的是我們想要的未來嗎?你希望以後在別人眼裏,你的頭上頂著一個AR標簽,寫著你的年齡,學歷,職業和社交評分嗎?我覺得設計師有責任為我們的未來負責,避免科技走向【黑鏡】中反烏托邦。並不是我們有科技技術去實作一件事,我們就應該去做, 「能不能」和「要不要」應該有明確的道德底線 。我在Google曾經參與一個計畫,就是制定AR設計的道德準則,保證AR產品不會走向歧途。


2. 缺乏高效的互動方式


在iPhone出現之前,智慧型手機已經可以拍照、上網、聽音樂,上QQ了,那為什麽智慧型手機直到在iPhone出現後才真正起飛?原因很多,但其中一個就是iPhone的觸屏互動在真正意義上提供一種高效的互動模式。在這裏一定要強調「高效」,我認為的高效互動有幾個原則:

  1. 高速 :使用者能在非常低延遲、流暢地切換套用和功能,完成輸入。
  2. 輕松 :符合使用者的人體工學,使用者長時間使用也不會有疲勞感
  3. 準確 :低錯誤容忍度,比如使用手機26字母鍵盤,即便按鍵很小,依然要求高準確率和低錯誤率。
  4. 符合社會習俗 :簡單說就是不感到尷尬。什麽叫不尷尬?一個人穿著短褲拖鞋去參加人大會議就是不符合社會習俗,就是很尷尬。同樣地,互動方式不應該讓使用者感覺尷尬、不自在。

但直到今天,我們依然沒有找到一個能滿足以上標準的高效互動方式。

我在CMU研究生階段做的手勢互動設計,利用自然存在的Affordances,讓裝置和AR世界間能無縫的連線。(這個是實際demo,沒有後期特效)


手勢互動:
手勢互動的問題我在「下一代革命性互動」的回答裏講過,具體可參考那篇文章,這裏就簡要概括一下:

  1. 不符合人體工學:長時間舉手非常疲勞,也就不滿足剛剛提到的「輕松」的原則
  2. 觸感缺失:觸摸虛擬按鍵沒有力反饋,也就很難實作「速度」的要求
  3. 違反社會習俗:在公共場合有無足蹈會讓使用者感到非常尷尬,就是原則裏的第四條。
最近被Facebook收購的CTRL-Labs的神經訊號手勢辨識裝置,戴在手腕可以讀取神經訊號,結合機器學習來做手勢判斷,對這個技術的未來比較看好

實際上,透過腕部神經訊號做手勢辨識的技術我是非常看好的,目前唯一擁有這個技術公司叫CRL-Lab。這項技術由於不需要使用者把手舉到空中,可以在任何姿勢和位置做手勢辨識,所以是可以解決以上提到的大多數問題的。這家公司也曾經聯系到我,在全球選了幾位AR/VR設計師和開發者和他們共同來探索這項技術的互動套用,但我當時準備畢業論文,也就拒絕了。不久前,Facebook收購了CRL-Lab,應該說進一步表明了FB要做AR/VR的戰略決心。

Bose AR眼鏡用內建的IMU感應鏡腿的點選來進行互動,和AirPods類似,適合於輕量級的眼鏡形態

眼鏡腿觸控互動
在Bose AR中,雙擊鏡腿會出發互動指令,比如喚起語音助手等。Bose AR眼鏡主要用的眼鏡內的IMU(陀螺儀,加速度感應器)加上演算法來做辨識,並不是非常準確,也就不滿足我們說的「準確性」的要求。

當然,我們可以把鏡腿加上一個類似膝上型電腦的touch pad觸控板,這似乎是一種可行的解決方案,我們就可以加入單擊、雙擊、長按、滑動等更豐富的互動方式,但且不說劃著眼鏡腿會不會總把眼鏡碰歪,這個互動依然需要使用者把手舉到和頭一樣的高度進行互動,也就違背了人體工學的要求,做為低頻的互動模式沒有問題(AirPod也是支持手指的點選互動),卻很難成為高頻和長時間的互動方式,不可能成為生產力工具的主要互動方式。但作為輕量級眼鏡產品的互動模式應該是足夠了,我也認為這中模式大機率會是第一代AR眼鏡的主要互動模式之一。


語音互動
語音互動對於未來的AR眼鏡肯定是一個必備能力,非常適合目標明確的互動任務。比如播放音樂,導航去XX,設定提醒鬧鐘。但我們今天在使用互聯網,有太多時間不是花在這些目標明確的任務上。刷朋友圈,看短視訊,訂外賣,瀏覽網頁,網上購物等,這些以「逛」為核心的體驗,語音是非常局限的。

國內創業公司Nreal Light應該是市面上最接近普通眼鏡的AR眼鏡,但連線到手機的USBC線和墨鏡感的濾光鏡片依然讓他很難成為日常佩戴的產品

如果沒有高效的互動方式,那麽AR眼鏡就不可能成為一個生產力工具,也很難實作購物,瀏覽網頁,社交媒體互動等需要復雜互動的場景套用,比如連打字輸入這個看似簡單的任務,以上互動方式都沒有能夠根本解決。有人說除了我上述提到的方式,還可以使用手柄或者手持控制器,這種方式可能適合遊戲這種私密使用場景,但很難讓使用者在日常生活中再額外帶一個外接裝置。而之前也分析了,遊戲本身不會是AR產品中的殺手級場景,所以這個AR手柄能解決的場景從根本上就是個偽命題。


3. 外觀和佩戴舒適性


硬體的外觀應該說不僅僅是個設計的問題,更是產品定位的問題。我們這裏主要探討能日常使用的產品定位,那產品就要滿足輕便、外觀低調(和普通眼鏡外觀無異)。


實際上,現在市場上已經有相對輕便的AR眼鏡了。一副普通眼鏡的重量理想在30g內,墨鏡在40g內,而國內Nreal已經能做到88g了,應該說重量和外觀與普通眼鏡已經比較接近了,但Nreal light的計算是依賴於用USBC線連線到手機的,所以可以算是采用的分體的設計,Magic Leap也采用了這種設計,可以給眼鏡鏡身大振幅減重。但很遺憾,這種設計和他的產品定位是相互矛盾的,因為一方面NReal Light想要輕便定位於日常佩戴,另一方面連線手機的那根USB線使用上非常別扭,也不適合長時間日常使用。


有沒有解決方案?目前在這種產品定位下是沒有的,因為一方面AR眼鏡要求6DoF tracking和SLAM(空間定位和建構)的能力,這個能力本身是非常吃裝置效能,進而非常耗電。於是為了保持合理的續航時間,只能增加電池容量,而每增加一分電池容量,就增加一分眼鏡整體重量。所以在電池沒有大振幅提升效率之前,這幾乎是個悖論的死迴圈。


4.電池續航

對於消費級AR眼鏡來說,這個問題的重要性永遠不能被忽視。剛才提到了續航和產品重量之間的矛盾問題,越長的續航,意味著越大的體積,也就是越差的使用者體驗。而我要問一個問題,AR眼鏡需要用那麽多的電量嗎?需要即時做SLAM空間定位嗎?需要無時無刻不顯示AR畫面嗎?我覺得這個問題,大部份AR眼鏡公司可能並沒有想清楚,所以不得不退而求其次,選擇分體式設計,亦或者加大體積和重量,變成一個頭盔式的設計(比如Hololens,但註意Holelnes是2B的產品定位,所以這麽設計沒有問題)。

另外,消費級AR眼鏡對於近視者來講是需要配矯正鏡片的,這當然本身並不難解決,大部份AR眼鏡公司也都有對應的解決方案。但這裏的悖論是,如果電池續航只有2-3個小時,意味著在電池耗盡後,這副AR眼鏡的價值無異於一個普通的近視鏡。那一天中剩下的8-10個小時白天工作時間,使用者要不勉強接受戴一個又重,又不舒服的沒有AR功能的AR眼鏡,要不需要再每天準備一副額外的普通眼鏡換上。無論哪一種,都是非常糟糕的使用者體驗。所以,我覺得要讓AR眼鏡成為日常佩戴的消費級產品,在電池技術沒有長足進步前提下,必須大幅降低對電池的依賴,從低功耗的路線。

Magic Leap 早在2015年釋放的這個柯吉拉的概念視訊相信大家記憶猶新,幾乎一下子點燃了人們對AR技術的熱情。但後來實際產品也證實,這個效果完全是後期合成,與實際體驗相差甚遠。但柯吉拉的這一躍,將永遠成為AR發展史上最有戲劇性的一個畫面,仿佛象征了Magic Leap一瞬即逝的隕落過程

走下神壇的Magic Leap


從技術到設計,多個條件在今天都不完備,所以我說短期內我是非常不看好消費級AR眼鏡。在2B的某些專業套用場景,AR眼鏡確實有自己的剛需。但對創業公司來說,2B的天花板太低,也很難講出打動VC的好故事,所以很多公司一股腦的往2C的AR眼鏡上沖。

最典型的例子就是Magic Leap,2個月前,有人向我咨詢AR行業現狀,提到Magic Leap,我說非常不看好,並判斷離被收購的結局也不遠了,對方還非常不解。果不其然,不久前,Magic Leap宣布裁員50%,也傳出100億美金求收購的訊息。而Magic Leap的價值主要在專利和技術人員,裁員50%後的Magic Leap價值自然又大縮水,另外市場上有幾個有能力和有意願收購它的公司?它到底有多少其他公司沒有但迫切需要的技術?答案也是非常存疑的,所以最後大機率一地雞毛地賤賣。

Magic Leap的早期原型,盡管最終釋出產品已經在體積上縮小了無數倍,但離消費級產品體驗還有一個數量級的差距


Magic Leap 2C的激進產品策略完全浪費了幾十億美金的投資,更是消費了大眾對AR產品的期待,我認為失敗的主要問題有四。 第一, 從大環境上看,2C的AR眼鏡技術和市場上都還完全沒有成熟,這是客觀因素,上面已經做了詳細分析。 第二 ,從創業方法論上看,Magic Leap還在走幾十年前的瀑布流和憋大招式的產品研發模式,沒有做足使用者測試,沒有敏捷試錯叠代的過程,公司產品一直保密,妄想著靠一個大招來一擊制勝,自然風險非常高。 第三, 從公司戰略上看,企圖一蹴而就地搭建整個開發者,合作夥伴,和內容生態的野心太大,燒錢也猛,不然不至於這麽快燒完融資,本來還有騰挪轉身2B的可能,現在局面難上加難了。 第四 ,過度行銷給使用者心理預期過高,而產品問世後自然帶來更多失望,但這個我倒覺得是相對次要的原因。



消費級AR眼鏡 是否有解決方案?


有,但需要完全重新思考AR眼鏡的產品定位 。現在大部份AR眼鏡創業公司都走到了一個2VC的歧途上,走強技術的AR眼鏡,大力宣傳自己的AR技術,空間定位(SLAM),物體辨識,手勢追蹤,多人共享等,試圖勾畫一個讓人激動的未來圖景。事實上怎麽樣呢?

一方面,從技術實力上講,這些AR創業公司與Apple,Google,Facebook等一線大廠比幾乎沒有什麽優勢,大廠完全可以透過後發制人的方式進行使用者體驗和產品技術上的碾壓,更何況硬體生產需要完整供應鏈營運能力。所以大廠完全可以放任初創公司試錯,等到有市場上比較成功的先例再出招,這也是為什麽蘋果在短期內沒必要,也不會推出AR眼鏡的重要原因(果粉們可能要失望了),蘋果完全可以後發制人。

另一方面,從使用者角度上講,這些功能到底提供了多少使用者價值?而又要為之付出多少成本?這裏的成本不單單是企業研發生成成本,而更是轉嫁到產品上的,比如重量,電池續航,散熱,舒適性,成本和價格等。所以我認為現階段走強技術的AR眼鏡是歧路一條。


那麽,更符合使用者需求,符合現階段技術的產品形態是什麽?
應該定位為AirPod和Apple Watch的延伸,作為手機附件(Accessory)存在,並且有三個核心功能模組:


第一,AR眼鏡首先要是一個好耳機,要和AirPods一樣好用 。聽歌聽音訊視訊是最核心的高頻需求,戴眼鏡的使用者再不需要戴AirPods,而不帶眼鏡的人也可以有動力戴上眼鏡,不用被抱怨每天堵著耳朵戴AirPods了。眼鏡要能做到10小時左右的續航,成為一個可以讓使用者一整天佩戴的產品。這裏有人會擔心眼鏡的耳機漏音問題,Bose等耳機廠家其實已經有技術能讓聲音定向傳到使用者的耳朵裏,外人幾乎聽不到,來確保使用者私密和不打擾他人。


第二,讓AR眼映像Apple Watch一樣成為更貼身的通知提醒平台。 設計師需要非常小心地來過濾不必要的提醒通知,只讓最重要的訊息出現在眼鏡的螢幕上。而這個的設計原則是盡量減少使用者掏出手機的頻率,讓眼鏡成為手機的一塊延伸螢幕。比如現在智慧型手錶可以讓你看簡訊,讀通知,步行導航等,都可以算在這個範疇。而這塊螢幕也不需要很大的視場角(FoV),因為基本的Head-up display是完全可以滿足通知提醒的要求,可以理解於把手表螢幕移動到眼鏡上。


第三,主打健康和運動。 如果說前兩者是高頻使用的核心功能,那運動和健康將是這款產品的核心賣點。很少有使用者真正關心有多少炫酷的AR內容浮現在眼前,但運動和健康是每個人都切實關心的。透過鏡腿上的傳感器監測心跳,IMU來記錄運動,加上AR顯示的即時運動數據等,這款產品將能把運動健康和科技結合的更緊密。而健康和運動的定位也更容易讓非技術迷的大眾使用者接受AR眼鏡,有動力去首先嘗試。

當年的Google Glass是矽谷科技極客們的玩具,但過於未來感的外觀、私密問題的擔憂和高售價註定它是個小眾科技產品


講了這麽多,你可能註意到我根本都沒有提到網路攝影機 。沒錯,我對網路攝影機在第一代AR眼鏡中的運用是持非常保守態度的。無論是網路攝影機所帶來的私密顧慮(也是Google Glass失敗的重要原因之一),還是對電池續航的消耗,以及對計算效能的要求,都不是特別符合大眾消費級產品的核心定位。在這種情況下,我覺得 舍棄網路攝影機不失為一種好的選擇。


我列舉的三個模組是我認為第一代AR眼鏡最核心的功能定位,當然相應的可以配合語音助手(這也是AirPods延伸功能範圍內),有簡單的音樂切換選擇功能等基於這三大模組延伸的功能體驗。 這些是看似是非常平淡的功能,但不僅是對現有AR眼鏡形態的一個大力的減法,更是在使用者體驗上做的加法 。如何能把這三個功能模組做到極致,和已有的手機、手表,甚至更多的裝置做無縫整合和關聯,將是決定誰能開啟這個重要的人機互動新入口的最終決定性因素。

而當這樣一款產品誕生後,很可能大部份人的第一反應會是失望和嘲諷,但一旦你上手體驗之後,很可能變成「真香」的評價,就和我們對待AirPods的態度轉化一樣。參照Google創始人Larrry Page「牙刷測試」的觀點,這也是我們在Google做產品和設計時常常用來自檢的原則,更是Google收購一家公司的一個重要衡量標準:

這是不是(像牙刷一樣)你每天都要用幾次的產品?它有沒有讓你生活更好?
Is this something you will use once or twice per day, and does it make your life better?"

而我想,如果AR眼鏡的從業者能用這個標準來檢視自己的產品設計,剔除掉對炫酷的技術執著,尋找能透過「牙刷測試」(Toothbrush test)的使用場景和產品定位,那就更有可能設計出使用者真正喜愛的AR眼鏡。而這裏講的喜愛,不是用嘴說說或分享朋友圈,而是使用者用自己口袋的真金白銀來投票,並願意每天佩戴的喜愛,而只有這樣真正的「喜愛」方式,才能帶來這個行業的繁榮發展。

————————————

歡迎關註我的知乎專欄「隱形的界面:萬物互聯時代的互動設計」,帶你從另一個視角看萬物互聯的人機互動,讓好設計同時強化科技和人性最好的一面。