智能汽車是機器人的第一形態,對應的智能座艙也引領了機器人時代人機交互發展的新方向。歷史上,每一次交互方式的改變,都重塑了智能設備的產業格局。正如DOS轉向Windows時代帶來的產業巨變一樣,人機自然交互打開了一道通向新產業的大門。

其中智能座艙是智能汽車與人類交互的第一“場所”,其最理想的交互模式應該是什么樣呢?

自然交互實現方式是什么?

智能汽車本質上是載人機器人,機器人最重要的兩項能力是自主決策能力和人機交互能力,缺乏其中任何一項,就無法有效地為人類服務。因此打造智能的人機交互能力是其必選項。

如何衡量人機交互的智能化程度呢?我認為是使用圖靈測試,即機器能否在交互行為的表現上和人無法區分。

如何實現自然交互呢?傳感器、算力和算法缺一不可。

座艙內會融合越來越多的傳感器,一方面會使座艙內算力需求不斷飆升,座艙里的AI算力需求將上升到30TOPS以上,甚至百TOPS級別的水平;另一方面也提供了更好的感知能力支撐。

座艙傳感器

在數量和種類上都在迅速提升

AI計算能實現人臉、表情、手勢、語音等多信息的感知,從而實現更加智能的人機交互。座艙人機交互的計算必須依賴邊緣計算,而不是云計算來實現。原因有三點:即可靠性、實時性和隱私保護。

個人隱私保護可能是我們這一代人在AI時代面臨的最大挑戰之一,座艙內的私密空間,隱私保護問題更加突出。今天的語音識別,絕大部分仍然是在云端進行,其中的聲紋等生物信息可以輕易暴露個人身份。通過在車端進行邊緣AI計算,可以將視頻、語音等個人生物信息去除,轉化為語義信息,再上傳到云端,可以有效保護車內個人數據隱私。

交互智能必須跟駕駛智能相匹配

在可以預見的未來,人機共駕都會是長期存在的狀態,座艙內的人機交互是人了解自動駕駛能力的第一界面。

當前智能汽車技術存在進化不均衡的挑戰,人機交互能力落后于自動駕駛能力的發展,導致自動駕駛事故頻發,影響了自動駕駛的普及。

人機共駕的特點是人在駕駛回路中(Human In the Loop),因此,人機交互能力必須跟自動駕駛能力相匹配,否則將帶來嚴重的預期功能安全問題,幾乎所有的自動駕駛致命事故都與此有關。即使不發生事故,對自動駕駛狀態的不了解也會讓人產生嚴重的恐慌和焦慮。

例如,自動駕駛系統在實際駕駛工況中,經常出現“鬼剎車”的情況。如果人機交互界面能夠顯示自動駕駛的感知結果,司機就可能會明白系統誤判是由于把路上的一個易拉罐識別成了一輛車導致的。

為什么特斯拉把越來越多的自動駕駛感知結果展示出來,背后的出發點就是這一原因。隨著自動駕駛的能力越來越強,用戶將越來越關注自動駕駛系統在虛擬3D環境中呈現的過程和狀態。

人機交互與自動駕駛相輔相成

例如,未來更為人性化的泊車應該是人車共泊的,包括人對車的接管和車對人的接管,比如車遇到困難路況,可能會說我不太有把握,請求接管。再比如人遲遲停不進去,AI算法推薦是否開啟自動泊車。

這種艙泊一體的方案能提升智能座艙交互和泊車的整體體驗,還能大幅節省硬件成本:通過分時復用AI芯片的資源,可以同時滿足座艙感知與APA泊車感知的需求,從而為行業提供高性價比方案,也可讓智能化下探到更多中低端車型。在國內,地平線和映馳科技合作,正在推進這一方案開發。

當前,智能座艙的交互方式主要還是手機安卓生態的延伸,主要由實體屏幕來支撐。今天屏幕越變越大,甚至達到60寸,這實際上是用低優先級的功能占據了高優先級功能的空間,還帶來額外的信息干擾,容易讓人分心,影響駕駛安全。

實體屏幕在未來依然會存在,但我的判斷是,未來,實體屏幕和觸控將不再是座艙交互的中心,取而代之的是自然交互+ARHUD。

第一個原因:面向自動駕駛的人機交互屬于“溫飽”問題,是剛需,屬于安全域,有最高優先級;面向音樂、游戲和舒適性的人機交互是“小康”需求,屬于娛樂域,在實現了前一階段任務后才能有足夠的施展空間。

因此,未來座艙內娛樂域和安全域人機交互和自動駕駛的定位會調過來,安全域會成為主控制域。

第二個原因:自然交互方式+AR-HUD的交互界面更加安全,例如通過語音和手勢交流,可以避免駕駛員視線偏移,從而提升駕駛安全。而座艙的大屏是無法做到這一點的,相比之下,AR-HUD可以做到在顯示自動駕駛感知信息的同時避免了這個問題。

第三個原因:自然交互方式是隱形的、簡約的、更加情感化的交互方式,不會過多地占用車內寶貴的物理空間,但卻可以做到隨時陪伴在身邊,給予駕駛員及乘客更多的信任感、安全感。

綜合以上分析,未來智能駕駛和智能座艙的跨域融合是較為確定的發展方向,最終誕生的就是車載中央計算平臺。

當前發展階段、前沿實踐以及挑戰

目前,座艙的語音識別基本已經普及,語音識別主流廠商主要使用端到端算法,在理想實驗環境下語音識別準確率可高達98%以上。

DMS正在急速普及,預測至2030年裝備車內攝像頭的車型占比將超過50%。

DMS普及勢頭迅猛,下一步將是語音+手勢+眼球跟蹤+AR-HUD交互界面的組合,這是對應于L3+級別自動駕駛的智能交互方式。業內領先的車企已經開始布局。

中國自主品牌在這一塊的實踐基本上跟國外領先品牌是并駕齊驅的,從迭代速度上看還要更快。2020年,長安推出的UNI-T車型就包含多項主動服務。比如:如果駕駛員正在接聽電話,系統會自動降低多媒體音量;再比如,當車機中控屏處于熄屏狀態時,注視屏幕一秒即可喚醒屏幕。該方案搭載了地平線的征程2芯片,支持通過語音、動作姿態、面部表情等指令的交互。

理想中的自然交互目標是從用戶體驗出發,需要提供穩定、流暢、可預期的交互體驗。但理想再“豐滿”,也得從“骨感”的現實起步,當前挑戰依舊眾多。

例如,當前自然交互的誤識別情況依然嚴峻,全工況、全天候的可靠性和準確率還不夠。比如手勢識別,也許駕駛員不經意間動一下手勢,就會被誤識別為一個命令動作,這只是無數種誤識別情況之一,在移動狀態下,光照、震動、遮擋等都是巨大的工程挑戰。自然交互的流暢度也是亟待解決的問題,這需要更高性能的傳感器、更強大的算力和高效算法來逐漸改善。而同時自然語言理解(NLP)和意圖理解依然處于早期階段,還需要算法理論創新。

人機自然交互

是機器人時代的基石性發明

在當下激烈的行業競爭中,智能座艙已經成為整車廠實現功能差異化的關鍵一招,座艙人機交互與人的溝通習慣、語言文化等密切相關,因此必須是高度本地化的。智能座艙人機交互是中國智能汽車公司品牌向上的重要突破口,更是中國智能汽車技術引領全球技術潮流的突破口。

智能座艙產業鏈將持續延伸,會有更多“玩家”進入到智能汽車這個大生態中,智能汽車“玩家”也會跨界進入更多的機器人領域,未來智能座艙生態圈發展主題將圍繞“生態協同”與“跨界延伸”展開。這場科技革命將產生顛覆性影響,不僅將開啟一個全新的產業生態,更對我們的社會工作方式及生活方式等方面產生深遠的影響。

標簽: 智能汽車 智能座艙 自然交互 座艙傳感器