百度研究院:未來(lái)3年,AI人機交互8大趨勢
【快印客導讀】人工智能(AI)已經(jīng)成為新一輪科技革命和產(chǎn)業(yè)變革的核心驅動(dòng)力,AI人工智能名片的使用真火熱,也進(jìn)一步說(shuō)明人工智能正在對世界經(jīng)濟、社會(huì )進(jìn)步和人類(lèi)生活產(chǎn)生極其深刻的影響。
其中,普羅大眾對人工智能感知最為深切的當屬人機交互,比如AI人工智能名片,幫助營(yíng)銷(xiāo)客戶(hù)實(shí)現精準營(yíng)銷(xiāo),增長(cháng)業(yè)績(jì)。語(yǔ)音交互、人臉識別等人工智能技術(shù)已經(jīng)化為應用產(chǎn)品走進(jìn)了我們的生活。近日,百度人工智能交互設計院發(fā)布了一份聚焦于未來(lái)3年內的AI人機交互趨勢研究報告(以下簡(jiǎn)稱(chēng)“《報告》”)。
該報告是百度人工智能交互設計院基于過(guò)去一年多對AI領(lǐng)域前沿技術(shù)、產(chǎn)品和設計的深入研究和洞察,結合產(chǎn)業(yè)界和學(xué)術(shù)界的經(jīng)驗探析而來(lái)。AI賦能的人機交互革新了大眾的生活形態(tài),未來(lái),AI加持的人機交互模式又會(huì )呈現出什么樣的態(tài)勢呢?
《報告》從“人機交互介質(zhì)”、“交互對象”、“AI應用場(chǎng)景”、“人機關(guān)系”等方面總結了AI人機交互的八大趨勢。
趨勢一:語(yǔ)音交互技術(shù)進(jìn)步,更趨向人類(lèi)自然對話(huà)體驗
研究公司Ovum預測稱(chēng),到2021年,地球上的語(yǔ)音助手的數量會(huì )和人類(lèi)一樣多,人們會(huì )越來(lái)越傾向于向語(yǔ)音助手尋求情感上的幫助。在A(yíng)I人機交互中,語(yǔ)音交互技術(shù)在用戶(hù)終端上的覆蓋最為廣泛。
以智能音箱為例,有數據顯示,2018年全球智能音箱市場(chǎng)同比增長(cháng)200%。其中,中國智能音箱市場(chǎng)增速達到罕見(jiàn)的5370%。谷歌、亞馬遜、蘋(píng)果等全球巨頭企業(yè)均加速了用語(yǔ)音交互技術(shù)開(kāi)啟大眾智能生活的步伐。截止2018年12月31日,搭載百度對話(huà)式人工智能操作系統DuerOS的智能設備激活量也已超2億。
目前,語(yǔ)音交互技術(shù)已經(jīng)加速在智能家居、手機、車(chē)載、智能穿戴、機器人等行業(yè)的滲透和落地?!秷蟾妗分赋?,未來(lái)隨著(zhù)語(yǔ)音技術(shù)的不斷完善,語(yǔ)音交互的自然度將進(jìn)一步提升,并愈加趨向人類(lèi)自然對話(huà)的體驗。具體表現為:語(yǔ)音交互將從機械的單輪對話(huà)進(jìn)階到更流暢的多輪對話(huà);合成語(yǔ)音更自然、真實(shí),接近真人水平;語(yǔ)音交互具備聽(tīng)覺(jué)選擇能力,提升多人對話(huà)體驗;語(yǔ)音交互將支持多種方言,并針對細分群體進(jìn)行差異化設計。
趨勢二:人臉、手勢等通道更多出現在產(chǎn)品中,多通道融合交互成為主流交互形式
媒介學(xué)家雷吉斯德布雷(Régis Debray)曾提出:“技術(shù)能實(shí)現不同區域里不同文化的人之間的連接”。隨著(zhù)技術(shù)的發(fā)展,人與人之間的連接早已不成問(wèn)題。當前,AI技術(shù)更是拓展了人與智能體交互的通道。除語(yǔ)音交互外,計算機視覺(jué)技術(shù)的發(fā)展已使得智能體實(shí)現了通過(guò)識別人臉、指紋、面部表情、肢體動(dòng)作等人體信息,而更加快捷多元地與人類(lèi)進(jìn)行交互。但是不同的交互通道在有其獨特優(yōu)勢和場(chǎng)景適用性外,也有一定的局限性。
《報告》認為,未來(lái),人與智能體的交互將融合語(yǔ)音、人臉、手勢、生理信號等多種方式,為人類(lèi)打開(kāi)更多的交互空間和應用場(chǎng)景。具體表現為:人臉檢測及識別聚集更細維度的面部特征,拓展更多的交互空間和場(chǎng)景;空中手勢交互將成為新熱點(diǎn);觸控、語(yǔ)音、手勢、人臉最有可能成為多通道融合的主流通道;生理信號、觸覺(jué)、嗅覺(jué)等也將成為輔助通道融入多通道交互中。
趨勢三:智能體開(kāi)始擁有明確的人設
近期,明星“人設”崩塌已成大家茶余飯后的熱門(mén)話(huà)題。但是你想過(guò),智能體也將擁有明確的“人設”么?《報告》認為,未來(lái),用戶(hù)可以更加明顯地感知到智能體鮮活的“人設”。
所謂智能體的“人設”是指,用戶(hù)在與智能體的互動(dòng)過(guò)程中,根據感知到的綜合特征推斷出一種具有一致性的角色形象,一般由性格(如外向、善良等)、關(guān)系(如助手、朋友等)和基本屬性(如性別、年齡等)構成?!秷蟾妗分赋?,目前,智能體人設的設計和表達主要聚焦在語(yǔ)音(如音色、語(yǔ)調等)和語(yǔ)言層面(如表達方式),并且通常局限在部分場(chǎng)景、部分話(huà)術(shù)上,缺少一致性和全局感。
《報告》提出,未來(lái),智能體人設將從語(yǔ)音、產(chǎn)品外觀(guān)、虛擬形象等多維度進(jìn)行設計,甚至聘用編劇設計具有統一形象特點(diǎn)的話(huà)術(shù),利用混合現實(shí)(MR)、全息投影等技術(shù)將人設具象化,讓用戶(hù)在不同場(chǎng)景下均感受到智能體一致、明顯的人設特征。換句話(huà)說(shuō),未來(lái),智能體的人設會(huì )具有很明顯的特征,但不會(huì )輕易崩塌。
此外,《報告》還認為,打造用戶(hù)喜愛(ài)的人設也將成為企業(yè)在市場(chǎng)競爭中形成差異化、吸引更多用戶(hù)的重要方式。
趨勢四:智能體在被動(dòng)交互外,開(kāi)始出現主動(dòng)交互行為
技術(shù)的發(fā)展雖然革新了我們的生活方式,但是長(cháng)久以來(lái),人機交互一直延續著(zhù)人類(lèi)“輸入”,機器“反饋”的循環(huán)模式,人類(lèi)始終是主動(dòng)的,機器始終是被動(dòng)的。
《報告》認為,AI人工智能名片賦予了機器情境感知和自主認知能力,使我們有機會(huì )構建機器主動(dòng)服務(wù)于人的交互模型。智能體出現主動(dòng)交互行為的具體表現為:主動(dòng)交互越來(lái)越“貼心”;主動(dòng)交互在“家”和“車(chē)”的場(chǎng)景下率先商用落地;主動(dòng)交互將提升公共場(chǎng)景下人機協(xié)同的效率。
趨勢五:智能體開(kāi)始擁有情感判斷及反饋智能
2014年在北美上映的動(dòng)畫(huà)片《超能陸戰隊》中的機器人大白,以對主人公關(guān)懷備至的暖萌形象收獲了大批影迷的喜愛(ài)。觀(guān)影后的每個(gè)人都希望自己能夠擁有一臺如大白一樣忠心耿耿又溫柔體貼的機器人。令人欣喜的是,具有情感判斷和應對能力的智能體正逐漸成為現實(shí)。
過(guò)去20年,在人機交互中,機器基于表情、文本等方式的的情感識別能力已有很大的提升。目前市面上出現的如情感陪護機器人、智能音箱、智能汽車(chē)等已經(jīng)初步具備一些情感識別能力,可以根據不同的場(chǎng)景、對象,進(jìn)行適當的情感交互。
《報告》指出,未來(lái),情感計算技術(shù)的提升及硬件升級將賦予智能體在“視”“聽(tīng)”等方面更強的情感識別能力;同時(shí)智能體對于人類(lèi)思維理解、情景理解能力也將更加完善,情感交互能力將更智能、更體貼。
趨勢六:AI對特定人群的關(guān)懷得到快速發(fā)展和應用
人機交互的發(fā)展為兒童、老人、殘障人士等群體更便捷地利用機器獲得服務(wù),提供了充分可能。當前市面上已經(jīng)出現大量針對兒童教育的AI產(chǎn)品。搭載DuerOS的小度智能音箱也針對以?xún)和癁橹行牡募彝フZ(yǔ)音互動(dòng)需求,特別開(kāi)發(fā)了兒童語(yǔ)音識別引擎,并定制兒童語(yǔ)音播報音色及對話(huà)邏輯,陪伴兒童一起成長(cháng)。在養老領(lǐng)域,為老人提供陪聊、提醒等陪護服務(wù)的智能產(chǎn)品也被AI企業(yè)提上了日程。此外,少數AI產(chǎn)品也開(kāi)始專(zhuān)注殘障、病患等更加細分的人群,如2018年11月,百度推出了AI眼底篩查一體機,幫助患者快速篩查眼底疾病,為基層醫療帶去了極大的便利。
《報告》提出,未來(lái),AI人工智能名片對人類(lèi)的關(guān)懷將得到快速發(fā)展和應用,覆蓋更加細分的人群和更深入的場(chǎng)景。為兒童,AI將從易于交互到提供心智陪伴的服務(wù);為老人,AI將縮小他們與科技的鴻溝,助推他們開(kāi)啟品質(zhì)生活;為感官殘障人士,AI將幫助他們重獲對世界的立體感知;為特殊疾病人群,AI將提供預測、診斷和康復服務(wù)。
趨勢七:智能設備互聯(lián)互通,多場(chǎng)景銜接
以BAT為首的互聯(lián)網(wǎng)企業(yè),在2018年紛紛調整組織架構,轉向To B。巨頭重提產(chǎn)業(yè)互聯(lián)網(wǎng)戰略成為當前市場(chǎng)新現象。此現象背后,正是AI、5G、云計算等新興技術(shù)的發(fā)展與升級。2018年的政府工作報告,進(jìn)一步強調了“產(chǎn)業(yè)升級的人工智能應用”?!爱a(chǎn)業(yè)化”和“應用化”成為未來(lái)幾年人工智能的兩大發(fā)展方向。
《報告》指出,隨著(zhù)AI技術(shù)的進(jìn)一步成熟和落地,及其與大數據、IoT的結合,AI將從單品智能、獨立場(chǎng)景到互聯(lián)智能,場(chǎng)景融合進(jìn)階。智能設備將互聯(lián)互通,場(chǎng)景將進(jìn)一步融合,實(shí)現多場(chǎng)景銜接;VR/AR將促進(jìn)線(xiàn)上和線(xiàn)下、虛擬和現實(shí)的聯(lián)結,未來(lái),VR會(huì )加速拓展到更多的產(chǎn)業(yè)和實(shí)體,AR中的現實(shí)與虛擬將從簡(jiǎn)單疊加到有機融合,實(shí)現用戶(hù)可以源自自然意識進(jìn)行人機互動(dòng)。
趨勢八:人機開(kāi)始走向深度協(xié)同,信任構建成為首要突破點(diǎn)
2018年6月,百度研究院發(fā)布并開(kāi)源“神經(jīng)條件隨機場(chǎng)”的AI算法。該算法擁有強大的腫瘤病理切片檢測能力,可以大幅提升醫生閱讀病理切皮的效率和準確率。人機協(xié)同即,通過(guò)人工智能增強人類(lèi)智能,讓人工智能成為人類(lèi)智能的自然延伸和擴展。
目前,人機協(xié)同已在工業(yè)領(lǐng)域初步實(shí)現,而隨著(zhù)智能體從工業(yè)生產(chǎn)領(lǐng)域向商業(yè)服務(wù)、社會(huì )服務(wù)和家居服務(wù)領(lǐng)域拓展,人機將走向深度協(xié)同?!秷蟾妗氛J為,人機深度協(xié)同可以最大化發(fā)揮雙方優(yōu)勢,實(shí)現合作共贏(yíng)。
而人們對AI的信任,是智能體全面進(jìn)入人類(lèi)工作和生活,實(shí)現真正人機協(xié)同的前提。即,信任構建成為了實(shí)現人機深度協(xié)同的首要突破點(diǎn)。與此同時(shí),AI倫理道德將更加細化,成為所有從業(yè)者需遵守的行業(yè)準繩。AI行業(yè)的發(fā)展在帶給大眾便利生活之時(shí),避免算法歧視、保護人類(lèi)隱私、尊重人類(lèi)價(jià)值等也變成了從業(yè)者們亟需重視的問(wèn)題。
最后,《報告》指出,AI時(shí)代的人因工程是一個(gè)真正的系統工程。而每個(gè)人機交互行業(yè)的從業(yè)者都需要擁有AI思維。最重要的是,中國的人機交互設計和研究者們將首次和發(fā)達國家站在同一起跑線(xiàn)上,我們有機會(huì )去定義這些體驗標準,而不再是追隨或遵守。
AI時(shí)代大門(mén)緩緩開(kāi)啟,屬于中國和中國企業(yè)引領(lǐng)世界前沿的新時(shí)機已到來(lái)。AI人工智能名片引領(lǐng)行業(yè)發(fā)展的機遇已經(jīng)到來(lái)。