新華網 > > 正文

語音交互革命風暴將起

2017年02月15日 09:54:11 來源: 經濟參考報

    “嘿,Kuri!想一起玩嗎?”“嘿,Kuri!能講個故事嗎?”……

    只要聽到叫自己的名字,身高半米、看上去胖嘟嘟的機器人Kuri就會睜開眼睛跑到您的跟前,像小狗一般可愛。前不久,這款由新創公司Mayfield Robotics推出的黑白色家用機器人引起了媒體的爭相報道。

    “Kuri是一款社交機器人,您可以把它當成家庭的一個成員,”公司首席執行官Michael Beebe對記者介紹説。除了常見的手機應用程序控制方式外,人們可以通過一些簡單的語言命令指揮它完成一些任務,比如讓它在家裏自動巡邏,把小狗趕下沙發,還能與小孩一起玩耍,講故事放音樂,等等。

    據有關預測,到2020年,美國每10戶家庭中就有一戶人家有家用機器人“入駐”。這些機器人不僅能任勞任怨地幹活掃地,更重要的是具有“社交”功能,能與人簡單交流,幫我們排憂解悶。

    隨著重出江湖的“阿爾法圍棋”近日橫掃多位中日韓頂尖棋手,有人評價説,人腦鬥不過機器的時代已經來臨!但實際上,至少在語言理解方面,機器還遠遠鬥不過人腦。不過,這種情況正在迅速發生改變,Kuri們正越來越能聽懂人類的語言。

    “電腦的下一個接口是語音,”美國消費技術協會的首席經濟學家肖恩·杜布拉瓦茨斷言。他列出未來5大技術發展趨勢,其中人機語音交互排在第一位。

    不管是現在的智能手機還是個人電腦,採用的都是最早可追溯至1981年施樂(xerox)公司“施樂之星”率先採用的圖形用戶界面。3年後,蘋果公司“偷師”“施樂之星”推出的Macintosh成為首個在商用領域取得成功的圖形用戶界面電腦。從這之前的文字命令發展到圖形界面,這是人機交互方式的重大革命,此後個人電腦迅速普及。

    自那以來,隨著個人設備的運算能力日益增強,各種應用程序越來越多,圖形用戶界面變得日益復雜,今天圖形界面被認為已經做到了極致。與此同時,從2010年左右逐漸興起的可穿戴式設備以及其他一些非傳統設備開始嘗試摒棄圖形用戶界面,把最重要的運算功能通過無線連接交給手機或其他中樞設備。

    許多人認為,圖形用戶界面已經接近走到了極限。那麼,接下來,誰能把人類從紛繁復雜的界面窗口、工具欄以及菜單選項中拯救出來?腦電波、眼神還是語音?放到10年前,這三種方式沒有一個靠譜,但今天語音似乎成為了首選項。

    語音識別研究已經有好幾十年的歷史,但進展一直不盡如人意。比如,微軟早在1994年就成立了有關研究團隊,但當其研究人員2006年在給投資者面前做基于視窗操作係統的演示時,電腦竟然把“mom”(媽媽)聽成了“aunt”(阿姨)。“早期版本的語音設別技術太糟糕了,”杜布拉瓦茨説。

    據杜布拉瓦茨介紹,即便到了2013年,哪怕您講話再標準,再沒有背景噪音,語音識別的單詞錯誤率依然高達25%,即每説4個詞,電腦就會聽錯一個。但得益于深度學習與人工神經網絡的發展,語音識別在過去3年獲得了突飛猛進的發展,單詞錯誤率降到了5%左右,達到了人耳的程度。

    “我們在過去30個月所取得的語音識別進展比過去30年還要多,”杜布拉瓦茨説,“這就是為什麼我認為語音技術會出現爆發式增長的原因。”

    蘋果手機用戶應該比較熟悉它的語音助手Siri,微軟、谷歌與亞馬遜也相繼推出了類似語音助手。值得一提的是,大約兩年前,亞馬遜第一個把它的語音助手 Alexa嵌入到智能家居中樞控制音箱Echo之中,讓我們多了一個“家庭事務助理”。有了Echo,人們只用動動嘴皮子,就可以查信用卡賬單、關燈、鎖門,甚至叫車。

    此後,谷歌不甘示弱推出了Google Home,三星和聯想等也準備推出類似産品……一場由語音交互驅動的智能家居競賽正在進行之中。現在,汽車廠商也加入進來,比如福特近來宣布與亞馬遜合作,在車上安裝Alexa,將來可通過Alexa幫您播放音樂、新聞,快到家時打開車庫門和家中的照明、空調等。

    杜布拉瓦茨説,到目前為止,全球估計已售出約500萬個聲控助手,今年可能還會再售出500萬個。

【糾錯】 [責任編輯: 王迪 ]
新華炫聞客戶端下載

相關稿件

010020080870000000000000011121061360579631