借助AI 人類能聽懂動物的“喜怒哀樂”?-新華網
新華網 > > 正文
2022 05/09 09:19:12
來源:科技日報

借助AI 人類能聽懂動物的“喜怒哀樂”?

字體:

  目前來看,相關研究僅僅只是在一定程度上實現了人與動物之間簡單的資訊傳遞,離實現真正的跨物種交流,恐怕還有很長的一段路要走。從短期來看,要想實現跨物種交流還很難,但越來越多的研究無疑正在為其打開一扇扇大門。

  譚茗洲 遠望智庫人工智慧事業部部長、圖靈機器人首席戰略官

  在《安徒生童話》等文學作品,以及不少優秀的影視作品中都反映了同一個主題——人與動物的交流互動。如今,世界各地的學者們試圖通過人工智慧等途徑打破人與動物的語言屏障,真正實現跨物種的溝通,甚至情感交流。

  近日,一個由丹麥哥本哈根大學、瑞士蘇黎世聯邦理工學院,以及法國國家農業、食品和環境研究所等研究人員組成的國際研究小組,開發出一款人工智慧産品,可以翻譯家豬在各種場景中發出的聲音,成功解碼了其叫聲中所傳遞的“喜怒哀樂”。該研究成果發表在最新一期的《科學報道》期刊上。那麼,人工智慧是否可以實現人與動物的溝通?演算法具體是如何分辨動物情緒的?目前,人類要通過AI理解動物語言,還需克服哪些困難?

  已通過演算法研究多種動物語言

  動物和人一樣也會有自己的情緒。它們會快樂、難過、恐懼、憤怒,但受限于語言和表達方式,動物的情緒較難為人所知。其實,在我們聽起來大同小異的動物叫聲中,或許隱藏著它們不一樣的情緒。

  上述論文顯示,研究人員為了訓練AI翻譯豬的語言,專門錄下了411頭家豬發生于19種不同場景中的7000多次叫聲。演算法執行結果表明,豬積極情緒的呼叫聲比負面情緒的呼叫聲更短且振幅更低。研究人員稱,這種演算法的準確率高達92%,可以基本準確地從豬叫聲中辨別其情緒。

  無獨有偶,此前康橋大學一個科研團隊讓AI僅根據綿羊的面部表情來識別這只羊是否處于困境之中。AI係統首先根據綿羊疼痛的面部表情,列出與不同疼痛程度相關的幾個“面部動作單元”(AU),然後在480張綿羊照片中標記了這些AU——鼻孔變形、每只耳朵的旋轉和眼睛的縮小等,以此來判斷綿羊的處境。

  “其實,借助演算法研究動物的語言,以及人與動物之間的溝通,早有先例。之前就有研究寵物狗、貓的項目,這些研究的目的在于讓人類便于跟它們更好地相處。”5月4日,遠望智庫人工智慧事業部部長、圖靈機器人首席戰略官譚茗洲在接受科技日報記者採訪時指出。

  例如,為了實現人寵溝通,日本著名聲學專家鈴木松美博士利用基于機器學習的動物翻譯技術,曾經發明過一款“寵物狗翻譯器”。寵物主人只需要將一枚迷你麥克風別在衣領上,所收集到的寵物叫聲便會傳輸到翻譯器中進行語音識別和轉換,進而向主人傳達寵物想要表達的意思,了解它們的情緒。

  “此外,還有研究人員研究簡單動物的群體智慧,如蜜蜂、螞蟻的溝通方式,這些研究對于軍事戰術、設備等有一定的倣生借鑒意義;還有對海豚、鯨魚這類動物組織化能力的跨學科研究,這類研究對于探究生物進化史非常有價值。”譚茗洲進一步解釋。

  不懂語言也能獲得翻譯能力

  動物有自己的語言嗎?如果有的話,它們會聊些什麼?了解動物可以説是人類的一個長久研究課題,目前AI正在幫我們探尋答案。譚茗洲表示:“動物沒有人類所特有的語言係統,所以研究人員可以通過結合它們的叫聲、行為、習性來分析其訴求,以便更好地了解它們。”

  一位研究人員曾經旁聽了兩只位置相對靜止的抹香鯨之間斷斷續續長達40分鐘的“對話”,它們的“對話”幾乎每一句都不重樣,並且伴有各種動作。這令人不禁猜測:是否這兩只母鯨在“拉家常”、分享育兒心得?對抹香鯨“對話”內容的研究,正是近幾年由國際科學家團隊發起、《國家地理》支援的“鯨語翻譯計劃”(Project CETI)中的研究內容之一。 據報道,研究人員正在使用自然語言處理係統(NLP)分析抹香鯨的40億個交流代碼。NLP是人工智慧的一個子領域,專注于處理人類的書面和口頭語言。研究團隊計劃讓人工智慧將每個聲音與特定的背景聯繫起來,這一過程預計至少需要5年時間。如果該團隊實現了這些目標,下一步將是開發和部署一個互動聊天機器人,與生活在野外的抹香鯨進行對話。

  發表在《自然》期刊的科學研究證明,人工智慧在破譯古代人類語言方面非常有效。這為使用AI探索動物語言開辟了可能性。該研究稱,機器學習技術提供了新的工具,可以幫助考古學家更快地了解過去,特別是在破譯古代文字時。該AI係統採用了古希臘語言和整個古代地中海世界的銘文進行訓練,訓練數據來自相關人文學院提供的最大的希臘銘文數字數據集,而且這些銘文中的每一條都標注了元數據,其中描述了由歷史學家考察出來的銘文的書寫地點和時間。有了這些數據,AI就能在這些資訊中尋找模式和規律,並利用復雜的數學模型來對這些資訊進行編碼,然後進一步使用這些推測出的資訊來對其他銘文的內容、編寫地點和年限進行推斷。研究顯示,該AI在修復受損文字方面達到了62%的準確率。這也為翻譯動物語言提供了靈感。

  人工智慧在破解古文字和翻譯動物語言上往往遵循同樣的方法和準則。譚茗洲表示:“在翻譯這一經典任務上,機器不需要理解語言,而是僅靠單一語言的語料,即可掌握該語言的句法、語法等關鍵要素。也就是説,深度學習不懂英語和中文,但是通過大量學習語料即可獲得中英互譯的能力。”

  “歸根到底,AI能夠翻譯、理解動物語言,其背後依然是基于人類對語言進行的有效解讀。” 譚茗洲説。

  實現跨物種交流尚有很長的路要走

  “人類的語言有規律可循,因而不同國家的語言是可以遵循規律去學習的。但動物的語言規則存在未知壁壘,因此AI要實現跨物種語言翻譯,尚有一段很長的路要走,需要克服一些困難。”譚茗洲表示。

  首先,事實證明,利用受人為偏見影響的數據進行訓練的演算法很容易將結果導向“歧途”。比如,狗會發出急促的叫聲,可能是因為想要向主人乞食,也可能是因為提醒主人警惕陌生人,還可能是對主人不陪自己玩的責怪。但如果研究人員僅基于自己的認知,在對這種叫聲數據進行標記的時候,認為這種叫聲只表達寵物向主人要食物的需求,從而對數據進行單一標記處理,那麼人工智慧在學習數據、翻譯的時候往往就會産生很大的局限性。這種翻譯很容易導致人和寵物的溝通障礙,從而喪失寵語翻譯的意義。

  “在研究中,科研人員需要去‘人類中心’,也就是説,借助于演算法實現的跨物種溝通,需要演算法避免人類某些偏見。”譚茗洲指出。

  其次,通過AI演算法將人類語言與動物語言對應,需要大量、廣泛、完善的數據採集和場景訓練,以完成對動物語言的解讀,實現對“規則”的總結。這需要廣泛同步採集動物叫聲和腦電波數據並進行比對,再將其納入數據庫。然而不同犬種聲帶特點不同,面對同一場景的發聲表現也不同,而這樣的場景和叫聲的組合有無數個,這為數據採集工作帶來了巨大的挑戰。

  譚茗洲説,在技術方面,一個AI翻譯産品做到精確翻譯至少需攻破幾個難題:在形式端,如果使用拍譯的形式要攻克圖像識別相關問題,同聲翻譯形式則要攻克語音識別相關問題;在內容端,AI翻譯産品還要攻克文本語言分析、大數據採集等問題。由于AI缺乏對視覺場景、聽覺場景、自然語言處理的常識判斷,這還需要AI發展到能夠極為精確地處理這些問題的階段。

  此外,有學者指出,動物語言和人語之間的代溝是客觀存在的,AI所能做的,只能是不斷改進自身的功能,用科學手段完善數據庫、內容、語料和場景;形式和內容雙管齊下,才能將這條橫亙在動物和人之間的語言鴻溝填平,在堅實的地基上實現人和動物的有效溝通。

  “盡管有些研究也曾獲得了很大的進展,但是其中的問題也無法被忽視。目前來看,相關研究僅僅只是在一定程度上實現了人與動物之間簡單的資訊傳遞,離實現真正的跨物種交流,恐怕還有很長的一段路要走。從短期來看,要想實現跨物種交流還很難,但越來越多的研究無疑正在為其打開一扇扇大門。”譚茗洲表示。(記者 華 淩)

【糾錯】 【責任編輯:谷雨】