新華網 正文
從“傻白甜”到“杠精” AI有了認知智能萌芽
2019-01-07 07:58:16 來源: 科技日報
關注新華網
微博
Qzone
評論
圖集

  每個人身體裏都有一個“杠精”:“這可不一定”“我可不這麼認為”“那可説不準”……這些“杠”詞要麼在心裏默念、要麼在口中碎碎念、要麼大聲講出來,無論是否表達,“杠”的意識出現均是人類獨立思維的表現,所基于的正是人類的綜合分析能力。

  如今,人工智能(AI)也開始“杠”得有條理、有邏輯、有思路起來。日前,在百分點舉辦的無界智能發布會現場,IBM大中華區全球信息科技服務部總經理謝少毅介紹了人工智能做辯論的項目,“杠精”們大愛的口頭禪出現在了IBM的人工智能係統 “Project Debater”口中,這背後是機器學習、自然語言處理、海量數據搜索處理、識別情緒等大量人工智能技術的應用。

  越來越多的人工智能研究者發明新的技術讓AI向人類“偷師”,一定程度上習得觸類旁通、獨立思考的能力。從“傻白甜”到“杠精”,AI向真實的“人”又貼近了一步,從“感知智能”慢慢走向“認知智能”,哪些技術是AI不可或缺的?還有哪些仍待攻堅呢?

  從理解語義到“讀心術”,認知智能初現

  “你告訴一個AI自己有減肥計劃,AI如果每天建議你吃沙拉,你就會説它不好,不符合心意;如果它天天讓你吃蛋糕,你也會説它不好,不符合減肥需求。”上海紐約大學商學部主任陳宇新教授舉了個連真正的人類都難以把握的兩難抉擇,充分説明理解語義並不一定能夠真正把握要義。

  “雖然主人説這是我想要的,但AI做了之後,主人仍會説這不是他想要的……”擁有“認知智能”的未來AI將充分理解這句堪比繞口令的實質,陳宇新認為,當數據足夠多、算法足夠強大、模型足夠優秀之後,AI將從理解語義到擁有“讀心術”,分析推測出人類當時可能都不確定的真正想法,在人心裏矛盾時給出“撓到癢處”的答案。

  將這個“減肥吃什麼”的難題放大來看,就是對正反的“兩難”進行一係列諸如身體指徵、愛好、時間等多維度的數據綜合分析後,用到大量的人類學、心理學、社會學的內容和方法,通過一係列探索性地問答獲得數據,給出結果。

  這種探索性的分析將使AI得到進化,並擁有更廣闊的“職業”選擇。據介紹,美國有公司做出了第一個人工智能律師ROSS,美國一個律師以往用上百上千個小時做一個案例的分析和調查,現在用了ROSS和人一起合作,時間減少到28分鐘,ROSS,可以提供正反雙方的意見讓律師做決策。

  “正反意見的博弈還可以幫高層做決策,可以通過一個機器人提供正反兩面意見的辯論,幫助高層綜合分析做更好的決策。”謝少毅認為,這方面的研究才剛剛開始。進化的AI將被用在更多需要做信息分析或做決策的領域,例如高級銷售、經濟分析師、企業高級管理人員等。

  數據動態融合,AI走進認知智能的“基石”

  從海量數據中“摘出”與當前任務關聯的數據,是AI擁有綜合分析能力的第一步。百分點董事長兼CEO蘇萌表示,AI走進認知智能首先建立在數據融合的基礎上。

  以辯論項目為例,沃森化身的這位“女性”辯手,和另一位人類辯手就“是否應該把體育博彩合法化”的議題展開辯論時,能在聽懂人類長達4分鐘的快速陳述(700—900個單詞)後,進行迅速反應,搜集資料、選取角度,給出旁徵博引的辯駁;在短兵相接的短辯交鋒中也能很快理解對方的觀點、組織語句並做出有針對性的論述。

  蘇萌表示,數據目前來看仍然是人工智能的基石。不久前,德國商業軟件巨頭SAP以80億美元收購全球最大在線調查公司Qualtrics,説明了數據融合的重要性。2017年,百分點也並購了中國最大的在線調研服務商極速洞察,使得百分點同時擁有高達380萬的中國最大用戶樣本庫,將雙方的行為數據和態度數據進行融合。

  數據融合包括擁有海量數據和實現高效融合兩方面。

  蘇萌表示,數據融合指的是打破業務係統的煙囪融合海量的多元異構的數據,它既是一次企業內外部數據的融合,也是大小數據的融合,同時也是歷史數據和實時數據的融合,只有數據融合了之後,才能洞見真相避免偏見,才能明智決策避免武斷。

  “知識圖譜是我們讓機器去了解、認識人類世界的核心,它把我們的知識構建成網狀的知識結構,再通過人機交互直接輸出。”蘇萌進一步解釋,數據融合意味著知識需要不斷更新,但在更新一個知識點的時候往往需要更新整個知識係統,操作非常繁瑣。

  “出版行業或者媒體,甚至公安行業,所涉及的知識都需要實時動態理解,某一個知識不是固定不變的,所以知識圖譜未來的發展方向是動態知識圖譜。” 蘇萌解釋,這個世界由很多的東西構成,比如人、事、地,這些可以理解為本體,本體發生變化或者本體間的關係發生變化後,動態知識圖譜能夠迅速自動重構,高效地實現對一個行業的知識圖譜的構建。

  攻堅在路上,來自小數據的挑戰

  新的領域、沒有海量樣本、訓練速度不夠,是不是每遇到一個特殊場景,都要重新建模,輸入大量的樣本讓機器重新學習一次呢?條件並不允許。

  “很多客戶的實際應用場景是數據量不夠甚至是比較少的,在這種情況下我們結合遷移學習技術,解決了小樣本的模型訓練問題,標注量只有以往的10%。”百分點首席算法科學家蘇海波説。

  從小數據中獲得學習能力,也是人工智能走向認知智能的一個重要部分。人工智能專家經常用貓舉例:小孩子認得貓只要指給他看一兩次就夠了,AI卻需要成百上千張圖片,才能掌握貓的特徵。

  為此,人工智能科學家嘗試結合遷移學習開發一係列算法,節約人工標注樣本的時間,讓模型在少量的標注數據上,也能取得好的效果,可以理解為賦予AI“舉一反三”的能力。“例如像電商評論情感分類這樣一個任務,用傳統的深度學習模型需要數萬條數據才能達到85%左右的效果,但是如果採用深度遷移學習技術,數百條數據就能達到同樣的效果。”蘇海波説,我們判斷認知智能未來會迎來黃金十年的發展,為此百分點成立了認知智能實驗室。除了深度遷移學習技術,實驗室還會重點研發多語種自然語言處理技術,幫助認知智能實現跨種族、國際化。

  “未來我們會與各大高校和研究機構開展合作,建立聯合實驗室,共同探索更多前沿的認知智能技術,包括各個重點行業的知識圖譜構建、自動問答等等。基于這些技術,實驗室會研發出更多行業落地的應用産品,為客戶創造價值,用認知智能推動社會進步。”蘇海波説。(記者 張佳星)

+1
【糾錯】 責任編輯: 王頔
相關新聞
  • 人工智能有望幫助預測癌症患者心理問題
    在驗證機器學習效果的階段,研究人員將癌症患者第一次化療前和第一次化療後一周的調查問卷數據輸入機器,讓其分析預測患者是否會出現抑鬱、焦慮和睡眠障礙這些心理問題,以及在何時會出現這些心理問題。
    2019-01-06 18:02:02
  • 互聯網+人工智能驅動在線教育産業普及
    近年來“互聯網+教育”的業務載體和商業模式不斷推陳出新,先後出現了以視頻直播為代表的“電大模式”、以線上授課和線下答疑為代表的“雙師模式”和更注重互動性、參與性的“人工智能課堂”模式。
    2019-01-06 17:05:16
新聞評論
加載更多
梅香小寒
梅香小寒
江蘇海安:國粹進課堂
江蘇海安:國粹進課堂
《己亥年》生肖豬特種郵票發行
《己亥年》生肖豬特種郵票發行
隨心而行,走走停停始終精彩。
隨心而行,走走停停始終精彩。

010030090900000000000000011107681123954327