自己能學習!電腦程序竟戰勝圍棋歐洲冠軍
新年伊始,世界頂級科學雜誌《自然》的封面新聞震驚了人工智能界:一個名為AlphaGo的電腦程序戰勝了圍棋歐洲冠軍樊麾。
這是電腦首次戰勝圍棋職業棋手,其意義遠大於1997年電腦“深藍”戰勝國際象棋大師,因為在這場腦力游戲中,電腦不是通過預設程序,而是靠學習精進棋力。
這場勝利,與谷歌公司旗下人工智能技術企業“深度思維”的創始人德米什·哈薩比斯密不可分。他的最終夢想是開發出媲美人腦的人工智能,一個在他看來安全可控的人類助手。
【讓人工智能更智能】
人工智能技術早已滲透到我們的日常生活,從智能語音助手Siri到人臉識別系統。不過,哈薩比斯2月中旬接受英國《衛報》採訪時説,這些只是預設好程序的軟體,只能掌握某項特定技能,屬於“弱人工智能”。所以,電腦“深藍”在國際象棋上的造詣可能技壓全人類,但論起下五子棋,它不見得能贏得了垂髫小兒。
哈薩比斯追求的是“通用人工智能”。所謂“通用”,即具備解決任何問題的潛力。這種強人工智能與以往技術的一大區別在於學習能力。用他的話説,“通用型學習機器”有一套能自己學習、適應性強的靈活算法,僅靠原始數據就能從零學起,掌握任何技能。
哈薩比斯認為,當今世界面臨許多難題,如癌症、氣候變化、基因組學等,解決起來需要處理大量複雜信息,單靠人腦有些“力不從心”。如何從浩瀚數據中篩選出有用部分?一種方案是借助通用人工智能將雜亂信息轉化為有用知識,為人類服務。
“我們正致力於研究一個有可能處理任何問題的元解決方案,”他説。聽起來像天方夜譚嗎?但哈薩比斯正率領自己的團隊一步步接近夢想。
2011年,哈薩比斯和發小穆斯塔法·蘇萊曼以及讀博時認識的人工智能專家沙恩·萊格共同創立深度思維技術公司,致力通過結合“機器學習和系統神經學的先進技術設計強大的通用性學習算法”,解決人工智能問題。
【21世紀的“阿波羅項目”】
“深度學習”,是時下流行的人工智能技術,作為研究機器學習的新領域,旨在通過模仿人腦神經網絡、模擬人腦學習機制來分析、處理數據。
研究這套技術的機構並不少,但成果跟“深度思維”比起來差遠了。這家企業能博採眾長,將技術發揮到一個又一個新高度。哈薩比斯説,這是21世紀的“阿波羅工程”。
2013年12月,這家行事低調的初創公司首次出席業內領先的機器學習研究大會,攜帶的智能軟體表現出眾,驚艷全場。
1個月後,搜索引擎巨頭谷歌以4億英鎊(約合6.3億美元)將公司收歸旗下。
2015年2月,公司研究人員的報告成為英國《自然》雜誌封面文章,專家驚呼“具備自學能力的人工智能軟體”在電子游戲中表現已達到人類水準。
文章説,這款名為“深度Q網絡”的程序可讓計算機實現更接近人類的獨立學習和推理能力,是世界上首個成功實現點對點通用學習的系統。
研究者讓這個程序通過在玩中自學來挑戰49款不同的經典電子游戲。結果顯示,新程序取得了與人類職業游戲測試員相當的成績,在多半游戲中得分與測試員非常接近。
哈薩比斯和他的團隊沒有止步,而是轉向下一個目標——圍棋,對應的英文單詞是“Go”。
棋盤游戲,在西方被視為人類頂級智力的試金石。在中國具有兩千多年歷史的圍棋,更是被不少人視為抵擋電腦進攻的最後陣地。它看起來棋盤明了,縱橫19條平行線構成361個交叉點;規則簡單,雙方交叉落子,佔領棋盤最大者為勝。但棋子位置的可能性多到遠超整個宇宙的原子數目,現有技術無法讓電腦像當年象棋大戰那樣靠枚舉所有情況戰勝對手。
怎麼辦?
研發者再次祭出“深度學習”的神器,結合其他技術,模仿人類大師分析盤局,推斷走勢。8個月後,AlphaGo以5比0的成績完勝樊麾,準備今年3月迎戰造詣更深的韓國棋手李世石。
相關論文介紹,這款程序的最大特點不是計算速度,而是算法優化。它通過名為“價值網絡”的算法評估整體局勢,拋棄在人類看來會一條道走到黑的路線;通過名為“策略網絡”的算法選擇在哪兒落子,直接略過那些明顯不該走的棋步。如此配合,減少大量無用功,將計算量控制在能力範圍內,本質上與人類棋手無異。而每次對弈,對電腦程序而言都是再學習的過程,更何況它用不着休息,經過足夠多的訓練,棋藝自然突飛猛進。
“這是一個意義重大的里程碑,”英國牛津大學人類未來研究所所長尼克·博斯特倫如此評價這場圍棋大戰。
雖然這場勝利是哈薩比斯職業生涯中迄今最引以為榮的事情,但他仍未滿足。他説,AlphaGo只會下圍棋,如何將這種智能用於其他領域還是個挑戰。如果電腦能突破這個限制,無疑會將人工智能帶入一個新境界。
“想想它下一個可能解決的問題吧,多讓人激動啊!”現年39歲的哈薩比斯滿面紅光地説。
【智力超群的跨界奇才】
哈薩比斯謙遜有禮、其貌不揚的外表下,有着讓大多數人望塵莫及的聰明大腦。
成為人工智能專家之前,他是象棋神童,13歲就得到國際象棋大師的稱號;他是電腦游戲開發牛人,8歲編寫游戲程序,17歲領銜開發出包含人工智能元素的經典電腦游戲《主題公園》,22歲成立後來大名遠揚的游戲公司“仙丹工作室”;他更是雙料學霸,20歲畢業於劍橋大學計算機學專業後改讀認知神經學博士,開創性地發現海馬體和情景記憶間的&&,研究成果被頂級學術期刊《科學》評為“年度突破”。互聯網之父、英國計算機學家蒂姆·伯納斯·李稱他是這個星球上最聰明的人類之一。
也許是太過聰明,哈薩比斯自認“很容易感到無聊”,而他又什麼都想試試,“世界這麼有意思,炫酷的事又這麼多”,“我要是體育運動員,就想當十項全能選手”。
有意思的是,這名具有希臘、塞浦路斯、新加坡和中國四國血統的英國人並非出自科學世家。按照他的説法,他是家中異類。教書的父母有些恐懼現代技術,倒是對藝術和文學興趣濃厚。弟弟和妹妹也繼承衣缽,一個搞寫作,一個是作曲家兼鋼琴家。
不過,這些都不妨礙身為長子的他最終在人工智能界縱橫馳騁。
但哈薩比斯絕非科學怪咖,無論待人接物、研發管理,他都游刃有餘。“我從不認為工作和生活水火不容,”他坦言,“我確實很喜歡讀書、看電影、聽音樂,而這些似乎又能反過來幫助我更好地工作。”
這名成功人士還是名顧家好男人。無論工作多忙,他每晚會準時到家與家人進餐。他會陪兩個兒子玩耍、讀書,幫忙輔導功課,哄孩子上床睡覺。
在同事眼中,他是十足工作狂。
他的一天,往往在孩子入睡後從大約23點開始。那時,美國總部會通過即時通信軟體Skype給他打來一通通工作電話,直到凌晨1點才能告一段落。
接下來是哈薩比斯的“純思考時間”,通常持續到凌晨三四點,思考的內容五花八門——研究方向,公司管理,突然冒出的算法設計,甚至讀書或看新聞時直覺與研究可能有關係的一段話。
他承認目前花在編程上的功夫不如以前多,更多的時間是放在琢磨提高公司運作效率上。他認為自己的公司“融合了最優秀的學術和最令人興奮的創業,充滿驚人的能量,催生出創造力和進步”。
在《衛報》記者克萊門茜·伯頓—希爾看來,這句評價一點也不誇張。“全世界最聰明的人排着隊想來這裡工作,儘管谷歌不少競爭對手和全球頂級科研機構爭相研究人工智能、吸引人才,但迄今‘深度思維’沒有一個人跳槽”。
哈薩比斯的公司佔據了倫敦市中心一整棟6層大樓,員工近200名,來自45個國家和地區。公司架構的核心是一群被哈薩比斯稱為“粘合思維”的人:這些人博學多才,能從紛繁的學術研究中找出結合點,迅速定位到有前景的研究方向。借助合適的獎勵機制,這些人以工作小組的形式隔幾週碰一次面,高效、靈活地調配資源和工程師。
“這樣你會有一名出色的天才研究人員,幾乎同時還會有三四名來自其他領域的研究人員可以接手任務,貢獻才智,”哈薩比斯解釋道,“這與學術界不同,但能很快産生驚人的成果,”例如啟動不過短短18個月的AlphaGo項目。
【人工智能威脅人類?】
人工智能的發展最終是否會威脅到人類生存?
對於這個熱議話題,不少人持悲觀態度。著名科學家斯蒂芬·霍金預言,成功開創人工智能將是“人類史上最偉大的一件事,不幸的是,這也可能是最後一件大事”。
“深度思維”另一名創始人萊格也認為,“人類滅絕或許會發生,而技術可能難辭其咎”。
但哈薩比斯的觀點截然相反。他認為眼下我們固然需要考慮人工智能帶來的法律和倫理風險,但人類能夠避免遭遇科幻小説中機器消滅人類的厄運。
他説,不少對人工智能安全性心存疑慮的科學家並不了解這個領域,所以才會胡思亂想。“我們距離那種能達到人類級別的通用智能還有好幾十年,目前才爬到梯子最下面一級”,只是在做游戲,當這些技術強大到不僅僅能玩游戲時,“我們會用在更現實、更重要的領域,比如醫療保健,到那時,我們才需要確認它們可以發展到什麼程度,這將阻止機器接管世界”。
在哈薩比斯眼中,目前公眾對通用人工智能的過度擔憂阻礙了人工智能的發展。事實上,一線研發人員已經開始致力於減少技術隱患。
他説自己的公司在這方面走在前列。“深度思維”雖然不受政府審查,但以相當透明的方式運作;公司一向較樂於公開代碼,在併入谷歌時就在協議上寫明禁止將技術用於軍事或情報;他和同事們多次推動召開業內國際會議,發起倡議將智能技術用於善舉、杜絕潛在危險;他們協助宣傳成立非官方的內部道德委員會和諮詢委員會。
“哈薩比斯很熟悉人工智能安全方面的爭議,”英國帝國理工學院認知機器人學教授默裏·沙納漢評價道,“他當然不幼稚,也不會逃避現實。”
當伯頓—希爾問起長期來看人工智能面臨哪些挑戰時,哈薩比斯答道:“由於這些系統變得越來越複雜,我們需要考慮如何充分利用它們以及利用它們做什麼事。技術本身是中立的,但它是一個學習系統,必然會帶上設計者價值體系和文化的印記,所以我們必須認真思考價值觀問題。”
至於能媲美人腦的超級智能問題,他認為如何準確明了地下達指令至關重要。他強調,任何一個系統的“終極目標仍將由人類設計者明確設定,系統可能需要想辦法達成目標,但不會自行設定目標”。(王鑫方)(新華社專特稿)

資料圖
