新華網 正文
柯潔“約戰”AlphaGo:我抱著必勝的信念!
2017-04-11 15:08:30 來源: 新華網
關注新華網
微博
Qzone
評論
圖集

    新華網北京4月11日電(記者 陳聽雨)“雖然AlphaGo給我們帶來了極大的震撼,但也不是不可戰勝的。我抱著必勝的信念而來,絕不會説人機大戰勝負無所謂這樣的話,我會全力以赴,爭取打破AlphaGo的不敗戰績!”4月10日,20歲的圍棋天才,被認為當今全球人類圍棋第一人的柯潔九段在新聞發布會上説。    

柯潔(右一)。

    4月10日,中國圍棋協會與浙江省體育局共同舉辦新聞發布會宣布,5月23日至27日將在烏鎮舉辦“中國烏鎮·圍棋峰會”。屆時AlphaGo將與中國頂尖棋手以及來自人工智能界的專家齊聚一堂,共同探索圍棋與人工智能背後的深遠奧秘。

    一年前,世人共同見證了人工智能領域的一個重大裏程碑: AlphaGo戰勝了傳奇圍棋選手李世石。

    事實上,人工智能的加入並沒有像一些人所擔心的那樣使這項遊戲式微,反而讓人類棋手變得更加強大而富有創造力。盡管圍棋可能是歷史上被研究、推敲得最為透徹的一項遊戲,許多職業棋手以及業余愛好者仍然是通過對AlphaGo創新著法的深入研究,學到了嶄新的知識和策略。

    “AlphaGo下棋讓人感覺更自由一些,沒有什麼著法是完全不能下的。現在大家都更多地在嘗試以前沒有下過的一些下法。”周睿羊九段曾表示。

    圖為:柯潔(最右)與聶衛平(右二),樊麾(站立者)和古力(最左)于去年在北京聶衛平圍棋道場,憑記憶復盤 AlphaGo與李世石第一局的開局。

    此次“中國烏鎮·圍棋峰會”旨在通過頂尖人類棋手與極具創造性的人工智能對手之間的合作,使人們得到關于圍棋和人工智能的更多新啟示。

    據主辦方介紹,此次峰會特別設計了AlphaGo與中國頂尖棋手的三種比賽形式,具體包括:首先,人機配對賽:中國職業棋手將與另一名職業棋手對弈。每一方棋手都將有AlphaGo作為自己的隊友與他們交替落子,真正體現共同學習的真諦。

    其次,團隊賽:由五位中國頂尖棋手組隊與 AlphaGo進行對弈,共同測試 AlphaGo在面對組合風格時所展現的創造力和適應性。

    第三,柯潔對陣 AlphaGo:AlphaGo 與世界排名第一的棋手柯潔進行的三番棋對弈將成為萬眾所矚目的焦點。柯潔會將 AlphaGo的能力推向甚至超越極限。

    柯潔是金立智能手機的品牌文化大使。金立認為,圍棋,並不在于計較一子一目的得失,更需要放眼全局的取舍和戰略,是一種長距離的“超級續航”般的較量。圍棋表達了一種靜默的思考,充滿了寵辱不驚的氣度,是人類智慧的傑作。圍棋人工智能的最高水平與人類最高水平之間的對決,比賽本身的意義就已非同凡響。人工智能代表著科技的未來,也是人類的未來,人機之戰,是人類智慧的延伸,是人類對極限、對未來的一次勇敢探索。金立支持柯潔勇戰AlphaGo。

    除動人心魄的比賽之外,峰會還將舉辦一場有關人工智能未來的論壇。來自人工智能的頂尖專家將共同探索AlphaGo如何為圍棋這項古老的遊戲帶來了全新的認知,並進一步探討人工智能與機器學習是如何幫助人類為世界上一些重大難題帶來解決方案。

    據介紹,AlphaGo背後的部分機器學習方法已經被應用到實際生活中,並在一些重大問題中發揮了作用,比如減少能源使用。機器學習技術也已經開始應用于一係列醫療研究項目中。

    延伸閱讀

    AlphaGo是什麼?

    AlphaGo 是第一個擊敗人類職業圍棋選手、第一個戰勝世界冠軍的電子計算機程序,是圍棋史上最具實力的選手之一。2016 年 3 月,在全世界超過一億觀眾的關注下,AlphaGo經過5局對弈,最終以 4 比 1 的總比分戰勝了圍棋世界冠軍李世石,這場比賽成為了人工智能領域的一個重要裏程碑。過去曾有專家預測,人工智能需要十年的時間才可能戰勝人類職業選手,在這場比賽後,AlphaGo憑借其“充滿創意而又機智”的下法,躋身圍棋界最高職業稱號——職業九段行列,成為歷史上首個獲得這一榮譽的非人類棋手。 近期,AlphaGo的升級版本以"Master / Magister"的稱謂與世界頂級的圍棋選手進行了60場線上快棋賽,並取得了全勝的出色戰績。

    AlphaGo如何訓練?

    一直以來,圍棋就被認為是傳統遊戲中,對人工智能而言最具挑戰性的項目。這不僅是因為圍棋包含了龐大的搜索空間,更是因為對于落子位置的評估難度已遠遠超過了簡單的啟發式算法。 為應對圍棋的復雜性,AlphaGo採用了一種新穎的機器學習技術,結合了監督學習和強化學習的優勢。通過訓練形成一個策略網絡(policy network),將棋盤上的局勢作為輸入信息,並對所有可行的落子位置生成一個概率分布。然後,訓練出一個價值網絡(value network)對自我對弈進行預測,以 -1(對手的絕對勝利)到1(AlphaGo的絕對勝利)的標準,預測所有可行落子位置的結果。這兩個網絡自身都十分強大,而 AlphaGo將這兩種網絡整合進基于概率的蒙特卡羅樹搜索(MCTS)中,實現了它真正的優勢。最後,新版的AlphaGo 産生大量自我對弈棋局,為下一代版本提供了訓練數據,此過程循環往復。

    AlphaGo 如何決定落子?

    在獲取棋局信息後,AlphaGo 會根據策略網絡(policy network)探索哪個位置同時具備高潛在價值和高可能性,進而決定最佳落子位置。在分配的搜索時間結束時,模擬過程中被係統最頻繁考察的位置將成為 AlphaGo 的最終選擇。在經過先期的全盤探索和過程中對最佳落子的不斷揣摩後,AlphaGo的搜索算法就能在其計算能力之上加入近似人類的直覺判斷。

+1
【糾錯】 責任編輯: 冉曉寧
新聞評論
    加載更多
    建設一支強大的現代化新型陸軍——陸軍官兵奮力開新圖強、矢志強軍興軍綜述
    建設一支強大的現代化新型陸軍——陸軍官兵奮力開新圖強、矢志強軍興軍綜述
    十裏桃花相映紅 萬戶桃農甩窮帽
    十裏桃花相映紅 萬戶桃農甩窮帽
    埃及亞歷山大舉行教堂爆炸襲擊遇難者葬禮
    埃及亞歷山大舉行教堂爆炸襲擊遇難者葬禮
    亞乒聯換屆選舉 蔡振華再度連任
    亞乒聯換屆選舉 蔡振華再度連任
    010020010010000000000000011101201120788805