2017年10月19日星期四

不靠人類自學三天 新版Al擊敗Alpha Go

【明報專訊】2017-10-20

Google旗下的人工智能研究公司DeepMind宣布,他們開發出的人工智能(AI)程式AlphaGo最新版本Zero,可以毋須人類教導就可「由零開始」自學圍棋,3天就能戰勝舊版本AlphaGo。研究員稱,Zero不再受人類所限,能自創知識,標誌着邁向通用AI的重要里程碑。

舊版本AI需透過學習逾10萬個圍棋高手對局才能超越頂尖棋手,但最新版的AlphaGo Zero,則只要開發員輸入圍棋基本規則和空白棋盤數據就能自學。開發員利用新形式「強化學習」模式設計Zero,並結合尋找下一步棋的模擬搜索和神經網絡,以決定勝算最高的棋步。

AlphaGo Zero熟習逾千年棋法

Zero憑自我對局數以百萬次,從最初隨機在棋盤上放棋子,至後來發現致勝策略。Zero經過3天自我對局後,已能打敗在2015年擊敗韓國棋手李世石的舊版AlphaGO,且對局100次未失一局。經過40日練習後,Zero與今年5月擊敗過世界第一的中國棋手柯潔的新版AlphaGo對局,勝率已超過90%。DeepMind行政總裁哈薩比斯(Demis Hassabis)稱,Zero發現棋手逾千年來發展出的棋法,甚至研究出更好棋法。

AlphaGo首席研究員西爾弗(David Silver)稱,Zero不用人類輸入大量數據,不再受人類知識所限,可以自行創造知識。現時的AI只是為個別目的而研發出來,只負責單一用途,例如翻譯語言、臉部辨識等。但「通用AI」可以應用於不同種類工作,理論上可解決不同問題。哈薩比斯稱,Zero的設計並非只在下棋,修改程式可以應用到其他範疇,例如Zero目前亦正研究蛋白質摺疊(proteins fold)原理。

自創知識 可望助科研

AI突破是否將會在所有範疇取代人類?英國謝菲爾德大學電腦神經科學教授瓦西拉奇(Eleni Vasilaki)雖然對Zero的成果感到驚喜,但指AI不容易做到一些人們輕易完成的事,例如走路、跑步和踢球。

哈薩比斯亦承認,Zero只勝任於電腦可完整模擬的任務,駕駛汽車則難以做到。他預測未來10年,AI或可協助人類發現新藥物、新物質,研究量子化學和粒子物理等,以醫學和科研專家的身分跟人類共事。他說:「我們感到很興奮,因為我們即使距離開發全面的AI仍有很長距離,現在它應該可以對一些真實問題帶來顯著改變。」。

(BBC/The Verge/衛報/金融時報)

沒有留言:

發佈留言