宗教教育: 不靠人類自學三天新版Al擊敗Alpha Go

2017年10月19日星期四

不靠人類自學三天新版Al擊敗Alpha Go

【明報專訊】2017-10-20

Google旗下的人工智能研究公司DeepMind宣布，他們開發出的人工智能（AI）程式AlphaGo最新版本Zero，可以毋須人類教導就可「由零開始」自學圍棋，3天就能戰勝舊版本AlphaGo。研究員稱，Zero不再受人類所限，能自創知識，標誌着邁向通用AI的重要里程碑。

舊版本AI需透過學習逾10萬個圍棋高手對局才能超越頂尖棋手，但最新版的AlphaGo Zero，則只要開發員輸入圍棋基本規則和空白棋盤數據就能自學。開發員利用新形式「強化學習」模式設計Zero，並結合尋找下一步棋的模擬搜索和神經網絡，以決定勝算最高的棋步。

AlphaGo Zero熟習逾千年棋法

Zero憑自我對局數以百萬次，從最初隨機在棋盤上放棋子，至後來發現致勝策略。Zero經過3天自我對局後，已能打敗在2015年擊敗韓國棋手李世石的舊版AlphaGO，且對局100次未失一局。經過40日練習後，Zero與今年5月擊敗過世界第一的中國棋手柯潔的新版AlphaGo對局，勝率已超過90%。DeepMind行政總裁哈薩比斯（Demis Hassabis）稱，Zero發現棋手逾千年來發展出的棋法，甚至研究出更好棋法。

AlphaGo首席研究員西爾弗（David Silver）稱，Zero不用人類輸入大量數據，不再受人類知識所限，可以自行創造知識。現時的AI只是為個別目的而研發出來，只負責單一用途，例如翻譯語言、臉部辨識等。但「通用AI」可以應用於不同種類工作，理論上可解決不同問題。哈薩比斯稱，Zero的設計並非只在下棋，修改程式可以應用到其他範疇，例如Zero目前亦正研究蛋白質摺疊（proteins fold）原理。

自創知識可望助科研

AI突破是否將會在所有範疇取代人類？英國謝菲爾德大學電腦神經科學教授瓦西拉奇（Eleni Vasilaki）雖然對Zero的成果感到驚喜，但指AI不容易做到一些人們輕易完成的事，例如走路、跑步和踢球。

哈薩比斯亦承認，Zero只勝任於電腦可完整模擬的任務，駕駛汽車則難以做到。他預測未來10年，AI或可協助人類發現新藥物、新物質，研究量子化學和粒子物理等，以醫學和科研專家的身分跟人類共事。他說：「我們感到很興奮，因為我們即使距離開發全面的AI仍有很長距離，現在它應該可以對一些真實問題帶來顯著改變。」。

（BBC/The Verge/衛報/金融時報）

宗教教育

2017年10月19日星期四

不靠人類自學三天新版Al擊敗Alpha Go

沒有留言:

發佈留言

網誌封存

2017年10月19日星期四

不靠人類自學三天 新版Al擊敗Alpha Go

沒有留言:

發佈留言

不靠人類自學三天新版Al擊敗Alpha Go