此次AlphaGo戰勝的是歐洲圍棋冠軍樊麾(法國國家圍棋隊總教練),AlphaGo以5-0完勝。但AlphaGo真正的挑戰是2個月后,與韓國圍棋九段高手李世石的對弈。而樊麾雖為歐洲圍棋冠軍,但實際上也僅為二段水平。高手與頂級高手之前也存在很大差距,不知道在AlphaGo與李世石之間,隔了多少個樊麾。此前圍棋軟件ZEN、Crazystone都戰勝過九段圍棋高手,不過都是在對方讓子的前提下。
樊麾與AlphaGo的對弈棋譜,黑方為樊麾,白方為AlphaGo
圍棋到底有多難?在19×19的棋盤內,共有361個點,就機器學習的角度而言,圍棋的計算最大有3361次方種局面,大致的體量是10170,而已經觀測到的宇宙中,原子的數量才1080。而相較之下,國際象棋每一步平均只有35種可能性的走法,最多只有2155種局面。
如此大的計算量無疑是對人工智能的一大挑戰,但實際上,人工智能是與人類一樣,通過不斷模仿而戰勝對手的。一個圍棋愛好者向雷鋒網記者表示,人工智能其實是一個模仿高手,通過記住大量高手在以往對弈中的棋譜,并不斷練習,從而研究出新的招數。
“圍棋2500年,積累了很多棋譜,棋譜除了對開局定式的研究,然后就是很多高手實戰中下出比較有借鑒意義的棋局。計算機能夠記住3000萬步棋譜(谷歌這個就是先用這些來訓練的),人類是記不住的,很多時候,要依靠現場的純腦計算。就像職業棋手懂得對現有棋譜進行拆解一樣,拆解過程研究出新的變化,因為有時棋譜象征著某一個招數達到最優,因為是當時最厲害那個人下出來的,但后人總可以超越,谷歌這個特點就在于能夠在棋譜訓練中計算出新的變化(走法),否則充其量只能和人類打平手的水平。”
除了需要記住大量棋譜,人工智能還需要一個高手來讓自己不斷提高。ZEN早年就拉上日本一流高手,九段棋手武宮正樹作為陪練,2012年3月,在武宮正樹讓五子和四子的前提下,ZEN連勝兩盤。武宮正樹“宇宙流”式下棋特點,也被ZEN很好地模仿了去。因此,AlphaGo如果想戰勝李世石,最快的方式是找到一個同水平的高手作為陪練,最好是熟悉李世石下棋特點的人。因為,留給它的時間已經不多了。
李世石
對于人類來說,因天分和后天努力程度,每個人提升速度會不一樣,有人20歲就能躋身世界冠軍,有人窮盡一生也入不了高手榜。但無論如何,在很多人眼里,圍棋并非一蹴而就。就比如最近引起輿論嘩然的“真瘋叔叔”的“六天速成法”,宣稱可以讓成年人在六天之內,圍棋水平從零基礎提高到業余1段,不過回應他的,是來自圍棋界的各種嘲笑。
六天從零基礎提高到業余1段,如果放在人工智能身上,或許有這個可能。不過想要從職業二段挑戰職業九段,贏得可能性并不大。圍棋作為起源于中國的博弈游戲,在亞洲的流行更加廣泛,在歐美等地區,圍棋的普及度還較低,這也就是為什么會出現一個二段棋手成為歐洲冠軍。在這種情況下,AlphaGo很難遇到一個頂級高手,也就妄論戰勝頂級高手了。
不過,圍棋的復雜度與挑戰難度,令其成為人工智能最想攻克的難題。一個多月前,DeepMind的CEO Demis Hassabis在一個視頻采訪中透露,他們的秘密團隊可能將破解圍棋。Hassabis在談到這個可能時表現得很興奮,因為在他看來這是個了不起的挑戰。“它不像國際圍棋那樣需要蠻力,它實際上是漂亮的,有規律可循,有形狀可追的,而這些通常是計算機不擅長的,因此它非常了不起。”
除了谷歌,Facebook也在進行AI攻克圍棋的測試。就在《Nature》報道了AlphaGo戰勝樊麾的前一天,Facebook也在arXiv.org上更新了一篇用卷積神經網絡和蒙特卡洛樹搜索相結合來解決圍棋問題的新論文。Facebook人工智能實驗室負責人Yann LeCun在論文中表示,作為一項非常困難的任務,圍棋是一個很好的案例來驗證各種學習技能的結合,包括模式識別、問題解決和規劃等,也是一個可以用來測試新想法的工具,包括機器學習、推理和規劃的結合。因此,戰勝圍棋高手,不僅僅是一場游戲,更重要的是人工智能的突破。而人工智能對于人類的影響,將是無限可能的。
從國際象棋的經驗看,1997 年人工智能第一次打敗人類后,直到2006年,人工智能在人類這里再無對手。而人工智能想要在圍棋上完全戰勝人類,還需要不斷地練習。至少這次,贏得可能性很小。