從深藍到阿爾法狗 人機大戰20年進化了什么?
2016-03-12 16:41:18 it168俄羅斯國際象棋世界冠軍弗拉基米爾?克拉姆尼曾說過:“相信我,敗給電腦的痛苦感覺,相當于敗給同行的兩倍。” 不想求李世石現在的心理陰影面積,因為很認同谷歌董事長施密特在賽前說過的一句話,“輸贏都是人類的勝利!因為正是人類的努力才讓人工智能有了現在的突破。”
雖然3:0的結果會讓很多期待李世石扳回一城的人黯然神傷,更有可能會讓“機器人威脅論”再次甚囂塵上。但是作為剛剛加入人機大戰俱樂部的新成員來說,AlphaGo交上的這份答卷可以說是完美。
從“算”到“學”,人工智能的進化
1997年,IBM的“深藍”戰勝了卡斯帕羅夫。在“深藍”設計者許峰雄看來,“深藍”主要依靠強大的計算能力窮舉所有路數來選擇最佳策略:“深藍”靠硬算可以預判12步,卡斯帕羅夫可以預判10步。
2006年,超級計算機浪潮天梭與中國象棋特級大師許銀川的較量最終以平局收場,然而許銀川在賽后感慨道:“整個比賽感覺很吃力,因為電腦一步可以算16個變化,而我只能憑借經驗和理解與它對抗。而跟我下棋的對手不是真人,這讓我感覺很寂寞,我想我還是習慣和有表情交流的真人對弈。”
憑借超越特級大師對后續變化的計算能力,人工智能在此前的多場棋類人機大戰中占據上風。但在圍棋,人工智能始終無法戰勝人類高手。為什么?
因此,要想在圍棋上戰勝人類頂尖棋手,必須先要讓電腦學會像人一樣思考。為此,谷歌為AlphaGo設計了兩個神經網絡:“決策網絡”(policy network)負責選擇下一步走法, “值網絡”(value network)則預測比賽勝利方,用人類圍棋高手的三千萬步圍棋走法訓練神經網絡。與此同時,AlphaGo也自行研究新戰略,在它的神經網絡之間運行了數千局圍棋,利用反復試驗調整連接點,完成了大量研究工作。
而這種超強的學習能力,正是AlphaGo在戰勝職業二段樊麾5個月之后,就可以挑戰人類頂尖棋手并“戰而勝之”的關鍵所在。
如果說20年前的超級計算機還在依靠窮舉這種有些粗暴的手段才能戰勝人類,那么今天AlphaGo在與職業棋手的兩場對弈中,所表現出來智慧和超強學習能力則更加讓人驚嘆。
AlphaGo的連續勝利讓人更加確信,深度學習確實是當下最有希望實現人工智能的技術。深度學習的概念源于人工神經網絡的研究,其動機在于建立、模擬人腦進行分析學習的神經網絡,讓機器能夠像人一樣思考。
從本質上來說,深度學習是一項“大數據工程”,需要通過建立有效的學習模型,讓機器從數以百萬計的圖像、聲音和文本數據中,自行總結出某種特定事物的特征,從而實現自主學習。
因此,實現機器像人一樣思考的一個關鍵前提是,需要有計算速度可以媲美人腦的高性能計算集群,來快速完成海量數據的“學習”。據說,AlphaGo的“單機版”性能至少是當年“深藍”的1000倍。
與AlphaGo和李世石之間的最終勝負無關,這場人機大戰的重要意義在于:有更多人愿意相信深度學習代表著人工智能未來之路,而這也勢必會讓本已“大紅”的深度學習變成“大紫”。