?
圍棋變化無(wú)窮
Google DeepMind 實(shí)驗(yàn)室的 AlphaGo 把歐洲圍棋冠軍樊麾干翻了,這條新聞都看過(guò)了吧,這里咱聊點(diǎn)兒不太一樣的東西。
首先,要說(shuō)說(shuō)圍棋是個(gè)什么游戲。規(guī)則很簡(jiǎn)單,一人拿黑子一人拿白子,在棋盤 361 個(gè)交叉點(diǎn)上輪流下子,落子不得移動(dòng)。一個(gè)點(diǎn)周圍的四個(gè)點(diǎn)都是“氣”,子周圍沒(méi)氣就死了,死棋則被拿走。在棋盤 361 個(gè)點(diǎn)下滿后,數(shù)數(shù)誰(shuí)地盤大,誰(shuí)就贏了??梢哉f(shuō),圍棋是一個(gè)“圈地游戲”。
最簡(jiǎn)單的規(guī)則,最復(fù)雜的變化。
為什么這么重要呢?因?yàn)槭菣C(jī)器第一次在這項(xiàng)競(jìng)技游戲上勝過(guò)人類。雖然 1997 年超級(jí)計(jì)算機(jī)“深藍(lán)”戰(zhàn)勝了國(guó)際象棋世界冠軍卡斯帕羅夫,但圍棋一直被認(rèn)為是人工智能難以攻克的題目。
2013 年,日本電圣戰(zhàn)上,電腦圍棋 CrazyStone 打敗了石田芳夫九段(石田讓四子)。石田賽后評(píng)論 CrazyStone:“大約與業(yè)余六段水平相當(dāng)……天才?。 边@次比賽算是電腦圍棋的一次小突破,但由于有讓子,算不上是真正的勝利。
在“通關(guān)”國(guó)際象棋之后,圍棋不可避免地成為了人工智能科學(xué)家要攀登的下一座山峰。不過(guò)許多媒體以及職業(yè)選手對(duì)此并不太在意,認(rèn)為計(jì)算機(jī)擊敗人類圍棋手幾乎是不可能的任務(wù)。許多媒體都曾發(fā)出如是論斷:
計(jì)算機(jī)要在圍棋上戰(zhàn)勝人類,再等100年吧!
接下來(lái)要說(shuō)點(diǎn)復(fù)雜的東西
圍棋到底復(fù)雜在哪里?
參照維基百科上“游戲復(fù)雜度”詞條,可以通過(guò)兩種方式衡量棋類游戲的復(fù)雜性,一是狀態(tài)空間復(fù)雜度,二是博弈樹(shù)復(fù)雜度。
狀態(tài)空間復(fù)雜度:圍棋是 10 的 172 次方,中國(guó)象棋、國(guó)際象棋分別是 10 的 48 次方、46 次方。
博弈樹(shù)復(fù)雜度:圍棋是 10 的 300 次方,中國(guó)象棋、國(guó)際象棋分別是 10 的 150 次方、10 的 123 次方。
不多花篇幅解釋兩個(gè)名詞的內(nèi)涵,光看數(shù)字大小就知道圍棋的變數(shù)遠(yuǎn)遠(yuǎn)多于象棋,但這還不足以說(shuō)明圍棋的復(fù)雜性。Facebook 智能圍棋負(fù)責(zé)人田淵棟在知乎上有此一說(shuō):
單單拿游戲的狀態(tài)個(gè)數(shù)去比較它們的難度是不準(zhǔn)確的。有很多狀態(tài)空間廣闊但是易解的例子。讓計(jì)算機(jī)投籃,出手的方向,速度,籃球的旋轉(zhuǎn),每個(gè)變量都是連續(xù)因而有無(wú)限可能,但是計(jì)算機(jī)試幾次之后很快就能找到最優(yōu)解……
圍棋難的地方在于它的估值函數(shù)非常不平滑,差一個(gè)子盤面就可能天翻地覆,同時(shí)狀態(tài)空間大,也沒(méi)有全局的結(jié)構(gòu)。這兩點(diǎn)加起來(lái),迫使目前計(jì)算機(jī)只能用窮舉法并且因此進(jìn)展緩慢。
圍棋本已復(fù)雜,計(jì)算機(jī)更是要將圍棋轉(zhuǎn)化為 0、1,再窮舉出所有可能的狀態(tài),最后進(jìn)行決策——這項(xiàng)工作極為繁重。本次機(jī)器勝利意味著人們?yōu)檫@項(xiàng)工作找到了一個(gè)相對(duì)簡(jiǎn)單的解決方案,但仍說(shuō)不上是質(zhì)的突破。據(jù)愛(ài)范兒 CTO 何世友介紹,人工智能可以在三種情況下完爆人類棋手:
計(jì)算機(jī)性能無(wú)限強(qiáng)大,窮舉之;
計(jì)算機(jī)窮舉效率提高,高效窮舉之(如神經(jīng)網(wǎng)絡(luò));
新型計(jì)算機(jī)出現(xiàn)(如量子計(jì)算機(jī))。
目前 Google 的 AlphaGo 正處在第二階段。另外世友還指出,不必過(guò)分解讀這次勝利——
人類處理 123+321=444 只需要三次運(yùn)算,而計(jì)算機(jī) CPU 需要進(jìn)行上百次運(yùn)算才能得出同樣的結(jié)果?,F(xiàn)在人工智能戰(zhàn)勝了人類棋手,是策略優(yōu)化和硬件運(yùn)算速度提高共同作用的結(jié)果,換句話說(shuō),是人類戰(zhàn)勝了人類。與其惶惶論機(jī)器將征服人類,不如說(shuō)得益于計(jì)算機(jī)的幫助,人類的諸多智慧能夠更快得到驗(yàn)證,這對(duì)人類文明進(jìn)步的提速將不可估量。20 世紀(jì)中葉以來(lái),在計(jì)算機(jī)的幫助下數(shù)學(xué)家們解決了三大數(shù)學(xué)猜想之一的四色問(wèn)題以及克卜勒猜想,這便是最好的佐證。
深度學(xué)習(xí)只是機(jī)器學(xué)習(xí)領(lǐng)域的一個(gè)分支。有趣的是,從近年機(jī)器學(xué)習(xí)領(lǐng)域的發(fā)展來(lái)看,似乎深度學(xué)習(xí)已經(jīng)統(tǒng)治了這個(gè)領(lǐng)域。這是一瓶好的萬(wàn)精油。有意入機(jī)器學(xué)習(xí)坑的同學(xué)們趕快上,不要放過(guò)它。
·凡注明來(lái)源為“??诰W(wǎng)”的所有文字、圖片、音視頻、美術(shù)設(shè)計(jì)等作品,版權(quán)均屬??诰W(wǎng)所有。未經(jīng)本網(wǎng)書面授權(quán),不得進(jìn)行一切形式的下載、轉(zhuǎn)載或建立鏡像。
·凡注明為其它來(lái)源的信息,均轉(zhuǎn)載自其它媒體,轉(zhuǎn)載目的在于傳遞更多信息,并不代表本網(wǎng)贊同其觀點(diǎn)和對(duì)其真實(shí)性負(fù)責(zé)。
網(wǎng)絡(luò)內(nèi)容從業(yè)人員違法違規(guī)行為舉報(bào)郵箱:jb66822333@126.com