江溪中文 > 重生之AI教父 > 第150章 151. 狗之原理

      第150章 151. 狗之原理

          這里主要是因為孟繁岐的輕量級網絡,節約了大量計算資源給搜索方法那邊。

          前面說到,一個19x19的矩陣可以用來表示棋盤上所有的落子地點,而每個地點的取值就只有三種狀態,黑,白,無子。

          可以用[-1,0,1]三個數字來指代。

          但單獨只使用一個這樣的矩陣是不夠的。

          還需要其他相同形狀的矩陣來表達其他常用的判斷信息,比如棋子的“氣”。

          在阿爾法狗中,這里采用了48個[19x19]的矩陣輸入,這讓本身對棋了解不大夠的孟繁岐大開眼界。

          “目前階段,我們就是使用海量的落子數據,不斷讓網絡逼近人類的落子位置。可以說,這一版本的阿爾法狗只是先得到了一個模仿人類模仿得非常好的模型。”

          “單獨只是這個策略網絡的話,棋力大概elo評分在2000左右,還有很大的不足。”

          孟繁岐微微點頭,第一流棋手的棋力大約在elo評分3600左右。

          2000分確實還差得遠,戰鷹此時的初段水平大概是在2500-2600左右。

          這版本的阿爾法狗主要是策略網絡+走子驗算,兩者結合之下,將分數從2000提高到了與戰鷹相若的水平。

          這個所謂的策略網絡,其實和孟繁岐最初參加競賽的圖像分類十分相似,原理都差不多。

          讓孟繁岐走上世界舞臺的IMAGENET千分類圖像競賽,需要網絡判斷,給定的圖像是1000個中的哪一個類別。

          也就是說,網絡會返回一個長度為1000的數組,告訴你每一個對應類別的概率是多少,這1000個概率加起來就是百分之一百。

          而這個策略網絡,其實也可以看做是19x19,也就是361分類問題。

          每一類,意味著在對應的點上下棋的概率。

          當然了,圍棋不比普通圖像分類,棋盤上哪里可以落子哪里不可以,還有一定的講究。

          先不說氣還是什么其他的,至少原本有子的地方,你不可以繼續去落。