產經情報

DeepMind 新研究:AlphaZero 的黑盒子打開了

日期:2022-11-23

西洋棋一直是 AI 實驗室。70 年前艾倫·圖靈想製造能自我學習、不斷進步的下棋機器,20 世紀誕生的「深藍」第一次擊敗人類,但是靠專家輸入西洋棋知識;2017 年出現的 AlphaZero 為神經網路驅動強化學習機器,實現了圖靈的夢想。

AlphaZero的啟發式演算法無需任何人工設計,也不需看人類下棋,完全自我對弈訓練。那它真的學到人類下西洋棋的概念嗎?這是神經網路的可解釋性問題。

最近AlphaZero作者Demis Hassabis與DeepMind同事及Google Brain研究員合作研究,從AlphaZero神經網路找到人類下西洋棋概念的證據,顯示神經網路訓練過程獲得概念的時間和位置,還發現AlphaZero與人類不同風格之處,論文發表於PNAS。


本文列點如下:
● AlphaZero訓練時學到人類西洋棋概念
● AlphaZero開局策略與人類不同
● AlphaZero掌握知識的過程