近日谷歌旗下人工智能公司 DeepMind 发布了一篇新论文,它讲述了团队若何应用 AlphaGo 的机械进修零碎,构建了新的项目 AlphaZero。AlphaZero 运用了名为「强化进修」(reinforcement learning)的 AI 手艺,它只运用了根本划定规矩,没有人的经历,从零开端练习,横扫了棋类游戏 AI。
AlphaZero 起首降服了围棋,又完爆其他棋类游戏:相反前提下,该零碎经由 8 个小时的练习,打败了第一个击败人类的 AI――李世石版 AlphaGo;经由 4 个小时的练习,打败了此前最强国际象棋 AI Stockfish,2 个小时打败了最强将棋(又称日本象棋)AI Elmo。连最强围棋 AlphaGo 也未能幸免,练习 34 个小时的 AlphaZero 胜过了练习 72 小时的 AlphaGo Zero。
现在我们就把10局AlphaZero 战胜 Stockfish的对局整理成动态谱,让大家可以研究一下AlphaZero到底强在哪里?
这10局棋中,AlphaZero执白8局,执黑2局全部获胜,在所有对局的100盘棋中,AlphaZero执白25胜25和,AphaZero执黑3胜47和,无一败绩!