【PConline 资讯】作为 AlphaGo 的继任者,DeepMind 在 11 月 6 日发表的《科学》(Science)论文中介绍了 AlphaZero 。作为谷歌母公司 Alphabet 旗下的英国人工智能子公司,DeepMind 多年来一直致力于改进 Go AI 。2017 年的时候,前 AI 围棋冠军 AlphaGo 正式退休,之后AlphaZero成为继任者。 AlphaZero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台。在三款棋类比赛中,AlphaZero获得三局全胜的结果 。 Stockfish:国际象棋 AI 世界冠军;elmo:2017 年度世界计算机将棋锦标赛冠军;AlphaGo:战胜柯洁的AI高手。 在仅获知有关游戏基本规则的情况下,AlphaZero 在成为人工智能大师之前会先自己机型数百万场的对抗练习。该 AI 初期会实施随机战术来取得胜利,但后续会通过‘强化学习’来试错,以逐步了解哪些策略是最有效的。实测国际象棋需要 9 小时、将棋 12 小时、围棋 13 天,涉及 5000 个张量处理单元(TPU)。 这么说可能不太能量化理解,可以参考一下一套 TPU 每天可以处理超过 Google Photos 中的 1 亿+照片,所以 AlphaZero 对硬件的性能的要求还是相当高的。 |