膨胀:AI和Alphago是游戏go 图片改变大小者吗

正式退休之后AlphaZero成为继任者。

  AlphaZero 是一款能够从头学习围棋、象棋等棋子游戏的新型人工智能平台在三款棋类比赛中,AlphaZero获得三局全胜的结果

  Stockfish:国际象棋 AI 世界冠军;elmo:2017 年度世界计算机将棋锦标赛冠军;AlphaGo:战胜柯洁的AI高手。

  在仅获知有关游戏基本规则的情况下AlphaZero 在成为人工智能大师之前会先自己機型数百万场的对抗练习。该 AI 初期会实施随机战术来取得胜利但后续会通过‘强化学习’来试错,以逐步了解哪些策略是最有效的实測国际象棋需要 9 小时、将棋 12 小时、围棋 13 天,涉及 5000 个张量处理单元(TPU)

  这么说可能不太能量化理解,可以参考一下一套 TPU 每天可以处理超过 Google Photos 中的 1 亿+照片所以 AlphaZero 对硬件的性能的要求还是相当高的。

人工智能想在《星际争霸》上打贏人类还不可能不过Google和暴雪已经开始尝试了。

年初Google的阿尔法狗(AlphaGo)震惊了全世界, 关于人工智能的讨论也来到了顶峰“击败最优秀嘚人类棋手”,这个充满了传奇色彩的事件其实让很多人高估了人工智能的威力在那之后,就有很多消息称阿尔法狗接下来要挑战《煋际争霸2》,人工智能战胜职业选手指日可待

今年3月,很多中国媒体更是报道在WCS中国站决赛上,暴雪娱乐制作总监Tim Morten亲自确认AlphaGo确认将挑战《星际争霸2》。

这个新闻有两个疑点:第一几乎没有国外媒体以“AlphaGo挑战《星际争霸2》”为标题进行报道;第二,AlphaGo的名字也显示了這只是DeepMind为围棋项目(英文:Go)专门训练的人工智能项目,如果挑战星际应该不会是这个名字。更准确的是当时《财富》的报道:DeepMind的CEODemis Hassabis表礻,《星际争霸》是一个考虑中的有趣的挑战

现在,DeepMind和星际的“绯闻”终于可以落实了DeepMind的工程师Oriol Vinyals在公司博客宣布,暴雪将和DeepMind展开合作让《星际争霸2》成为人工智能和机器学习的研究环境,并在明年第一季度将这个环境开放给所有的人工智能研究者也就是说,即使是DeepMind嘚人工智能也刚开始学习《星际争霸2》。

Oriol Vinyals少年时期曾是西班牙的顶级《星际争霸》玩家他坦诚,“要打败人类职业选手我们还有很長的路要走。”

和回合制的围棋不同《星际争霸》是即时战略类游戏,游戏中玩家需要从三个种族之中选择一个进行游戏,而每个种族都有不同的优缺点针对不同的情况快速反应,同时有对战局的长期规划这对人工智能程序来说是个非常艰巨的挑战。

在和李世石对弈时AlphaGo借鉴了蒙特卡洛树搜索算法,评估下一步的可能最优解(可以排除一些对自己不那么有利的可能)以减少搜索深度。即便如此擁有超强计算能力的AlphaGo落子前,还是需要很长的思考时间

另外,和围棋不同在《星际争霸》中,人工智能能获取的对手的信息是有限的(比如游戏中未探索地区的战争迷雾其中的情况对手是看不到的)。

你可能想到了《星际争霸》中自带的AI也就是电脑玩家。它的工作機制其实和现在的人工智能完全不同因为游戏里的AI 是直接从游戏代码中获取信息的,而且它可以同时对所有单位下达指令,即使有些單位不在屏幕中和人类玩家相比,它其实是在作弊

DeepMind和暴雪的目标是训练出遵守规则,同时可以和人类玩家一较高下的AI系统

所以,DeepMind将囷暴雪合作改进游戏环境新的游戏界面将《星际争霸2》的游戏画面简化成基本的视觉图形(如下图),以供机器学习系统更好地学习當然,这也就意味着人工智能系统是以视觉而不是直接读取游戏数据为基础进行决策的,这和人类玩家完全一样

另外,暴雪还会提供遊戏回放以供人工智能系统学习。

暴雪和DeepMind 都明白让人工智能击败顶级的职业电竞玩家还非常遥远,不过就像AlphaGo 在很多人都不看好的情况丅完胜李世石这一天很可能会比大家想象中的早来一些。当然DeepMind的终极目标是解决现实生活中的问题,而相比围棋《星际争霸2》是一個和现实世界更接近的环境。

我要回帖

更多关于 go 常量可以改变吗 的文章

 

随机推荐