现在的位置: 首页资讯>正文
AlphaGo Zero——数据为王,离真正的AI还远
2017年11月10日 作者: 暂无评论 186+ 0

前言

AlphaGo Zero [1]提出了新的估算搜索评价函数的方法,即基于蒙特卡洛树搜索的强化学习;部分地解决了超大状态空间搜索的难点;成功地应用到围棋领域并完胜了人类;证明了强化学习的有效性,是人工智能史上一座里程碑。其学术贡献中上,学术意义上,社会影响上上。

AlphaGo Zero虽然不是开创性工作,但它所提出的方法很好地结合了已有的两种重要方法。对于类围棋智力游戏,AlphaGo Zero是一个重要的结论性工作。但故事并没有完全结束,因为围棋的必胜策略还没找到。对于能转化成搜索问题的人工智能领域和难点,AlphaGo Zero有很大的用武之地,但这需要研究者们的艰辛努力。而对于人工智能其他领域和难点,或许能触类旁通。但至少目前,AlphaGo Zero并不能提供直接帮助。

对AlphaGo Zero的评价,既没有必要贬低,也不用神化。本着实事求是的精神,还原其真实面貌。更重要的是,期望AlphaGo Zero取得的成功能鼓励同侪做出更好的工作,从而进一步推动人工智能发展。

AlphaGo Zero的意义

AlphaGo Zero的成功意味着什么?我们从学术贡献、学术意义和社会影响三个方面来谈谈。

从学术贡献的角度,虽然AlphaGo Zero是一个里程碑式的工作,但不应该对其过分神化。前文已经论述,AlphaGo Zero的主要学术贡献是提出了新的估算评价函数的方法,即基于蒙特卡洛树搜索的强化学习方法。该方法是把已有的两种方法,即蒙特卡洛树搜索[2]和强化学习[3, 4],融合到了一起,在围棋领域取得了很好的效果。所以,AlphaGo Zero在人工智能学术界不算最顶级的开创性工作。

AlphaGo Zero更重要的,是其学术意义。首先,AlphaGo Zero某种程度上攻克了围棋领域。至此,可以论断,机器下围棋可以完胜人类。由于围棋难度在同类智力游戏中居首,由此推论,在同类智力游戏中,机器可以战胜人类。

另外,AlphaGo Zero也再次验证了深度学习的有效性。深度学习给人工智能带来了革命性的变革,使人工智能整体水准有了质的飞跃,并能真正应用到不同的领域,取得商业上的成功。AlphaGo Zero001

►图1 AlphaGo Zero学习过程,图片来源:Deepmind

更值得称道的是,AlphaGo Zero摒弃了有监督学习,仅使用强化学习就达到了很好的效果,而且发现了以前没有被人类所有选手发现的知识。因此,AlphaGo Zero在围棋这个领域,解决了困扰机器学习的两个最重要的问题,数据的来源以及数据的质量。如果这种方法能够推广到其他领域,那AlphaGo Zero的学术意义就会更加巨大。

同时,由于没有用到人类先验知识和原始数据,AlphaGo Zero再次强调了算法的重要性。算法比数据重要一直是人工智能界的主流观点,但近年由于基于大数据的人工智能应用取得了重大的成功,“数据是王道”成为了一种新的潮流,某种程度上稍微忽略了对算法、原理以及理论的探索。AlphaGo Zero再次表明,算法、数据、原理和理论都很重要。

在上一段的论述中,笔者加了很多看似拗口的修饰词,如“某种程度上”、“围棋领域”、“同类智力游戏”、 “如果能够推广”等,而这些修饰词是有其深意的。 “某种程度上”意味着AlphaGo Zero并没有完全攻克围棋领域。完全攻克需要找到围棋的必胜策略(理论上一定存在)。战胜世界冠军和找到必胜策略之间存在相当大的距离,前者代表相对于人类 “更好”,而后者代表绝对意义上的“最佳”。就象西洋跳棋程序一样,Chinook 1994年战胜了人类世界冠军,2007年才找到必胜策略[5]。“围棋领域”、“同类智力游戏”意味着AlphaGo Zero能够应用的领域,虽然可能很广,但并不包括人工智能的全部。 “如果能够推广”意味着把AlphaGo Zero中的技术推广和应用到其他领域,并不是一个想当然的事情,需要人工智能研究者们付出相当大的努力。其根本原因在于其他领域的基本难点于环境和围棋有本质上的区别。AlphaGo Zero002

►图2 1992年,Chinook与Tinsley人机对战现场,图片来源:google

为何AlphaGo Zero取得了如此大的成功,而人工智能离总体成功却仍然遥远?这就要先从人工智能的原理说起。

自人工智能出现以来,人们对于智能本质是否可描述、可用数学刻画就有不同的观点。观点的分歧导致了两种截然不同的人工智能发展思路,即强人工智能和弱人工智能。前者强调需要弄清楚智能原理,而后者不管三七二十一,只要造出来的机器能够体现某种智能行为即可,比如下棋、驾驶、高考、翻译、玩游戏等。在弱人工智能中,又可以分为通用和专用。通用是指要让造出的机器体现通用的智能,既可以用来下棋、又可以用来驾驶、高考、翻译和玩游戏;而专用是指对每一种不同的智能行为,打造专用的机器,如程序A用来下棋,程序B用来驾驶等等。当前的人工智能进展,主要在专用弱人工智能上,通用弱人工智能和强人工智能几乎没有革命性的突破。AlphaGo Zero003

►图3 人工智能在翻译软件中的应用,图片来源:google

AlphaGo Zero再次为专用弱人工智能添砖加瓦,而且是最亮丽的一片琉璃瓦之一。AlphaGo Zero对通用人工智能和强人工智能可能会有些启发,但至少目前并不明朗。但话说回来,从应用角度,专用弱人工智能已经非常强大非常重要,因为很多人类的工作就是在某种特定的场景下做特定的事情。

除了智能原理之外,再深入一点,人工智能可以细分为很多困难点,我试图用九点来大致概括,插入与AlphaGo Zero战胜人类的的围棋问题作对比,供大家了解。

第一,建模。很多人工智能问题,连一个完整的数学模型都很难建立。例如玩星际争霸游戏、高考、自然语言理解等,虽然很容易对其中的某一部分建立一个模型,但很难把整个模型完整地统一起来。而围棋的建模非常简单。

第二,如何处理复杂函数,特别是是嵌套分层的函数。在围棋中,作为数据的<输入,输出>对被定义得很清楚,输入就是棋盘状态而输出就是当前状态下的选择。但在很多开放问题上,函数的定义没那么清楚。比如机器人足球,传球这个行动,不仅有参数,本身不好定义,而且可以进一步细分成很多更加细粒度的行动,如抬脚、踢球等等,而这些行动又可以进一步细分。

  

文章分页: 1 2

相关文章

AI远不止会下棋这么简单,AI手机正在带来一场颠覆性革命
AI

日前,谷歌DeepMind发布了最终版围棋程序AlphaGo Zero,并以100:0的战绩击败了原来的AlphaGo。这场令人注目的对弈结果,见证了人工智能发展的里程碑式变革。一时间,AI的狂风被再次掀起。

中医也能人工智能——微医发布“华佗智能医生”
AI

11月15日,首届国际智能医疗大会今天在杭州国际博览中心举行。

华为Mate 10保时捷设计版炒到3万 溢价不仅仅全面屏
Mate 10

昨日华为Mate 10 Pro及华为Mate 10保时捷设计版本迎来首卖,两部手机均出现了供不应求的情况。

NVIDIA自造AI超级计算机:轻松进入世界前五
NVIDIA

全球超级计算机TOP500最新榜单近日公布,中国继续占据前两名,无论数量还是性能都全面超越美国,第一次实现双杀。但和中国不同的是,美国很多企业都在打造自己的超算,而且性能颇为不俗,比...

深度揭秘为啥人工智能不能替代人
AI

毫无疑问,人工智能将加速数字化转型的快速步伐,以前所未有的规模速度改变我们工作、生活。 人工智能对创造力和设计的影响是从事创造性专业人员的不得不考虑因素。

给我留言

您必须 [ 登录 ] 才能发表留言!