下完围棋打星际 为什么DeepMind的AI机器人那么爱玩

2024-12-14 12:58:34
推荐回答(1个)
回答1:

Google DeepMind 团队在最新一期《Nature》上发表论文称,其名为 “阿尔法围棋”(AlphaGo)的人工智能,在没有任何让子的情况下以 5:0 完胜欧洲冠军、职业围棋二段樊麾。
在计算机的发展史,在国际象棋比赛中,计算机战胜人类是重要历史事件,过去了这么多年,人工智能战胜围棋冠军又怎么说明谷歌AI很牛呢?
围棋,一直被认为是人类仍然在机器面前能保持优势的游戏之一。过去20多年来,科技家们一直在试着教会电脑下棋,在1997年,IBM的深蓝曾经打败了国际象棋的世界冠军Garry Kasparov,这成为了人工智能的一座里程碑事件。但是,围棋比国际象棋还是要复杂得多,国际象棋中,平均每回合有35种可能,一盘棋可以有80回合;相比之下,围棋每回合有250种可能,一盘棋可以长达150回合。
在下国际象棋的时候,计算机可以分析出每一个可能的步骤,从而进行最优选择,但是,围棋可能的步骤是国际象棋的10倍之多。这也正是围棋人工智能的难点所在。
在过去很长时间里,最好的计算机连厉害点的业余围棋棋手都下不过。所以,去年,Facebook就开始打造围棋人工智能,并且在过去6个月里让它可以用最快0.1秒的速度来落子。负责这项目的人,就坐在里扎克伯格20英尺远的地方。但是,Google还是快一步。
这场比赛实际上发生在去年十月,但是知道今天,它才在《自然》杂志中披露出来。
David Silver是这项研究的第一作者,在他看来,阿尔法Go的关键不在于简单粗暴的计算出可能步骤,而是近似于人类的“想象力”。这背后是名为一项名为“深度学习”的大杀器,它让计算机不再是简单地使用计算能力来统计所有数据,而是像人类一样,训练,然后学习。Silver说,计算机“下围棋需要的极复杂的直觉机制,这种机制以前我们认为只可能存在于人类大脑中。”
阿尔法Go用了多种“神经网络”并行,并且相互作用。其中,一个叫做“值网络”(value network),来衡量白字和黑子在棋盘上的位置,一个叫做“策略网络”(“policy network” ),会不断地学习此前人类和自己的落子,来选择接下来怎么下。
不仅仅比人类、比起其他机器人同类,阿尔法Go也更加强大。它和其他人工智能下了500场围棋,只输了1场,甚至在给对手让子的情况下,它也照赢不误。而Silver说,它比其他人工智能更先进的地方,就在于可以自我学习。而且,这种机制不仅仅可以用在围棋学习中,阿尔法Go还可以用来解决很多现实问题,比如处理气候模型等。
据消息称,Google的“阿尔法Go”V和现在的围棋世界冠军李世石 (Lee Sedol),将在今年三月正式进行比赛。在围棋这个古老的、几乎代表了人类智力巅峰的游戏上,机器人和人类究竟谁更强大,答案很快就会揭晓。