2023-10-24 12:40:57 作者:姚立伟
近日,一位名为Peter Whidden的程序员通过长时间的训练,试图让AI学习如何玩《宝可梦 火红》八大员玩。Whidden利用模拟器控制输入与游戏进行交互,并设定学习会话每次游玩两个小时。他甚至加速了AI的学习过程,使其能在6分钟左右完成一系列任务。
然而,由于AI算法本身并不关心如何通关游戏,Whidden设定了奖励目标来激发其探索行为八大员玩。具体而言,每当AI发现新事物时就能获得奖励点。这一机制是基于屏幕像素变化触发的,但也导致了某些问题。例如,在发现水域中有动画效果后,AI会一直盯着水面发呆。
此外,在发现新的宝可梦并抓捕过程中,AI可能会选择放弃战斗或抓捕过程中的其他操作八大员玩。为此,Whidden引入了与宝可梦等级相关的奖励机制,并调整了相应的奖励分数下降率以解决其中的问题。
尽管AI在处理人类行为方面存在困难,但它们做出了许多深奥而复杂的行动八大员玩。Whidden注意到,在花费7千个小时击败第一个道馆后,AI在月见山迷路很长时间,并最终花费5万小时仍未找到第二个道馆。然而,这个过程也带来了不少有趣之处:比如AI最喜欢购买鲤鱼王超过1万次;当它捕捉到小拉达时,还会将其命名为“AI”。
总之,这项研究展示了人工智能如何应用于游戏领域并具备一定程度上的探索能力,并引发人们对未来科技发展的思考八大员玩。