当前位置:首页 > 体育 > 电竞

谷歌、OpenAI争相让旗下AI玩《精灵宝可梦》游戏:衡量AI真正实力

时间:2026-01-26 01:11:00 来源:看球吧

电竞体育01月25报道 据科技媒体 Tom's Hardware 今天报道,当今时代我们有无数种跑分测试和评测方法来衡量 AI 的聪明程度与能力,但最近一种相对小众的测试方法也在 AI 圈内引发关注。

目前,谷歌、OpenAI 和 Anthropic 等 AI 巨头正在让自家模型游玩经典的《精灵宝可梦》系列游戏,以此来评估 AI 性能表现。

Anthropic 公司 AI 部门负责人 David Hershey 对此表示:“《精灵宝可梦》之所以能吸引机器学习社区关注,是因为它不像《Pong》等简单游戏那样受限。这种游戏对电脑程序来说非常具有挑战性”。

Hershey 从去年开始在 Twitch 平台进行直播,每天的日常就是用公司自产模型 Claude 玩《精灵宝可梦》。这名负责人平时的工作就是帮助客户部署 AI,因此他开直播本质上也是在测试模型。

这名负责人给自家 AI 直播游戏的做法也启发了不少自由开发者,他们也陆续搞了“Gemini 玩《宝可梦》”“GPT 玩《宝可梦》”等类似的直播节目。

后来,这些直播甚至被谷歌和 OpenAI 注意到,开发团队有时还会客串直播间亲自调整模型参数,在官方力量注入下,Gemini 和 GPT 已经成功通关了 Gam Boy 时代的《宝可梦蓝》,目前已在挑战续作;而 Claude 至今还没打通任何一个版本。

至于为何要用《宝可梦》评估 AI 性能?Hershey 对此解释道:“因为它给我们提供了直观的方法观察模型表现,还能用量化指标评估性能”。

通常来讲,玩家在《宝可梦》系列游戏中需要升级、训练已有 / 刚抓的宝可梦,还要打败道馆馆主来捕捉新的宝可梦。这种游戏流程并非线性,而是充满着判断和取舍。

而且,玩家还要经常在游戏中做出选择:是先冒险挑战强大的训练家以获取珍稀宝可梦,还是稳扎稳打造出一支实力均衡的队伍。

显然,人类非常擅长做此类决策,这也是游戏的乐趣所在,但对于 AI 来说,这是一场关乎逻辑推理、风险评估以及长期规划能力的综合考验。

因此研究人员会深入剖析 AI 在游戏里的决策方式,深入理解模型的能力边界。

Hershey 还会将 AI 玩《宝可梦》的结果分享给客户以改进控制框架(IT之家注:harness),帮助他们提升算力使用效率,让模型更高效运转。

上一篇: 厂长当教练还要被问经典为什么开大:支支吾吾,只能嘴硬人马要大多人的

下一篇: S赛亚军连垫底队BRO都打不过KT.Aiming被Teddy抽陀螺鬼皇抽象辅助

热门专题

更多

相关信息

相关集锦

热门TAG

足球 篮球 NBA 英超 西甲 意甲 中国足球 中超 CBA 中国篮球 湖人 皇家马德里 德甲 曼联 转会 利物浦 巴塞罗那 阿森纳 五洲 勇士 法甲 曼城 欧冠 直播 切尔西 国际米兰 火箭 詹姆斯 拜仁慕尼黑 快船 AC米兰 巴黎圣日耳曼 转载 花絮 比赛集锦 掘金 尤文图斯 中国男足 库里 比赛录像 开拓者 国家队 马德里竞技 独行侠 雷霆 太阳 凯尔特人 杨瀚森 那不勒斯 切尔西队 狼队视频 曼联马蒂奇伤退 中央5台直播 马赛VS朗斯直播 阿尔克马尔VS托特纳姆热刺直播 中央一套直播在线观看高清直播 007球探即时比分足球电脑版 cctv-1在线直播 中央一台cctv1直播 切尔西vs曼城 大师赛直播 阿根廷vs哥伦比亚 巴伦西亚VS马德里竞技直播 伊朗VS印度直播 广岛三箭VS南定直播 柔佛VS浦项制铁直播 阿尔瓦沙尔VS利雅得新月直播 迪拜青年国民VS阿尔维达特直播 篮球直播在线观看jrs 西超杯决赛2025在哪看 nba直播在线观看蜘蛛直播 辽宁本钢队今天现场直播 833cba在线直播 91直播免费看nba 火箭直播间直播在线观看

Copyright © 2022-2025 看球吧. All Rights Reserved. 网站地图 陕ICP备14003757号-1