腾讯研发全新TiG框架：用AI玩王者荣耀让AI模型学会战略性思考

时间：2025-10-05 04:02:49 来源：大精灵

体育资讯10月4日称据 decoder 今天报道，腾讯研究人员最近用《王者荣耀》游戏作为训练平台，探索如何让AI在游戏中学会“战略性思考”，研究全新 TiG（Think in Games）框架，相关成果已发表于 Hugging Face 平台和 arXiv 期刊。

研究团队指出，目前的 AI 模型存在明显的功能鸿沟，以游戏为取向的 AI 能正常游玩但无法理解自己所做的决策，而语言模型虽然可以推理策略，但很难真正执行操作，为此他们研发了全新 TiG 框架，让模型在游戏中同步思考、行动。

团队选择以《王者荣耀》游戏作为训练范本，先使用匿名且标准化的赛事数据定义推上路、击杀暴君、守家等 40 种宏观行动，胜负回数均衡，AI 模型们必须要在每个定义好的场景下选择最佳策略，并解释其战略缘由。

具体来说，训练分为两个阶段，首先是在监督中学习，弄清楚这些策略的基本机制；随后通过奖励机制进行强化学习，如果行动正确能得 1 分，错误行动则得 0 分。

随后团队测试了多种语言模型，涵盖 Qwen2.5（7B、14B、32B）、Qwen3-14B 模型，并使用 DeepSeek-R1 大模型作为对照组；先从 DeepSeek-R1 提炼高质量训练数据，然后使用群体相对策略优化（GRPO）技术，比较不同策略之间的优劣。

最终经过 TiG 框架训练的模型不仅能制定行动计划，还能解释原因，例如 AI 会指出某个防御塔防守薄弱，是理想的进攻目标，但需要注意埋伏的敌人。模型训练后仍保持原有的文本理解、数学推理与问答能力。

最终测试结果如下：

对照组 DeepSeek-R1：决策准确率达 86.67%

Qwen3-14B：决策准确率达 90.91%，超越 DeepSeek-R1

Qwen2.5-32B ：准确率从 66.67% 提升至 86.84%

Qwen2.5-14B：准确率从 53.25% 提升至 83.12%

标签荣耀模型学会思考战略

上一篇：消息称：明年苹果第一款折叠屏的比例大概是14比10

下一篇：又有新业务！解说王多多预告：930在抖音解说德甲，多特vs莱比锡

腾讯研发全新TiG框架：用AI玩王者荣耀让AI模型学会战略性思考

热门数据

相关信息

Bin谈被波比单杀：以为波比不敢打我结果他直接跟我allin

《逃离鸭科夫》在线人数创新高！22万恐怖如斯

Hope：现在的胜利说明不了什么，还是要看后面比赛谁能获胜

MKOI上单排世界赛上单TOP5：TheShy第三！Bin第四，他训练赛真的很强

S15前三轮辅助数据：关键先生榜Kael第一keria第五ON第七

瑞士轮第六日宣传片Viper：我们做好准备无论对手是谁都会赢

Doggo：参加亚运会的队友帮我提升了心态和对游戏的理解

原神成2024年X讨论度最高游戏：《崩坏》《绝区零》同在前十

直播走起，兼职外卖，两不误饿了吗小哥分享自拍神似Doinb与Wei

LOL测试服更新：新图标、新表情、新皮肤边框内容公布

10月18日NBA季前赛国王湖人全场录像

10月18日NBA季前赛篮网猛龙全场录像

10月17日女篮锦标赛56名排位赛山西女篮上海女篮全场录像

10月17日女篮锦标赛78名排位赛浙江女篮辽宁女篮全场录像

10月17日NBA常规赛森林狼公牛全场录像

10月16日女篮锦标赛半决赛四川女篮武汉女篮全场录像

10月16日女篮锦标赛半决赛江苏女篮山东女篮全场录像

10月16日NBA季前赛灰熊黄蜂全场录像

10月15日女篮锦标赛14决赛四川女篮上海女篮全场录像

10月15日NBA季前赛勇士开拓者全场录像

相关集锦

10月22日NBA常规赛揭幕战火箭雷霆精彩镜头

季前赛东契奇31+9小里15中3琼斯罚球绝杀湖人1分惜败国王

季前赛50号秀桑德斯25分比尔12分库里20+4+5快船险胜勇士

季前赛文班17+12+4帽哈珀10中3马刺大胜步行者保持全胜

季前赛末节轰170！吉昂压哨三分SGA半场12+5雷霆逆转掘金

季前赛JJJ13中4韦尔20+14鲍威尔23+6灰熊末节一波灭热火

季前赛布伦森31+7+6塞克斯顿21+10+9失误尼克斯击败黄蜂

季前赛恩比德复出14+7+8埃奇库姆26+6+5断76人击退森林狼

季前赛巴恩斯31+6巴雷特25分小波特34+10猛龙险胜篮网

10月17日NBA季前赛开拓者爵士精彩镜头

热门TAG