由于其兼具挑战性和趣味性,一经推出便吸引海内外队伍踊跃参加,截至 12 月中旬,吸引了来自世界各地的 1100 多个团队,其中包含多支世界顶级学府和研究机构的科研强队。
最终——腾讯 AI Lab 绝悟 WeKick版本(下称「绝悟」)以 1785.8 的分数获得冠军,且相比于其它队伍优势非常明显。
外表简陋,但和正常足球比赛一样没差,短传、长传、直塞、射门、铲球样样都有。
游戏场景是完全对称的,双方有一样的球员,没有主客场、状态好坏的数值差异,没有替补球员、没有加时赛、进球多获胜(否则平局)。
规则也与普通足球比赛类似——比赛分上下半场(各 45 分钟,1500 步,两支球队各开球一次),目标都是将球踢入对方球门。
对方开场势如破竹呀,只见对方10号传给了中插的5号,一脚抽射,应声入网。
可以看到,比赛中每个球员都各由一个单独的智能体控制,参赛团队需要实时选择并控制其中一个智能体,与其他内置智能体配合。
因此,每个球员不仅需要观察对手的行为,还需要留意己方队员的情况。这需要非常复杂的团队协作和竞争策略。
和大多数参赛队伍一样,「绝悟」也主要采用了强化学习和自博弈(Self-Play)来从零开始训练模型的方法。
其训练的基础架构是基于「绝悟」完全体的架构迁移得到的,详情参阅《腾讯绝悟AI完全体限时开放体验,研究登上国际顶会与顶刊》
基于此,腾讯 AI Lab 又针对足球任务对该框架做针对性改进,使其能适应 11 智能体足球游戏训练环境。
这也证明了腾讯 AI Lab 开发的「绝悟」的底层架构与方法的通用性,可以预见这类方法未来还有望进一步迁移至机器人等更多领域,从而创造更大的实用价值。
从围棋 AI 「绝艺」到策略决策型 AI「绝悟」,再到如今的 AI 足球队绝悟 WeKick 版本,腾讯 AI Lab 的深度强化学习智能体步步进化,逐渐向更复杂更多样化的问题迁移,其中的每一次进展都让我们离通用人工智能终极目标更近了一步。返回搜狐,查看更多
|