蚂蚁集团联合清人形机器人华大脑机学量子发布大模型进展开源强化学习训练框架AReaL v1.0稳定版核聚变-蠹众木折网

　　新浪科技讯 3月4日上午消息，蚂蚁蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。集团该版本主打“Agent一键接入RL训练”：不用改代码，联合兼容各类Agent框架，清华强化大模型进展让智能体强化学习训练开箱即用。大学

　　2026年开年以来，发布量子Agent持续升温，开源框架以LangChain 、学习训练Claude Code、稳定OpenClaw为代表的蚂蚁智能体框架繁荣发展，但也暴露出两大瓶颈。集团一是联合接入训练成本高：现有智能体框架接口各异，每接入一个往往需要编写整套适配代码。清华强化脑机二是大学Agent缺乏持续进化的能力：多数Agent的能力取决于底层模型在训练阶段习得的固定权重，部署后无法再针对特定场景持续优化，发布能力上限在交付时便已确定。核聚变

　　AReaL是首个全异步训推解耦的大模型强化学习训练系统，能让Agent在真实任务交互中获得反馈、持续优化决策。人形机器人此次发布的v1.0版本让任意Agent零改造接入RL 训练成为现实，即通过在智能体与训练系统之间加入 Proxy Worker 中转层，开发者只需修改一个请求地址即可接入训练。

海量资讯、精准解读，尽在新浪财经APP

责任编辑：杨赐

蚂蚁集团联合清人形机器人华大脑机学量子发布大模型进展开源强化学习训练框架AReaL v1.0稳定版核聚变

更多相关文章

大图推荐

B站2025年调整后净利润25.9亿元首次实现全年盈利

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

京东健康2025年业绩超预期：总收入734亿元，同比增长26.3%

雷军：微博基本上都是我自己写的

杨元庆：AGI还有很远距离，赋能于人才是好AI

雷军：微博基本上都是我自己写的

工银瑞信年度策略对话：以长期主义为锚，力争服务人生各阶段的投资需求

杨元庆：科技公司营销背后要有创新实力｜直击ces

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

AWE2026：索尼首款真彩RGB电视亮相

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：科技公司营销背后要有创新实力｜直击ces

电动化上半场完美收官：比亚迪发布第二代刀片电池及闪充技术

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

最新发布

热门文章

阿里辟谣：千问模型团队集体离职系谣言

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

BOSS直聘：升级“灭蟑行动” ，月均打击涉黄违规账号超1万个

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：科技公司营销背后要有创新实力｜直击ces

杨元庆：AGI还有很远距离，赋能于人才是好AI

工银瑞信年度策略对话：以长期主义为锚，力争服务人生各阶段的投资需求

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

标签列表

蚂蚁集团联合清人形机器人华大脑机学量子发布大模型进展开源强化学习训练框架AReaL v1.0稳定版核聚变

更多相关文章

大图推荐

B站2025年调整后净利润25.9亿元 首次实现全年盈利

杨元庆：AGI还有很远距离 ，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

杨元庆：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

京东健康2025年业绩超预期：总收入734亿元，同比增长26.3%

雷军：微博基本上都是我自己写的

杨元庆：AGI还有很远距离，赋能于人才是好AI

雷军：微博基本上都是我自己写的

工银瑞信年度策略对话：以长期主义为锚 ，力争服务人生各阶段的投资需求

杨元庆 ：科技公司营销背后要有创新实力｜直击ces

杨元庆 ：AGI还有很远距离 ，赋能于人才是好AI

杨元庆 ：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

AWE2026：索尼首款真彩RGB电视亮相

杨元庆：AGI还有很远距离 ，赋能于人才是好AI

杨元庆 ：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

杨元庆 ：科技公司营销背后要有创新实力｜直击ces

电动化上半场完美收官 ：比亚迪发布第二代刀片电池及闪充技术

杨元庆：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

雷军 ：微博基本上都是我自己写的

最新发布

热门文章

阿里辟谣：千问模型团队集体离职系谣言

杨元庆 ：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

杨元庆 ：AI时代没有赢者通吃 联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

BOSS直聘 ：升级“灭蟑行动”  ，月均打击涉黄违规账号超1万个

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：科技公司营销背后要有创新实力｜直击ces

杨元庆：AGI还有很远距离 ，赋能于人才是好AI

工银瑞信年度策略对话 ：以长期主义为锚  ，力争服务人生各阶段的投资需求

雷军：微博基本上都是我自己写的

雷军 ：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

标签列表

B站2025年调整后净利润25.9亿元首次实现全年盈利

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

京东健康2025年业绩超预期：总收入734亿元，同比增长26.3%

雷军：微博基本上都是我自己写的

杨元庆：AGI还有很远距离，赋能于人才是好AI

雷军：微博基本上都是我自己写的

工银瑞信年度策略对话：以长期主义为锚，力争服务人生各阶段的投资需求

杨元庆：科技公司营销背后要有创新实力｜直击ces

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

AWE2026：索尼首款真彩RGB电视亮相

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：科技公司营销背后要有创新实力｜直击ces

电动化上半场完美收官：比亚迪发布第二代刀片电池及闪充技术

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

阿里辟谣：千问模型团队集体离职系谣言

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

杨元庆：AI时代没有赢者通吃联想要发挥特长开放合作｜直击 CES

雷军：微博基本上都是我自己写的

BOSS直聘：升级“灭蟑行动” ，月均打击涉黄违规账号超1万个

杨元庆：AGI还有很远距离，赋能于人才是好AI

杨元庆：科技公司营销背后要有创新实力｜直击ces

杨元庆：AGI还有很远距离，赋能于人才是好AI

工银瑞信年度策略对话：以长期主义为锚，力争服务人生各阶段的投资需求

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的

雷军：微博基本上都是我自己写的