新浪科技讯 3月4日上午消息,蚂蚁蚂蚁集团联合清华大学发布开源强化学习训练框架AReaL v1.0稳定版。集团该版本主打“Agent一键接入RL训练”:不用改代码,联合兼容各类Agent框架,清华强化大模型进展让智能体强化学习训练开箱即用 。大学
2026年开年以来,发布量子Agent持续升温 ,开源框架以LangChain 、学习训练Claude Code、稳定OpenClaw为代表的蚂蚁智能体框架繁荣发展,但也暴露出两大瓶颈 。集团一是联合接入训练成本高:现有智能体框架接口各异 ,每接入一个往往需要编写整套适配代码 。清华强化脑机二是大学Agent缺乏持续进化的能力 :多数Agent的能力取决于底层模型在训练阶段习得的固定权重,部署后无法再针对特定场景持续优化

