灵初智能推出Psi-R1：创新分层端到端VLA RL模型

发布时间：2025-04-28 14:44:37

近日，灵初智能发布的分层端到端VLA 强化学习算法模型Psi-R1，已实现机器人在开放环境中的长程灵巧操作能力，达成了30分钟持续CoAT超长任务时长，同时验证了三重复合交互能力（人-机交互、机-机交互、机-环境交互），体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

理论上，只有具备L3（即基于Chain of Action Thought（CoAT）框架的自主推理系统）的长程CoAT灵巧操作能力，才能理解世界，并将学到的知识迁移到新的环境中落地。灵初智能凭借其分层端到端VLA 强化学习算法模型Psi-R1，以麻将为场景，展现了机器人在开放环境中的长程灵巧操作能力，达成了30分钟持续CoAT超长任务时长，同时验证了三重复合交互能力（人-机交互、机-机交互、机-环境交互），体现出VLA的超强推理能力和RL超越人类上限的思考、操作能力。

这项突破性成果标志着具身智能从单一动作执行向完成复杂物理世界感知、推理和执行闭环的关键跃迁，为具身智能真正进入商业场景提供了可落地的技术范式。

在24年成立之初，灵初智能率先提出分层端到端快慢脑架构技术路线，如今已成为行业共识；而此次发布的Psi-R1快慢脑架构，不仅可实现模态对齐，结合强化学习达到具身Aha Moment，更是回应了并一定程度解决了Nvidia机器人高级总监及华盛顿大学教授 Deiter Fox对快慢脑架构存在两个核心问题（即，如何连接快慢脑、实现慢脑规划和快脑操作的模态对齐；如何突破模仿学习的瓶、训练丰富技能）。

灵初R1模型已首度成功验证VLA Test-Time Scaling

灵初智能R1快慢脑系统具备L3能力，可在开放环境下自主推理决策，完成长程复杂操作，其技术得以广泛应用并已与制造业、商超零售、跨境物流等行业龙头企业展开合作，梯次布局高价值商业化场景，从泛工业向泛零售物流，再最终迈向家庭应用，并进一步探索具身智能的未知领域。

免责声明：以上内容为本网站转自其它媒体，相关信息仅为传递更多信息之目的，不代表本网观点，亦不代表本网站赞同其观点或证实其内容的真实性。如稿件版权单位或个人不想在本网发布，可与本网联系，本网视情况可立即将其撤除。

免责声明：本文为转载，非本网原创内容，不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实，对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺，请读者仅作参考，并请自行核实相关内容。

如有疑问请发送邮件至：bangqikeconnect@gmail.com

灵初智能推出Psi-R1：创新分层端到端VLA RL模型

相关阅读

新闻推荐

最新资讯