虽然具身智能还未迎来GPT时代,但国内外人形机器人企业纷纷加速应用落地,探索核心技术突破。
5月29日,在2025张江具身智能开发者大会上,国家地方共建人形机器人创新中心(下称“国地中心”)联合复旦大学正式发布全球首款生成式人形机器人运动大模型—— “龙跃”(MindLoongGPT)。此举将标志着我国在智能体运动控制领域迈入全球领先行列。
首款生成式人形机器人运动大模型有何意义
龙跃大模型以“自然语言驱动”为核心,构建了从多模态输入到高保真动作生成的完整闭环,颠覆传统运动控制范式。
国地中心首席科学家江磊接受第一财经记者采访时说,人形机器人是一个全身具有移动性的整体,双臂在动,腰部也会配合,然后双足也会配合移动保持平衡。“我们认为应该要有一个全身运动的大模型解决最后端到端问题。这次首发了针对移动能力和操作能力的大模型,可以帮助人们在实际采集数据非常困难的情况下,通过这个大模型生成更多的仿真级的动作,来构成更完整的具身智能数据集。它也是实体训练场一个非常重要的补充。”
上述他提到的训练场,是今年1月21日启用的全国首个异构人形机器人训练场,首期部署了超100台异构人形机器人,以10余种人形机器人典型应用场景的建设,牵引形成上海人形机器人超级中心。作为一个数据生产的工厂,能产生更多数据提供给具身智能大模型的企业去使用,帮助行业加速发展。
龙跃大模型联合发布方——复旦大学信息科学与工程学院教授陈涛在2025张江具身智能开发者大会上的“张江论剑”科创沙龙上表示,具身智能距离GPT时刻还有距离,而这次和国地中心联合发布的龙跃,它的特点是可以根据用户的输入产生动作,比如说用户只需说出“挥手致意”或上传一段参考视频,模型即可自动解析语义并生成连贯动作。传统方法依赖专业参数调整的桎梏被打破,实现“人人可用”。
他补充解释,通过“龙跃”MindLoongGPT生成特技动作运动轨迹,作为部署的全身跟踪小模型的输入目标观测,可以在青龙上实现丰富的全身动作。“目前我们在青龙机器人上做了一些demo的验证,在仿真平台上针对全尺寸人形机器人也做了一些数据生成。”
数据为何重要
具身智能所依赖的数据,不仅来源广泛、形式多样,而且对模型训练和技能获取起着至关重要的作用。当前,国内外企业纷纷投入资源,加快数据集构建和训练场建设的步伐,但如何在保证数据数量的同时确保其高质量,依然是摆在各方面前的一大难题。
中国信通院人工智能研究所安全与具身智能部副主任颜媚在“张江论剑”上表示,数据资源主要包括三大类型:真机数据、合成数据和互联网中的多模态数据。然而,尽管多种数据来源为具身智能的发展提供了丰富资源,应用推广仍面临两大主要挑战:数据需求量巨大、数据质量的把控问题更为突出。
她说,相比无人驾驶领域,具身智能所涉及的环境复杂性更高,空间不确定性往往是无人车的几十倍。以无人驾驶为例,产业界已用三年时间采集约十万辆车辆的真实数据和大量高质量仿真数据,才勉强达到可用标准,而具身智能机器人所需的数据量则更加庞大。因此,如何短时间内构建大规模、可用性强的数据集,成为当前亟待突破的难题。
基于上述挑战,中国信通院和国地中心联合推进了具身智能数据质量及评估标准的制定工作。该标准主要从三个方面展开:围绕数据全生命周期的管理,明确提出从数据采集、清洗、标注到最终使用过程中各关键环节的质量控制要求;建立了包括完整性、一致性、多样性、真实性、易用性、实用性及可扩展性在内的七大质量评价指标;从组织管理角度构建制度保障,明确将持续推动具身智能标准体系不断完善,以期形成一个定量和定性兼备的全面数据生态体系。
江磊也对记者说,今年国地中心自己的训练场会完成高质量实体数据集,成为国际上最大的一个数据聚集地。同时他们还联合了企业和省市一级的创新中心联合打造出将近2500万条的数据来发展更智能的大模型。

他说,今年年底会把他们具身智能大模型的操作精度从约70%~80%继续优化提升到90%,基本达到相当于ChatGPT-3的水平。“接下去我们要采集更多数据,上千万条还不够,达到PB级(1PB=1000TB=1000000GB)的量级才是符合具身智能数据体量的要求。”
会议当天,在前期与上海大学联合发布的“格物”具身智能仿真平台相关工作基础上,国地中心还正式发布“致知”具身应用开发平台。
据国地中心介绍,“格物-致知”通用具身智能开发平台深度融合OpenLoong(人形机器人开源社区)核心软件框架,形成具身智能应用一站式 向导式的快速开发管道,同时以开源开放的机制持续推动人形机器人开发范式从“单点突破”迈向“生态共建”,并依托麒麟具身智能训练场规模化数据采集与白虎百万开源数据集快速形成具身基础大模型库,加速人形机器人在实际场景的应用落地。
国地中心研发总监邢伯阳分享称,目前中心的麒麟训练场已成功搭建起从具身数据到大模型的一站式开发基础设施,整合了一百多家异构机器人同步进行数据采集,为后续模型训练提供了坚实的数据支撑。
在刑伯阳看来,人形机器人赛道正迎来量产元年的重要时刻。从数据采集、模型训练到技能整合的全链路探索正成为推动整个行业突破的重要因素。未来应用场景的快速形成不仅依赖于庞大的数据和高精度模型,更需要通过集成开发平台将各个技术模块高效融合,实现从底层操作系统中间件、芯片适配到上层生态开发的无缝对接。只有解决好模型技能组合为可落地应用这一核心问题,才能真正实现全套端到端应用的突破。
免责声明:本文为转载,非本网原创内容,不代表本网观点。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。
如有疑问请发送邮件至:bangqikeconnect@gmail.com