在2025年第二十七届高交会期间,由中国高新技术论坛主办的一场聚焦人工智能与具身智能的专题研讨会上,北京人形机器人创新中心有限公司首席技术官唐剑分享了团队在通用人工智能领域的最新探索成果。他指出,当前机器人行业面临的核心挑战在于泛化能力不足,多数机器人仍局限于特定场景执行预设任务,而实现真正通用型具身智能需要突破五大关键技术瓶颈。
唐剑团队提出的解决方案围绕"大小脑协同架构"展开,其中"大脑"采用多模态大模型(VLM)与世界模型结合的技术路径,通过蒙特卡洛树搜索算法枚举任务执行路径,并利用强化学习框架持续优化决策能力。实验数据显示,其自主研发的天鹕(Pelican)模型在11项核心指标上超越现有最优水平,特别是在空间理解与任务规划方面展现出显著优势。该模型已实现开源,配套发布的具身世界模型WoW通过双模闭环训练机制,在物理规律遵循性和时空一致性方面取得突破性进展。
在硬件适配层面,创新中心推出的慧思开物开发平台已支持九款主流机器人,包括量产型天工2.0双足机器人和天轶2.0轮臂式机器人。平台采用"一脑多机"设计理念,开发者可基于统一架构开发跨本体应用。今年8月展示的多机器人协同Demo中,云端大脑同时指挥四款机器人完成配电柜操作、箱体搬运等复杂任务,验证了分布式智能系统的可行性。平台现已开放SDK下载,包含多智能体架构代码、语音交互模块及运动控制组件,首批用户可免费获取核心开发工具。
数据建设方面,创新中心构建的自动化数据工厂已采集超过27万条真实场景轨迹数据,涵盖工业搬运、家庭服务等300余类任务场景。配套发布的RoboMIND数据集下载量突破10万次,本月将新增开源铰链物品仿真数据资产。唐剑特别强调,全自主导航技术的突破使人形机器人能在复杂环境中实现厘米级定位,其田径赛场自主奔跑演示中,机器人以零踩线表现完成100米赛程,运动控制精度达到专业级水平。
针对产业化进程,唐剑将当前瓶颈分为线性与非线性两类:前者涉及移动稳定性、负载能力等硬件指标,后者则聚焦大小脑的场景泛化能力。他预测行业将经历三阶段发展:初期聚焦结构化工业场景,中期拓展商业服务领域,最终实现家庭场景落地。目前导览导购场景已产生实际订单,而家庭保姆、管家等高难度应用仍需3-5年技术沉淀。团队正通过持续迭代算法模型与构建行业数据标准,推动通用人形机器人向消费级市场渗透。