6月12日,2026年“活力中国调研行”主题采访活动期间,北京人形机器人创新中心具身智能机器人数据与训练基地(以下简称“数据基地”)负责人夏华林对澎湃新闻记者表示,具身智能发展的关键之一在于高质量数据,这也是建立数据基地的重要原因。

“我们现在缺很多数据,尤其是真机的(数据),也不可能把全世界的数据都采一遍,我们一步步走,先在部分结构化、比较单一的场景落地,比如工厂、科研机构、办公场所等,然后逐步上量形成数据闭环。”夏华林说,“它(机器人)的动作,像跳舞这些,可能做得很好,但是要真正像人一样去做事情,还有一些距离。”


北京人形机器人创新中心具身智能机器人数据与训练基地(摄像,澎湃新闻 滕晗)

真机数据被认为是机器人智能从虚拟走向现实的必经之路,它们能够精准还原力觉反馈、触觉信息、环境干扰等仿真难以复制的细节,这些被称为“物理直觉”的关键信息只能通过真机采集的多模态数据来训练。

据悉,数据基地将分散的场景集中复现,将多样的机器人统一调度,将采集、标注、质检全流程标准化。数据基地被认为是国内场景覆盖最齐全、机器人构型最丰富、数据产能及质量最高的专业化数据采集平台之一,建筑面积近5000平方米,包含家居、商超、办公、工业、医药、康养等领域30余个典型场景,建有约200平方米专业光学动作捕捉场地。截至目前,数据基地已为多家头部企业及科研机构交付超数万小时高质量数据,整体数据合格率稳定在95%以上。

北京⼈形机器⼈创新中心有限公司于2023年11月成立,并于2024年10月由工业和信息化部与北京市⼈⺠政府共同揭牌,正式挂牌为“国家地⽅共建具⾝智能机器⼈创新中⼼”。总部位于北京市经济技术开发区,聚焦于具身智能机器⼈核⼼技术、产品研发和应用落地,是国内⾸家具身智能软硬件全栈科技公司,也被视作具身智能“国家队”,目前已牵头制定国内首个具身智能数据集行业标准《人工智能具身智能数据采集规范》。