3月19日消息,北京人形机器人创新中心(以下简称“北京人形”)举行具身智能机器人数据采集与训练基地参访活动,北京人形机器人创新中心具身智能机器人数据与训练基地一期(以下简称“数据基地”)自建成不到半年,已发展成为国内场景覆盖最齐全、机器人构型最丰富、数据产能及质量最高的专业化数据采集平台之一。
据介绍,北京人形作为具身智能“国家队”,已牵头制定国内首个具身智能数据集行业标准《人工智能具身智能数据采集规范》,规范数据采集格式以促进跨机构数据共享与模型训练效率提升,通过标准定义具身智能采集规范,引领具身智能行业发展。
北京人形已发布并开源的Robomind具身智能数据集,下载次数超200万次,与此同时数据基地对外市场化交付超数万小时高质量实采数据,数据下载量与交付能力均位居行业第一,服务客户包括多家头部企业及科研机构,应用场景覆盖物流、商超、办公、家居等多个领域。
数据基地一期,建筑面积近5000平方米,覆盖家居、商超、办公、工业、医药、康养等领域30余个典型场景,建有约200平方米专业光学动作捕捉场地。数据基地拥有全国构型最丰富的机器人120多台,配备头环式、夹爪式采集设备,动捕服、动捕手套及遥操驾舱等专业装备,具备真机遥操作、开放环境采集、动作捕捉采集等全栈式数据采集能力。数据基地已建立标准化项目管理体系,制定了数据采集、标注、质检等系列规范,实现全流程质量可控。
数据基地建立了标准化的项目管理体系,制定了从数据采集、标注、质检在内的全流程规范手册,实现从任务下发到最终交付的全流程质量可控。
在数据采集环节,基地针对不同任务类型制定了详细的操作规范,操作员上岗前需通过标准化动作考核,确保同一任务在不同时间、不同人员执行下,采集到的动作轨迹具有高度一致性;在数据标注环节,建立了多层复核机制,对关键动作节点进行双重校验,仅当结果一致时才进入下一环节,全面控制数据标注的错误率;在质量检测环节,实施“三审制”——一审动作完整性,二审标注准确性,三审场景泛化性,只有通过全部质检的数据,才能进入算法训练流程。正是这套标准化的采集规范流程,确保了数据基地交付的每一小时数据均达到合格可交付标准。
北京人形机器人创新中心认为,有望成为全球首个采集完成百万小时高质量的具身智能机器人数据。(崔玉贤)