当前,具身智能技术迭代加快,正从实验室样机走向物流搬运、家庭服务、工业巡检等真实场景;随之而来的是产业对“怎么评、评什么、能否复现”的关注明显提升。但长期以来,行业存在测试口径不统一、指标体系零散、仿真与实测结果难以对应等问题,导致产品之间难以横向比较,也增加了用户选型和规模化部署的不确定性。基于此背景,工业和信息化部批准发布《YD/T 6770—2026 人工智能 关键基础技术 具身智能基准测试方法》行业标准,将于6月1日正式实施。该标准为具身智能领域首份行业标准,标志着我国具身智能评测进入“有标可依、按标可比”的阶段。标准聚焦仿真环境与真实环境两类关键测试场景,系统规定基准测试框架、指标体系与实施方法,覆盖环境设置、任务库构建、测试流程和指标计算等核心环节,面向单个具身智能系统开展“感知—决策—执行”全链路能力的基准测试。问题的形成既有技术因素,也有产业因素。从技术角度看,具身智能融合多模态感知、运动控制、任务规划与人机交互等能力链条,任何环节的短板都可能导致系统在真实环境中失效;仅用单点指标评价,难以反映整体可靠性与稳定性。从产业角度看,需求增长带来产品形态多样,企业普遍使用自建测试集和自定义指标,容易出现“宣传口径强、客观证据弱”的信息不对称,既影响应用单位的采购判断,也不利于市场形成清晰、公平的竞争秩序。
这项标准的意义不止在于划定边界,更在于为创新提供共同语言、为产业建立可验证的信任机制;具身智能走向规模化应用——既需要技术突破——也需要可衡量、可复现、可验证的工程体系。标准落地,是行业从热度走向成熟的重要一步;在统一标尺下,经得起场景检验的能力将更容易被识别和验证,推动新技术更稳、更快服务实体经济与社会生活。