当前,全球人工智能竞争已进入关键阶段,高质量数据的供给与应用成为各国战略竞争的焦点。
北京亦庄此次集中兑现数据产业奖励政策,正是在这一背景下,以"真金白银"激活数据要素价值,筑牢人工智能产业发展基础的重要举措。
高质量数据集为何如此关键?
业内专家指出,这类数据不仅是训练大模型的精准样本,更是推动人工智能从通用型向产业专用型转变的关键桥梁。
在人工智能与实体经济深度融合的过程中,针对性强、质量高的数据集能够显著提升模型的行业适配度,加速创新成果的产业化转化。
然而,长期以来,国内多个产业领域存在高质量数据供给不足的问题,成为制约人工智能应用升级的重要瓶颈。
北京亦庄发布的"数据20条"政策,正是为了破解这一瓶颈而设计。
该政策以场景为驱动,通过奖励机制激励企业加大高质量数据集建设力度。
此次首次集中兑现,共有38个数据产品获得认定与奖励,涵盖四大重点产业领域,实现了多项突破性进展。
在具身智能领域,北京人形机器人创新中心推出的"RoboMIND2.0数据集"填补了国内双足人形机器人开源数据的空白,已支撑国内首个通过国标测试的跨本体具身VLA大模型的训练与开源。
星海图打造的全球首个开放场景真机数据集,开源后在全球机器人真机数据集下载量中跃居首位,展现了中国创新的国际竞争力。
在生物医药领域,麦克奥迪医疗采用专家诊断、AI制片质控与临床信息关联脱敏相结合的模式,打造了数字病理疑难病例数据集,已获得北京数据交易所的数字资产登记凭证。
药云构建的国内首个面向真实世界证据生成的垂直化医药融合数据集,已为生物医药企业提供实际服务,推动了产业的数据驱动转变。
在工业制造领域,北京蚂蚁工场构建的国内首个覆盖"非标+标准件"全流程柔性制造的强合规数据集,填补了"数据驱动智能制造闭环+大模型可持续训练"的双重空白。
星龙数智在钢铁行业首创全产业链高质量数据集建设与应用平台,已助力钢铁企业生产协同效率提升超10%、能源消耗降低3%以上,体现了数据应用的直接经济效益。
在智能网联领域,四维图新智驾推出的"基于4D时空障碍物检测的高质量自动驾驶数据集"首创"4D时空+自动化闭环"模式,填补了中国特有复杂交通场景数据空白,破解了高级别自动驾驶研发中的数据瓶颈。
恺望数据集则助力自动驾驶向无图模式加速转型,展现了产业升级的新方向。
政策奖励的真正价值在于激发企业的创新动力。
获奖企业纷纷表示,这笔资金不仅是对既有工作的肯定,更是推动后续研发升级与生态共建的催化剂。
北京人形表示将进一步扩大真实场景数据规模,推动机器人在实际应用中的落地。
麦克奥迪医疗将持续加大研发投入,推进数据开放与AI应用大模型开发。
北京蚂蚁工场明确提出要把"数据集成果"升级为"数据能力供给",探索受控开放与场景共建,推动数据在产业链协同中流动。
这些企业的后续规划反映出一个重要趋势:高质量数据集不再是静态的资源,而是需要通过持续迭代、开放共享,形成产业生态中的动态流动。
从单点突破到系统赋能,从数据供给到能力供给,产业发展的逻辑正在升级。
北京亦庄作为国家级经济技术开发区,在全域人工智能之城建设中担当重任。
通过政策激励与产业引导的有机结合,正在形成"数据集建设—奖励兑现—研发升级—生态共建"的良性循环,为人工智能产业的高质量发展提供坚实的数据基础。
数据是新型生产要素,质量决定价值,流通决定效率。
以政策兑现撬动企业投入,以场景驱动牵引数据供给,是释放数据要素潜能的现实路径。
面向未来,只有在安全合规底线之上持续完善标准体系、促进协同共建、打通供需两端,才能让高质量数据集从“项目成果”成长为“公共能力”,在更大范围内催生产业创新与高质量发展的新动能。