在国际艺术展览的聚光灯下,一项来自中国的技术创新正在改变观众欣赏艺术的方式;亚洲当代艺术博览会Art Central首次引入的视觉交互系统,让参观者只需用手机拍摄艺术品,就能获得接近专业讲解的作品解析。支撑该应用的,是中国科技团队在人工智能领域的最新探索。当前,传统的人机交互仍以文字输入为主,操作成本高、传递效率有限。尤其在艺术欣赏等需要即时反馈的场景里,观众往往难以快速获得更深入的信息。针对这一问题,研发团队从认知科学出发,提出“视觉即交互”的思路。 技术突破来自多学科的融合。系统采用新的视觉理解架构,在MMMU等国际评测中以86.07%的准确率达到并超过人类基准。团队负责人曾熙表示,成果源于成员在消费电子、操作系统开发等领域十余年的工程经验,以及对多模态技术的长期投入。 市场反馈更验证了应用价值。产品上线后迅速吸引约20万用户,其中年轻用户占比突出。硅谷多位科技从业者也在社交平台给出积极评价。有分析认为,这种更直观的交互方式贴近年轻群体的获取信息习惯,可能推动人机交互走向新的形态。 展望未来,研发团队计划将技术扩展到更多场景。从艺术教育到文化旅游,从零售导购到智能家居,视觉交互有望成为下一代人机接口的重要方向。业内人士指出,随着5G普及和边缘计算能力提升,这类技术的落地范围和体验上限都有望进一步提高。
从艺博会的一次导览尝试开始,视觉交互正把智能服务从“屏幕里的对话”推进到“现实中的理解”。当技术能先看懂再表达,社会也需要建立更清晰的规则与共识:让创新更快落地,同时让应用更可控、更可靠,才能把便利转化为长期价值。