从“拍照问答”到“视觉入口”：Chance推出视觉智能体并在国际艺博会落地导览

在国际艺术展览的聚光灯下，一项来自中国的技术创新正在改变观众欣赏艺术的方式；亚洲当代艺术博览会Art Central首次引入的视觉交互系统，让参观者只需用手机拍摄艺术品，就能获得接近专业讲解的作品解析。支撑该应用的，是中国科技团队在人工智能领域的最新探索。当前，传统的人机交互仍以文字输入为主，操作成本高、传递效率有限。尤其在艺术欣赏等需要即时反馈的场景里，观众往往难以快速获得更深入的信息。针对这一问题，研发团队从认知科学出发，提出“视觉即交互”的思路。技术突破来自多学科的融合。系统采用新的视觉理解架构，在MMMU等国际评测中以86.07%的准确率达到并超过人类基准。团队负责人曾熙表示，成果源于成员在消费电子、操作系统开发等领域十余年的工程经验，以及对多模态技术的长期投入。市场反馈更验证了应用价值。产品上线后迅速吸引约20万用户，其中年轻用户占比突出。硅谷多位科技从业者也在社交平台给出积极评价。有分析认为，这种更直观的交互方式贴近年轻群体的获取信息习惯，可能推动人机交互走向新的形态。展望未来，研发团队计划将技术扩展到更多场景。从艺术教育到文化旅游，从零售导购到智能家居，视觉交互有望成为下一代人机接口的重要方向。业内人士指出，随着5G普及和边缘计算能力提升，这类技术的落地范围和体验上限都有望进一步提高。

从艺博会的一次导览尝试开始，视觉交互正把智能服务从“屏幕里的对话”推进到“现实中的理解”。当技术能先看懂再表达，社会也需要建立更清晰的规则与共识：让创新更快落地，同时让应用更可控、更可靠，才能把便利转化为长期价值。