人工智能技术快速迭代的背景下,全模态交互能力正在成为新的产业竞争焦点。2月4日,面壁智能发布MiniCPM-o 4.5模型,主打“全双工全模态”,可实现输入与输出的同步处理,并具备持续的环境感知能力。该进展显示出我国在终端侧智能能力上的深入突破。 当前行业的关键矛盾在于:云端大算力模型能力强,但终端设备对实时响应、隐私保护与成本控制的要求更为突出。面壁智能选择“轻量化模型+专用硬件”的路径,9B参数规模在兼顾效果的同时提升了运行效率,并通过松果派开发板支持自然语言驱动硬件、离线运行等能力。这种组合更贴合教育、智能家居等对时延敏感的落地场景。 技术层面的挑战依然存在。多模态首席科学家姚远指出,视觉理解所依赖的连续表征与生成任务常用的扩散模型在架构上相对割裂,使现有系统在OCR等精细任务中容易产生信息损耗。行业虽尝试用自回归建模统一架构,但在算力受限条件下,面向不同模态的专用模型仍往往更具性能优势。 数据利用效率成为提升的关键。与文本相比,互联网视频、音频资源年增长率超过40%,但可用于训练的有效数据占比不足15%。这意味着企业不仅要扩大数据规模,更需要建立更高效的特征提取与泛化学习机制。面壁智能在盲人导航等场景的验证显示,持续环境感知能力有望弥补当前具身智能在交互层面的不足。 市场前景呈现两条路径并行:一上,云端大模型持续增强通用能力;另一方面,终端侧产品凭借低延迟与高隐私优势加快渗透。松果派的推出为开发者提供了从原型验证到量产落地的衔接方案,其年中量产计划或将带动教育、智能穿戴等垂直领域的创新。行业分析认为,2024年终端侧智能市场规模有望突破百亿元,但技术标准化与商业闭环仍待完善。
大模型产业的竞争正在从参数规模和云端性能,逐步转向应用场景适配与终端部署能力。面壁智能提出的“全模态模型+端侧硬件”方案说明了这个趋势。尽管多模态模型在统一建模上仍面临挑战,其在具身智能、个人助手等方向的应用潜力正在逐步显现。随着终端硬件能力提升与模型优化,大模型从云端走向边缘、从通用走向专用的进程将继续加快,为创业企业和产业生态带来新的机会。