哦,各位老铁,咱们聊聊最近的事儿。国产大模型这两个月是真的猛,春节前后上新的速度太快了。业内都说,现在好多大模型都在搞新功能或者生态整合,感觉马上就要搞出个大新闻了,国产大模型这回可能要从“技术比拼”变成“看谁更有价值”。2月12日那天,字节跳动把视频生成模型Seedance2.0给推出来了,他们的豆包和即梦这两个产品都接进来了。听说是支持图片、视频、音频还有文字四种输入,你可以用一张图告诉它要啥风格,用视频定好角色动作,用音频给它说说节奏氛围,反正现在的提示词不光是文字了,做起来更顺溜。 同一天,MiniMax也上线了MiniMax M2.5,这可是专为Agent场景设计的编程模型。能力很强,和国际顶尖的比起来没差多少。支持PC、App和跨端开发,尤其是Excel和PPT这些办公场景特别适配。2月11日晚上,智谱推出了GLM-5,说是最新一代旗舰模型,主攻复杂系统工程和长程Agent任务。科大讯飞那边也发了星火X2,这是用全国产算力训练的。介绍说除了通用能力变强了,更专注于教育、医疗、汽车和智能体这些专业场景。 你看这些企业公布的信息就知道大模型的能力又升级了。MiniMax说M2.5激活参数量才10B,内存占用少还省电。智谱的GLM-5用了新的“Slime”训练框架,还有异步强化学习算法,能让模型在长期互动中学到东西。字节跳动也介绍说Seedance2.0是统一多模态架构做出来的,不仅能生音画同步的高质量视频,还能做编辑、延长这些复杂操作。 研究院的院长陆峰分析说,现在的竞争重点从“有啥功能”变成了“能不能解决实际问题”。像GLM-5和M2.5主攻代码生成和任务自动化,直接就能帮企业搞软件开发和IT运维;Seedance2.0瞄准广告、电商、影视这些行业。国联民生证券也觉得Agent时代到了,互联网的价值链变了样。 大家觉得2026年会是国产大模型商业化的分水岭吧?陆峰说企业现在得重点跑通“降本-留客-盈利”这个闭环。分析家们还觉得国产大模型的这一波“上新”能带动算力需求涨起来。浙商证券说以前大模型主要是在对话和图片生成上花钱,现在Agent和视频生产要大规模用起来了,推理算力消耗肯定得涨。