问题:开源热度上升背后,行业痛点仍待破解 大模型应用加速渗透的同时,开发者普遍面临“能用但难改、可部署但难定制”的现实约束;一方面,部分模型以接口调用为主,研发者难以深入理解模型训练路径与能力边界;另一方面,即便开源,一些项目多停留发布成品权重层面,开发者虽可直接部署,却难以按特定场景进行深度再训练与结构化优化。智能体(Agent)方向的兴起深入放大该矛盾:工具调用、复杂推理、代码生成等能力差异,往往并非源自参数规模本身,而与训练阶段的策略设计密切涉及的。 原因:从“开放结果”转向“开放过程”,释放再创新空间 据公开信息,Step 3.5 Flash在3月4日全面开源后,热度持续走高,并在OpenClaw相关榜单中迅速上升。引发讨论的关键,在于其开源内容不仅包含可直接使用的模型,还覆盖预训练权重(Base)、中训练权重(Midtrain)以及配套训练框架Steptron,并辅以此前发布的技术说明材料。 从技术路径看,预训练阶段主要用于构建通用知识与语言能力,使模型形成对世界的基础认知;中训练阶段则更强调面向任务的能力强化,例如推理、代码、工具调用与智能体协同等。当前业内对智能体能力的竞争,很大程度上集中在中训练阶段的数据构建、目标函数设计与训练配方优化。同步开放两类权重及训练框架,意味着开发者不仅能“拿来用”,还可在既有训练轨迹基础上进行复现实验、对比验证与定向增强,从而在更低成本下开展二次开发。 影响:降低创新门槛,推动全球开发者生态协同 业内人士指出,开放预训练与中训练权重的做法在当前大模型市场中并不多见,其直接影响体现在三上:一是提升研发透明度。开发者可基于公开权重与框架对关键能力进行复现与评估,减少“黑箱式”试错成本。二是增强可定制性。针对垂直行业的专业语料、安全规范与工具链环境,开发者可选择不同训练起点与路径,以更灵活方式获得适配模型。三是促进生态共建。开源项目一旦形成“可复现、可迭代、可协作”的机制,更易吸引全球开发者参与插件、数据集、评测集与应用范式的共建,进而带动模型能力竞争中加速演进。 同时,热度登顶也从侧面反映出国际开发者社区对高质量开源供给的现实需求。在全球开源竞合日益激烈的背景下,开源力度与工程可用性正成为影响开发者选择的重要因素。 对策:在开放与治理之间寻找平衡点 开源并非“只放出代码与权重”,更需要配套的工程文档、评测体系与安全治理安排。业内建议,相关团队与社区可从三上持续完善:其一,强化文档与工具链支持,降低训练、部署、对齐与评测的门槛,提升不同硬件条件下的可复现性。其二,完善分层评测与应用指引,围绕推理、代码、工具调用、多轮对话等能力建立可对比的基准,帮助开发者明确模型边界。其三,建立安全合规的社区协作机制,在内容安全、数据合规、模型滥用防范等形成可执行的治理规则,确保开放红利转化为可持续的产业价值。 前景:开源竞争走向“体系化”,中国模型全球影响力有望扩大 从趋势看,大模型开源正从“发布一个权重文件”迈向“开放训练阶段、开放框架工具、开放评测方法”的体系化竞争。谁能提供更完整的研发链路与更友好的二次开发环境,谁就更可能在全球开发者生态中形成持续吸引力。此次国产模型在全球开源平台热度攀升,发出积极信号:以更高质量、更深层次的开放形态,连接全球创新资源,推动技术扩散与应用落地。未来,随着更多企业与科研机构加入开源协同,中国大模型有望在智能体、工具调用与行业应用等关键方向形成更具竞争力的生态优势。
大模型发展已进入生态建设阶段;阶跃星辰的开源实践显示,国产模型正从性能竞争转向生态价值竞争。这种开放共享的做法不仅推动行业进步,也为全球开发者创造了新机会,将加速AI技术的普及和创新应用的诞生。