国产存储技术突破AI算力瓶颈星辰天合发布三网合一架构解决方案

问题——算力中心“富算力、缺供给”的矛盾加剧。

随着大模型训练规模扩大，算力投入快速上升，但在不少训练场景中，GPU并未始终处于高负载状态。

业内普遍观察到，训练过程中因I/O等待造成的算力空转较为常见，部分场景下顶级GPU近三成时间用于等待数据到达。

算力价格高企与利用率不高形成反差，直接推高企业训练成本，也降低了模型迭代速度。

原因——“三堵墙”限制数据向算力高效流动。

一是I/O瓶颈突出。

计算加速能力提升迅速，而存储读写与数据通道建设相对滞后，导致数据供给无法匹配GPU吞吐节奏。

二是内存约束增强。

模型参数量增长带来显存容量压力，数据在显存与存储之间频繁搬运，进一步放大带宽与时延问题。

三是数据“重力效应”显现。

数据规模越大，跨地域、跨集群迁移与共享的成本越高，合规与安全要求也使关键数据更多留在私有环境，客观上加剧数据孤岛，影响训练与推理协同。

影响——成本、效率与竞争力同时承压。

对企业而言，算力空转意味着资金消耗；数据供给不足意味着研发周期延长。

更重要的是，在算法与开源模型日趋成熟、路径相对趋同的情况下，差异化竞争越来越依赖企业自身的专有数据资产。

若数据无法在安全合规前提下实现高效组织、快速调用和跨域协同，专有数据就难以转化为模型能力，进而影响产业智能化落地效果。

对策——以架构创新替代单纯“堆硬件”。

业内常见做法是通过更快的存储介质、更高规格的内存与网络来提升供给，但这一路径往往带来成本快速上升，且对系统整体协同提升有限。

星辰天合此次提出的AIMesh思路，强调用更柔性的架构设计提升数据到算力的输送效率。

该公司表示，其在关键数据基础设施领域深耕多年，承担了超过5500PB关键数据的存储与安全运行；在金融、运营商、自动驾驶等对性能与可靠性要求较高的行业积累了规模化实践，并在全闪存储与大规模集群部署方面形成能力基础。

从发布信息看，AIMesh面向“AI工厂”提出“三网合一”的数据与内存协同框架：其一，训练数据网MeshFS聚焦I/O瓶颈，强调在兼容常用数据访问协议的同时提升顺序读写带宽与供给效率，目标是减少训练中因数据到达不及时造成的等待；其二，全局对象网MeshSpace着眼跨域协同，通过全局命名空间等机制，将不同地域、不同云环境的存储资源抽象为统一逻辑入口，降低数据访问对物理位置的感知，提升大规模非结构化数据的可用性与流动性；其三，面向推理侧的内存网能力，则指向训练到推理的链路协同与资源复用，意在缩短数据路径、降低延迟，提升在线业务的响应效率与稳定性。

前景——数据底座能力或成大模型竞争“新分水岭”。

当前大模型从“能训”走向“训得快、用得稳”，算力供给与数据供给协同成为关键变量。

未来一段时间，企业级大模型落地将更强调三类能力：一是高性能数据通道与存储体系，确保训练吞吐稳定；二是统一的数据治理与跨域协同，解决数据孤岛与合规约束下的共享难题；三是面向业务推理的低时延与高可靠体系，支撑规模化应用。

业内人士认为，围绕“算力—数据—网络—存储”的整体优化，将成为基础设施升级的重要方向，也将影响大模型在各行业的落地速度与成本结构。

智能时代的竞争,表面看是算法和算力的较量,实质是数据资产运用效率的比拼。

当昂贵的计算资源因等待数据而空转,当海量的专有数据因流动不畅而沉睡,技术进步的红利便难以充分释放。

从硬件堆砌转向架构优化,从单点突破转向系统协同,这不仅是技术路径的调整,更是产业发展理念的深刻变革。

对于致力于智能化转型的中国企业而言,如何构建高效、安全、经济的数据基础设施,已成为必须回答好的时代命题。

国产存储技术突破AI算力瓶颈 星辰天合发布三网合一架构解决方案

国产存储技术突破AI算力瓶颈星辰天合发布三网合一架构解决方案