问题——算力成为“新底座”,通算与AI算力同时承压;随着大模型训练与推理从研发走向规模化应用,算力从“配套资源”转变为数字经济的基础生产要素。一方面,通用计算承担业务系统运行、数据调度与基础处理等任务,云化、多租户并行、实时分析等场景下,高并发处理与多线程调度能力受到考验;另一上,AI推理需求快速增长,行业从“少量试点”走向“高频调用”,对峰值性能、吞吐能力与稳定性提出更高要求。供给能力与使用效率之间的矛盾,正成为应用落地的重要约束。 原因——需求扩容、成本压力与协同不足叠加。业内人士指出,当前算力压力主要来自三上:其一,数据规模与模型规模持续扩大,带来更高并发、更复杂的任务链路与更长的运行时长,传统架构在资源调度与性能释放上存在瓶颈;其二,企业在业务波动下往往选择超额部署,低负载阶段资源闲置,而高功耗与散热需求推高运维成本,中小企业更容易受到投入门槛影响;其三,通用计算与AI算力之间仍存在“孤岛”,在数据流转、任务编排、软件栈适配等环节衔接不顺,影响模型上线速度和持续迭代效率。软硬件协同与生态适配能力,正成为衡量算力产品竞争力的重要指标。 影响——算力短板制约“通智融合”进程与行业应用规模化。算力供给不足或结构性失衡,可能引发推理排队、响应延迟、成本难降等问题,进而影响政务、金融、制造、交通、教育、医疗等领域的应用体验与推广节奏。此外,如果通用算力与AI算力无法协同优化,企业在数据处理、模型推理与业务系统之间的衔接成本会上升,导致上线周期拉长、运维复杂度增加。算力体系是否稳定可用、是否便于部署与运维,直接关系到“模型能力”能否转化为“业务价值”。 对策——以“双底座”完善供给结构,用产品化方案回应行业痛点。大会期间,宝德计算集中展示以鲲鹏与昇腾为核心的算力产品与方案,并发布两款面向重点场景服务器新品:昇腾AI推理服务器PR610KI PRO与鲲鹏存储型服务器PR410K PRO。企业对应的负责人表示,行业需要的不只是单点性能提升,更需要从硬件平台、软件适配、交付服务到生态协作的整体能力,以提高算力利用率,降低部署与运维门槛,并提升通用计算与AI推理的协同效率。 据介绍,面向AI推理场景的PR610KI PRO主要针对推理算力紧缺与成本压力,强调在大模型推理、人工智能计算中心等场景下提供稳定吞吐与更高资源利用效率;面向数据密集型业务的PR410K PRO则聚焦海量数据存储、读写并发与稳定运行能力,支撑云化业务、数据平台与行业应用持续增长。业内分析认为,随着应用从“能跑”走向“更省、更稳、更快”,推理服务器与存储服务器的协同配置将更普遍,产品需要在性能、能效、可靠性与可运维性之间实现平衡。 同时,生态协同能力被多方视为国产算力规模化落地的关键。围绕主流框架、行业软件与业务系统的兼容适配,算力厂商需要与上下游伙伴建立更紧密的联动,缩短模型部署与迭代周期,减少重复适配带来的时间消耗。宝德计算在大会期间展示的交付服务与协同体系也显示出,行业竞争正从单纯比拼硬件参数,转向“平台能力+生态能力+服务能力”的综合竞争。 前景——算力建设将从“增量扩容”迈向“结构优化”,国产化与高效化并重。展望未来,随着大模型能力继续深入行业场景,推理需求将持续增长,算力基础设施将更强调模块化、可扩展与易运维;同时,通用计算与AI算力的协同调度、数据链路优化与能效管理将成为建设重点。业内预计,面向行业的“通智融合”将加速推进,算力产品的竞争焦点将进一步转向软硬件协同水平、开发部署工具链完善程度以及端到端交付能力。国产算力体系若能在关键场景实现稳定可用、成本可控与快速适配,将为数字经济发展提供更有力支撑。
算力之争,表面是性能与成本的比拼,实质是体系能力与生态协同的竞争。面对大模型应用规模化带来的新要求,推动通算与智算一体化演进,提升国产化供给与服务能力,将为更多行业实现“用得起、用得好、用得稳”的智能应用提供支撑,也为培育新质生产力夯实数字底座。