问题——Token快速增长凸显算力成为新型“通用消耗品” 从产业运行规律看,Token调用量的变化,本质上反映了大模型训练、推理与应用侧的真实消耗强度。OpenRouter数据显示,3月9日至15日,中国大模型周调用量达到4.69万亿Token,并已连续两周高于美国同期水平。与过去“模型能力竞争”更多停留在参数规模、评测榜单不同,Token的持续攀升意味着应用端活跃度和推理需求在实质扩张,算力正在成为支撑大模型规模化服务基础性“通用消耗品”,其商业价值与资源属性继续凸显。 原因——应用形态升级与云端价格调整共同推升需求 一是应用形态从单一对话走向多模态与智能体。除文生文外,文生图、文生视频、语音交互、内容理解与检索增强等多模态场景,对推理时延、并发能力与显存占用提出更高要求;智能体在“规划—执行—反馈”链路中往往需要多轮调用并伴随工具调用,也显著推高Token消耗。 二是云厂商价格与产品策略调整,推动市场重新评估算力价值。近期海内外主要云服务商相继调整定价与产品组合,反映供需变化、能源与硬件成本波动,以及高性能算力稀缺性对价格的影响。价格信号变化促使企业在“自建还是租用”“购买还是订阅”之间重新权衡,算力租赁与托管服务的吸引力随之上升。 三是产业生态加速完善带来规模效应。国内大模型产品在通用能力、工具链与生态合作上持续推进,带动服务器、网络、存储、机房、电力与运维等环节协同扩张,为Token快速增长提供了供给基础。 影响——“卖服务”与“卖算力”分工深化 产业链多环节受益 从产业分工看,大模型应用端竞争愈发激烈,而算力与基础设施环节的商业逻辑相对清晰:需求可量化、交付可标准化、现金流更可预测。算力租赁、智算中心建设与IDC托管等成为承接需求的重要载体。部分企业通过提供算力底座、机柜托管、网络交换与温控系统等服务,直接受益于行业景气度上行带来的增量。 同时,头部互联网平台持续加固算力底座,带动服务器整机、液冷与精密空调、供配电、机房建设运维等细分环节订单增长。围绕大规模数据中心运行所需的工程与运维能力,产业链正从“设备供给”延伸到“全生命周期服务”,专业分工进一步细化。 值得关注的是,国产算力生态热度上升,对应的合作伙伴在数据中心建设、整机与网络设备供应、行业一体机发布诸上动作频密。此外,政务云与国资云建设开展。安全合规、数据主权、算力自主可控等要求下,地方与行业云的基础设施投入有望保持韧性,为算力产业提供稳定的“基础盘”。 对策——补短板、提能效、强保障,夯实算力供给体系 业内人士认为,面对Token持续走高带来的算力压力,应从供给、效率与安全三上同步推进。 其一,提升算力供给的稳定性与可扩展性。通过“自建+租赁+多云”组合增强峰值弹性;推动智算中心合理布局,优化跨区域调度能力,减少资源闲置与重复建设。 其二,把能效与运维能力作为核心竞争力。数据中心能耗与电力保障是成本关键变量,应加快高效制冷、液冷应用、能耗监测与智能运维,推动PUE等指标持续改善,“算力增长”与“绿色约束”之间取得平衡。 其三,完善安全与合规体系。大模型应用对数据安全、内容安全与隐私保护提出更高要求。国资云、政务云场景更需要在算力底座、数据治理、访问控制与审计追溯上形成标准化能力,确保“用得上、用得稳、用得安全”。 前景——算力将从成本项转为生产要素 结构性机会仍将延续 综合判断,Token增长趋势短期内难以逆转:一方面,多模态与视频生成等新应用仍处渗透期,单位任务消耗更高;另一上,企业端在智能客服、营销内容生产、研发辅助、办公协同等场景的规模化部署,将把推理需求从“试用”推向“常态化生产”。在这个过程中,算力产业链的机会将更多体现在三条主线:一是以算力租赁、托管与云服务为代表的弹性供给;二是服务器、网络与存储等硬件系统的迭代升级;三是围绕数据中心能效、运维与交付的工程化能力沉淀。 同时也需看到,行业快速扩张可能带来阶段性供需错配与价格波动。企业布局算力时,应避免盲目上马与同质化竞争,更重视交付质量、资源利用率与长期客户黏性,以规模化、标准化和精细化运营穿越周期。
算力产业的快速发展,折射出中国科技与数字经济的加速进阶。在全球技术竞争加剧的背景下,如何在效率与安全、创新与可持续之间取得平衡,将成为行业长期课题。只有夯实底座、推动协同创新,才能在新一轮技术变革中赢得更大主动权。