近期,全球模型聚合平台OpenRouter数据显示,中国大模型一周Token调用量达4.69万亿,连续第二周超过美国,全球前三名均为中国模型。同时,国内头部应用Kimi融资与市场表现走强,估值短期快速上升,订阅与收入增长显著,显示出行业活跃度和国际影响力持续提升。 然而,亮眼数据背后也暴露出算力供需紧张的问题。一线用户使用Kimi时频繁遇到“高峰时段算力不足”提示,这并非单一企业的运营波动,而是调用量快速攀升带来的系统性压力。中国大模型成为全球调用量高地,意味着生态进入高负荷运行阶段,基础设施供给能力正面临考验。 造成算力紧张的首要原因在于应用范式变化。智能体正在从探索走向规模化部署。以OpenClaw等框架为代表,智能体把模型从“问答工具”变为“任务执行者”,运行更持续、流程更长,Token消耗显著增加。Kimi K2.5被海外开发者选作主力模型,调用量明显上升,继续加重资源负担。与传统对话相比,智能体单位时间消耗可达数十倍甚至更高,需求呈倍数级增长。 第二个原因是应用场景向复杂任务扩展。大模型从文本交互延伸至编程、多模态处理、视频理解等高消耗领域。以编程为例,模型需反复生成、测试、修正,Token密集且持续时间长;多模态任务涉及大量图像、视频解析,单次处理成本明显高于普通对话。技术能力升级与用户需求升级叠加,进一步推高总体消耗。 第三个原因是用户规模迅速扩大。随着更多平台接入智能体框架,AI应用从开发者工具走向大众使用场景,未来可能嵌入国民级产品。用户基数从几十万跃升至亿级规模,将带来连续、海量、全天候的调用需求,现有算力储备难以完全覆盖。 算力紧张的影响不仅是用户体验下降,还可能限制创新速度和产业扩张节奏。一上,算力不足会导致服务限流、响应延迟,影响企业口碑与市场转化;另一方面,高消耗场景若无法稳定供应,将推高成本,影响产品定价与普及。 面向这个趋势,业内普遍认为需要多方协同加快“算力—模型—应用”全链条建设。一是加快建设新型算力基础设施,优化算力布局,提高资源调度效率;二是推动模型算法优化和推理效率提升,以更高效的技术降低Token消耗;三是完善行业资源共享与服务保障机制,形成可持续的供需匹配体系。政策层面也可通过标准建设和数据中心布局引导,推动行业良性竞争与稳健扩张。 展望未来,机构预测中国AI推理Token消耗量未来五年将增长数百倍,说明产业正处在大规模应用前夜。能否在增长与供给之间建立平衡,将决定中国大模型在全球竞争中的持续优势。
中国人工智能产业正处在从规模扩张走向高质量发展的关键节点;技术创新与资本热度不断抬高行业上限之际,如何构建匹配的算力底座和可持续生态,将成为影响未来国际竞争格局的核心问题。这场由4.69万亿Token调用量引发的算力考验,或许正是检验我国科技产业体系韧性的契机。