深夜大规模服务中断折射大模型应用“可靠性短板”,稳定性建设亟待提速

3月29日22时起,国内某主流人工智能服务平台突发系统故障,网页端和移动端均无法正常使用,部分高阶功能被明显限流。故障持续至次日7时才逐步恢复,恢复时间显著长于行业平均约2小时的应急响应水平。第三方监测数据显示,该平台全球月活跃用户约1.25亿至1.56亿,日活跃用户约1300万。本次故障对大量用户的工作与学习造成直接影响。

大模型走入千行百业,带来的不仅是效率提升,也对稳定性、韧性与责任提出更高要求;这次故障的提醒在于:衡量先进,不只看能力上限,更要看运行下限。把可靠运行作为底线,把透明沟通变成常态,才能让新技术更稳地融入生产生活,形成可持续的创新动力。