英伟达下个月的gtc 大会要推个新的推理芯片,把groq家的lpu 架构给整合进去了

英伟达下个月的GTC大会要推个新的推理芯片,把Groq家的LPU架构给整合进去了,打算把纯CPU部署这块市场也给开拓开来。现在AI技术正在拼命往应用层渗透,全球芯片巨头英伟达打算通过改变架构和搞生态布局,把行业局面给重写一下。有财经媒体透露,英伟达要在最近的峰会上发新一代推理芯片,这玩意把初创公司Groq的“语言处理单元”技术给加进去了。创始人管它叫“划时代的产品”,专门是给AI模型实时响应场景设计的。它跟以前的GPU不一样,核心是用SRAM密集型存储方案和3D堆叠技术,把计算和存储单元垂直堆起来。这么搞突破了传统芯片在内存带宽和延迟上的硬伤。分析师说这能让大语言模型解码快好几倍,能耗也能降40%以上。 市场格局在变,OpenAI这个AI界的巨头成了第一批客户,打算买大批推理算力升级自己的代码工具。这事儿挺说明问题——以前他们找Cerebras合作还在亚马逊Trainium上建基础设施,现在转头投英伟达,说明大家太需要高效的推理方案了。除了硬件创新,英伟达的商业模式也变了。云服务商对成本卡得严,他们开始不搞纯GPU那一套了。这月跟meta的合作就证明了这点:在纯CPU架构的数据中心跑广告推荐系统。这种灵活的策略让英伟达覆盖了训练到推理的所有需求。 现在推理市场多极化挺严重的:Cerebras说自家芯片在特定场景超过英伟达GPU;亚马逊、谷歌这些巨头也在加大自研芯片投入;Anthropic这些新势力靠混合架构减少对单一供应商的依赖。面对这架势,英伟达开始搞一个包含芯片、数据中心、云服务的完整生态,想继续统治推理市场。这场算力革命的底层动力是应用层变了。AI代理技术突破了以后,企业对推理性能的要求爆炸式增长。有技术负责人说智能客服每天要处理好几亿次查询,以前的GPU方案太贵了扛不住。这种需求变化正在重新分产业链的钱,给有架构创新的公司造了新机会。 资本市场盯着英伟达的转型呢。投资机构分析说三年内推理芯片市场可能过千亿美元了。英伟达能不能保住90%以上的份额就看新品实不实用、跟生态能不能兼容了。马上就要开的技术峰会就是第一个考验点。大家都觉得这会引发新一轮AI基础设施的投资热潮。