英伟达成立nemotron 联盟,把基础模型变成能卖钱的东西

英伟达在这次GTC大会上抛出了一个大招,那就是成立Nemotron联盟。在这个把大家的专业知识、数据还有评估能力都给拢在一起的平台上,大家能一起去搞那个开放的基础模型。这就好比是开了个互相借力的大会,不光是给加入的人带来了便利,更是给整个AI行业的发展加了把火。首发阵容里面就有BlackForestLabs、Cursor、LangChain、Mistral这几个响当当的公司。比如说那个做Flux图像模型的BlackForestLabs就直接找了英伟达合作优化,Perplexity和LangChain也是把人家的Nemotron模型直接用进了自家的系统里。 Kari Briski在讲台上说了,搞出个牛的基础模型那得花老鼻子时间、专业的知识还有大把的算力,这哪是一个公司就能自己包圆儿的?通过这个联盟,大家伙儿就不用去干那种重复性的训练了。大家把自己最擅长的东西都拿出来贡献一下,英伟达呢就专门把DGX这种超级算力资源给提供出来。这模式可真叫高效,基础模型的开发速度肯定能蹭蹭往上涨。 说到这儿就得提一嘴现在的形势了。大家都在争着去搞基础模型,这玩意儿都快成了企业入场的门票了。可光有这张门票不行啊,Briski也说了,得在上面再做些后处理或者别的活儿才行。只有这样才能把基础模型变成能卖钱的东西。 Nemotron3Ultra是个重磅炸弹,虽然还没正式放出来,但它有5000亿个参数呢!这参数里头活跃的也有500亿个。英伟达给它封了个“世界上最好的开放基础模型”的名头。还有那个Nemotron3Super也挺抢眼的,它是一个混合了Mamba-Transformer的家伙,参数堆了1200亿。它在PinchBench那个测试里表现特别猛。 这个联盟不光是在帮公司搞技术支援,更是给整个行业指明了一条新路。以后这种基础模型肯定用得越来越多。越来越多的企业都会开始盯着开放模型看,技术也能共享了。 总而言之吧,Nemotron联盟其实就是个把技术实力凑一块儿的地方,更是推动大家共享和创新的重要推手。接下来大家都得好好琢磨琢磨咋把这些现成的模型用起来赚钱了。