谷歌云的ai 大佬迈克尔格斯滕哈伯最近聊了聊他们在模型能力上的三个主要发力方向。作为verte

谷歌云的AI大佬迈克尔·格斯滕哈伯最近聊了聊他们在模型能力上的三个主要发力方向。作为Vertex AI平台的负责人,迈克尔在谷歌有一个独特的视角,能看见企业到底怎么用AI,还有就是还得做点什么才能把智能体AI的潜力彻底释放出来。我跟他聊的时候,他说了个以前从没听过的观点,挺让人印象深刻的。他说,现在的AI模型其实是在三个地方同时使劲:一个是原始智能,也就是质量这块;另一个是响应速度;还有一个呢,虽然跟原始能力没啥关系,但跟成本关系大得很,也就是能不能用很低的成本把模型跑起来,好去干那些大规模、不确定的活儿。 这算是看模型能力的一个新思路,对想搞前沿模型的人特别有用。这部分是被编辑过的,为了更清晰点儿。先说说您在AI这块混了多久,还有在谷歌具体干些啥?我在AI圈子里转悠了大概两年。之前在Anthropic待了一年半,现在在谷歌干了快半年了。我主要是管Vertex AI这一块,这是个给开发者用的平台。咱们的客户大多是程序员自己动手做应用的。他们要想用智能体模式,或者想蹭一蹭世界上最厉害的模型来推理东西。我只管把这些能力给他们用上,但不做应用本身。像Shopify、汤森路透这些公司,还有各行各业的客户,他们自己开发的那些应用才是最实际的。 当初是怎么被谷歌吸引过去的?我觉得谷歌在这行挺特别的,从界面一直到基础设施层什么都有。我们能造数据中心、自己买电盖电厂、有自己的芯片和模型、有控制推理层和智能体层的能力、还有搞内存和交错代码编写的API。在此基础上,还有负责合规性治理的引擎。最后我们还有面向企业的Gemini enterprise聊天界面和面向普通用户的Gemini chat。我来这里有一部分原因是看中了这种垂直整合的能力,感觉这对咱们来说是个大优势。 有意思的是,感觉各大实验室能力都挺接近的。这是不是就只是比谁的智能更高的一场比赛?还是说比这要复杂多了?我看见的是三个界限。像Gemini Pro这种模型就盯着原始智能死磕。比如写代码的时候,你就只想要最好的代码就行,哪怕花上45分钟也没所谓,反正以后我还得维护它、得把它弄进生产环境里去用。我只想要最棒的。 还有就是另一个跟延迟有关的界限。如果你在做客服工作,得知道怎么套政策用才行。比如能不能处理退货?能不能给飞机座位升舱?不管你回答得有多对劲儿,要是花了45分钟才给我答案,那也白搭。所以对于这种情况,你就希望在这个延迟预算里拿到最聪明的产品。因为一旦客户觉得无聊挂断电话了,再多的智能也就没啥用了。 最后还有一种情况是像Reddit或者Meta这种公司想管住整个互联网呢?他们手里钱多得是,但如果搞不清怎么扩展规模,那在这种级别的项目上他们可不敢随便冒险碰运气啊!不知道今天或者明天会冒出来多少有害的帖子。所以他们就必须把预算卡在能承担的最高智能模型上,但还得保证能把数量无限多的主题都给处理掉才行。这种时候成本就变得至关重要了。 我一直没搞懂的是为啥智能体系统普及得这么慢?感觉技术上已经具备了相关的本事了。我也看过不少让人惊叹的演示,但也没见到像大家一年前想象的那种翻天覆地的变化。您觉得到底是什么拦着了它的发展脚步? 这个技术也就刚发展了两年左右吧?基础设施还缺了很多。咱们现在还没有审计智能体行为的模式、也没有给智能体授权数据的模式啊!有些模式搞起来得花大力气才能放进生产环境里去用。而生产环节通常都是技术能力的滞后指标嘛!所以两年时间根本不够让你看清这技术在生产里到底能顶多大用——这也正是大伙儿正在拼命想办法解决的问题呢! 我感觉在软件工程这一块儿发展得特别快?因为它特别适合软件开发生命周期这块儿的逻辑嘛!咱们有个地方可以放心大胆地乱搞代码搞坏东西测试测试的环境;然后再把它从测试环境升级到正式运行的环境里去用。 比如在谷歌写代码的时候就得经过两个人的审核签字确认才行呢!两个人都得点头说这个代码足够好、能代表谷歌的品牌、也能拿给咱们的客户用才行。所以咱们这边有很多人机配合的流程啊!把实施这件事的风险压得特别低! 但现在咱们得在别的地方、别的行业里面建立起这些模式来才行!