美国防部和anthropic 之间的那点事儿,也算是现在所有搞ai 公司都躲不过的坎儿。

有一个事情我给大伙念叨念叨,就说那个美国国防部跟Anthropic之间那点事儿,也算是现在所有搞AI公司都躲不过的坎儿。Pentagon那边因为怎么用Claude的问题跟Anthropic僵在那儿了,这事儿也把所有靠单一款式的顶尖AI模型过日子的CTO都给难住了。你细品品,如果明天人家不给你用了,你再想换另一个模型,这中间得费多大劲?多麻烦?这事儿Axios也报道了,国防部长Hegseth周二一大早直接把Anthropic的CEO Dario Amodei请到了五角大楼,就是想把这个美国国防部(DoD)能不能接着用Claude这事儿给谈清楚。 咱们先说说五角大楼心里那点憋屈。其实大家都知道Anthropic给Claude设了不少限制,国防部分多少也挺不高兴的。不过Anthropic也不打算完全撕破脸,毕竟这钱不能不赚嘛,他们就说可以稍微松一松口子,但有一条底线不能破:绝对不能用自家技术去监视美国人或者开发那些没有人性参与的杀人武器。Axios里面的话挺实在的,要想把根深蒂固的Claude全换掉换成现在的哪个次一等的AI实验室来顶班?那简直就是在折腾人啊。 不过话说回来,要是换个方式看呢?真的就得非得彻底折腾一番不可吗?NeuroMetric AI这家公司的CEO Rob May觉得也未必。他觉得他们公司的活儿就是帮企业摆脱对Claude这种单款巨型模型的依赖。他们家怎么操作的?其实挺简单的,就是帮你分析AI的流量,然后把那些合适的查询给分流到更小、更便宜、也更快的模型上跑。这里面还包括那些开源选项或者自己搭的小型模型。May跟《The New Stack》说过这么个道理:咱们平时把他们接进你们的AI流量里去分析一下,然后就能告诉你们,“哦哟,这些简单的问题你完全可以拿那个开源模型跑一跑;那些稍微复杂点的你甚至自己就有本事搭出来。” 再琢磨琢磨啊,这种动辄几百上千万的超大型模型真的就那么香吗?其实对于好多任务来说,真的就是牛刀杀鸡、大材小用啊!它太慢了不说还死贵死贵的。May觉得那些搞大模型的公司有点像以前的大型机时代的角色……当然了一开始你需要这些大公司给你演示演示AI模型到底能有多强的本事,不过等到你真的用了一段时间就会发现,其实你那一大半的查询根本没必要送到Anthropic或者OpenAI那边去。这不仅是在浪费资源更是在浪费钱。 另外一点更让人清醒的是:那些大模型背后的人简直就是智商天花板的代表啊!你会有那种闲功夫去求人家做那种连我都会的客户服务问题吗?你肯定不会对吧?那纯粹是在浪费人家时间嘛!所以你公司里的AI工作负荷也应该按照这个道理去安排。May给企业支了个招:想要彻底解决这个问题你得有两样东西。第一个是一个能够灵活调配多个模型还能带个故障转移功能的编排层;第二个是一个专门用来根据成本、速度和准确性去测试新模型在实际工作中表现的评估框架。 而且他还特别强调说,在他看来国防部不如直接在内部自己去微调像Meta的Llama这样的开源模型或者用人类反馈来强化学习的模型算了,反正千万别指望外面的商业供应商能像你们自己的人一样听话。May最后说句掏心窝子的话:“未来的战争就是AI驱动的嘛!国防部肯定需要掌握这种核心技术才行。” 就在咱们讨论这些的时候咱们也得看看时间线啊!要是你有个12步的工作流程(以前不是这样的),每一步都得去调用Claude才能完成的话,那这一来一回至少得800毫秒到2.5秒的延迟啊!这么一算下来你这整个流程走下来光时间成本就达到了25秒! 所以如果有办法让你在其中某些步骤上运行更小的模型呢?那肯定会便宜得多也快得多! 无论是因为政策对不上茬儿、还是价格没谈拢或者是地缘政治的压力导致了现在这种局面。总之国防部这就不是一个孤立事件。 哪怕手里攥着2亿美元的政府大单Anthropic也敢给你立规矩说明白一件事:顶尖的AI供应商这时候肯定还是把自家的政策放在第一位而不是客户的需求放在第一位。May还问了个很有意思的问题:“他们是不是应该为了联邦政府就直接把服务条款给废掉?” 如果联邦政府想利用这些模型去帮忙规划怎么把加勒比海那边的毒船给摧毁掉——你会允许任何人这么干吗?这就把Anthropic给难住了。 其实Axios也说了上午那次会谈肯定不会有好脸色看的。“这就是一次‘要么就干要么就滚蛋’的会”,一位高级国防官员跟媒体透露。