蚂蚁数科发布了ling dt-fin-mini-2.5,这可是ling dt 系列的第一款金融轻量模型。

蚂蚁数科这次发布了Ling-DT-Fin-Mini-2.5,这可是Ling DT系列的第一款金融轻量模型。基于Ling2.5的混合线性注意力架构,它在保证专业性的同时,把推理成本压得特别低,硬件成本也少花了不少钱。跟别的同能力的大模型比,它的速度提高了整整100%,这可太厉害了!给那些对成本和速度特别敏感的金融机构提供了实实在在的好方案。 其实现在AI智能体正往“任务执行”这个方向猛冲,OpenClaw就是最好的代表。可这东西在实际干活的时候也挺麻烦,因为不熟悉行业规矩和业务流程,执行复杂任务时老是乱调用工具,结果Tokens消耗得特别多。比如高频调用场景下,它花的钱能达到集成式Agent的几十倍甚至上百倍,这让它很难大规模铺开用。章鹏就说,企业得结合实际情况搞个大小模型协同的方案,既能省钱又能提升价值。 就拿金融来说吧,每天都有一大堆高频低时延的任务要处理。以前那些大模型虽然推理能力强,但在这种场景里成本太高、响应又慢,纯属资源浪费。真正想要的是专业、严谨还合规的高性价比方案。大模型负责复杂推理和深度分析就对了,小模型干高频小任务效率高还便宜。所以把两者结合起来才是最管用的路子。 论坛上章鹏还提到OpenClaw的兴起会带来企业级AI范式的变革,推动大模型从比参数规模转向比Token效能。他特别强调提升单位Token的效能是现在落地下半场的核心目标。他觉得技术发展最终还是得回归产业对效率的理性追求。下一阶段衡量企业级AI价值的核心指标就看Tokens花得值不值。蚂蚁数科以后还会继续深耕AGI领域,打算推出百灵企业版Ling DT大模型及其行业版,助力智能体在复杂场景里真正跑起来。 除了蚂蚁数科,OpenAI最近也搞了两个小模型GPT‑5.4mini和nano,专门用来做执行层子智能体。这些都说明大小模型结合已经是个大趋势了。未来Token效能肯定会成为大家最看重的东西。