蚂蚁数科发布了ling dt-fin-mini-2.5，这可是ling dt 系列的第一款金融轻量模型。

蚂蚁数科这次发布了Ling-DT-Fin-Mini-2.5，这可是Ling DT系列的第一款金融轻量模型。基于Ling2.5的混合线性注意力架构，它在保证专业性的同时，把推理成本压得特别低，硬件成本也少花了不少钱。跟别的同能力的大模型比，它的速度提高了整整100%，这可太厉害了！给那些对成本和速度特别敏感的金融机构提供了实实在在的好方案。其实现在AI智能体正往“任务执行”这个方向猛冲，OpenClaw就是最好的代表。可这东西在实际干活的时候也挺麻烦，因为不熟悉行业规矩和业务流程，执行复杂任务时老是乱调用工具，结果Tokens消耗得特别多。比如高频调用场景下，它花的钱能达到集成式Agent的几十倍甚至上百倍，这让它很难大规模铺开用。章鹏就说，企业得结合实际情况搞个大小模型协同的方案，既能省钱又能提升价值。就拿金融来说吧，每天都有一大堆高频低时延的任务要处理。以前那些大模型虽然推理能力强，但在这种场景里成本太高、响应又慢，纯属资源浪费。真正想要的是专业、严谨还合规的高性价比方案。大模型负责复杂推理和深度分析就对了，小模型干高频小任务效率高还便宜。所以把两者结合起来才是最管用的路子。论坛上章鹏还提到OpenClaw的兴起会带来企业级AI范式的变革，推动大模型从比参数规模转向比Token效能。他特别强调提升单位Token的效能是现在落地下半场的核心目标。他觉得技术发展最终还是得回归产业对效率的理性追求。下一阶段衡量企业级AI价值的核心指标就看Tokens花得值不值。蚂蚁数科以后还会继续深耕AGI领域，打算推出百灵企业版Ling DT大模型及其行业版，助力智能体在复杂场景里真正跑起来。除了蚂蚁数科，OpenAI最近也搞了两个小模型GPT‑5.4mini和nano，专门用来做执行层子智能体。这些都说明大小模型结合已经是个大趋势了。未来Token效能肯定会成为大家最看重的东西。