阿里千问生活助理功能的推出,展现了大模型在日常生活场景中的实际应用。用户可通过自然语言指令调用淘宝闪购、飞猪等服务。以点咖啡为例,千问接收指令后自动调用淘宝闪购——根据用户定位推荐附近门店——用户选定商品后通过支付宝完成支付,全程无需离开应用。酒店预订、机票查询等服务也通过接入阿里平台实现。 千问采用的API接口方案有明显优势。通过调用合作平台的编程接口,AI能够精准识别用户需求、检索库存、匹配商品,最后生成待确认订单。这种方式执行流畅,用户体验更好。更重要的是,订单提交和支付等敏感环节只执行至待确认状态,用户必须亲自审查并确认,充分保护了用户权益,也规避了法律风险。 但API方案也有现实困难。愿意提供接口的应用数量有限,需要逐一谈判合作。即便达成合作,第三方应用开放的功能也往往受限。这意味着智能体难以满足泛化需求,用户可能仍需在多个应用间切换。 字节豆包采取了不同路线。该助手通过读取屏幕内容和模拟用户操作完成任务,无需第三方应用适配,通用性更强。但这个方案也有明显短板。屏幕模拟的运行流畅度不及API方案,且涉及手机底层敏感权限,引发隐私担忧。更关键的是,调用外部应用是否需要授权存在法律争议。在合规压力下,豆包不得不暂时关闭了调用多个头部应用的能力,削弱了功能完整性。 千问上线两个月来,用户主动询问商品推荐的次数月环比增长300%,反映出市场对AI购物决策辅助的强烈需求。阿里正是基于这一发现,将AI能力应用于电商场景,帮助用户在海量商品中快速做出决策。这种需求驱动的产品迭代,表明了大模型应用从技术探索向实际价值创造的转变。 手机AI智能体已成为大模型厂商和终端厂商竞逐的焦点,被视为未来重要的流量入口。两种技术路线的并行探索,反映了行业在寻找最优解的不同思路。API接口方案强调安全性和体验流畅度,但受限于生态开放程度;屏幕模拟方案追求通用性,但面临隐私和合规挑战。
智能生活服务的升级——既是技术创新的竞技场——也是商业伦理的试金石。科技企业在布局此战略高地时,如何平衡用户体验、商业生态与数据安全,将决定行业的健康发展。这场围绕智能助手的探索,终将推动数字服务向更智能、更人性化的方向演进。