千问调研:AI Agent落地过程中潜在风险及应对措施,2026年出海节奏估计,AI硬件如眼镜及和荣耀等合作,潜在商业化模式探讨 – 字节/腾讯

2/9/2026, 8:39:04 AM

摘要

以下为专家观点:

1,随着AI Agent开始触及最后的执行操作,国内市场将如何应对由此产生的潜在风险?从企业和监管层面看,字节跳动和阿里巴巴等公司在赋予Agent执行权限时,核心考量点是什么?目前是否存在相关的监管法规?

AI Agent直接替用户执行操作确实带来了新的风险,可能会出现跳过用户确认而直接决策,从而导致意想不到的后果,既有惊喜也伴随风险。在国内,腾讯因其注重风险和底线的企业文化,在此方面可能会最为谨慎。

对于阿里巴巴和字节跳动等公司而言,在赋予Agent执行权限时,核心考量点主要围绕安全性和可追溯性。以阿里巴巴的ACT协议为例,其强制要求最终支付环节必须通过支付宝完成。这一设计的目的在于,利用支付宝成熟的支付协议来保障AI执行链路的安全性,同时确保每一笔交易都有类似交易日志的记录,使其具备可回溯性,...

全文

以下为专家观点:

1,随着AI Agent开始触及最后的执行操作,国内市场将如何应对由此产生的潜在风险?从企业和监管层面看,字节跳动和阿里巴巴等公司在赋予Agent执行权限时,核心考量点是什么?目前是否存在相关的监管法规?

AI Agent直接替用户执行操作确实带来了新的风险,可能会出现跳过用户确认而直接决策,从而导致意想不到的后果,既有惊喜也伴随风险。在国内,腾讯因其注重风险和底线的企业文化,在此方面可能会最为谨慎。

对于阿里巴巴和字节跳动等公司而言,在赋予Agent执行权限时,核心考量点主要围绕安全性和可追溯性。以阿里巴巴的ACT协议为例,其强制要求最终支付环节必须通过支付宝完成。这一设计的目的在于,利用支付宝成熟的支付协议来保障AI执行链路的安全性,同时确保每一笔交易都有类似交易日志的记录,使其具备可回溯性,以便在出现问题时进行追溯和处理。

目前,从国家监管层面尚未看到针对AI Agent执行权限出台具体的法规或监管条文。


2,在AI执行交易任务方面,尤其是在广告和直接购买等场景中,存在哪些安全风险与监管考量,以及目前采取了怎样的风险控制措施?

当前的监管重点主要集中在AI广告领域,特别是对于那些没有明确标识的隐性“GEO广告”。在任务执行层面,为应对安全风险,一些公司比如千问采取了分步走的策略。目前,AI可以辅助用户完成交易前的流程,但最终的交易确认环节仍需用户进行二次确认,千问并未将完整的交易执行权限完全交给AI,这是短期内不会开放的核心原则。风险在阿里体系内是可控的,因为AI的运行必须基于ACT协议,该协议的每一层都设有风险管控机制。即使到了最后的支付宝交易环节,也会有设备IP等多维度的风控系统介入。千问没有也计划不会开放对微信支付或银行卡直接支付的协议,确保整个交易过程的可控与可追溯。未来,随着产品迭代,风险控制也需要寻求突破。

预计在2026年年中模型升级后,AI服务将从被动响应转变为主动服务。例如,用户可以设定一条指令,当iPhone价格达到某个区间时,AI自动执行交易闭环。这种主动服务模式要求交易完全由AI进行,为此阿里正在加紧研发端侧模型,并结合端云协同的方案,将本地数据保留在端侧,需要处理的结果放在云端,以实现有效的隔离。


3,将阿里生态内的各类Agent接入千问,当前面临哪些主要的技术瓶颈或用户体验上的挑战,以及相应的解决方案是什么?

将“千问”接入生态系统后,主要挑战体现在电商这类复杂场景。电商涉及的品类繁多且广泛,导致AI在处理复杂品类时的任务完成率,相比于闪购或飞猪这类品类相对单一的应用要低。以闪购为例,其任务处理率较高,能够较好地完成从用户意图识别、商品卡推荐到最终交易的全流程呈现,但订单完成率一般。这主要是因为模型处理长文本的能力尚有不足。为解决此问题,可能会在春节后接入更高的模型版本,其长文本处理能力将比3.0版本提升一倍以上,以更好地支持复杂的电商交易链路。

从现状来看,单任务的整体处理率符合预期。然而,多任务处理率远未达到要求,导致用户体验不佳。多任务处理指的是用户的单一意图可能包含淘宝购物、高德地图出行和飞猪酒旅等跨生态的需求。因此,现阶段阿里的重点仍是优化单任务处理。

另一个巨大挑战是处理时效性。比如不仅要支持文本对话,还要将服务集成到硬件、视频对话、语音通话等多模态实时交互场景中。目前,整个商品推荐过程耗时约4到4.x秒,而中短期目标是将其控制在2秒以内,甚至1秒以下,以提升用户体验的流畅性。


4,千问中短期内单任务和多任务的准确率预计将提升至何种水平,这将对用户留存和业务规模产生怎样的影响?

模型的显著提升预计将在版本更新后体现。阿里每个月的15号会进行一次大版本更新,未来计划对单任务和多任务处理能力进行优化,目标是将多任务处理率提升至85%以上,单任务处理率提升至99%。

从业务数据来看,目前的日均GMV表现尚可,这部分得益于阿里在整合生态时投入了6000万元的随机立减优惠券,使得约六成用户认为通过“千问”点外卖比在淘宝闪购更便宜。然而,真正认为产品体验好的用户占比并未达到阿里的预期。


5,如何看待千问在海外市场的拓展规划,特别是在第三方服务商的接入方面进展?

根据专家个人理解,尽管尚未发布独立的出海产品,但准备工作已在进行中。阿里已通过后端模型完成了多语言版本的开发,并接入了海外产品,统一使用了谷歌的UCP,该协议整合了海外的电商、本地生活以及Uber等打车服务。同时,中间层生态也会打通阿里在海外布局的电商和阿里支付等产品。综合来看,未来发布时会优先选择东南亚和南美市场,因为阿里在这些地区的生态布局市场份额较大且体系较为完整。

在与海外第三方服务商接触方面,情况呈现两极分化。像亚马逊这样的头部电商平台接入意愿不强。相比之下,垂直领域的服务商,如Uber这类打车应用,则表现出较高的接入意愿。因此,阿里也在寻求与更多中小型厂商合作,例如已经与爱彼迎这类旅宿服务平台完成了一些接入。目前,与第三方服务生态的合作仍处于接触阶段,垂直领域的中腰部或尾部服务商的合作意愿相对更高。


6,对于AI驱动的电商模式,其GMV渗透率的长期预期?

根据当前情况,专家个人预估2026年全年由AI驱动的电商GMV占比将在1.5%至2%之间。真正的拐点预计出现在2027年至2028年,届时渗透率将加速提升,预计2027年达到5%,到2028年将超过15%至20%的区间。

做出这一决策主要基于以下几点判断:

首先,用户心智的转变会非常迅速,随着营销层面的投入,用户会逐渐从传统电商转向对话式服务。

其次,产品本身正从初级阶段快速发展。2026年模型侧的发展速度将超过2025年,重点方向是任务执行与主动服务,而非仅仅提升基础问答的准确性。这将使AI在生活履约和交易环节中扮演更重要的角色,模型的决策能力是关键。

最后,阿里的布局不局限于软件层面,也包括硬件端。一方面,阿里与手机厂商合作,实现系统级入口的接入;另一方面,阿里也在发展独立的硬件产品,如AI眼镜,以承载履约交易的物理感官体验。


7,在硬件产品方面,2026年有哪些具体规划和布局?

2026年,阿里将基于夸克AI眼镜推出三个不同版本,包括全彩无显示和单绿显示的型号。此外,还会加入智能戒指等配件,以增强操控性和提供健康监测功能。同时,阿里还会推出一款类似智能语音设备的产品,以满足家庭场景的使用需求。这些都是硬件上的延展。除了AI眼镜、家庭语音设备以及学习平板这类相对小众的垂直品类,阿里的一个重要方向是与手机厂商合作。通过这种合作,未来的手机机型可以在系统层面选择调用“千问”的服务能力,用户无需打开App,通过荣耀的语音助手就能直接调用“千问”的能力,完成交易服务。阿里采取的是自有硬件发展和与现有硬件厂商合作双线并行的策略。


8,针对千问,其潜在的商业化方向和具体模式是怎样的?

2026年的商业化目标设定得相对保守。主要有两种模式:

第一种是交易抽佣。阿里对每一笔通过“千问”完成的交易进行抽佣。预计2026年“千问”将贡献约数百亿的GMV,从中获得的抽成收入约为几亿元。

第二种是GEO广告。阿里正在试点在AI的回答结果中投放广告,预计这部分能贡献8至10亿的收入规模。这是一个非常谨慎的试点,计划覆盖的用户比例不会超过10%,即90%的用户不会接触到这类广告。广告形式不仅是在回答中植入品牌名称或商品,还会加入官网链接或商品卡,探索AI广告与商品交易的融合。


9,对于接入千问生态的第三方服务(如携程)和与硬件厂商(如荣耀)的合作,具体的商业化模式和收入分成机制是怎样的?

与携程这类第三方服务商的合作模式是收取佣金。根据目前的商谈结果,携程将有三个月的免佣金期,之后按初始佣金率进行抽成。

与荣耀的合作模式则不同,它提供的是端侧的硬件服务。阿里之间的计费方式是按照token调用量来计算,这部分收入会给到阿里云。当用户通过荣耀手机完成了交易闭环,产生的佣金会按照一定比例返还给手机厂商,这是一个再分成的过程。对于商家或淘宝这样的供应商而言,整个过程是无感的,他们无需关心这部分的分成细节。目前,手机厂商的具体分成比例尚未最终确定。

觉得有帮助?分享给朋友,带来新用户可持续支持我们更新高质量内容。