千问Agentic流程落地大客户形式和挑战,星算计划合作,Kimi Agent Swarm等探讨。
2/9/2026, 12:00:38 AM
摘要
【以下为专家观点汇总,具体细节仅供参考。】
Qwen-3 Max Thinking的测试时拓展和自循环提升的实现路径?对幻觉等性能的提升幅度?
千问3 Max Thinking模型是基于千问系列进行后续训练得到的,其主要特点包括两点:第一,它能够实现自适应的工具调用;第二,它在推理过程中能够基于之前的经验进行优化。例如,当用户提出的问题在上下文中已经被推理并验证过,模型可以直接利用已有结论,而无需重新计算。这种特性显著提升了复杂问题解决的深度和效率。
关于幻觉率,千问3 Max模型虽然没有达到0.5%的水平,但相比之前版本,其架构进行了优化,尤其是在思考过程中的调整。具体来说,该模型通过引入基于身份(identity)的强化学习,在推理时优先考虑...
全文
【以下为专家观点汇总,具体细节仅供参考。】
Qwen-3 Max Thinking的测试时拓展和自循环提升的实现路径?对幻觉等性能的提升幅度?
千问3 Max Thinking模型是基于千问系列进行后续训练得到的,其主要特点包括两点:第一,它能够实现自适应的工具调用;第二,它在推理过程中能够基于之前的经验进行优化。例如,当用户提出的问题在上下文中已经被推理并验证过,模型可以直接利用已有结论,而无需重新计算。这种特性显著提升了复杂问题解决的深度和效率。
关于幻觉率,千问3 Max模型虽然没有达到0.5%的水平,但相比之前版本,其架构进行了优化,尤其是在思考过程中的调整。具体来说,该模型通过引入基于身份(identity)的强化学习,在推理时优先考虑如何调用工具解决问题,而不是单纯依赖预训练知识。这种方法使得其幻觉率有所降低,但尚未达到极低水平。
在Token调用和算力消耗方面,千问3 Max整体上表现为更高效。尽管其思考深度较以往有所增加,但由于引入了基于经验的推理方式,相同步数下所需计算量减少。然而,对于复杂问题,由于需要更深入的思考,其Test Time Scaling机制会导致一定程度上的算力增加。因此,总体来看,该模型在处理简单任务时更加高效,而在处理复杂任务时则展现出更强大的能力。
千问3 Max Thinking相比Omni、Max Instruct在2B目标需求上的差异?
千问3 Max Thinking正逐步成为千问APP的重要底座,并计划整合到该平台中。然而,目前该模型尚未完全应用于To B服务,因为需要结合QPS(每秒查询数)和TPM(每分钟事务数)等指标来调试推理性能,因此暂未全面上线。相比之下,Omni和Max Instruct等其他相关模型已经开始体现出To B端需求。在B端市场中,客户普遍倾向选择性能较强的模型。目前最强大的B端服务型号支持百万Token输入,其定价为5元/输入Token、10元/输出Token,相较以往价格大幅降低。如果使用时间延长至20多分钟,总成本也仅为20多元。在B端客户群体中,大约60%以上选择了Max系列产品,而相对弱一些的Qwen 3 Plus等产品占比则较低。
目前AI Agent的收入贡献水平?
阿里的云收入里面约20%来自于AI,其中40%来自于云租赁,25%左右是来自API调用的。AI Agent相关的应用属于延伸应用和智能体收入。
Qwen在面向2B的Agentic流程商业化的进展?比较典型的1-2个部署案例?
在To B市场中,以行业为抓手,通过场景化Agent实现部署是当前的重要策略。以下是两个典型案例:
• 法律行业:针对企业法律场景,如合同审查、合同撰写等核心需求,提供了专门设计的“法律助手”Agent。用户可以将原始合同文档上传到系统,并选择所需功能模块,例如审查或修改合同条款。系统会自动生成修订建议,并将这些建议以批注形式标注在原始文档上。此外,如果需要重新撰写合同内容,可以调用写作Agent生成新的合同版本。例如,将10份合同同时提交给系统处理,仅需约1小时即可完成所有审阅并生成最终文件,大幅提高工作效率。
• 营销行业:针对营销场景,提供了一整套内容生成工具,包括文案创作、配图生成以及视频制作功能。例如,通过分析目标用户群体及产品信息,可以自动生成符合特定场景需求的营销文案。同时,还能利用AI生成与文案匹配的图片,以及根据现有素材制作十几秒到一两分钟的视频短片,用于投放广告。此外,对于市场调研分析,可通过BI调研分析助手对接客户数据,从而输出包含客户分布、消费行为等信息的数据可视化报告。这些功能均可根据行业需求进行定制或直接使用现成模块,为企业提供灵活、高效的一站式解决方案。
客户在构建整体流程时,通常会先查看是否有现成的解决方案可供选择。如果有现成的方案,他们会进行组合使用;如果没有,则需要从零开始构建。
在公有云架构下,客户通常自行在提供的平台上完成流程设计与实施,而公司更多提供底层模型、工具和框架支持。在混合云架构中,公司提供了一个名为“百炼专属版”的轻量化解决方案,为企业配备所需算力(如英伟达显卡或其他硬件)及服务器,并将“百炼”框架部署到本地端侧。这种混合模式允许企业根据敏感性需求决定数据处理的位置,例如敏感数据留存在本地,而非敏感数据则可以通过云端处理。金融行业由于对数据安全性和合规性的高要求,大多采用混合云模式。例如,在社交交易或量化分析场景下,公司为其提供了一个基础框架,包括规划智能体、执行智能体和反馈智能体三个一级模块,并支持企业根据自身需求进行二次开发。以招商银行为例,其内部开发了名为“小招”的数字员工,用于覆盖HR、培训、客服、薪资等多个场景,通过自定义二级智能体实现完整业务流的自动化管理。
大客户在落地Agentic 流程面临的主要挑战?千问团队如何帮助其加速落地?
招商银行等大客户在落地AI技术过程中主要面临两大挑战:一是跨部门的数据共享问题,由于各部门之间的数据隔离,导致AI无法充分挖掘价值,仅能应用于有限场景;二是难以量化AI带来的实际效益,如降本增效效果难以直观呈现。针对这些问题,公司协助客户优化主架构,实现跨部门的数据共享,从而提升数据利用效率。此外,为了解决效益量化难题,公司帮助客户建立了一套可视化指标体系,以天为单位记录系统使用情况,包括员工与AI交互次数、解决问题数量以及具体提效成果。例如,在销售场景中,通过语音转录功能减少手动记录工作,提高销售人员效率。这些措施不仅帮助企业更好地评估项目效果,也便于管理者向决策层展示项目价值,从而获得更多支持。
对于大型企业而言,其内部通常拥有较强的研发能力,例如招商银行拥有数千名研发人员。因此,在实际操作层面,公司倾向于让这些企业自行完成开发工作,而公司则专注于提供清晰明确的系统架构设计支持。一旦将核心框架理顺后,这些企业能够基于自身资源完成后续开发工作,从而实现更高效、更自主的系统建设。
公有云AI需求与私有/混合云AI需求各自的增长前景?
公有云产品更注重标准化,通过细分场景和预设解决方案满足不同用户需求。公司通过头部客户积累经验,将其沉淀为标准产品,以减少定制开发成本,并引导腰部及尾部客户直接采用成熟产品。而对于私有/混合云用户,则开放权限,让其团队基于公司的框架进行个性化定制,以适应特定行业或业务逻辑需求。
从市场趋势看,私有/混合云主要服务特定行业的大型客户,如金融、制造业及医疗健康领域。这些行业因对数据安全性及技术迭代速度要求较高,更倾向采用灵活且符合监管要求的混合模式。相比传统私有化部署需要半年至一年才能升级,新一代混合模式允许快速迭代更新,以天为单位同步最新版本,因此逐渐成为主流选择。然而,与C端市场可能出现爆发式增长不同,这类B端市场的发展更趋向渐进式成熟,今年(2026年)预计仍处于稳步增长阶段。
2B端的Agentic流程需求上在2026年难以看到显著爆发?
2B的数字化转型之所以被描述为“渐进式”,主要是因为该行业具有高度碎片化的特点。不同企业在不同细分领域中面临的需求和场景各不相同,因此无法通过单一产品或解决方案覆盖所有企业需求。云计算厂商通常需要根据特定行业和具体应用场景提供定制化解决方案。例如,云服务可以按照内容创作、营销、电商、政务等多个细分场景进一步划分,并针对性地开发业务智能(BI)工具或其他功能模块。这种碎片化特性决定了B端市场的发展不会出现短期内大规模爆发,而是以30%-50%的季度增速逐步推进,这样的增长速度在一年内即可实现1.2倍左右的增长,属于较为健康且可持续的发展模式。
如何评价近期Kimi推出的Agent Swarm架构及其实际应用前景?
Agent Swarm架构旨在解决当前智能体(Agent)并发能力受限的问题。在语音对话及多证据协同等复杂链路中,资源占用较高,而Agent Swarm通过将动态任务拆解为多个子智能体并行执行,实现了更高效的大规模并行处理能力,例如支持上百甚至上千个智能体同时运行。该架构标志着模型技术进入了更成熟的阶段,即所谓“A级时代”。这一阶段要求具备完整的一套模型调用工具和部署环境,Agent Swarm正是为了满足这一需求而设计,其核心功能包括提供智能体调度环境和系统架构支持。与主流大厂如阿里的Agent Bay相比,Agent Swarm进一步完善了从模型到部署的一整套服务体系,为客户提供从模型开发到实际应用落地的一站式解决方案。这种整合不仅提升了用户体验,还增强了客户粘性。
千问在“星算计划01组太空计算中心”项目上和国星宇航合作的实现和收入贡献?
“星算计划”旨在应对地球算力资源不足的问题,通过在太空中部署数千颗卫星来扩展计算能力。这些卫星将利用太空中的太阳能供电,并通过“地助天转”的方式,将地面数据传输至卫星进行处理后再返回,从而避免与地面设备争夺资源。目前,该计划处于初期实验阶段,预计第一阶段每颗卫星搭载基础算力设备,用于验证100Gbps带宽下的数据传输与计算链路可行性。长期目标是在未来5至8年内完成2,800颗卫星的部署,以形成大规模太空算力网络。在此过程中,将逐步提高卫星密度、带宽以及整体性能。目前,该项目尚处于投入期,短期内不会对收入产生显著贡献,但未来可能成为重要商业模式之一。
PPU是否有明确对外销售计划?今年内售与外售比例?
PPU目前已制定明确对外销售计划。在2025年,约70%的PPU销量用于内部消耗,其中包括阿里巴巴集团内部使用以及蚂蚁集团租赁使用。然而,由于平头哥即将上市,公司正在调整业务结构以增加对外销售占比。今年(2026年),目标是将内部与外部销售比例调整,提升外部销售比例。此外,今年公司还计划通过超节点服务器捆绑销售PPU,以吸引更多国资企业、大型互联网公司及汽车制造企业等客户群体,从而进一步提升市场份额并优化业务结构。
觉得有帮助?分享给朋友,带来新用户可持续支持我们更新高质量内容。