#出处未知,来源未知,注意风险...

2/7/2026, 11:38:10 PM

#出处未知,来源未知,注意风险# # 算力缺口将持续到2027年 Ag­e­nt爆发带来的算力缺口是底层逻辑改变带来的质变增长,并且是指数增长。 单Ag­e­nt算力消耗是传统Ch­a­t­b­ot的100-1000倍,算力缺口将持续至2027年Q2,部分高端环节可能延至2030年。 1️⃣Ag­e­nt如何引爆算力缺口 ‼任务性质质变:从“聊天”到“执行”的算力跃迁 比如千问,一句话点外卖,这背后对to­k­en的消耗是巨大的。 To­k­en消耗爆炸:传统Ch­a­t­b­ot单次交互约2,000 to­k­en;Ag­e­nt启动阶段1-2万 to­k­en,单步思考20万+ to­k­en,完成项目总消耗达百万级,是普通用户的100-1000倍 CPU成为核心瓶颈:Ag­e­nt任务中**90.6%端到端延迟消耗在CPU(工具调用、任务拆解、逻辑判断),GPU仅负责不到20%**密集计算 并发模式重构:从“用户触发”到“7×24小时自主工作”,长任务并发率从Ch­a­t­G­PT的1%飙升至Ag­e­nt的30%-40%,资源持续占用不释放 2️⃣算力核心全面缺货 缺卡众所周知,不再赘述: Ki­mi(月之暗面)在2026年2月5日公开求卡: “是真的缺卡。已扩容几次了,还是缺。” 存储到目前也涨价好几倍,从GPU到存储,CPU也面临缺货延期。先进制程优先排产GPU,材料优先供给等,多种因素叠加导致缺货爆发。 (利好国产替代,光刻机、光刻胶) 3️⃣算力缺口持续到27年 算力缺口或持续到27年,部分高端环节紧张可能延至2030年。 硬件供给本身受限,算力核心硬件(GPU、HBM、先进封装、CPU)的扩产周期都在18-24个月以上。 算力需求不是“线性增长”,而是指数级+结构性质变,2026-2027年将迎来“训练+推理+边缘”三端共振,进一步拉长缺口周期。 还有一个非常非常非常重要的问题,区域错配。 大多数郭嘉都不允许数据出海,所以跨国企业就要在当地建立数据中心。 在跨国企业待过的小伙伴都知道,有些芝麻大小的都要求数据不能出海,咱不说小地方,老美、龙村、欧洲你得搞吧?这些都是新的增长。 特斯拉昨天也宣布了国内的AI训练中心投入使用。国内小鹏出海欧洲,智驾也得在欧洲建立AI训练中心。 我之前甚至在想,有没有可能在巨轮上建一个数据中心,然后跑过来跑过去复用硬件,数据依然本地,训练卡可以到处跑,不知道可行不可行。 总之,算力缺口很大,还将持续!

觉得有帮助?分享给朋友,带来新用户可持续支持我们更新高质量内容。