← 返回列表

火山调研:AI推理需求爆发-日均Tokens调用量增长趋势,NV卡以及寒武纪590、昇腾910系列在AI推理用应用对比,东南亚数据中心使用方式,自研芯片预期 – 寒武纪/昇腾/昆仑芯

摘要

2026年以来,火山引擎推理端需求增长超预期,日均Token消耗量增至近100万亿。增长核心由企业级订阅驱动,SeeDance2.0等新模型发布加剧了算力紧缺。目前推理仍以英伟达芯片为主,寒武纪590作为主要补充,性能约达A800的80%至85%。为解决缺口,火山采取国产化适配、合规租用及探索海外资源调度等策略。国产芯片采购中,寒武纪因适配成熟度高位列首选,华为昇腾紧随其后。此外,字节跳动正推进自研芯片并洽谈与华为的深度资源合作,未来采购格局将受自研进展与供应链合规性影响。

全文

全文为付费会员专享,免费用户仅可阅读摘要。

觉得有帮助?分享给朋友,带来新用户可持续支持我们更新高质量内容。