CPO调研:CPO进展/量产节奏/组装良率水平展望, socket的设计算CPO还是更接近NPO?CPO的TCO优势, 解耦vs强绑定背后CSP/芯片阵营话语权对CPO渗透影响 - 聚焦LITE/Coherent/英伟达/台积电/博通/Meta

2/9/2026, 12:03:46 AM

摘要

以下是调研纪要总结:

- 公司CPO当前最先批量交付的是外置光源(ELS)相关激光芯片,ELS模块进度更慢、兑现滞后。已收到数百万只激光芯片订单,预计2026Q2~Q3放量,2027进入大规模出货阶段;

- “socket 可维护”更多是外界推测:专家口径仍偏“纯CPO(光电混合封装)”,维护以“整tray更换”为主,而不是拆换光引擎。网络上“socket/NPO式插拔光引擎”的说法,专家认为更接近NPO概念、工程落地未见明确案例。

- CPO在特定环节具备显著节能与TCO优势,scale-out大范围渗透仍受“必要性/运维稳定/解耦诉求”约束。以102T交换机对比为例,专家认为CPO在scale up层功耗上可降40–50%;但中短期内多数scale-o...

全文

以下是调研纪要总结:

- 公司CPO当前最先批量交付的是外置光源(ELS)相关激光芯片,ELS模块进度更慢、兑现滞后。已收到数百万只激光芯片订单,预计2026Q2~Q3放量,2027进入大规模出货阶段;

- “socket 可维护”更多是外界推测:专家口径仍偏“纯CPO(光电混合封装)”,维护以“整tray更换”为主,而不是拆换光引擎。网络上“socket/NPO式插拔光引擎”的说法,专家认为更接近NPO概念、工程落地未见明确案例。

- CPO在特定环节具备显著节能与TCO优势,scale-out大范围渗透仍受“必要性/运维稳定/解耦诉求”约束。以102T交换机对比为例,专家认为CPO在scale up层功耗上可降40–50%;但中短期内多数scale-out场景TCO优势并不显著,叠加CSP亦倾向避免被芯片厂强绑定,可能优先采用NPO/LPO等过渡方案,是否在2027–2028后出现更大范围迁移仍待观察(包括产业规模化效应带来的成本下降/良率提升、供应链博弈等因素)。

以下是专家观点:

Bryce:能否介绍下目前CPO相关进展情况?近期市场对CPO话题非常关注,能否请结合这些信息讲讲现在CPO的发展现状?

专家:目前在CPO领域主要批量交付的产品是外置光源的ELS光芯片,同时也在开发ELS模块,但ELS的进展相对较慢,预计要到2026年第三季度才能送样。未来会有两类产品:一类是激光器芯片,另一类是ELS模块。2025年公司已经收到部分激光器芯片的订单,数量在几百万只左右。

 

由于2027年光芯片产能较为紧张,终端客户更倾向于提前下单以锁定产能。从CPO用的外置光源和ELS用的光芯片发货节奏来看,2026年第二季度末或第三季度,出货量才会明显增长。到2027年,预计会进入大规模出货阶段。

 

公司的光芯片产能将在2026年第三季度提升,2026年上半年会有部分激光器芯片出货,但量不大,Q1略有发货,Q2略有增加,真正放量要到Q2末或Q3。

 

公司自研的ELS模块量产时间取决于对方的整体验证周期,大约需要2到3个季度,再加上公司会寻找代工厂协作,预计批量生产要到2026年底或2027年。2026年公司主要出货光芯片。

 

Bryce:目前收到的订单主要用于scale up还是scale out?

专家:公司收到的订单,客户并没有明确区分是用于scale up还是scale out,两种应用场景所用的CPO光芯片实际上是一样的。公司内部沟通认为,CPO的部署可能会优先在scale out场景,后续scale up的量也会远高于scale out。但无法从订单中看到下游具体应用是scale up还是scale out。

 

Bryce:有信息显示,英伟达在两个柜子之间的scale up层面采用了CPO,之前的痛点是可插拔或可维护性不佳,现在采用了所谓的socket设计。请问socket设计目前处于什么阶段?可行性如何?产业怎么看?此外,这种设计在概念上属于CPO还是NPO?

专家:也看过相关的信息,文档中提到是将交换机的ASIC芯片与硅光部分做成可插拔设计,把光引擎与ASIC靠得很近。但据个人了解,英伟达方案是纯CPO方案,通过台积电实现光电混合封装。维护时,并不是把光引擎从ASIC上拆下直接更换。实际场景中,光芯片作为无源器件,可靠性很高,很难出现故障,ASIC芯片本身寿命也较长。维护时,通常是将整个tray(托盘)更换,而不是单独更换硅光部分。每个tray都是独立单元,出现问题时会整体更换,然后对tray进行返修和维护。交换机ASIC本身的故障率较低,而将带有激光器芯片的部分做成ELS,是因为这部分在交换机中失效率相对较高。传统交换机中,最容易出问题的是光模块内的光芯片,因此在CPO交换机设计时,将激光器芯片做成ELS,实现可插拔,便于更换。

 

在实际工程案例中没有见过类似设计,更多是外界对英伟达方案的猜测。英伟达的CPO方案是光电混合封装,并不是将硅光部分和ASIC做成两个独立模块直接插拔。网络上提到的案例更接近NPO的概念,NPO是将光模块中的调制接收和光路部分做成硅光片,放在很近的位置以缩短物理距离,减少损耗。而博通和英伟达的CPO方案是纯CPO设计,并不是像NPO那样通过插槽实现可插拔。

 

Bryce:有分析认为,区分CPO和NPO不能仅看可插拔或可解耦状态,还要看光的位置和封装边界。虽然socket设计在可维护性上更接近NPO,但其位置如果是与光引擎合封的情况下,这种情况下,概念上是否仍属于CPO?

专家:严格来说,这种设计不叫CPO。CPO的英文全称是光电混合共封装,如果只是将光引擎插在ASIC上,更像是大型硅光模块,不能称为CPO。

 

Bryce:如果不考虑概念的归属到底是什么,从设计角度看,这种方案会对产业链分工,尤其是光模块商业模式产生什么影响?

专家:对光模块的影响其实有限。CPO的核心应用场景主要在AI推理和训练等对带宽和端口密度要求极高的领域,这些场景下CPO的优势才明显。因此,CPO前期主要用于数据量密集的场景,如scale up或scale out内部的某些环节。CPO很难完全取代如InfiniBand等传统方案。

 

以太网等场景实际上并不会被完全取代。从当前架构来看,即使将所有适用CPO的场景都采用该方案,预计其占比也仅为数据中心整体的百分之二三十。数据中心的互联架构不仅包括AI训练和推理,还涉及局端AI处理后通过网络与外部进行光网络连接,以及前端与后端、半层等多种网络结构。在这些场景下,实际上并没有必要使用CPO交换机。

 

CPO一般更适用于数据量密集且传输距离较短的场景。在没有更优选择的情况下,数据量大时,单个光电端口速率越高,经济性越好。但对于偏向scale out或以太网等场景,目前还未达到对高品质容量的需求,从经济性和可维护性角度看,采用CPO并无必要。

 

Bryce:在scale up这一层,如果使用CPO,对整个柜子的能耗、功耗或性能提升大吗?单位性能的单位成本TCO会有怎样的变化?

专家:在功耗方面,CPO能够显著降低能耗。例如,使用Tomahawk 102T的传统交换机,插入64个1.6T光模块时,每个光模块的功耗相加后总能耗较高。而CPO交换机搭配18个ELS和CPO本身的功耗,整体能耗差距非常明显,至少可降低40%至50%。在成本方面,以102T交换机为例,1.6T光模块按1000美元计算,64个模块约为6.4万美元。CPO交换机的外置光源模块约500美元一个,18个共9000美元。虽然还需计入交换机卡和CPO封装的成本,但整体TCO明显低于传统交换机,主要得益于较低的功耗和由此带来的散热成本降低。此外,光模块节省的成本足以覆盖CPO封装带来的额外支出。

 

Bryce:除了性价比,scale up层面推动CPO的主要因素还有哪些?比如供应链的话语权是否会向芯片厂商集中,从而提升其利润或话语权?

专家:确实如此。以博通和英伟达为例,他们希望通过CPO方案提升整体价值量。传统上只销售单一产品,而CPO交换机则能带来更高的整体价值。此外,光模块向更高带宽升级(如从1.6T到3.2T)时,光学层面没有瓶颈,但电学层面,尤其是DSP部分,存在较大物理限制。当前主流DSP供应商如博通和Marvell,1.6T DSP尚可实现,但3.2T、单通道400G DSP面临功耗和尺寸等挑战。博通等公司通过将光模块中的DSP功能集成到ASIC层,提出了更优方案,这也是CPO应用的重要推动力。Marvell等公司因光电能力相对较弱,倾向于发展NPO等方案,并将硅光部分委托给专业公司。

 

Bryce:假设scale up层CPO推进顺利,工程和量产都很稳定,未来在scale out层CPO会处于什么状态?结合scale out层的性价比,以及CSP与芯片厂商在供应链话语权的博弈,如何看待这一趋势?

专家:scale up层CPO的应用主要集中在架构的特定部分,整体来看,scale out层大部分场景并不需要CPO交换机。首先,是没有必要;其次,CSP如微软、AWS等不愿被博通或英伟达完全绑定,倾向于继续采用现有架构,保障运营和维护的稳定性。未来若带宽需求进一步提升,可能优先采用NPO或LPO等过渡性方案,这些方案能将ASIC芯片、光引擎和I/O集成,并可选择多家供应商,获得更具竞争力和公平性的价格。

Bryce:提到scale out层目前没有必要采用CPO,是因为TCO还未达到足够吸引力吗?

专家:scale out层只有架构内圈等少数部分存在采用CPO的迫切需求,大部分场景无需CPO交换机即可满足需求。

 

Bryce:是否存在当前产业渗透率较低、组装良率等问题导致CPO在成本和性价比上暂未体现优势?如果未来scale up层在工程上验证是顺利的状态,然后大规模铺开、工程顺利,量起来后成本显著下降,这样scale out层TCO也更显著,CSP是否也能节省大量成本?

专家:至少在中短期内,公司尚未看到这一趋势。未来如到2027、2028年,若CPO升级换代并实现大幅降本,且展现出明显优势,不排除scale out层大规模转向CPO的可能。但目前来看,这一进程还未到来。

 

Bryce:关于CPO供应链,普遍认为组装良率较低。展望良率的主要瓶颈在哪里?未来成熟后良率和TCO会有怎样的变化,尤其在scale out层?

专家:目前良率的主要瓶颈在于CPO的组装和集成环节。当前良率相对较低,随着工艺和技术的成熟,良率有望提升,进而带来TCO的进一步下降。尤其在scale out层,良率提升后,TCO优势会更加明显。

 

目前良率的核心卡点主要在CPO封装环节。对于整个产业链来说,这种封装技术本身就是一个新事物。一般情况下,包括公司自己做的光芯片,刚开始良率都不高,基本上需要在量产一段时间后,发货量达到一定规模,对中间各个工艺环节进行优化,包括内部的降本措施,良率才会逐步达到一个比较稳定的水平。其次,另一个卡点在于供应物料。以英伟达为例,针对公司的光芯片来说,供应压力很大。公司做I/O光芯片,量产时间原本定在2025年上半年,但由于磷化铟工厂产能有限,需要扩产才能满足英伟达的供应需求。因此,公司也在持续提升光芯片的良率和供应能力。

 

Bryce:未来良率会达到什么程度?进而对scale out层的TCO还能节省多少空间?

专家:具体数字很难判断,可能台积电的工程师会更清楚。一般来说,半导体行业从新产品开发到小规模量产,再到大规模量产,至少需要两到三个季度。所以个人预计整个2026年仍处于小规模上量和布局阶段,到了2027年,发货量和良率提升后,才会迎来大幅增长。

 

Bryce:在scale out层还有供应链话语权的问题。如果放到谷歌自有集群,或者谷歌作为CSP和芯片供应商的情况下,会不会看到英伟达在scale up层相对成功后,自己也在推进scale out层尝试CPO相关方案?

专家:个人认为谷歌不会这样做。谷歌在行业中属于比较特殊的公司,技术整体非常领先,但工程上相对保守。虽然他们在行业内较早提出CPO,但实际部署和应用并不多。在scale场景下,他们更倾向于推动OCS承光交换机方案。公司与谷歌有OCS合作,从交流情况来看,他们在TPU V5或V6搭配128×128 OCS时,收益很大,无论是功耗还是推理、训练成本都大幅降低。因此,他们更希望将OCS技术推广到更多场景,包括交换机、scale out和scale across等,而在CPO方面并不激进。实际上,在CPO领域最激进的云服务商是Meta。上个月行业有个CPO论坛,Meta专门做了报告,认为交换机形式在功耗、成本和长期可靠性上都优于传统交换机。如果北美云服务商要部署CPO,Meta会是第一梯队,之后可能是Oracle和微软,AWS和谷歌则更为保守。英伟达的方案预计会率先在Coreweave客户中铺开。

 

 

觉得有帮助?分享给朋友,带来新用户可持续支持我们更新高质量内容。