关于ZAKER Skills 合作
钛媒体 44分钟前

台积电:“一定要记住 COUPE ”

文 | 半导体产业纵横

2021 年,台积电在 Hot Chips 上发布了最新的 3D 封装技术路线图,里面涉及了一个硅光封装 COUPE。

这一年行业最热的话题是 3nm、2nm,硅光封装只是小小一点。但台积电看到的是另一个问题:当 AI 训练集群的 GPU 从几十块跳到万卡级别,数据在芯片之间跑来跑去的代价,开始变得让人难以忽视。

五年后,故事翻转了。台积电宣布硅光整合平台 COUPE 于 2026 年进入量产。英伟达、博通的订单已经砸下去了,三星在追赶。今年,台积电副共同营运长张晓强在技术论坛上说了句话:一定要记住 COUPE。

01 一个被忽视的瓶颈

过去几十年,数据中心内部 GPU 和交换机的通信靠的是可插拔光模块,可以理解为一个可以拔插的盒子,把电信号变成光信号发出去,对方再把光信号变回电信号。这套架构的好处是:简单、好用、出问题换掉就好。

但是 AI 的疯狂,再次刷新了需求。当单次训练任务的 GPU 数量从几十跳到数万,当传输速率从 400G 涨到 800G、1.6T,信号在电→光→电之间来回折腾的代价开始失控。传统 DSP 可插拔方案处理 1.6T 信号,功耗在 30 瓦量级。在先进制程竞赛中,这个功耗数字听起来不算什么,但放在数万 GPU 同时跑的大模型训练里,光是光模块的能耗就能吃掉的整台服务器的电力配额。更关键的是,FEC 纠错需要额外的处理时间,在大模型分布式训练的场景下,这些零碎加起来,足以让相当一部分 GPU 在等数据。

铜能救场吗?短距离可以,但是一旦跨机架、跨节点,信号衰减和延迟就扛不住了。业界需要新的方案。

可插拔光学器件、OBO、NPO 和 CPO

可插拔和 CPO 的功耗

业内选择了光互连,用光代替电来传数据,功耗更低、延迟更短、带宽密度更高。但问题在于,怎么把光学器件和电学芯片高效地集成在一起?传统做法是分立设计、光模块单独封装,但这种方式在 AI 场景下显得太松散,信号路径太长,损耗太大。

CPO,共封装光学,就是来解决这个问题的:把光学引擎直接塞进芯片封装里,让光信号在最靠近处理器的地方产生。

想法不复杂。实现起来,是另一回事。

02 COUPE 是什么?

硅光子不是什么新鲜事。2000 年代初就有人在研究了。优势明确:跟 CMOS 工艺兼容,成本可控,可大规模集成。但难题同样明确:光学器件和电学芯片怎么高密度地捏在一起?光学耦合怎么搞?封装精度怎么保证?测试怎么搞?这些问题不解决,硅光子就无法大规模量产。

台积电给出的思路是:既然硅光子自己搞不定,那就让它跟台积电最强的封装能力绑在一起。CoWoS、SoIC,这两把刀在 AI 圈已经是响当当的了。

2023 年,台积电在 IEEE ECTC 上推出 COUPE 2.0,核心升级是引入混合键合(Hybrid Bonding)技术。芯片之间不再靠微凸块(bump)连接,而是在室温下让氧化物分子直接 " 吸 " 在一起,再升温退火让铜键合。这个工艺大幅缩短了电子芯片和光子芯片的间距,把信号传输的损耗压到最低。

进入 2024 年,COUPE 进入密集验证阶段。IEDM 大会上,台积电公布了更多细节:单模硅波导损耗 0.67dB/cm,氮化硅波导低至 0.21dB/cm,Ge 探测器响应率接近 1A/W,200Gbps 微环调制器的误码率不到一亿分之一。也就是说,COUPE 不但能干活,而且干的好。

不过,能把复杂的事情变得简单,才有资格收溢价。真正让 COUPE 从技术变成生意的是台积电的改变。

这里要插一段行业背景:在硅光子这件事上,GlobalFoundries 其实是更早的玩家,2017 年就开始给客户代工硅光芯片,积累了大量经验。按理说,它应该占据先机。但 GlobalFoundries 的模式是典型的 foundry 思维:我只管造芯片,后面的封装集成你自己搞定。这套逻辑对有完整光电设计能力的头部客户没问题,但具备这种能力的公司,全球数不出十家。

台积电的打法不同,它不只造芯片,还包圆了整个封装流程。从硅光子晶圆制造,到电子芯片和光子芯片的键合,再到光学封装,全部在台积电的产线里完成。客户只需要把需求提了,剩下的一站式搞定。

这个差异最终决定了客户的流向。2025 年,英伟达和博通开始把部分产品从 GlobalFoundries 迁移到台积电 COUPE 平台。更关键的是,当英伟达决定用 6nm 先进逻辑节点做电子控制芯片时,只有台积电能同时搞定先进制程和混合键合封装,其他家要么工艺领先但封装跟不上,要么封装可以但先进节点没有。

绕了一圈,CoWoS 成了入场券,而台积电独发。

03 COUPE 量产,产业链变局

COUPE 量产的影响,远不止台积电自己。目前,供应链价值正在从传统光模块厂商向半导体与先进封装环节转移。

激光器将从配套零件变成核心资产。传统可插拔光模块用的是 EML 激光器,调制器是集成在里面的。但 CPO 需要外部连续波激光器,一个持续发光、功率高达数百毫瓦的激光光源,通过分束器同时给多个光子通道供光。技术门槛完全不在一个量级。同时,这类激光器的核心材料是磷化铟(InP),全球供应偏偏偏紧。需求在涨(光通信市场扩张、CPO 新增需求、出口限制),产能却跟不上。

结果是,激光器厂商从幕后走到了聚光灯下。Coherent 认为,InP(磷化铟)的供需失衡至少将持续整个 2026 和 2027 年。Coherent 正全力推进 6 英寸 InP 晶圆的量产爬坡。Lumentum 预计到 2026 财年底,EML 产能将较 2025 年增长超 50%,因此公司已推进约 40% 的磷化铟 ( InP ) 扩产计划。2026 年 3 月,英伟达直接砸了 40 亿美元(各 20 亿)投资 Lumentum 和 Coherent,锁定多年采购承诺。

测试设备厂商也是赢家。CPO 的制造复杂度远超传统光模块。从光子晶圆测试、芯片键合、光引擎装配到整机测试,每个环节都需要微米级精度的专用设备。联讯仪器、Chroma、ficonTEC 在 CPO 量产链路上不可或缺。Yole 预测,CPO 市场将从 2024 年的 4600 万美元飙升至 2030 年的 81 亿美元,这意味着,测试设备的订单高峰还在后面。

FAU 厂商也将受益。光纤阵列单元(FAU)是把芯片产生的光信号耦合进光纤的关键组件。在 CPO 架构下,FAU 需要更高的耦合精度和更复杂的封装集成。在 CPO 场景下,单个 FAU 的价值量将显著提升。天孚通信等国内 FAU 厂商凭借精密加工能力,正成为 CPO 产业链中不可或缺的一环。

传统光模块厂商会受到一定的冲击。中际旭创和新易盛是这场变局中最典型的案例。这两家全球光模块龙头,2025 年业绩都在高速增长(中际旭创净利润同比增长 109%,新易盛同比增长 235%)。可插拔时代,光模块厂商是方案的集成商,掌握着光电转换的核心环节。但到了 CPO 时代,光引擎和 XPU/ 交换机芯片被共封装在一起,方案集成商的位置被半导体厂商(英伟达、博通)和 OSAT 接手,传统光模块厂商能做的只剩下光引擎制造和外部光源组件。

不过,中际旭创早已官宣光引擎实现自研自产,新易盛也在 2026 年 3 月表态手握光引擎技术。它们的策略是:既然你不需要 " 外挂 " 的模块,那我就把核心的 " 光引擎 " 做好了卖给你。从 " 卖模块 " 到 " 卖光引擎 ",这是头部厂商的主动转型。

04 竞赛才刚起步

2026 年,Scale-out CPO(机架间互联)交换机开始量产出货,这是当前的主战场。但真正的挑战是 2027 年 -2028 年时,Scale-up CPO(机架内 GPU 互联)方案。Scale-up CPO 意味着光互连要进到机架内部,直接和 GPU 封装在一起。这个场景对技术的要求更高,对供应链的控制也更严。

台积电并非这一赛道的唯一玩家。

每当台积电宣布什么大动作时,另一位韩国友商也会迅速跟进。对,说的是三星。今年 3 月,三星电子正式宣布进军光通信市场。三星电子路线图显示,将于 2027 年实现基于 TC(热压)键合的光引擎,2028 年实现混合键合过渡,2029 年开始提供 " 交钥匙 "CPO 服务,即一站式、全流程的 CPO 代工总包。

目前,Tower Semiconductor的硅光子收入还在持续增长。从 2024 年约 1.06 亿美元增长到 2025 年约 2.28 亿美元,并计划将产能扩大 5 倍以上。今年已经与最大硅光子客户签署总额 13 亿美元的 2027 年供货合同,并已收到 2.9 亿美元预付款用于产能预留。公司还披露,客户已就 2028 年承诺更大规模的晶圆订单,相关追加预付款将于 2027 年 1 月前到位。

同时业内也有很多后起之秀,Ayar Labs、Lightmatter、Celestial AI,这波企业走的更激进,直接把光子塞进 XPU 封装里,瞄准 2028 年以后的下一代市场。Marvell宣布用 32.5 亿美元收购 Celestial AI,就是希望早早占位。

05 结语

台积电正在打造完整的 " 三层蛋糕 "AI 平台架构,包括 SoIC、CoWoS 与 COUPE 光互连技术。

台积电表示,全球首款采用 COUPE 技术的 200Gbps 微环调制器(Micro Ring Modulator)已于今年开始生产,并已实现低于一亿分之一的比特误码率。

到 2030 年前,台积电将通过 400Gbps 光调制器、多波长与多光纤阵列技术,把带宽密度提升 8 倍至 4TBps。相较传统铜线,COUPE 可让系统能效提升 4 倍、延迟降低 10 倍;若进一步与封装平台深度整合,能效甚至可提升至 10 倍,延迟降低 20 倍,成为未来 AI 数据中心的重要基础技术。

COUPE 的需求将越发旺盛。

相关标签

觉得文章不错,微信扫描分享好友

扫码分享

热门推荐

查看更多内容

企业资讯

查看更多内容