简介
生成式人工智能(AI)的兴起正在改变众多行业,数据中心也不例外。人工智能模型是计算密集型的,其日益增长的复杂性要求 GPU、节点、服务器机架和数据中心园区之间实现更快、更高效的互连。这些互连将极大地影响数据中心架构的扩展能力,并使其能够可持续地处理人工智能模型的需求。
适合这个新人工智能时代的收发器必须快速、智能,并能适应多种用例和条件。然而,这会对这些收发器内部的可调激光器和数字信号处理器(DSP)产生什么影响呢?本文将回顾激光器和 DSP 适应新时代的几个趋势。
激光阵列的威力
2022 年,英特尔实验室展示了完全集成在硅片上的八波长激光阵列。这些里程碑对于光收发器来说很重要,因为激光阵列可以实现多通道收发器,在提升速度时更具成本效益。
假设我们需要一条容量为 1.6 太比特/秒的 DCI 内部链路,可以通过三种方式来实现:
1.四个 400G 模块:该解决方案使用现有的现成模块,但占用空间最大。它需要路由器面板上的四个插槽和一个外部多路复用器,以便将这些插槽合并为一个 1.6T 通道。
2.一个 1.6T 模块:这种解决方案不需要外部多路复用器,只占用路由器面板上的一个插槽。不过,制作单通道 1.6T 设备的复杂性和成本最高。
3.一个模块有四个内部 400G 信道:一个模块有四个激光器阵列(因此有四个不同的 400G 信道),只需在面板上安装一个插槽,同时避免了单通道 1.6T 方法的复杂性和成本。
表 1:实现 1.6 太比特/秒链路的不同方法比较:四个 400G 模块、一个单通道 1.6T 模块和一个带四个 400G 通道的模块。
多激光阵列和多通道解决方案对于提高相干系统的链路容量将越来越有必要,它们不需要路由器面板上更多的插槽,同时避免了仅用单通道提高速度所带来的更高成本和复杂性。
共同设计 DSP 和光引擎
收发器开发商通常从不同的供应商处采购 DSP、激光器和光引擎,因此所有这些芯片都是分开设计的。在这种情况下,DSP 就像一把瑞士军刀:它是为不同光学引擎设计的万能工具,但却不是万金油。
例如,目前的 DSP 在设计上与所连接的光电芯片 (PIC) 的材料平台无关,后者可以是磷化铟 (InP) 或硅。因此,它们无法利用这些材料平台的固有优势。将 DSP 芯片与 PIC 共同设计,可以使这些组件之间的配合更加完美。
PIC 和标准平台无关的 DSP 通常使用不同强度的信号工作,因此需要一些射频模拟电子元件来相互 "对话"。这种信号功率转换开销最高可达 2 瓦,约占收发器功耗的 10-15%。
不过,InP PIC 的调制器可以在比硅调制器更低的电压下运行。如果这种 InP PIC 和 DSP 一起设计和优化,而不是使用标准 DSP,那么 PIC 就可以设计为在与 DSP 信号输出兼容的电压下运行。这样,经过优化的 DSP 就可以直接驱动 PIC,而不需要射频模拟驱动器,从而省去了我们之前讨论的大部分电源转换开销。
图 1:三种不同 PIC DSP 组合的驱动功率和功耗比较:标准 DSP 与硅 PIC、标准 DSP 与 InP PIC,以及优化 DSP 与 InP。
规模化制造智能器件
要使相干光收发器更经济实惠,就必须进行批量生产,如果 PIC 的年产量能从几千片增加到几百万片,那么每片光芯片的价格就能从几千美元降到几十美元。要实现这一生产目标,光电子制造链需要向电子产品学习,并利用现有的电子制造流程和生态系统。
虽然垂直整合的 PIC 开发有其优势,但开发商将其 PIC 制造外包给大型代工厂的无工厂模式是将产量扩大到数百万个单位的最简单方法。无晶圆厂 PIC 开发商可以依靠可信赖的大规模制造合作伙伴,保证芯片的安全和大批量供应,从而保持灵活和精益。此外,无晶圆厂模式使光电子开发商能够将研发资源集中在终端市场和设计上,而不是昂贵的制造设施上。
光电芯片的封装、组装和测试也必须取得进一步进展。虽然这些工序只占电子系统成本的一小部分,但光电子技术却恰恰相反。光电子制造链必须更加自动化和标准化,才能变得更加容易获得和负担得起,必须向电子工业常用的成熟、可扩展的封装方法转变。
如果您想了解更多有关光电芯片技术开发人员如何利用电子生态系统和方法的信息,建议您阅读我们有关该主题的深度文章。
收获
可调谐激光器和 DSP 正在适应人工智能驱动的数据中心基础设施不断增长的需求。多波长激光器阵列的集成以及 DSP 和光引擎的协同设计是打造更高效、可扩展和高性价比光收发器的关键步骤。这些设备将是智能的,并能提供一些遥测数据,因此必须转向批量生产,并采用电子行业的方法。面对人工智能的计算需求,这些创新不仅有望提高数据中心互连的容量和效率,还能为更可持续的增长轨迹开辟路径。