Leave Your Message
AI集群中的400G SR4和800G SR8光模块

博客

AI集群中的400G SR4和800G SR8光模块

2024-07-05

随着人工智能(AI)技术的快速发展,AI集群的计算能力和数据传输需求不断增加。为了满足这一需求,光模块技术也在不断进步。高速光模块作为新一代高速光通信解决方案,正逐步应用于AI集群,为其提供更高效、稳定的数据传输能力。智能计算中心机房互联的光模块端口速率已达到800G,并持续向高速(1.6T/3.2T)演进。

1321321.png

 

一、未来五年AI集群以太网光模块需求预测

 

早在7月23日,光通信行业研究机构LightCounting(以下简称LC)就发布了《超级数据中心光学报告》,该报告指出,未来一段时间,用于AI集群的以太网光模块的总销量五年内将达到176亿美元,占所有以太网光模块市场的38%。报告预测2023年、2024年和2025年全球以太网光模块市场规模分别约为52亿美元、65亿美元和83亿美元左右,较去年Q1报告上调约8%、25%和43%分别,可以看出绝大多数增量增长来自于AI集群的需求,该机构认为AI集群的应用将掀起全新的光学产品需求浪潮。

 

同时,LC还表示,大型企业AI系统的新设计将需要更多的光学,未来两年头部企业网络的部署可能需要200万个400G SR4和600万个800G SR8光模块。对此,LC大幅上调了2024&2025年以太网光模块市场预测,如果结合头部企业的新需求,数通光模块市场具有很强的弹性。超级以太网联盟的成立,瞄准高性能AI集群网络,以太网AI光模块和应用前端网络升级将构成超越光通信行业头部企业的市场驱动力。

AI集群光模块占比从25%提升至38%.png

 

二、高速光模块在AI集群中的开发与应用

 

在人工智能应用中,数据量的激增对光互连技术的带宽提出了更高的要求。目前,很多400G SR4和800G SR8光模块构建的短距离链路均采用VCSEL激光器,工作速率为106Gb/s。技术演进的下一步是将光通道的单通道速率提升至200G/lane,结合4通道光通道的数量,进一步降低800G模块的成本和功耗;并同步演进单模块带宽至1.6T(8通道光路)。

 

在AI集群中,400G SR4光模块常用于服务器和交换机之间的连接。由于AI训练和推理过程需要大量数据传输,高速稳定的网络连接至关重要。 400G SR4光模块可以提供充足的带宽和低时延的传输环境,保证AI模型训练和数据处理高效进行。 800G SR8光模块主要用于超大规模AI集群和数据中心的核心网络连接。随着AI模型的复杂性和数据量的增加,800G SR8光模块可以提供所需的高带宽和低延迟连接,以支持海量数据的快速传输和处理。

 

三、AI场景下的光互连技术创新

 

低功耗、低时延是光互连技术不可或缺的特性。低功耗意味着更少的能源消耗和更低的运营成本,而低延迟意味着更快的响应时间和更高的数据处理效率。为了满足这些需求,光互连技术需要在设计上进行优化,以减少能量损失并提高传输效率。

 

人工智能对系统稳定性要求很高,因此光互连技术必须具有高可靠性。这就需要我们优化系统的端到端设计,保证数据传输的稳定性和可靠性。同时,我们还需要关注LPO的演进性和互联性,以适应AI技术不断发展的需求。

 

此外,光互连技术的智能运维也变得越来越重要。智能运维不仅可以帮助企业实时监控系统的运行状态,还可以基于数据分析进行预测性维护,提高系统的可用性和稳定性。另外,智能运维可以帮助我们优化资源分配,提高系统的整体性能。

 

随着速率的提高和单模下行链路的加速,硅光技术预计将出现高增长。硅光技术凭借其高速、低功耗、小型化等优势,在AI场景的光互连技术中发挥着越来越重要的作用。我们有理由相信,硅光技术将在未来的人工智能应用中发挥更加重要的作用。

 

部分来源:LightCounting