wordpress架站crm系统怎么用
2026/6/11 8:55:05 网站建设 项目流程
wordpress架站,crm系统怎么用,山楼小院在哪家网站做宣传,python做网站登录内容要点#xff1a; ◼ IB与Ethernet之争#xff0c;性能与通用性的博弈。 InfiniBand#xff08;IB#xff09;和以太网#xff08;Ethernet#xff09;是两种常见而又不同的网络技术。二者对比来看#xff0c;IB在带宽、延迟、可靠性方面的表现更为出色#xff0c;适…内容要点◼IB与Ethernet之争性能与通用性的博弈。InfiniBandIB和以太网Ethernet是两种常见而又不同的网络技术。二者对比来看IB在带宽、延迟、可靠性方面的表现更为出色适合需要高性能通信的场景而以太网因其较低的成本和广泛兼容性在一般网络应用中更为普及。两种技术逐渐走向融合2010年IBTA提出RoCE v1IB与RoCE协议栈在传输层以上是相同的在链路层中以太网替代了IB2014年IBTA进一步改进提出RoCE v2在RoCE v1的基础上融合以太网网络层使得RoCE v2协议数据包可以在第3层进行路由可扩展性更优。2023年7月AMD、Arista、Broadcom、思科、英特尔等企业联合成立超级以太网联盟意图开发一种新的以太网传输层协议——超以太网传输UET协议用来更好地满足人工智能和HPC工作负载的需求。◼英伟达如何实现Scale-out互连NVIDIA的网络布局涵盖了三种主要技术NVLink、InfiniBand和Ethernet它们具有各自不同的技术特点、应用场景和优势。NVLink作为NVIDIA专有的GPU间高速互连技术Scale-up环节与GPU联系紧密并同步演进因此演进速度最快。IB协议由于NVIDIA/Mellanox的主导地位以及其针对数据中心、HPC、AI集群等特定用途其演进速度受到标准生态掣肘相对较小。而Ethernet作为完全开放的标准由于需要考虑跨代兼容和多厂商互通的问题其演进速度相对较慢。因此在GTC 2024大会上224G SerDes技术最先在NVL72电缆背板系统中得到应用224G代际IB标准协议的Quantum X800交换机和ConnectX-8超级网卡也首次发布与此同时以太网Spectrum X800交换机和BlueField-3超级网卡仍然采用的是112G代际。◼从英伟达IB与Ethernet方案看二者技术差异网络技术核心关注的是带宽、时延等指标IB和以太网交换机应用不同技术以追求更高的带宽、更低的延迟。作为具有原生RDMA架构的无损网络加上其特有的SHARP技术IB实现了更快的数据传输和更低的延迟成为极致性能的代表。而NVIDIA以太网平台通过部署无损网络、RoCE、拥塞控制等技术不断提升性能以追赶IB。一、Scale-out 全视角IB 与Ethernet 之争性能与通用性的博弈InfiniBandIB和以太网Ethernet是两种常见而又不同的网络技术。以太网最早是由梅特卡夫在1973年提出的设想他于1979年创办了3Com公司推动了以太网技术的普及。以太网是一种广泛用于局域网LAN的技术基于IEEE 802.3以太网网络标准用于连接设备之间的数据传输适用于家庭、办公室网络、云计算、智慧城市和数据中心等场景。InfiniBand架构规范的1.0版本是由InfiniBand贸易协会InfiniBand Trade AssociationIBTA于 2000 年发布其诞生目的就是为了取代PCI总线。它引入了RDMA协议提供更低的延迟、更高的带宽、更高的可靠性从而实现更强大的I/O性能。Mellanox 是全球InfiniBand市场的主要供应商在该技术上拥有着近乎垄断的地位在2019年被英伟达收购。两种技术逐渐走向融合共同发展。2010年IBTA提出RoCE v1IB与RoCE协议栈在传输层以上是相同的在链路层中以太网替代了 IB但由于网络层IP 层即OSI 模型的第三层仍依赖于以太网的MAC地址和VLAN标签进行通信因此不能实现跨不同的IP子网传输。2014年IBTA进一步改进提出RoCE v2在 RoCE v1的基础上融合以太网网络层使得RoCE v2 协议数据包可以在第3层进行路由可扩展性更优因此也称为IP routable RoCE。图1Ethernet 与 InfiniBand 发展历程二者对比来看IB具备高性能优势以太网具备广泛兼容性。IB和以太网之间的性能主要区别在时延、带宽、可靠性、可扩展性等方面整体上IB在带宽、延迟、可靠性方面的表现更为出色适合需要高性能通信的场景而以太网因其较低的成本和广泛兼容性在一般网络应用中更为普及图2Ethernet 与 InfiniBand 部分性能对比InfiniBand 和以太网各有特点和差异在各自不同的适用领域不断发展演进。AI时代带来更低时延、更高带宽的网络需求更高技术的产品持续放量。当前的 InfiniBand产品路线图显示了对更高带宽的预期需求计划在未来推出1600Gbps GDR和3200Gbps LDR的InfiniBand 产品。图3InfiniBand 发展概况同时以太网技术也在不断发展。2023年7月在Linux基金会的牵头下AMD、Arista、Broadcom、思科、英特尔等企业联合成立超级以太网联盟意图开发一种新的以太网传输层协议——超以太网传输UET协议用来更好地满足人工智能和HPC工作负载的需求。二、英伟达如何实现Scale-out互连NVIDIA 的网络布局涵盖了三种主要技术NVLink、InfiniBand 和 Ethernet它们具有各自不同的技术特点、应用场景和优势。NVLink作为NVIDIA专有的GPU间高速互连技术与GPU联系紧密并同步演进因此演进速度最快。InfiniBand虽然是ITBA开放标准但由于NVIDIA / Mellanox 的主导地位以及其针对数据中心、HPC、AI 集群等特定用途其演进速度受到标准生态掣肘相对较小。而Ethernet作为完全开放的标准由于需要考虑跨代兼容和多厂商互通的问题其演进速度相对较慢。从NVIDIA GTC 2024发布的Blackwell平台架构可以明显看出这种演进速度的差异。首先224G SerDes技术最先在NVL72电缆背板系统中得到应用这表明NVLink在演进方面速度最快。其次基于224G代际InfiniBand标准协议的Quantum X800交换机和ConnectX-8 超级网卡也首次发布这虽然显示了InfiniBand技术也不断向前推进并且快于 Ethernet但其推进速度仍然受到面板侧互联技术的约束。其在互联技术和互联生态方面面板侧的互联相比于背板侧的互联更不容易形成技术和商业上的闭环。而与此同时发布的基于以太网的Spectrum X800 交换机和 BlueField-3 超级网卡仍然采用的是112G代际Spectrum-4交换芯片和400GbE BlueField-3 DPU 产品以太网技术在演进速度上相对较慢。图4Spectrum 与 Quantum交换机系列一览图以最新一代GB200为例其NVL72机柜的Scale-out网络相对复杂。整个NVL72系统犹如一台完整的超级服务器Scale Up扩展完全由背板互联完成面板侧只配备了网络接口和管理接口。计算单板中的B200芯片通过PCIE 6接口连接4张CX-8智能网卡出4800G InfiniBand 接口。另外Grace CPU 通过PCIE 6接口连接Bluefield-3 DPU芯片出400GE或者2200GE以太网接口。面板侧总计出72个800G InfiniBand接口和36个200GE或 18个400GE以太网接口。72个800G InfiniBand 接口用于连接InfiniBand 网络实现算力的 Scale Out 扩展而36个 200GE 以太网接口则用来连接业务面网络用户网络和数据面网络存储网络。图5GB200超级芯片的互连方案2025 年 3月NVIDIA公布最新一代Vera Rubin平台Scale Out性能显著提升。1从单芯片看VeraCPU 基于 Olympus 核心设计Vera 设计的速度将是去年采用Blackwell 架构 CPU 的两倍。Rubin GPU由两颗TSMC 3nm的计算芯片构成芯片两侧有两个I/O模块I/O模块集成了NVLink、PCIe和NVLink C2C IP释放20-30%的核心区域芯片性能进一步提升。50 PFLOPs的密集FP4计算速度约为B300的三倍Rubin还可以支持高达288 GB的快速内存。2从机柜看Rubin沿用Oberon架构并与Grace的下一代 Vera CPU 配对。但英伟达更新了机柜规模的计算方式VR200 NVL144 由72CPU×2GPU144 计算芯片VR NVL144的性能将提高至GB300 NVL 72的3.3倍。同时在Scale Up环节上Rubin将采用NVLink 6和224G SerDes协议得益于通道数量加倍速度将翻倍至3.6TB/s。3从 Scale Out环节看Rubin单卡网络接口将由Blackwell 世代 CX-7 400 Gbps 升级至CX-9 1.6T同时部署x1600 IB/Ethernet Switch 进一步提升集群信息传输速度。图5GB200超级芯片的互连方案Rubin Ultra 性能极致提升通过将四颗GPU芯片与两颗I/O共封于超大ABF基板把单封装算力推至100 PFLOPs。为了提升内存RubinUltra采用16个HBM4E堆栈和16层32Gb DRAM的双层堆栈结构同时运用Kyber的高密度架构。其中HBM容量达到1024GB是普通Rubin容量的3.5倍多。在NVSwitch-7 CPO 两层网络延迟支持下Rubin Ultra 为百万卡级集群的推理和新联奠定硬件基础。三、从英伟达IB与Ethernet方案看二者技术差异网络技术核心关注的是带宽、时延等指标IB 和以太网交换机应用不同技术以追求更高的带宽、更低的延迟。作为具有原生 RDMA 架构的无损网络加上其特有的SHARP技术IB实现了更快的数据传输和更低的延迟成为极致性能的代表。而NVIDIA以太网平台通过部署无损网络、RoCE、拥塞控制等技术不断提升性能以追赶IB。1. SHARPNCCL实现IB的极致性能InfiniBand 交换机实现网内计算 SHARP 技术执行数据归约改进运算性能。NVIDIA 网内计算In-Network Computing是专门为InfiniBand 架构开发的独特性能能力这一特性使得网络内基于硬件的计算引擎能够在规模上卸载复杂的操作。网内计算在NVIDIA Quantum InfiniBand 交换机上实现也就是NVIDIA可扩展分层聚合和归约协议SHARP技术它集成在交换机ASIC中旨在加速分布式计算系统中的集合通信。作为一种基于树的聚合机制SHARP支持多个同步集体操作。启用SHARP后交换机将被标识为聚合节点并将执行此类数据归约。NCCL集合通信库在执行跨越多个GPU 节点的通信算法时利用了这一能力。由于数据只发送一次来执行操作因此有效地将带宽增加了一倍从而归约了数据。因此在使用SHARP的端到端NVIDIA Quantum-2 400Gb/s InfiniBand 网络上运行的 NCCL 性能将优于没有使用 SHARP 的800Gb/s 端到端网络。2. 无损网络与RDMASpectrum-X实现以太网无损网络追赶IBSpectrum-X 实现了以太网无损网络配置。InfiniBand是一种无损网络而传统以太 网本质上是一种有损网络在拓展AI等分布式计算负载时会带来重大挑战。Spectrum X代表着传统以太网的重大进步实现了无损网络配置从而确保不丢弃数据包并最大限度地降低尾延迟。IB 具有原生 RDMA 架构以太网通过 RoCE 运行 RDMA。远程直接内存访问RDMA能够在网络上实现高速、低延迟的数据传输。InfiniBand具有原生RDMA架构而RoCERDMA over Converged Ethernet是一种允许通过以太网使用RDMA的网络协议属于非原生支持因此在部分性能方面如端到端时延不及IB但是能够满足大部分智算场景的业务性能要求并且具有成本更低、供应商更多的优势。如今随着GPU计算和大规模AI案例在云环境中的采用以太网在运行RoCE、优先级流量控制PFC以及Spectrum-X无损网络时可以成为一种实用的解决方案。3. 拥塞控制IB更为“严谨”以太网在大规模集群中或许更具优势IB 和以太网的拥塞控制机制略有不同IB更为“严谨”。NVIDIA Quantum InfiniBand 配置了拥塞控制架构CCA以三阶段流程管理拥塞事件。IB通过一种特殊的信用流量控制机制来调节发送者和接收者之间的数据流。当交换机检测到拥塞时它会开启一个称为转发显式拥塞通知FECN的位bit在数据包中。当数据包到达目标适配器时它会使用具有不同位集的数据包响应源该位集称为向后显式拥塞通知BECN。当发送端或源端适配器接收到BECN时它会通过限制其数据包注入来做出响应。而最典型的拥塞控制方法——显式拥塞通告ECN在以太网上部署生成式AI时并不充分。为了缓解拥塞必须对传输数据NIC或SuperNIC的网络设备进行计量。Spectrum-X 利用 Spectrum-X 交换机的带内、硬件加速遥测数据通知 Spectrum-X SuperNIC 进行流量计量确保工作负载得到保护并确保网络提供性能隔离。相比较来说IB的拥塞控制展示了更为“严谨”的特性当大量数据发送后目标适配器的缓存被填满发送端将不能再发送数据这会影响其实际性能。因此在大规模集群中以太网或许更具优势。 总结来说IB作为具有超低延迟、原生RDMA架构和网内计算能力的无损网络是性能上的黄金标准。而以太网的低成本、高灵活性使其更为多数厂商所青睐并且NVIDIA 以太网平台通过部署无损网络、RDMA、拥塞控制等技术不断提升性能未来以太网和IB均有各自的用武之地。四、投资建议重点推荐盛科通信、海光信息建议关注万通发展、澜起科技等。无、风险提示AI 应用进展不及预期。算力的长期需求是建立在AI应用逐步发展之上在初期大模型训练带来大量算力需求之外AI 应用带来的推理需求是长期维度上相关硬件设备市场空间增长的前提。如果AI应用进展不及预期将对算力各环节需求产生影响。技术发展不及预期。Scale-out 互连方案及其底层技术是AI芯片互连环节的核心该技术难度大、壁垒高若下一代发展受阻或影响AI芯片互连速率提升。市场竞争风险。虽然在Scale-out环节英伟达当前处于一骑绝尘的竞争地位但随着UALink联盟的崛起以及技术的不断发展尤其是海外云厂商自研芯片入局市场竞争格局或将发生变化。原文链接英伟达Scale-out网络为何兼有IB和以太网——算力芯片看点系列

需要专业的网站建设服务?

联系我们获取免费的网站建设咨询和方案报价,让我们帮助您实现业务目标

立即咨询