siennaxu’s blog

ここで通信分野と関連する記事を紹介していきます! よろしくお願いいたします。

InfiniBandネットワーキング:機能、コンポーネント、利点の探求

InfiniBandは、CPU/GPUサーバ、ストレージサーバ、その他のデバイス間の高性能接続を容易にするオープンスタンダードです。この記事では、InfiniBandネットワーキングの基本的な側面について、その構造的なコンポーネント、コア機能、従来のイーサネット・ソリューションに対する優位性などを解説します。

InfiniBandとは?

InfiniBandは、サーバーやストレージデバイスなどを相互接続するための高速ネットワークを定義するオープンな業界標準です。ポイント・ツー・ポイントの双方向リンクを活用し、異なるサーバに配置されたプロセッサ間のシームレスな通信を可能にします。InfiniBandは、LinuxWindows、ESXiなどのさまざまなオペレーティングシステムと互換性があります。

InfiniBandネットワークの構造コンポーネント

标签

InfiniBandネットワークは、以下の要素で構成されています:

ホストチャネルアダプタ(HCA)

HCAはネットワーク カードとも呼ばれ、InfiniBandネットワークに接続されたエンドノードとして機能します。HCAはトランスポートレイヤー機能を促進し、InfiniBandデバイスのプログラミングインターフェースを提供するverbsインターフェースをサポートします。

InfiniBandからイーサネットゲートウェイ/ブリッジへ

このデバイスは、InfiniBandとイーサネットメッセージの変換を可能にし、必要に応じてInfiniBandネットワークとイーサネットネットワーク間の通信を可能にします。

InfiniBandスイッチ

InfiniBandスイッチは、InfiniBandネットワーク間でメッセージを転送し、接続されたデバイス間で効率的なデータ伝送を可能にします。

サブネットマネージャー(SM)

サブネット・マネージャは、InfiniBandサブネットの管理を担当します。ホストやスイッチ上で動作するほか、Unified Fabric Manager(UFM)と併用して包括的な管理を行うことも可能です。

InfiniBandルーター

InfiniBandルーターは、異なるInfiniBandサブネット間のメッセージ伝送を容易にします。

InfiniBandのコア機能

标签

  • サブネットマネージャー(SM): サブネット・マネージャー・プログラムは、ルーティングの集中管理を保証し、ネットワーク内のすべてのノードでプラグ・アンド・プレイ機能を実現します。各サブネットにはマスターSMが必要で、他のSMはスタンバイモードで動作します。

  • GPUダイレクト: GPUダイレクトは、GPU間の直接的なデータ転送を可能にし、特にGPUベースのコンピューティングにおいて、待ち時間を短縮し、パフォーマンスを向上させます。NVIDIA GPUは、コンピュート・タスクのオフロードもサポートしています。

  • レイテンシー: InfiniBandは、ハードウェア・オフロードとアクセラレーション・メカニズムにより、極めて低いレイテンシーを実現しています。InfiniBandスイッチのカットスルー転送モードは、転送レイテンシを130nsまで低減します。RDMAテクノロジーは、エンド・ツー・エンドの伝送レイテンシをさらに短縮します。

  • ネットワークのスケーラビリティ: InfiniBandは、InfiniBandルーターを使用して複数のサブネットの相互接続を可能にし、48,000以上のノードを収容する拡張性を容易にします。

  • 耐障害性安定ネットワーク: InfiniBandネットワークは、サブネット・マネージャーのルーティング・アルゴリズムと効率的なフローの並べ替えにより、迅速なトラフィックの回復を保証します。その結果、迅速なトラフィックの復旧が可能になります。

  • セルフ・ヒーリング・ネットワーク: NVIDIA IBスイッチは、ハードウェアベースの自己回復メカニズムを備えており、わずか1ミリ秒での高速回復が可能です。

  • 適応型ルーティング: 適応型ルーティングは、スイッチ・ポート間のトラフィック配分をバランスさせます。NVIDIAスイッチは、この機能をハードウェアに組み込み、適応型ルーティングマネージャーを通じて管理します。

  • SHARP(スケーラブルな階層型集約および削減プロトコル): SHARPは、NVIDIAスイッチハードウェアと中央管理パケットに基づいて、集団通信を最適化し、AIや機械学習などのMPIベースのアプリケーション中のノード間のデータ転送を削減します。

InfiniBandとイーサネットの比較における利点

InfiniBandは、従来のイーサネット・ネットワーキング・ソリューションに比べていくつかの利点があり、高速通信と大規模データ転送を必要とするアプリケーションに非常に適しています。InfiniBandの利点は以下の通りです:

  • 帯域幅と低遅延: InfiniBandは、より高い帯域幅とより低いレイテンシーを提供し、大規模なデータ転送やリアルタイム通信アプリケーションの性能要求を満たします。

  • RDMA対応: InfiniBandはRDMA(Remote Direct Memory Access)をサポートし、ノードメモリ間の直接データ転送を可能にします。これにより、CPUオーバーヘッドが削減され、転送効率が向上します。

  • スケーラビリティ: InfiniBandファブリックは、多数のノードを接続し、高密度のサーバーレイアウトをサポートすることで、容易なスケーラビリティを実現します。InfiniBandスイッチやケーブルを追加することで、ネットワークの規模や帯域幅を拡張することができます。

  • 高信頼性: InfiniBandファブリックは冗長設計とフォールトアイソレーションカニズムを組み込み、ネットワークの可用性とフォールトトレランスを強化します。ノードや接続に障害が発生しても、代替パスがネットワークの接続性を維持します。

FS InfiniBandソリューション

番号 種類
 1  光モジュール/DAC/AOC  800G NDR InfiniBand
 2  400G NDR InfiniBand
 3  200G HDR InfiniBand
 4  100G EDR InfiniBand
 5  56/40G FDR InfiniBand
 6  NIC  NVIDIA® InfiniBandアダプタ
 7  スイッチ  NVIDIA® InfiniBandスイッチ

FSソリューションズは、InfiniBandの最先端ネットワークソリューションを活用し、高性能コンピューティング機能をユーザーに提供します。様々なアプリケーションやユーザー要件に合わせたソリューションにより、FSはパフォーマンスを最適化し、高帯域幅、低レイテンシー、シームレスなデータ転送を実現します。

FSと提携し、安定したInfiniBandネットワークを導入することで、新たな機会を引き出し、ビジネスの成長を加速し、全体的なユーザーエクスペリエンスを向上させることができます!