2025年9月22日月曜日

ライブマイグレーションにおけるネットワークトラフィックの

Nutanixの設計の基礎として、AOSやAHVなど管理系で利用するトラフィックは、1つのアップリンクでまとめられており、分離されていません。vSphereであれば、vMotionや管理ネットワークをそれぞれ分離したアップリンクで構成することが多かったように思います。

Nutanixは、10Gネットワークをベースとして構成で、1Gネットワークをアップリンクの分離で分散するという複雑化する設計を排除しているところに意味があります。

そのため、Nutanixは、管理系のトラフィックとユーザーVMのトラフィックを1つのアップリンクでVLANを分けて運用という形も構成可能です。

一方で、昨今のデーター大容量化を背景に、仮想マシンに構成されるメモリーサイズが256GBやBI系ツールが稼働する仮想マシンであれば、512GBのメモリーを搭載するという構成を見かけます。

このような構成の場合、例えばLCMによるアップグレードなどメンテナンスを行う際に、仮想マシンのライブマイグレーションを行いますが、単純に512GBの仮想マシンメモリーを10Gのネットワークで転送するのは、かなり時間がかかります。
Nutanixのデフォルトのアップリンクチーミングは、Active-Backupのため、10Gアップリンクの本数を増やしたところで、実際の転送速度は変わりません。

このような問題背景から、AOS 6.7以降では、アップリンク構成にLACP(Active-Active構成)の際には、送信元を分散し帯域幅を増やしてデーターを送る機能が追加されています。


例えば、ノードあたり25Gbpsの帯域幅を持つ4ノードクラスタの場合、複数チャネルを使用した単一のライブマイグレーションでネットワーク全体を活用し、マイグレーション速度を向上させることができます。以下の表はこの構成時のトラフィック例です。

<マルチチャネル有無でのライブマイグレーション動作の違い例>

測定属性複数チャネルによる
ライブマイグレーション
複数チャネルを使用しない
ライブマイグレーション
送信元ホストと宛先ホストでの帯域幅使用率。50 ~ 55 % を超える帯域幅を使用し、送信元ホストと宛先ホストの両方で約 55.54 Gbps の帯域幅を提供します。帯域幅の 10 ~ 11 % のみを使用し、送信元ホストと宛先ホストの両方で約 10.57 ~ 11.1 Gbps の帯域幅を提供します。
メンテナンスモード(EMM)タスク時間に入る複数のチャネルを使用しない単一のライブ移行と比較すると、EMM タスク時間が約 6 分の 1 に大幅に短縮されます。


このマルチチャネルライブマイグレーションは、以下の場合に限定されます。

  • マルチチャネル機能は、AHV バージョン 20220304.10055 および AOS バージョン 6.7 以上でサポートされています。
  • ホストの「メンテナンスモードへの移行」および「ローカル性の復元」移行タスクでのみサポートされます。これらの移行タスクは、ホストの退避および復元操作中に並行して実行されます。

 

ユーザーオペレーションで個別にライブマイグレーションした場合は、この条件に当てはまらないので、LACPであってもシリアル転送(1ch転送)になることに注意してください。


(参考)Multichannel Support for AHV Live Migration Performance







0 件のコメント:

コメントを投稿