2018年9月27日木曜日

PrismCentalの使いどころ(その11) 無駄なリソース足りないリソースの仮想マシンを見つける

※この機能はPrismProのライセンスが必要な機能の紹介です。
(PrismCentralは展開後60日間PrismProの機能を体験利用できます)

前回は、リソースの枯渇がいつおきるかをX-Fitによる機械学習のデーターをもとに表示されるグラフの見方を確認しました。
枯渇するリソースに対するアプローチはノードを足すことによるリソース追加が最も簡単ですがコストもかかる話になりますので、今使っている無駄なリソースを回収することによって既存リソースをうまく使いまわすこともアプローチの1つです。
今回は、リソース回収に当たって、度の仮想マシンからリソース回収を行えばよいかを確認する方法を紹介します。

まずは、PrismCentralで「Paln(計画)」から「容量のランウェイ」を選択し、表示したいNutanixクラスターを選択します。
ランウェイグラフが表示されたら、画面左中央にある「リソースの最適化」をクリックします。

そうすると、リソースの無駄遣いもしくはリソース不足な仮想マシンのサマリーが表示されます。


この表示では、
  • 左上・13の仮想マシンがリソースを割り当てすぎ
  • 左下・5台の仮想マシンがリソース不足
  • 右上・1台の仮想マシンは利用されていない
  • 右下・0台のノイジーネーバー(ホストリソースの独り占め)
が存在していることを表しています。

ここで各数量が書かれているところをクリックすると、探索(Explore)画面で、対象の仮想マシンだけがフィルターされ、仮想マシンのリソースに対するアドバイスが表示されます。

ただしすべてのアドバイスコメントが表示されておらず、マウスポインターをあてると表示されるのですが、この状態でアドバイスコメントをすべて読むのはあまり効率が良いとはいえません。

そのため、「レポートを取得」リンクをクリックし、対象の仮想マシン情報がまとまったレポートをもとに確認をしていきましょう。

リソース最適化の画面から「レポートを取得」をクリックします。
するとレポートインスタンス作成画面が出てきます。
レポートインスタンス名はこの帳票の名称を自分でつける場合に入力します。
わかりやすく管理する場合は日付と時間を記入するなどして管理してもよいかと思います。レポートをメールで送る場合は、メールアドレスを記載します。

実行を押すと以下のようなレポートの画面が表示されます。
メールで送信をしない場合このレポート画面からレポートを取得することができます。

レポート一覧から出力したレポートを取得します。

レポートは、PrismCentralに登録されているクラスター全部の内容がレポートで出力されます。各Nutanixクラスターごとにグルーピングされていますので、リソースの整理をした目的のクラスターのページに行きます。

レポートはサマリー情報はキャパシティランウェイのグラフも表示されています。

レポートはこの先にある各リストの項目がリソースの調整事項となります。

List of Inactive VMs
利用されていないと思われる仮想マシン一覧が表示されます。
これらの仮想マシンを削除することで回収できるストレージ容量が表示されてます。
この例では、21日間「Win10 1803 Template」はリソースをほぼ使っていなかったという記載があります。まあテンプレートと書いているので当たり前ではありますが...。

List of Overprovisioned VMs
必要なリソースに対して過剰なリソースを与えている仮想マシンの一覧が表示されます。
MEMORY GAINやSTORAGE GAINで回収できるリソースの具体的数値が表示されます。
こちらの例では「AFS-CLIENT01」は、21日の間、CPU平均利用率が2.36%で、メモリー平均利用率が30.69%だった。と記載があります。この仮想マシンは4vCPU、4GB RAMで構成しているのですが、そのうち3vCPU、2.47GB RAMを回収可能と言っています。


List of Constrained VMs
割り当てられたリソースが少ない、動作に制限が出ている仮想マシン一覧
こちらの例では「NTNX-afs01-1」が21日間にわたって平均メモリー使用率が100%であったと記載があります。つまり割り当てメモリーが不足しているということを表しています。

List of Bully VMs
他の仮想マシンに影響を及ぼしたりホストのリソースを占有するいわゆるノイジーネイバーな仮想マシンが表示されます。


このように見てると、無駄なリソースも回収できますし、仮想マシンに対してリソース割り当て不足なものに関しても発見することができますので、システムのスローダウンなどを引き起こす前に事前に対策を行うことも可能です。

今回の例では稼働時間が短いため、X-Fitによる学習時間がまだ短い状態ではありましたが、きちんと無駄と不足を提示してくれていました。

リソースの的確な利用においては、PrismCentralのX-Fitを使った各種機能を活用するのが最も効率的だと思います。





2018年9月26日水曜日

PrismCentalの使いどころ(その10) いつまで利用できるかのリソースを確認する

※この機能はPrismProのライセンスが必要な機能の紹介です。
(PrismCentralは展開後60日間PrismProの機能を体験利用できます)

Nutanixクラスターを使っていると、定期的に増えるファイルサーバーの容量や、業務システム追加による仮想マシンの追加など、一度動き出した仮想化基盤が、ずっと同じままのCPUやRAM,ストレージに容量が高知当時そのままの容量ということはまずありえません。
仮にAPサーバーだけでの運用であってもAPサーバーのログがたまって正しくrotateされていなければ、やはりストレージを消費することになります。

この調子で使い続けたら、いつCPUが枯渇するかやいつストレージの容量が足りなくなるかなどを推測するのがランウェイ機能です。
これを見ていくと、計画的にリソースの追加時期がわかりますので、あらかじめ予算申請などを行うのに最適です。

では実際のランウェイ画面を見ていきましょう。

まず、PrismCentralの「計画」メニューから「容量のランウェイ」を選択します。
PrismCentralに登録されたNutanixクラスターが表示されますので、リソースの状態を見たいクラスターをクリックします。
(ランウェイはNutanixクラスター単位の表示になります)

まず表示されるのは、ストレージのランウェイ(今と今後予測される利用状況)です。

右上のオレンジ色の文字列では、何日でリソースが枯渇するかが記載されています。
この環境では1年以上リソースは不足しないため「365+ days」と記載されています。
グラフは、現在地を基準に今後この調子で使っていくとどれくらいストレージが利用されていくかが、スナップショットやストレージ管理用のメタデーターを含め予測されたグラフが表示されています。
このNutanix環境は、Redundancy Factor2で構成していますので、N+1の原則に基づき、1ノードダウンしたときのストレージ容量として2.5TiB(有効容量)N+1を無視した最大利用可能容量3.74TiBの表示があります。
実際の運用としては、2.5TiBを超えた時点で、N+1が担保できなくなりますので、早急にノード追加が必要となりますが、その予測を含めてこのグラフでいつノードを追加する必要があるかがわかります。
このストレージの情痴はストレージコンテナごとに確認することも可能です。

では次にCPUランウェイを見ていきましょう。

CPUも同じようにN+1とクラスター全体のCPU氏擁立に基づいたグラフが表示されます。ここでN+1の線を超えるグラフが1年以内に出てくる場合は、線に近づく前にノードの追加を検討する必要があります。(この環境ではまだまだ余裕ですね)

では最後にメモリーも見ていきましょう。

こちらも同じようにクラスター全体のメモリー利用状況をグラフで表しています。
この画面では徐々にではありますが、クラスターのメモリー利用率が上昇していますが、1年以内に枯渇することはないと思われます。
また、下側にはクラスター内で稼働する仮想マシンのメモリー使用容量と使用率が表示されています。

このようにグラフを見るだけで、リソースの枯渇状態がすぐにわかるのはメリットがあります。一方でリソースが不足することが見えるということは、リソースを追加しなければなりませんが、一方で既存で稼働している仮想マシンのリソースがそもそも適切なのかというのを見る必要があります。過剰にリソースを与えていることによってクラスター全体のリソースが少なくなっているが、実はその仮想マシンからリソースを回収することでリソース不足を回避することができる可能性もあります。

次回はリソース配分に関するアドバイスを見る方法を見ていきましょう。




2018年9月25日火曜日

PrismCentalの使いどころ(その9) 現実に近い予測をするX-Fitを知る

※この機能はPrismProのライセンスが必要な機能の紹介です。
(PrismCentralは展開後60日間PrismProの機能を体験利用できます)

今まではPrismStarterで利用できる機能を中心に見てきましたが、今回はPrismProの肝でもあるPlan(計画)機能について見ていきます。

まずPlan機能において押さえておくべき機能がX-Fitです。
X-Fitは単純に言うとPrismCentarlに搭載されている機械学習の機能です。
今までのリソース管理とは、一般的に閾値を中心にした管理でしたが、閾値の設定は、それぞれの仮想マシンなどの監視対象の状態により異なり、その監視対象ごとにおけるフィットする閾値の設定というのは、閾値設定者の勘と経験がどうしても必要になります。
X-Fitは、仮想マシンやクラスター全体のCPUやRAMストレージなどを監視し、普段どのように動作しているかの"ふるまい"を観察(洞察)し、どのようにリソースが消費されていくかなどの状態から、未来の状況を予測したり、普段のふるまいから逸脱したものを見つけてアラートを出すような機能を持っています。

単純に言えば、普段からおりこうさんな仮想マシンが素行の悪い行為をしているのを見つけたら、即座にアラートがあがるようなもので、普段から素行が悪いものが、急に素行が良くなった場合もアラートが発動するといった感じでしょうか。

X-Fitのアーキテクチャーに関しては、X-Fitの解説(Seasonal Timeseries
Analysis and Forecasting using Tournament Selection)に詳しく書かれています。

実際のところX-Fitの動きを細かく知ったところで難しい話になしかならないと思っています。簡単に、普段のふるまいをもとに、リソース状況の今後の予測やよりよいリソースの活用法を指南してくれる機能だと思っていればよいかと思います。

次回からはX-Fitを使った機能を紹介していきます。




2018年9月24日月曜日

PrismCentalの使いどころ(その8) レポート機能を使って定期報告を楽に

※この機能はPrismProのライセンスが必要な機能の紹介です。
(PrismCentralは展開後60日間PrismProの機能を体験利用できます)

前回までに画面操作を中心としたPrismCentralのオペレーションを確認してきました。
PrismCentralは、集中管理とパフォーマンス等々の情報を集約と可視化できるということが理解できたかと思います。

さて、日本国内においてもシステムの安定稼働というのは重要視されることであり、データーセンターなどのシステム基盤の運用を行われる方は、稼働状況を定期的に報告するためにレポートを定期的に作成されているケースがあります。

PrismCentralはこのレポートを自動作成する機能を持っています。
今日はこのレポート機能について見ていきます。

レポートはPrismCentralの探索(Explorer)から、レポートを選択します。
今回は新しくレポートを作成しますので、「新規レポート」をクリックします。


まず、仮想マシンの一覧を出力させてみたいと思います。

実際に仮想マシンの一覧を追加してみます。

特殊な解説を入れることも可能です。その場合は、「表題と説明」を選択します。

あわせて、クラスターのCPU利用率の設定も線グラフで挿入します。
この場合は右側の「線グラフ」から挿入をします。


レポートの出力したい情報の設定が終わったら、レポートのタイトルを変更して、レポートの詳細な設定を行います。
レポートタイトルは、左上の鉛筆マークをクリックし、タイトル名を変更します。
レポートの設定を行います。
画面左下の「レポート設定」をクリックします。


ここの「外観」、ロゴやCopyrightの表示、レポートのカラーなどを設定できます。
ロゴはPNGファイル等をアップロードしない場合、Nutanixのロゴが表示されます。
なおヘッダーの色は表紙の次のページから表示されるレポート内容のヘッダーの色になります。


Eメールの設定ではメール送信先設定ができます。
(自動メール送信をしない場合この設定は無視しても構いません)


レポートの保存期間は、出力したレポートをPrismCentralの中にどれだけ保存するかの設定です。デフォルトでは10インスタンス(10出力)までとなっていますが、日付期間で設定することも可能です。

各種設定が完了したら、保存ボタンを押して設定完了です。

最後にスケジュールの設定を行います。
画面右上のスケジュールの設定をクリックします。

ここでレポートを出力するスケジュールおよびメールの配信先の設定が可能です。
こちらでは、レポートの発行間隔はレポートに収めるデーターの範囲も設定が可能です。


これで出力されたレポートは指定したメールから取得することも可能ですが、PrismCentralから取得する方法もご紹介します。
まず、取得したいレポートにチェックを入れ、「アクション」から「インスタンスを表示」をクリックします。

出力したレポートの一覧が表示されるので、任意のレポートの名をクリックするとPDFファイルがダウンロードされます。(この画面では同じ日に何回も出力したので同じ日付になっていますが、1日1回の出力スケジュールを設定した場合、出力日順にレポートが表示されます)

レポートを開くと以下のように定義した通りにレポートが出力されています。

レポート機能の設定は実は意外に簡単なのですが、結構強力なレポートを手軽に出力することが可能です。
日々のクラスターの状況報告などを行う運用保守を行う環境においては、是非積極活用を検討するのが良いと思います。





2018年9月23日日曜日

PrismCentalの使いどころ(その7) アラートの便利な設定方法

※今回紹介の機能は、PrismStarterでもPrismProでも利用可能です。

前回までアラートの設定を見てきました。
かんたんにアラートの設定ができることが理解できたかと思いますが、今回は、Explore(探索)機能からアラートを追加する方法をご紹介します。

PrismCentralのExplorer画面から、仮想マシンを選択し任意の仮想マシンの詳細を開きます。

画面上部の「評価指標」をクリックします。

ここで表示される縦の項目は、アラートの評価鵜目として利用できます。
CPUやメモリ、IO周りなど運用監視で必要なものがあらかじめ登録されており、その項目をクリックすると、現状の状態がグラフで表視されます。

ここで、監視対象にしたいものを具ラグ右上にある「Set Alert」をクリックします。

するとアラートの登録画面が表示されます。

アラートの画面で登録されているかを確認しましょう。
上部のアラート メニューから「Configure」で「アラートポリシー」を確認してみましょう。

ただしくアラートが登録されていることがわかります。

なお、この指標として表示されるのは、
  • 仮想マシン
  • クラスタ
  • ホスト
のみ利用が可能です。

これを使えば、アラートの定義を作る手間を大きく省くことができます。








2018年9月22日土曜日

PrismCentalの使いどころ(その6) 監視の基本アラートの設定方法

※今回紹介の機能は、PrismStarterでもPrismProでも利用可能です。

監視において、何らかの危険予兆を見つけたらあらかじめアラート情報を通知してくれる機能は、運用監視において基本ですね。
Nutanixにおいても同様にアラートをメールで送信する機能があります。

アラートはまずEmail送信の設定がなされていないと話が先に進みませんので、あらかじめSMTPサーバーの設定をしておきましょう。

アラートは、あらかじめ設定されているものもありますので、まずは、ConfigureのAlert Policyでアラートの設定を見てみましょう。



作成されたシステム(たぶんシステムで作成されたという意味だと思います)という怪しい日本語をクリックするとあらかじめデフォルトで設定されたアラートを確認することができます。

では、実際に自分でアラートを作成してみたいと思います。
まずは、新規のアラートポリシーをクリックします。

監視のエンティティタイプは
「クラスタ」「ホスト」「仮想マシン」の3つになります。

指標は監視項目です。エンティティに合わせて様々なものが選択できます。
影響のタイプは、パフォーマンスやキャパシティなどを選択できます。

アラートを自動解決するのチェックボックスは、発生したアラートが48時間以内に解決した場合、そのアラートを自動で解決済として設定する機能です。
挙動異常の項目はPrismProライセンスを保有している場合、設定が可能な項目です。これは普段の挙動から逸脱した範囲を設定し、それを異常と判断します。
たとえば、いつもCPU負荷率が70%の仮想マシンがある日25%までCPU負荷が下がると、おそらく仮想マシン内でプロセスか何かが落ちたと思われます、すなわちこれは、通常ではない異常になるわけです。

PrismStarterの場合はその下の静的しきい値の設定のみが行えます。
警告までの値と、クリティカルと判断される場合の値の範囲をそれぞれ入れていきます。
なお、クリティカルの範囲は警告の範囲を含むように設定する必要があります。

アラート発生の条件となり状況の維持時間は、アラートの条件に合致してそれが一定の時間内に解決される場合、アラートとして記録しないようにするための待機時間です。

最後にポリシー名を確認し、保存を行います。


この条件に適合する事項が起きれば、自動的にアラートのメールがPrismCentralから送られてきます。


残念ながらメールの内容は英語ですが、普段のオペレーションにおいては必要な内容しか記載されていませんので、英語であっても問題な内容だと思います。

なお、メールの件名および、メール本文の下にカスタムで任意の文字を入れることが可能です。(設定はE-Mail Configurationで行います)そこでは日本語の表示も行うことができます。


アラートは監視の中で最も利用する機会があるものだと思います。
適切な閾値の設定を行い、障害を未然に予知する設定を入れておきましょう。
カスタムなポリシーを作らずとも、デフォルトポリシーのままでアラートメールを受信する設定を入れるだけでも十分に監視の役割を果たすと考えられます。








2018年9月21日金曜日

PrismCentalの使いどころ(その5) Analysis(分析)の利用方法

※今回紹介の機能は、PrismStarterでもPrismProでも利用可能です。

特に注視して見ておきたい仮想マシンの状態や、パフォーマンス状態をいつも見れるようにしておきたいというのが、管理監視を行っている方のニーズだと思います。
そんな方に利用をお勧めするのが、分析機能です。

分析機能は各コンポーネントの性能情報をグラフ等で見ることができます。
ログは最大で2年間の保持が可能です(PrismElementは90日の保存期間です)


チャートは自分でお好みに合わせて作成することができます。
▼チャート作成メニュー

チャートには2種類のチャートがあります。
メトリックチャート1つの値(メトリック)を複数の対象(例えばホストなど)で表示
例)HOST A/HOST B/HOST CのそれぞれのCPU利用率
エンティティチャート複数の値(メトリック)を1つの対象で表示
例)HOST AのCPU/RAMの利用率

実際にメトリックチャートを作成してみましょう
ハイパーバイザーのCPU負荷率を出すものを作ってみたいと思います。

▼最初にチャート名を入力し、メトリックを選択します。

▼エンティティの対象を選び、ENTITIYで対象の名称を入力するか、検索で出てきたものをクリックすると下側の対象エリアに表示されます。選択時にShiftキーをクリックして対象を選択すると、複数の選択も可能です。

▼作成したチャートが表示されました

このチャートの右上の←ボタンを押すと、このグラフデーターをJSONまたはCSV5分単位の結果で取得することができます。

下側のChart Linkは、このチャートをいったん消した後に、もう一度追加したいときにこの表示されるURLを保存しておけばすぐにチャートを追加できるというものです。

▼チャート保存用のリンク


チャートは一見複雑に見えてしまいますが、なれると非常にわかりやすくかつ簡単に利用することができます。





2018年9月20日木曜日

PrismCentalの使いどころ(その4) Explorerを使いこなす

※今回紹介の機能は、PrismStarterでもPrismProでも利用可能です。

PrismCentralは様々な設定が可能ですが、まずは集中管理ができるExplorer(探索)を利用できるようになることが大事です。

早速探索画面で、仮想マシンを選んでみましょう。
クラスターをまたいですべての仮想マシンが表示されていることがわかります。

ここで、クラスターをまたいで仮想マシンの電源オンや再起動ができます。

PrismElementでは、複数の仮想マシンに対して一気に処理命令を出すことができませんが、PrismCentralであれば、仮想マシンの一斉再起動などが可能となります。

また、エクスプローラ画面は、さまざまな表現やグルーピング可能です。
カラーで仮想CPU数を選択すると仮想マシンの割り当てられたvCPUに併せて、違う色で表示されています。

フォーカスをパフォーマンスに変更すると、表の一覧が仮想マシンパフォーマンスに変わります。

グループを変えると、グルーピングごとの表示に変更することもできます。

表示形式を変えることで、様々な見方をすることもできます。


設定したフィルターは上部のクリアで元に戻すことができます。

フィルターボタンを押すと、さらに細かなフィルターを行い、よりほしい情報だけに絞って表示することができます。



仮想マシンをクリックすると、パフォーマンスの情報やコンソールなどをまとめて見ることができます。


仮想マシンの作成などもこの画面から可能です。
いわゆるオペレーションといわれる運用作業はこのExplorer(探索)から行います。

ほかにもクラスタやホスト、ストレージもこのExplorerからオペレーションが可能です。

この機能だけでも、無償で利用できるのはかなりうれしい機能だと思います。