インフラストラクチャ監視 UI では、 Hosts [ホスト] UI ページがインフラストラクチャの問題を理解し、トラブルシューティングを行うための主な場所です。
ヒント
これらのドキュメントでは、2023 年 4 月に追加された新しい Hosts [ホスト] UI について説明します。新しいビューと Classic [クラシック] ビューを切り替えることができます。クラシック UI は 2023 年 8 月 30 日にサポートを終了する予定です。
one.newrelic.com > All capabilities > Infrastructure
使用例の例
Hosts [ホスト] ページは、インフラストラクチャの問題を調査するための場所です。以下は、お客様が問題を診断するために使用する一般的なワークフローの一例です。
- APM の概要ページで、Kafka サービスの問題に気づきました。スループットが低下し、多くのエラーが発生します。
- APM に表示されるインフラストラクチャ データに基づいて、これはホストの問題であると考え、クリックしてインフラ ストラクチャ Hosts [ホスト] ページに移動します。
- Hosts [ホスト] ページでは、Kafka サービスが自動的にフィルターされます。そのサービスを実行しているホストの半分が CPU % を上限に達していることがわかります。
- ホスト構成の変更が問題の原因である可能性があると思われる場合は、 Inventory [インベントリー] タブに移動して、ホストごとのシステム構成を確認してください。
ホストを探索および分析するための UI 機能
Hosts [ホスト] UI 全体で利用できる重要な UI 機能がいくつかあります。これらの使用方法を理解すると、この UI を最大限に活用することができます。
A. フィルター バー: 表示したいホストをフィルターします。ヒントについては、 「フィルター バー」を参照してください。
B. 保存されたビュー: 好みのビュー (フィルター、カスタム チャートおよびテーブルの選択を含めることができます) を作成したら、 Save [保存]をクリックします。
C. グラフ オプション: グラフごとに異なる指標に切り替えることができます。また、 ...
をクリックすると、共有可能なリンクの取得やその指標のアラートの作成など、 その他のグラフ オプションが表示されます。
D. グループ化: これを使用して、グラフの結果を特定の属性ごとにグループ化します。たとえば、CPU 使用率が最も高い AWS リージョンを awsRegion
でグループ化して表示できます。
E. 属性フィルター: これにより、ホストを特定の 属性 値を持つホストにフィルターできます。例えば、
F. ホスト テーブル: デフォルトでは、25 個のホストが表示用に選択されています。テーブルの列と属性フィルターを使用してホストを調べ、表示する別のホストを選択します。テーブルを CSV としてエクスポートできます。
G. ホストの詳細: ホスト テーブル内の特定のホストについて、
アイコンをクリックすると、ログの表示、 エンティティ マップの表示などのオプションを含む、その他のオプションが表示されます。
ホスト UI ページのタブ
Hosts[ホスト] UI ページで利用できるタブの詳細は次のとおりです。
Hosts [ホスト] ページの Summary [概要] タブには、ホストのパフォーマンスの概要が表示されます。
one.newrelic.com > All capabilities > Infrastructure
このページの上部にあるタイルには、ホスト、アプリケーション、イベント、アラートの概要が表示されます。これらのタイルを使用して、ホストに関する詳細を表示したり、 Summary [概要] ページ全体を特定のホストにフィルターしたりできます。
Summary [概要] ページの時間ピッカーはメトリック タイルとグラフのみを調整しますが、ホスト テーブルは調整 しません 。Hosts [ホスト] UI の他のタブには、時間ピッカーによって設定された時間範囲を反映するテーブルがあります。
System [システム] タブには、システムの概要が表示されます。これは Summary [概要] タブに似ていますが、システムのいくつかの側面についてより詳細な詳細を検索できます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > System
System [システム] ページに表示されるデフォルトのグラフは次のとおりです。
CPU %: これは、 SystemSample
イベントの他のいくつかの指標から派生した指標です。具体的には、 cpuPercent
属性は cpuUserPercent
、 cpuSystemPercent
、 cpuIoWaitPercent
および cpuStealPercent
の集合です。
負荷平均5分:過去5分間において、システム上での作業を待っているタスクの平均数を表しています。
メモリ空き容量%:空きメモリのバイト数と使用メモリのバイト数を比較します。
これらのグラフの生成に使用されるデータの詳細については、 「 SystemSample 」を参照してください。
ネットワークページでは、個別のホストやウェブサーバー、ネットワーク全体のその他のリソースのグループの健全性とパフォーマンスがリアルタイムに可視化されます。デフォルトのチャートには、パケットごとの帯域幅メトリックス、バイト数ごとの帯域幅、1秒当たりのエラーが表示されます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > Network
個々のインターフェースに関する詳細は、次のことに役立ちます。
ネットワーク全体または選択したホストの飽和レベルを調べます。
特定のリソース間の負荷分散を比較します。
類似のホスト間の容量パターンの予期しない違いを特定します。
検出された上位 5 つのネットワーク エラーを評価します。
このリアルタイムのネットワークデータは、購入を決定する前に、ネットワークを再構成したり、負荷を再調整したり、その他の予防保守アクションを実行したりして、エラーを解決するかどうかを判断するのに役立ちます。
これらのグラフの生成に使用されるデータの詳細については、 「 NetworkSample 」を参照してください。
[プロセス]タブを使用して、ホストで実行されているプロセスに関する情報を取得し、プロセスメトリックにアラートを設定します。 [プロセス]タブには、CPUパーセンテージ、I / Oバイト、個々のプロセスまたはプロセスのグループ化のメモリ使用量などのデータが表示されます。
one.newrelic.com > All capabilities > Infrastructure > Hosts > Processes
Processes [プロセス] タブでは、CPU パーセントの範囲はホストではなく個々のプロセスに限定されます。このため、CPU パーセントのメトリックではシステム全体のリソースが考慮されません。代わりに、各プロセスが 1 つの CPU コアをどれだけ使用しているかを示します。
これらのグラフの生成に使用されるデータの詳細については、 「 ProcessSample 」を参照してください。
問題を正確に突き止め、アラートを設定する方法の例は次のとおりです:
Hosts [ホスト] ページを見ると、クラスターの CPU 使用率が通常よりもはるかに高いことがわかります。
プロセスページに移動し、そのクラスタのプロセスに絞り込みます。
同じプロセスのいくつかのインスタンスで、CPU使用率が高くなっていることが分かりました。
問題を解決した後、そのプロセスタイプのCPUの使用率が特定の閾値を超えた場合に起動するアラート条件を作成することにしました。
ヒント
UIからプロセスを開始、停止、または再開することはできません。代わりに、標準の手順に従って、インフラストラクチャエージェントを手動で開始、停止、確認、または再起動します。
one.newrelic.com > All capabilities > Infrastructure > ホスト > ストレージ
[ストレージ]タブでは、デバイスの全体的な使用率、ディスク使用量、I / O操作など、リソースの容量と効率を監視できます。これは次のことに役立ちます。
予期しないパターンを調べます。たとえば、I/Oタスクを均一に処理しないミラーリングされたマシンのクラスター。
ディスク容量が完全になくなる前に、使用レベルを監視します。
1つ以上のホストの問題について通知するアラート条件を設定します。たとえば、読み取りまたは書き込み操作の処理時間が長い、ディスクの可用性またはパーセンテージまたはバイトに基づく使用率など。
通常の処理要求よりも多いまたは少ないホストをどこに再配布するかについて、十分な情報に基づいて決定します。
データを使用して、緊急事態が発生する前にインフラストラクチャ予算の追加または変更を計画するのに役立ててください。
これらのグラフの生成に使用されるデータの詳細については、 「 StorageSample 」を参照してください。
Containers [コンテナー] タブを使用して、ホスト上で実行されているコンテナーに関する情報を取得し、コンテナーのメトリックに関するアラートを設定します。このタブには、個々のコンテナーまたはコンテナーのグループの CPU パーセンテージ、I/O バイト、メモリ使用量などのデータが表示されます。この情報は次の目的で使用します。
Infrastructureデータ
インフラストラクチャ データの詳細については、 「インフラストラクチャ データ」を参照してください。