アラート条件のための閾値の設定

条件を作成すると、何が違反を開くかを判断する閾値を設定することになります。このドキュメントでは、閾値とは何か、またその設定方法について解説します。

閾値とは何か?

条件において、閾値とは何が違反を開くかを判断するための設定になります。ポリシーのインシデント選好次第では、違反は以下をもたらす可能性があります:

  • インシデントの作成
  • 通知の送信

閾値の例:

  • アプリケーションのWebレスポンスタイム平均は、15分間にわたって5秒以上である。
  • アプリケーションの1分あたりエラー率は、最低でも1時間に1回10%以上である。
  • アプリケーションのAJAXレスポンスタイムは、その予想ベースライン行動から一定量逸脱している。

必須の重要閾値以外にも、深刻度の低い警告レベルに対して閾値を設定できます。これは、インシデントを作成せず、通知も送信しません。

閾値を表示して設定する

閾値の設定は、条件の作成プロセス中に行われます:

目標 解説
新規条件の閾値の設定 条件を作成するプロセスの一環として閾値を設定。
既存の条件の閾値を表示して更新する 条件の閾値を表示するには:UIでその条件を見つけます。閾値を更新するには、条件の閾値を選択して、変更を行います。

具体的なアラートの種類(ベースラインやNRQL)の詳細に関しては条件の種類を参照してください。

その他の機能性およびルールに関する詳細:

アラートAPIを使用する

Alerts APIを使用して、条件をリスト化して編集できます。

任意の警告レベルを設定する

閾値は、2つのレベルで設定できます:重要(必須)および警告(任意)。

閾値 詳細
icon-alert-critical.png 重要(赤) 必須。違反が発生すると、インシデントプリファレンス設定に基づき通知が送信されます。
icon-alert-warning.png 警告(黄) オプション。通知を生成しません。システムの挙動に不安があるか注意を要するものの、通知を必要とするほどの重要性が無い場合に監視した場合は、警告による閾値を使用します。
信号喪失(NRQL のみ)

信号喪失とは、New Relicでデータを受信できない期間を指します。これは、エンティティまたはサービスがオフラインになるか、エージェントまたはコレクターに問題があるか、データセンターまたはインターネットのネットワークに問題があることが原因である可能性があります。信号喪失の検出を使用して、信号が停止し、サービスが安定していると予想される場合に、新しい違反と通知を作成できます。また、この機能を使用して、短命のサービスがいつ停止するかを判断し、この状態に存在する未解決の違反を閉じるアクションを設定することもできます。

信号喪失、ギャップの充填、アクセスをリクエストする方法の詳細については、この発表を参照してください。

時間間隔を設定する

最低時間間隔は、条件の種類によって異なります。たとえば、一部の条件の種類は最低時間間隔が5分(APMのメトリックアラート条件など)である一方、最低時間間隔が1分(NRQLアラート条件)のものもあります。

ランブックの手順に関するURLを設定する

UI経由でこれを設定する方法に関しては、ランブックの手順を参照してください。

その他のヘルプ

さらに支援が必要な場合は、これらのサポートと学習リソースを確認してください: