News and media screen tile collage

New terminology coming for Alerts!」の抄訳記事です。

まもなくNew RelicのApplied Intelligenceを使用したインシデント対応の全く新しい方法が導入される予定です。その一環として、これまで使っていた用語を変更し、新たなコンセプトも追加します。新しいシステムがリリースされたらすぐに使い始めることができるように、今からこの変更点を紹介したいと思います。

今日は3つの用語をご紹介します。

  • インシデント(Incident)
  • イシュー(Issue)
  • イベント(Event)

これらはすべて、アラートとApplied Intelligenceの文脈で説明します。

ちょっと待って、インシデントとは何かすでに知っているはずですが?

これまでは、違反(violation)がインシデント(incident)に発展し、インシデントが通知(notification)につながっていました。これを変えようとしています。

もうすぐ、アラートの最小粒度はインシデントになります。これまでの違反と同じように機能しますが、多くのお客様が利用しているサードパーティのチケットシステムと用語を合わせたいと考えました。

そのため、これまで違反と呼んでいたものを、今後は 「インシデント」と呼ぶことにしました。

では、インシデントとは何でしょうか?

これまでは違反がインシデントに発展していました。

アラートの次の粒度はイシュー(issue)になります。イシューはこれまで「インシデント」と呼んでいたものとは少し異なる動作をしますが、アラートシステムにおける位置づけとしては、ほぼ同じです。

つまり......これまでインシデントと呼んでいたものは、「イシュー」と呼ばれることになります。

わかりました、イベントはこの文脈にどう当てはまるのでしょうか?

サードパーティのツールからNew Relicにアラートイベントを送信できるようになり、New RelicはそれらをNew Relicから来るアラートと同じように扱うようになったので、インシデントの発生につながった「イベント」の数を追跡するようになりました。

Events Column

上の「イベント」欄を見ると、「インシデント」画面に表示されています。

New Relic で発見されたアラートや異常からインシデントが開始された場合では、最大でも 2 つのイベントが表示されます。1つは「インシデントが開かれた」イベントで、残りの1つは「インシデントが閉じられた」イベントです。

しかし、サードパーティツールの中には状態を追跡しないものもあります。このようなタイプのツールは、症状が続いている限り、さらに「インシデントが開かれた」イベントを送信します(Nagiosがその好例です)。サードパーティツールをNew Relicと統合した場合、同じ問題に対して大量のインシデントを開くことはありません。代わりに、チケットシステムから送られてくるすべてのイベントをチェックして、そのエンティティと症状に対してすでにインシデントが開かれているかどうかを確認します。一致するインシデントがあれば、そのイベントを既存のインシデントに取り込むだけです。

例として、特定のエンティティの特定の症状についてNagiosから52の「インシデントが開かれた」イベントを取得した場合、New Relicは1つのインシデントを開くだけですが、「イベント」列には52のイベントが表示されます。

なんとなくわかったような気がしますが、簡単にまとめてくれませんか?

もちろん、こんな感じでどうでしょう?

  • イベントはインシデントにつながる

  • インシデントは症状の詳細

  • イシューは関連する症状の集まりで、問題があれば対応するものです

Events Incident Issues

これで、これから紹介する新しい用語の理解が深まったと思います。それでもまだ疑問がある場合は、このスレッドに投稿することをお勧めします。

それでは、楽しいアラートライフを