インシデント管理は、システムをスムーズに稼働させるために、さらにトラブルが起こった際に速やかに復旧させるために欠かせないものです。インシデント管理をしっかりと行い、情報を共有することで、よりスムーズにシステムを運用できるようになります。ここでは、インシデント管理の概要とメリットについて説明します。
インシデントとは
インシデント管理を理解するまえに、まずインシデントとは何かを確認しておきましょう。
インシデント(Incident)とは、日本語だと「(好ましくない)出来事」「ちょっとした事件」というような意味を持つ言葉です。ISO22300 (2.1.15)では「中断・阻害、損失、緊急事態、危機に、なり得るまたはそれらを引き起こし得る状況」と定義していて、迅速に対処しなければ被害が広がるような状態のことをインシデントと呼びます。
サービスのサポートデスクなどではシステムが正常に稼働できなくなる事象を指すことが多く、システムのバグや障害、ユーザーの操作ミスによるシステムの停止など、さまざまなことがインシデントに含まれます。
インシデント管理とは何か
インシデント管理(Incident Management)とは、何らかの理由でユーザーがシステムを正常に利用できなくなったときに、その原因を取り除き、再びシステムを正常に利用できるようにするためのサポート体制のことを指します。ITサービスや情報システムの運用管理で使われ、主にユーザーサポートが担当するのが一般的です。
インシデント管理はシステムの可用性を維持する方法のひとつとして活用され、システムを素早く復旧させ、ユーザーがすぐに業務を再開できるようにすることを目的に利用するものです。
インシデント管理の各段階
インシデント管理は、次の6つのステップに分けて進めていくのが基本です。
- ユーザーからの連絡やシステムからのアラートにより「インシデントの発生」を検出し、記録を開始します。
- ナレッジベースから過去によく似た事例がないかを検索し、その内容や影響する範囲に応じてインシデントを分類します。そのうえで緊急度や優先度、対応の難易度などを決定し、必要に応じてエスカレーションを行います。ちなみにエスカレーションとは、オペレーターの対応可能な範囲を超える場合に上位の管理者などの指示を仰ぐことや対応を引き継ぐことを指します。
- 対応が容易なものは、ユーザーサポートの担当者が問題を解決します。
- 担当者だけでは対応できないインシデントは、エスカレーションによりマネージャーや責任者が問題を解決します。
- システムが復旧したら、その記録をナレッジベースに登録します。経過の観察や顧客のフォローなどが必要な場合は、それらの対応が終了するまで管理を継続します。
- インシデントが解消して業務が再開されたら、関係者に報告してインシデントへの対応を終了します。
1. インシデントの検出
2. インシデントの分類
3. 担当者によるインシデントの解消
4. エスカレーションによるインシデントの解消
5. インシデントの管理
6. 終了
インシデント管理のメリットと問題点
適切なインシデント管理は、ユーザーサポートの担当者・マネージャー・ユーザーの三者にメリットをもたらします。ただし、そのためには、トラブル対処法などの属人化されていた知見を蓄積・共有し、適切な管理体制を整えておく必要があります。
ユーザーサポート担当のメリット
過去の知見をナレッジベース化して一元管理することで、インシデント管理を効率化できます。ユーザー側のシステムを正確に把握することが可能となるため、迅速で正確な対応ができるようになり、顧客満足度の向上にもつながります。
マネージャーのメリット
インシデント管理により、日常的な対応をユーザーサポートの担当者に任せられるようになります。その結果、マネージャーは重大なインシデントや多発するインシデントの分析に時間を費やせるようになります。この分析結果は問題管理へとつながり、システムやサービスの品質そのものを高めることが可能となります。
ユーザーのメリット
トラブルが発生した際に、スピーディーで正確なサポートを受けることができ、スムーズに業務を再開できるようになります。これはシステムやサポートに対する信頼性や安心感につながります。
インシデント管理の問題点
インシデント管理のナレッジベースは、適切に管理されていなければ効果がありません。たとえば、入力されているデータが少ないと、よく発生するインシデントであっても、あらためて対応策を検討する必要が生じてしまいます。また、データとして入力されている事例であっても、対応方法や対応結果などのデータが残っていなければ意味がありません。よって、データ入力に「漏れ」や「抜け」がないかに注意しなければなりません。
データの入力漏れをなくし、適切に管理・運用していくには、ユーザーサポート担当者にナレッジベースの重要性を十分に理解してもらい、手軽に入力作業が行えるシステムを構築しておく必要があります。
インシデント管理と問題管理の違いは
インシデント管理とよく似た用語に「問題管理」というものがありますが、この2つには大きな違いがあります。
問題管理とは
問題管理(Problem management)とは、インシデントを解消するだけでなく、そのインシデントの再発を予防するための対策を施すことを指します。ここでいう「問題」とは、インシデントを引き起こす根本的な原因のことです。発見された問題をインシデント管理により解決し、その知見をシステムやサービスに反映させることで、品質をより安定したものに改良していくことが問題管理となります。
インシデント管理と問題管理の違い
インシデント管理は、その場で発生しているインシデントを解消することが目的になります。このため、できるだけ速く問題を解決し、サービスやシステムを復旧させる必要があります。その場での対処が主になるので、システムやサービスそのものに変化はありません。根本的な解決策ではなく対処にすぎないので、同じインシデントが再発する可能性があります。
問題管理は、根本的な原因を発見して解消することで、インシデントの再発を予防することが目的になります。このため、多少時間がかかっても構いません。サービスの内容や運用管理方法を修正したり、他の管理プロセスと連携したりするなど、大掛かりな改変が必要になる場合もあります。
まとめ:インシデント管理によりシステムを運営・管理しやすく
インシデント管理は目の前で起きているトラブルに直接的に対応する「処理」が主な役目ですが、それだけではありません。重要なのは、インシデント管理によって今後の運営につながるノウハウを蓄積、共有していくことです。そのうえで、根本的な問題解決(問題管理)へとつなげていきます。
インシデント管理は、「サービス担当者とマネージャー」だけでなく、「ユーザー」にとっても利益になるものであり、極めて重要な業務のひとつとして捉えなければなりません。