システム障害の対応は、プロセスに沿って進められます。
どんなに堅牢に構築された情報システムでも、長い間運用していれば必ず障害が発生します。
そうした障害に対応するのも運用管理業務の一環です。
通常、システム障害の対応は「障害の検知、関係者への連絡・ヒアリング」「障害の切り分け(障害箇所の特定)」「システムの復旧」「関係者への連絡」「障害原因の究明」「再発防止策の立案」「障害の記録(障害対策マニュアル)」というプロセスで進められます。
障害の影響を最小限にするための対策が取られています。
現在、一定規模以上のシステムは、ネットワーク経由ですべての機器を監視しており、障害や負荷過多などが発生するとただちにメールなどで半自動的にシステムの運用管理担当などに通知されます。
また多くの企業において、システム障害の影響を最小限にするために、同じデータを複数台のコンピュータを相互接続し全体で1台のコンピュータのように振る舞わせる(クラスタリング)、同じデータを同時に複数のハードディスクに保存する(ミラーリング)などの対策が採られています。