15年前くらいの話。
i-modeゲームの絶頂期の頃です。
webサーバーが6時間程度停止した。
apacheのポート監視はしていたが、カーネルパニックでハングアップし監視で検知できず。
その当時は、web1台・DB1台構成で30万人規模のコンテンツのサーバーを運用していた。
ロードバランサーなどは高価すぎて当時気軽に導入できない時代。
という環境で6時間程度、休日に停止した。
翌週に、障害報告と謝罪。
担当者の声。
江戸さん!この件でどれだけの機会損失とクレームが来たか分かる?
特にこの時はクレームの件数だった。人気絶頂期。
約2000件。
これを回答する人がどれだけ必要か?
売上損失もそうであるが、この対応のコストは莫大である。
心に刻まれるいい経験でした。
サーバーが停止する事により
機会をそこね損失する売上金額がある。
サイトの信用度の低下がある。
停止する事により裏方のコストがかかる。
運営側に来るクレームがある。対応する人がいる。
停止によるもろもろのサービス対応や機会損失。
社内での説明など対応がある。
売上金額以外に見えにくいもので損失するものがかなりある。
こういう事態を極力無くす為にサーバー管理者が居る。
サーバー管理のプロの前提条件としてしっかり刻んでおかなければいけない事項。
未然の対応、障害後の対応、二度と起こらないようにする対応。
投稿者プロフィール
-
株式会社スカイアーチネットワークス
代表取締役社長 江戸達博
コメントを残す