東証 世界トップレベルのシステム トラブルの原因特定できず
NHKニュース
55Picks
コメント
注目のコメント
簡単に原因特定できるのなら、予め対策してます。
もし簡単に原因特定できてしまうくらいなら、対策してなかったと言う瑕疵になります。
そう言うレベルです。1号機が生きているかどうかを呼びかけるハートビートという一定時間間隔でのpingの応答による死活監視やって、応答が無い場合に自動的にフェイルオーバーする仕組みというのが基本なんだろうけど、死活監視が上手くいかなくてフェイルオーバーに失敗するというのは、ハードウエアの保守運用に関わった人なら何度か経験ありそうで、対策もやっていそうなもんかな。
ちなみに、自分が知っている範囲の10年くらい前のことでは、キャッシュ上にデータが残っていてあたかも正常であるかのような振る舞いをしていた、というようなことがあった記憶がおぼろげに残っている。ハード的な問題か、もしくはソフト的な問題か、もしくは人為的なものか、もしくは外部からの攻撃か。
仮にですが、障害の原因となる作業をした従業員がいた場合、その人はなかなか名乗り出にくいでしょうね。。。
今の時代、なかなかハードやソフトでの障害は多くはないし、それらが原因だったら直ぐに原因として判明していると思うんです。
そう考えると、人為的なものが原因かも、、、と思ってしまう。