全日空システム障害 原因は「データベースに負荷」 サイバー攻撃、データ流出なし
コメント
注目のコメント
まずは攻撃でなかったことに安心
そして関係各所大変な時間を過ごされたかと思います
しかしこう言った問題は単発で考えるのみでなく、不安定な国際情勢下においてはより進んだ考え方が必要でしょう
要するにデータベースに負荷を掛ければバックアップシステムが瞬時に立ち上がるわけでもなく、麻痺するということがわかったわけで、これは情報統制下においてほぼ報道されないロシア軍サイバー部隊によるサイバー攻撃によりかなり多くのインフラが麻痺していることを鑑みて考察する必要があるということです
よく「外部からはパケットが通らない」とかって言いますが、事前侵入や人を介した攻撃までしっかりと考えるクリティカルシンキングに基けば、現状の対策で良いのかどうかということが問われる
もちろんこう言った局所的な問題にフォーカスすれば馬力を問われるわけだが、平常業務時のトルクも大事になってくる
本当に我が国のインフラは安全なのか
それを問うには正しい攻撃に関する知識が必要であり、それを語れる論客が我が国に両手もいないことは言うまでもないどう作ってるのか全然知らないで言ってます。何となく普通に作るとって想像で、実は業界独特の事情や会社独特の事情があってとかありそうですが。
うーん、、、ダブルマスター運用(ってか今時はマスターって言わないようになってるので何て言うんだろ?)をしてたという事なのか?レプリケーション運用だったのか?わかりませんが、片方が落ちてしまったときに通常運用できないというのはそもそも冗長化できてないという事なのでは...?
というのが気になりました。
あとちょっと思ったのは、最悪予約システム側からのリクエスト落としちゃうとかできないんですかね?
予約システム側からのリクエストの方が多そうだし、そっちを一旦メンテナンスに落としてごめんなさい画面出して、搭乗手続きからの出発便までは正常運用できるようにするとか。
両方落として空港内でてんやわんやするより全然良いかなと。予約システムに関わるシステムは少なくともミッションクリティカルなシステムですので、冗長性だけでなく、自動でスケールアウト(データベースの処理インスタンスを増やす)もしくはスケールアップ(データベースのスペック自体を上げる)するような可用性のあるアーキテクチャ構成を志向することが求められますね。クラウドの話をするとポジショントークになるので控えますが、このような構成はクラウド/オンプレミスのどちらの環境でも十分可能です。ワークロードのビジネス影響を鑑みて適切なアーキテクチャを構成することが自社のビジネスの安定性堅牢性を向上させ、On-goingな企業を作るいちばんの近道です。