新着Pick
279Picks
Pick に失敗しました

人気 Picker
とにかく明日朝、無事システムがワークすることを心から願うばかりです…

そして今後は、万一の場合名古屋や福岡など、別の取引所にリプレイスできるような一部分散型のシステムにできるよう、工夫をお願いしたいものです。
内容は知りませんが。
想定してない障害で止まるって事はそんなに珍しい事では無い。

通常は1つの障害で止まる様な設計では無い。
しかし、いくつかの要因が重なると停止する。

例えば、以下の例。
HPのSSDストレージシステムが32,768時間を超えるとデータが消滅するって恐ろしい話。

https://pc.watch.impress.co.jp/docs/news/1222207.html

コレ、HPが悪い訳じゃなく、供給してるSSDベンダーが悪い。

でね、ファームウェア更新で修正されるんですけど、ストレージサーバーやSSDのファームウェア更新ってなかなかできないんですよ。
データが飛ぶ可能性はかなり高いから、全データバックアップ取らないとだし、全システム停止しないと更新できない。

なもんで、今問題になってないなら「計画メンテ時にやるか」となるんですよ。普通。

でね、ここで重要なのは、上記問題は運転時間で死ぬんです。

つまり、同じストレージで冗長化してたとしても、両方同時に死ぬんです。

コレで共有ストレージ構成していたらアウトです。
HDDストレージの様な偶発故障や物理的故障が前提の冗長化構成だと、意味がない。

とは言え、当然それも想定して、HDDなど別のストレージにもバックアップしていたと思うんです。

ただ、SSDとHDDだと読み書き能力の桁が違う。
なので、既に多くの処理トランザクションが発生していたら、HDDじゃ追いつかないんです。
バックアップから復元なら1日作業でしょう。

上記SSDベンダーが富士通にも供給してる可能性は高い。
昨年システム更新してるそうですが、共有ストレージはそのタイミングとは別で更新計画してるかも。

富士通はストレージファームウェア更新提案を東証にしたけど、東証に断られたかも。

そんな背景があるんじゃないか。
そう考えると、富士通だけを責める事はできないです。

実際のとこは知りませんけどね。
記者の質問レベルが低すぎる。東証トップの会見がしっかりしていただけに余計目立った。
Sakakibaraさんのコメントが分かりやすい(有難うございます!)。
インフラを担うシステムは、障害が起こらないようにだけでなく、障害が起こっても運用できるように、冗長設計やステップが作られている。ただ、それでもたまにフェイルオーバーに失敗して、大きな事態になる。
最近だと昨年のAWSの障害もこういうのの連鎖。実生活では、東証よりAWSやGoogleの障害の方が厳しい今日この頃。
https://japan.zdnet.com/article/35141745/
無事に明日、売買が再開できるようになったようです。良かった!
リリースも出ています
https://www.jpx.co.jp/news/1030/20201001-09.html
丸一日取引を止めてしまって、原因も対策も説明しない、できないでは、参加者の不安を拭えません。世界の主要市場として存続するためにも、しっかり対応いただきたく。
ひとまずよかった。
コメント欄を見ていると意外と好意的で驚き。
障害対応でも経営陣が具体的かつ真摯に対応することが重要。
明日は売買再開するとのことで、ひとまず良かった!
でもまだ治ってないんでしょう?