新型コロナの新規陽性者数、2月6日に1万人超えか Googleが予測データを更新
コメント
注目のコメント
皆さんご存知だと思いますが、コンピュータによる数値計算が当たるのは、ほぼほぼ正確な物理法則が分かっている単純な現象だけです。たとえば太陽と惑星の位置関係は、数千年後の未来に至るまでほぼ正確に予測できます。しかしそれでも小さな小惑星となると多くの影響を受けて誤差が大きくなるため、100年先の軌道計算さえ困難な場合があります。
気象の場合は皆さんご存知の通りで、物理法則は分かっているはずなのに、海と大気、陸と大気など人間にとって未知なさまざまな相互関係もあり、東京で雨になるのか雪になるのかという予測が数時間前になっても微妙で分からないということもあります。
要するにコンピュータは計算は得意ですが、その計算が正しいかどうかは保証してくれません。そのモデル(仮説)の計算式が正しいとしたらこうだ、という一つのシナリオを示しているだけです。新規陽性者が1万人だから何をしても無駄だ、とあきらめる必要もありませんし、Googleは不必要に社会不安を煽ってけしからん!と憤る必要もありません。単に起こりえる一つのシナリオを示しているにすぎません。
富士山が噴火したり、南海トラフ巨大地震が発生するのが、明日なのか、10年後なのか、20年後なのか、分からないのと同じようなものです。私たち人間に求められているのは、いろいろなシナリオを想定して備えておくだけです。
例えば新規陽性者が1万人出るようになったら、入院はおろか、隔離用ホテルの利用もままならないでしょう。中国であったように野戦病院のようなものを作るか、または各自が安全に自宅療養できる仕組みづくりが必要なのではないでしょうか。Predictive analytics (将来予測)は意識/行動を促す上で役立つものの、Googleには合わせてprescriptive analysis (処方分析)も提供してもらえると良いなとも思いました。様々ある施策の中で最も効果の期待できる手法や、個人がどのように行動を変化させるべきなのかも合わせて提供されることで、最悪の未来を回避することに各々どうすれば良いかのアクションにつながると思います。
言うは易しですが…(表現修正と加筆)
このGoogle Data Studioの予測値はトレンド(7日間移動平均の折れ線)と曜日の周期性の予測値(棒グラフ)なので、ノイズが多く日々激しく変動する実測値と大きく異なるのは当たり前です
さらに着目点は二月まで日別感染者数が減らないことかなと。すなわち実行再生産数が1を二月まで下回らず、緊急事態宣言の効果が期待ほど出ていないこと。
〉予測数値と実際の数値が異なる場合もある。1月8日以降のデータと厚生労働省が発表したデータを比較すると、8日の新規陽性者数は7863人(実際は7844人、以下同)、9日は7634人(7278人)、10日は7517人(6090人)、11日は7383人(4851人)となり、8日や9日の予測数値は実際の数値と近い結果となった一方、10日や11日は予測値と1000人以上異なる結果に。
Googleのデータサイエンティストの方が解説やRのコード等を公開しているのでご参考
https://twitter.com/TJO_datasci?s=09
ご参考にGoogleのデータサイエンティストの方が書かれたblogの二回差分トレンドモデルの説明をご参照ください。
https://tjo.hatenablog.com/entry/2020/04/29/152412
実際のモデルはもっと複雑なので詳細はGoogle Data Studioのリンクのユーザーガイドやホワイトペーパーを見てください。