未来に向かってデータを集める?過去のデータを解析?医療用AIで大切なこと
コメント
注目のコメント
後向きはすでにあるデータなので、データを残した人の恣意的な部分が入ります。
例えば、2-3回分の検査データを見直せば直近のデータが間違って記録されてるのがわかったとしても、直近のデータをそのまま使ったりします。3回平均とすること自体が稀ですが、そうすると2回分はここ数か月の検査だけど残り1回は5年前のデータということで何の平均かわならなくなったり、そもそも3回データを取ってない人は対象から外れてデータが小さくなり、統計学的処理に耐えないサイズになることもあります。
そして、数字で出る項目ならまだしも、医者の匙加減で判断が変わるような症状の記述などはデータとして耐えうるかもわかりません。
ということで、どういう定義でデータを集めていくか、前向きな研究・データ集めがより良いものとされているのです。エビデンスとして質が高いという意味です。
いずれにせよ、データの質が問われるのは今もこれからも変わりませんが、AIというブラックボックスを通る分、信頼できるデータでなかった時に、結果を見てもそれが正しいのかどうかがよりわかりにくくなるということが懸念されてるのかと思います。