Google、新型コロナ関連の論文内を質問形式で検索できるツールをリリース!
コメント
注目のコメント
関連して、最近よく聞く「プレプリント」とは何かを解説します。
プレプリントとは日本語だと査読前論文と表現されます。科学論文は一般的に2-3名の専門家による査読の後に受理されて雑誌に公開されます。実験系の論文であれば追加実験を要求されることもあり、査読期間は論理を武器にした闘いなのです。一発で受理されることはごくまれで、長ければ1年以上やりとりが続くことも。
プレプリントはこの査読のステップを省いて事前公開されている論文をさします。これによって即時性が担保されたり、フィードバックが得られる、逆に雑誌側からアプローチがくるなどのメリットが生じます。しかし査読がない分、質の悪いものが混じる頻度が多くなります。しかし一方で査読があるからといって全て質が良いわけでは無いところが難しいところ。
たった1本の論文では断定的な結論は出せず、複数の場所から似たような結論が得られた時に”確からしい”と判断されていくのが科学の進み方です。専門家が科学的に正しい表現を徹底すると、時に歯切れが悪い印象を強く与えてしまうので表現って難しいなと思います。専門家と社会の間を埋めるコミュニケーターの育成が大切なのだと思います。
検索ツールのアドレスはこちらです。
https://covid19-research-explorer.appspot.com/新型コロナウィルスに関連した論文は、信じられないほど日々爆発的に増加していて、医学論文を読むことを欠かすことのない私でも、全く追いつけません。
私もそうですが、論文を日々読む方の場合、自分の中で検索の型ができている方も多いのかもしれません。そのような場合には、あまりこのような検索ツールのお世話になることは多くないでしょう。しかし、そうでない方には、便利なツールになりうるかもしれません。
読む側として、もう一つの問題は、欲しい論文にありついても、その論文の質は結局読んでみないと分からないということです。論文投稿のスピードが速い反面、研究や論文の質があまりに玉石混交で、普段なら掲載されないであろう質の論文もトップジャーナルに掲載されるといった事態です。このため、「質の高い」論文を探すとなると、結局時間がかかります。
そんな中、各方面の専門家グループが論文を片っ端から読んでその質を第三者的に評価し、要約して配信してくれるサービス(NEJM Journal Watchなど)もあり、こちらは私も助けられているサービスの一つです。そのような質評価は、なかなかまだ人海戦術でないと難しいかもしれせん。コロナ関連の論文が5万以上に増えたので、検索技術の出番ですね。
最新の自然言語処理モデル「BERT」といえど医学系の専門用語に対応したトレーニングデータが必要。そこで、ヒトが作った生物医学データ「BioASQ」を元に、機械で大量のデータを生成して、学習させたとのこと。ただ、それでもキーワード検索より結果が悪い例もあり、その辺の試行錯誤と改善がBlogで説明されてます。
=参考=
Google AI Blog
https://ai.googleblog.com/2020/05/an-nlu-powered-tool-to-explore-covid-19.html