Picks
129フォロー
41フォロワー
創薬AI開発へ、製薬17社が「社外秘」データ提供…オールジャパンで候補絞り込み
読売新聞
渡邉 博文株式会社ウィズメーティス 代表取締役 博士(理学)
これですかね? AMED「創薬支援推進事業―産学連携による次世代創薬AI開発―」 https://www.amed.go.jp/news/program/20210129.html 社外秘だけど、企業秘密は守れるくらいの情報にする手段は、化合物の構造そのものではなく、特徴量に落とした状態での情報を共有するのでしょう。構造そのものとターゲットに対する活性値そのままでは、他社に知られ過ぎててしまうということで避けると思います。 特徴量というのは、機械学習にある値yを学習させるときの説明変数になる量のことです。y=ax+bならxのことです。化合物の代表的な特徴量は、分子量(分子の質量)、脂溶性(油へのなじみやすさ)、水素結合ドナーの数、同アクセプターの数など様々です。その他、フィンガープリントと呼ばれる、化合物を切った断片に番号を振って、それを持つか持たないかで符号化するやり方もあります。 確かに、機械学習は、データが多ければ多いほど、予測精度は高まりますし、学習に使うデータが、予測したいデータに近いほど精度が高まります。製薬会社が化合物ライブラリとして保存している化合物は、もともと医薬品になる可能性があると思って保存しているものですので、一般の有機化合物のライブラリに比べると遥かに有用です。そのデータを使ったAIは、特に溶解度などの物性パラメータや、代謝や心毒性関連のパラメータ(hERG阻害)などについては、高い予測精度が期待できるのではないでしょうか。 一つの薬を作りだすには10年以上かかるのは本当ですが、全て垂直統合のビジネスモデルにするから、回収に時間がかかるのです。スタートアップは、どこかの時点で製薬会社に導出し、前臨床通過、Phase1通過、同様にPhase2、Phase3などマイルストーンを達成したところで報酬を、もらっています。それぞれのプロセスに要している時間は、2、3年等で過ぎていきますし、それぞれの達成の確率は当然そこまで低いわけではないです。(国内大手の武田や大塚でも新規成分について約20種類しか同時に臨床試験を行っていませんし、 https://answers.ten-navi.com/pharmanews/19828/ 1つのターゲットの最適化に2万化合物も合成しません。それぞれのプロセスで篩にかけて少しずつ落としていくのです。)
121Picks
日本のIPOの現状と変えるべきもの
note(ノート)
渡邉 博文株式会社ウィズメーティス 代表取締役 博士(理学)
このコメントはアカウントを作成すると読むことができます。
122Picks
NORMAL