写真が撮られた場所を特定できるAIモデル--スタンフォード大学院生らが開発
コメント
注目のコメント
Googleストリートビューの位置当てゲームで、OpenAIの画像認識モデルを活用して、高精度の位置特定モデルを開発したとのこと。プラットフォームを活用すれば、色々できる時代ですね。
・実際に撮影された場所から25km以内の範囲でその場所を推測できる確率は40%以上
・Googleストリートビューの写真の場所を当てるゲームGeoGuessrのプレイヤーランキングで上位0.01%以内
・GeoGuessrから抽出した10万カ所のオリジナルデータセットと、パノラマを構成する画像4枚のダウンロードセット、合計40万枚の画像でトレーニング
・OpenAIの画像認識モデルCLIPを活用
・プライバシーの侵害を考慮し、モデルの重み値を一般に公開せず、学術的検証のためにのみコードを提供すごいですね👀 とはいえ、このあたりの技術は新しくなく、観光名所であれば結構前からしっかり判定できていました。アウトプットの粒度が粗ければ (特定座標ではなく国や州レベルとか), 今の技術水準なら十分可能そうだなとは思いました◎
あと細かいことを言うと「他のAIモデルを訓練するのに使われる膨大な数の画像に比べると、PIGEONの学習データははるかに少ない。参考までに、人気の高いOpenAIの画像生成モデル「DALL・E 2」は、数億枚の画像でトレーニングされている。」とありますが、画像生成 (DALL・E) は、画像判定 (GeoGuesser)よりアウトプットまでの過程が複雑なので、学習画像枚数が多いのは当然です。なので、このような比較は若干ナンセンスになってしまっているなと感じました🙈
どうでもいい話、GeoGuesser の RTA は日本でもやっていて、一度動画をみたことあるのですが、画像を一瞬みただけで地名を判定する様は圧巻です。ほんとすごいのでぜひ見てみてください。笑プライバシー保護観点からは、なかなか浸透が難しそうですが(サービス提供側として) うまく使えば行方不明になる人など事件性のあるものの解決に使えそうですね。AIなのかというと微妙ですが。。。(ディバイスのGPSを使えば良いのでは?)