今日のオリジナル番組


詳細を確認
予防医療は人生のリターンを高めるのか?
本日配信
169Picks
Pick に失敗しました

人気 Picker
所謂意図推定の研究では、強化学習と逆向きにアルゴリズムを回すことで、エキスパートの報酬関数自体を推定する逆強化学習(inverse reinforcement learning)という手法が知られています。

ただ、Perceptive Automata社のmedium記事、

Introducing Perceptive Automata: Human Intuition for Self-Driving Cars
https://medium.com/perceptive-automata/introducing-perceptive-automata-human-intuition-for-self-driving-cars-3d2aaa05c083


を見る限り、道路においては、まずは道を渡ろうとしているかどうかの意図を判断したいと思われるので、報酬関数はある程度決まっていて、もう少し行動モデルを使ったアプローチをしているのかも知れません。

CTOのSam Anthonyの昨年の記事

Self-driving cars still can’t mimic the most natural human behavior
https://qz.com/1064004/self-driving-cars-still-cant-mimic-the-most-natural-human-behavior/


私の知る過去事例としては、

Activity Forecasting
https://youtu.be/zHx1OqVsHb0

などがあります。ただこれは人の動きだけではなく、道路などのインフラから行動予測をするものですね。
現実的な問題をどう解決するのか。期待したいです