新着Pick
9Picks
Pick に失敗しました

人気 Picker
自ら行動を起こしその経験から行動を改善していく強化学習の紹介。

目標達成に近づけば加点されるため、スコアが上がるように試行錯誤を重ね、AIの行動が最適化されるのがその特徴です。

つまり、目的が明確で、さのための行動が分かっていないケースで有効な方法です。