有料コンテンツの購読
現在、Web上での有料コンテンツ購読機能は準備中です。
ご不便をおかけしますが、有料コンテンツを購読希望の方は
モバイルアプリ上で購読の手続きを行ってください
認証方法を選んでください
ご協力いただきありがとうございます。
いただいた情報は実名認証のみに使用いたします。
利用可能になる機能
コメントの公開範囲が
すべてのユーザーまで開放されます
フォロー中トピックスの投稿にコメント・返信ができるようになります
Facebookで認証を行う
LinkedInで認証を行う
名刺・学生証で認証を行う
お名前の変更には
再度実名認証が必要です
Facebookで認証を行う
LinkedInで認証を行う
名刺・学生証で認証を行う
名刺または学生証を利用して
実名認証を行いましょう
名刺または学生証をアップロード
※ 名刺等の情報は照合にのみ利用します
※ アップロードされた資料は公開されません
入力された情報に虚偽があった場合、認証が取り消されることがあります。
これに同意の上、下記のチェックボックスにチェックして登録を完了してください。
実名認証を行う
を利用して
実名認証を行いましょう
入力された情報に虚偽があった場合、認証が取り消されることがあります。
これに同意の上、下記のチェックボックスにチェックして登録を完了してください。
実名認証を行う
実名認証が完了しました
ご協力いただきありがとうございました。
一層のコミュニティ活性化に取り組んで参ります。引き続きNewsPicksをご活用ください。
利用をつづける
実名認証をして
コメントを発信しよう
現在あなたのコメント公開範囲は
フォロワーのみに限定されています
信頼性の高いコメントコミュニティをつくっていくために、実名認証にご協力をお願いします。設定を行うことでコメントの公開範囲が「すべての利用ユーザー」に開放されます。
実名認証を行う
あとで
学割プラン継続確認
学割プランは毎年月に更新の確認を行っております。
月以降も学割プランを継続されたい方は、
学生情報を更新してください。
学生情報を更新されない場合、
次回更新時に自動解約となります。
卒業される方等、プレミアムプランに移行される方には
1ヶ月無料期間をサービスいたします。
学割プランを更新されない場合
学生の場合
学生の間であれば、またいつでも学割プランにお申込み頂けます。
社会人になる場合
いま、アンケートに答えてプレミアムプランに移行すると1ヶ月無料の特典が受けられます。
ここで「更新しない」を選択すると、後からは1ヶ月無料の特典は受けられなくなりますのでご注意ください。
メール認証をしてください
ご登録いただいたメールアドレス宛に届くメールから
URLをクリックし本人確認をお願い致します。
届いてない場合、見つからない場合は下記から再送と認証をお願い致します。
再送設定する
閉じる
新しいトップページへの
フィードバックのお願い フィードバックを受けて改善いたしますので、ご意見・ご要望をいただけませんか?
Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces
https://arxiv.org/abs/1709.10163
メタな議論だけど。自分で手を動かさないマネージャーは、最終成果物の出来不出来しかわからない。まさに記事中のDQNと同じ。逆に自分で手を動かしているエンジニアは、日々の過程での中間ステップが良い方向に向かったかかどうかフィードバックがある。記事中のDeep Tamerのような感じ。
かくいう僕もどうも最近はタスク・マネージメントの仕事が増えてしまって、手を動かす時間より口やお金を動かす時間の方が長い。いかんなあ、もっと手を動かさなくては。
強化学習が「終わりのあるゲームにおける状況判断の学習」
だとすれば、継続的学習とは、「終わりのない戦いにおける
状況判断の学習」についての手法である。
人間のコーチが指導することによって、一見膨大に見える
パターンを一気に絞り込むことができる可能性が見えてきた。
「世界最大の計算資源」は、こと確率論的ゲームにおいて
は人間の勘に劣る場合があるのだ