753Picks
Pick に失敗しました

人気 Picker
わかりやすくて、本質が理解できる素晴らしい記事です。私もAlpahGoを 2016年3月に見て、衝撃を受けて以来、どう社会実装すれば良いか考えてましたが、その基本的アルゴリズムである強化学習の学習の困難さがネックになっていました。学習を加速するためには通常グーグルのTPUのようなスーパーコンピュータレベルのハードを使うのが一般的ですが、この記事にある人間の洞察を入れることも良い結果を産むかも知れない。今後の展開が楽しみです。
無粋なコメントで失礼しますが、他者の書いた文章や図面を引用するときは出典をきちんと示すといいと思います。

Deep TAMER: Interactive Agent Shaping in High-Dimensional State Spaces
https://arxiv.org/abs/1709.10163
Deep Learningの可能性と限界が素直に書かれた良記事。やはり自分で手を動かしている人の言うことは、口やお金しか動かさない人よりもはるかに説得力があるなあ。

メタな議論だけど。自分で手を動かさないマネージャーは、最終成果物の出来不出来しかわからない。まさに記事中のDQNと同じ。逆に自分で手を動かしているエンジニアは、日々の過程での中間ステップが良い方向に向かったかかどうかフィードバックがある。記事中のDeep Tamerのような感じ。

かくいう僕もどうも最近はタスク・マネージメントの仕事が増えてしまって、手を動かす時間より口やお金を動かす時間の方が長い。いかんなあ、もっと手を動かさなくては。
さすが清水さんという感じの読み応えもあり、わかりやすい記事だったでゲソ。ただ、TAMERのようなアプローチはこれまでやってきてなかったのか、少し気になったでゲソ。もしくはディープラーニングの進化によって、TAMERの与える効果が変わってきたということでゲソかね?
ずいぶん前の記事ですが、、、。まさにこれ!

  強化学習が「終わりのあるゲームにおける状況判断の学習」
  だとすれば、継続的学習とは、「終わりのない戦いにおける
  状況判断の学習」についての手法である。

  人間のコーチが指導することによって、一見膨大に見える
  パターンを一気に絞り込むことができる可能性が見えてきた。
  「世界最大の計算資源」は、こと確率論的ゲームにおいて
  は人間の勘に劣る場合があるのだ
良記事。文系人間でも理解できるのにもかかわらず、AIとかディープラーニングって何なのかも理解することができた。
タイトルがアレっぽい
新着記事一覧
日本人の深層心理に影響を及ぼす理系・文系の呪縛、理系だから、文系だからという言い訳、もうやめませんか? 【StraightTalk】生物学者・起業家の高橋祥子氏に聞く、今後の社会課題を解決する人材を育成するために必要なこと
JBpress(日本ビジネスプレス) JBpress 最新記事
4Picks

「無知は弱いけど、強いんです!」…大企業を辞めて「斜陽産業で起業したら超大変だった!」、女性起業家が明かす「過酷な現実」と「斜陽だけど『大丈夫』なワケ」
現代ビジネス
3Picks

【好きなことでお金を稼ぐ】 知識・経験ゼロからの「のんびり副業」「ゆる起業」 …リピート顧客を生み出す「メール」の書き方 - 「おウチ起業」で4畳半から7億円 ネットショップで「好き」を売ってお金を稼ぐ!
Diamond Online
3Picks

【スタートアップあるある】契約書をチェックしなかったせいで会社として終わってしまう - 起業家のためのリスク&法律入門
Diamond Online
3Picks

部長以上、必見。アジャイル組織の肝は「リーダーの団結」だ
NewsPicks Brand Design
5Picks

折りたたみPCって微妙だな…。「Lenovo ThinkPad X1 Fold 16」レビュー
ギズモード・ジャパン
2Picks

シジュウカラはジェスチャーで気持ちを表現している
ギズモード・ジャパン
3Picks

PC周りのホコリを退治! 残量を気にせず使えるサンワサプライの電動エアダスター
ギズモード・ジャパン
2Picks

【和田ラヂヲ】掃除中は遊びたくなる[ジャンピン ジャック ガジェット ep.41]
ギズモード・ジャパン
2Picks

手元と音声でAIをサクッと操れるワイヤレスマウス「GPT mouse」がまもなく販売終了
ギズモード・ジャパン
3Picks