AlphaZeroのソースコードはわずかホワイトボード一枚に収まる
コメント
注目のコメント
世間の「数理モデル」という言葉に対するイメージが実態と違いすぎるという問題はとてもよく理解できる。
通常そこには神秘的な「数学」などないし、ニューラルネットワークに至っては、人間に理解不能という意味で真にブラックボックスでしかなく、その意味がわからない人にとってそれを「数理モデル」と呼ぶことを戸惑う。
将棋や囲碁のような二人零和有限確定完全情報ゲームだけでなく、偶然の要素が入る「不確定」なポーカーや麻雀のようなゲームであっても、与えられた状況での最善手を考えるパターンマッチングという意味では、人間が囲碁将棋でやっていることとある意味大差ない作業なのかも知れない。必ずしも複雑で具体的な予測課程を経ていなくても。
筆者が最後に問うている「ミーム」は、人間集団側の脳に伝播するパターンの中で、人間が意識的に概念化可能なものを指しているので、ここでの問いとしては相応しいとは思えない。これはプログラム.他にデータが存在する.そちらが肝で量は膨大.
大雑把に言うと,一つの神経細胞(ニューロン)の入出力関係とニューロンの接続関係を変更していく(いわゆる学習)アルゴリズムを表したのがこのソースで,それ自体はこのくらい単純.しかし,一つ一つの動作は単純なニューロンがネットワークを作ると脳を構成し,複雑系と成りうる.そのニューロンの接続関係,つまりどのニューロンがどのニューロンとウェイト(重み)いくらで繋がるかというテーブルデータ(表)が別に存在している.そのテーブルデータこそが重要.同意します。AlphaGoZero, AlphaZeroはシンプルです、AlphaGo以前の最高知能はIBM Watsonでしたが、多分紙に書き出すことは不可能。それだけ職人技があちこちに散りばめられていたからと想像します。それに比べはるかにシンプル。何人かの研究者が作成した「AlphaZeroもどき」がすでにGithubに公開されてます。もちろん本家はまだ公開されてませんので、どこまで本物に迫っているかはわかりませんが、研究を始めるには持ってこいです。個人的にはAlphaZeroの探索機能に興味があります、英文ですが自分の見解をまとめてます。
https://www.linkedin.com/pulse/monte-carlo-tree-search-key-alphago-zero-toshifumi-kuga/