【プロ直伝】知識ゼロから使える「データサイエンス」14教材
コメント
選択しているユーザー
データアナリティクスに関するテーマの企画会議で、「◯◯の予測」がタイトル(むしろゴール)として設定されそうになることが往々にしてある。
もちろん、高精度な予測モデル構築することは手段のひとつとして必要なことだと思う。ただ、本当に大事なのは、予測値を見た結果、それが意思決定にどのような影響を与えて、その後の行動がどのように変わり、それがどのようなビジネス価値を生み出すのか、というところだと思う。
これをデータアナリティクス部門と事業部門でしっかりと合意形成出来ていないと、データの種類や量、アルゴリズムの選定、実装する出力機能が大きくズレてとても悲惨なことになる。テーマによっては、エクセルで解決できることもあるし、ワークフローの見直しだけで解決できるものもある。
そういう意味で、競馬の例は非常に分かりやすかったので、これから使わせてもらおうと思う。
また、参考書籍として、元大阪ガスの河本さんの書籍が最初に紹介されていたことが個人的にはとても嬉しかった。データサイエンスが世間を騒がしているが、データ×AIの文化が醸成されていないと取り組みに対する社内の理解はそう簡単には得られない。そういうことを分かりやすく、かつ、具体的な解決策も提示してくれているのでお勧めです。
注目のコメント
エクセルで十分いろんなことができるという意見に賛成です。
一方で、関数も多すぎてグラフも多機能過ぎて、結局何をしたら良いか分からないという人も多いと思います。
そんな方にオススメなのがこちら。
統計学大百科事典 仕事で使う公式・定理・ルール113
https://www.amazon.co.jp/dp/4798162809/
分かりやすくまとめられていて、読んでいるだけでも楽しく勉強になる。そして読みながら「あ、俺の仕事の○○はこの手法で分析すると!」みたいなインスパイアが生まれる。それから関数をググれば、やり方は簡単にわかります。
そして、以下は本当に大切なことだと思います。特に②は常に意識していないと、数字遊びになってしまいますから。
①データで何ができるのかを理解する
②適切な課題設定、それに必要なデータを使う
人事の方にはこちらもオススメ。
人事のためのデータサイエンス
https://www.amazon.co.jp/dp/4502266310/この記事を補足するとしたら、
・プログラミング言語Pythonはやっぱり学びたい。ちゃんとしたテキストを使い、TAに助けを得ながら学習すると数十時間でとりあえずのところまで習得できます。
・線形代数(統計はすでに書いてあるので)
があると良いと思います。
なんと言えばいいか、スプレッドシートやタブローで非常に多くのことができるのですが、結構すぐにできることに限界を感じてきてしまいます(言っていることが矛盾していますが)。もしくは、ExcelもGoogle SpreadsheetもVBAやGASができると幅が広がるかもしれません。
Pythonの勉強はGoogle ColabなどWEBサービス、もしくはWindowsでもMacでもフリーのツールがあるので簡単に始められます。
C言語とかDelphiとかしかなくて、コンパイラがそもそも数万円していた時代を考えると隔世の感がありますね。昔はそもそもパソコンも20万円くらいからでしたね。データ分析で課題設定が意外と難しいというのはリアルな話ですね。ある程度のケースをつまないと思考が鍛えられないのかもしれません。データの意味を理解して価値を生み出すがデータサイエンスのおもしろさですね。
"もう1つ意識すべきなのは、適切な課題設定をすることです。当たり前に聞こえるかもしれませんが、これが意外と難しい。〜たとえば、競馬でデータを使った予測をするとします。このとき、「どの馬が勝つか」と「どの馬券を買ったら儲かるのか」は、似ていますが異なる課題ですよね。"