統計学・データ分析の初心者でも「数字に強くなる」プロ推薦の必読本
コメント
注目のコメント
私はデータ分析に携わるようになって20年+ですが、最初から高度な数学、モデルから学びました。その後、経営学全般を実践するという流れでしたが、元来数字に強かったわけではなく、統計学の必要性を強いる環境に身をおいたため覚えざるを得ませんでした。
人間追い込まれると統計学も身につくものです。
統計学を学ぶ順序として、昨今「人工知能・AI」というキーワードが流行りだからといって、いきなり機械学習・ニューラルネットワークから入ることは避けたほうが良いと感じます。「数字に弱くて」という言い訳が通用しなくなるくらい、データの読み・書き・分析力が求められるようになった昨今のビジネスシーンで、統計や分析手法を初歩から学ぶにはどんな本がいいのか?
この悩みに応えるために、今回の「JobPicks Voice」ではデータサイエンスの専門家たちが未経験者におすすめする本を8冊、取り上げています。
推薦内容を眺めると、専門的な学問より、意外と「そもそもデータとどう向き合えばいいのか」「分析結果をビジネスに生かすには何が必要か」といった点を示唆する書籍が多かったのが印象的でした。
私自身、数字に弱いのが長年の悩みなのですが、まず「課題発見、分析設計に役立つ4冊」から読み始めようと思っています。僕は学問としてガッツリ学んだワケではない単なる分析好きに過ぎませんが、その僕からみていてコロナ対応では2つの問題があると見ています。
1つはデータの軽視です。水際対策でどれだけの時間が稼げたのか、あるいは入国人数の規模や人口あるいは流行度や検査によってどのていど日本の流行に影響するのか?の試算などがされず、ズルズルと今も差別的な水際対策が取られていることもその現れです。
もう1つは。データの深堀りのし過ぎです。分科会のデータを見ていても、細かなデータが何ページにもわたっています。人流に対するデータもそこまで細かくみて何が分かるんだろう??と不思議に思います。
コロナのような不確定要素が強いものを扱う時には試算するのに抑えなきゃいけないポイントをつかみ、ザックリと試算し、その上で議論する方が重要だと僕は考えています。なぜなら、いくら細かなデータを積み重ねたところで、そのデータや仮説あるいは変数に少しずつのズレがあるだけでそれを積み重ねて出された結論はとんでもない値になってしまうからです。
僕は統計のプロではありません。ですが統計のプロであればあるほど、各国の検査基準の違いや死亡認定基準の違いなどを揃えて比べることが不可能に近いことを知っているはずです。
だからこそ、細かな分析より、どこがポイントなのかを議論しつつザックリと当てることの方が重要だと考えています。ザックリとも当たらないN浦さんの例とか見ていると残念に思います。https://twitter.com/hase_29/status/1500779064654655490
僕も外すこともあります。ハズレ自体は仕方がないことだと思いますが、その試算が盲目的に信じられ記事になり、その後にハズレたかとかが検証されていないことについての残念な気持ちです。