統計言語 「R」の神はなぜ無償で貢献したのか オープンコミュニティで活躍する“新人類”の誕生
コメント
選択しているユーザー
注目のコメント
Rの神、ハドリーのインタビュー。日本語の記事は珍しいですね。
昨年の夏、来日したときにお会いすることができましたが、その天才性からは考えられないほど、すごく気さくでいい人でした。
統計学や機械学習をするときに、RとPythonどっちがいいの議論が以前はよくされていた気がしますが、最近は、Python人口が圧倒していますね。
個人的には、この記事にもある通り、Rはdplyrとggplot2がめちゃくちゃ使いやすいので、データのハンドリング、グラフ化、に関してはRに軍パイが上がるかなと思っています。R自体は、コンピュータ言語ですが、このRの神が作ったのは、その言語をさらに使いやすくするパッケージです。今からRを学び始める人にとっては、dplyrとggplot2は必須のツールです。
>>>引用
ただ、使いやすさでいえば、IBMのSPSSやStataのような統計解析ソフトがあります。その中でRが伸びているのは、人々の集めているデータがより大きくなり、複雑化しているのが理由の一つだと思います。あらかじめ用意されているような分析ツールには頼り切れなくなったということです。その点、Rは誰も試したことのないようなことを試す柔軟性がありますので。
ご指摘の通り、Rを使っている人は以前と比べて多様性が増しています。私より年上のエンジニアでRを使っている人はきっと統計学が得意な人でしょう。ただ、最近はより純粋なソフトウェアエンジニア、あるいは生命科学の研究者やジャーナリストが増えていると思います。ジャーナリストはデータの中で何が起きているのかを理解するためにRを学んでいます。統計的なものを学んでこなかった人々に対して、われわれがどのような手助けができるか。そこが重要なところだと思っています。pythonを先に学んだのでRはあまり書いたことがない。Rは統計という分野に絞った言語だから、書く人も見る人も余計なことを考えなくていいというメリットはある。けどpythonの開発環境や統計やグラフのライブラリが充実してるので、今はpythonではなかろうか。
ただ、特定分野ではみんな知ってるという言語を、1人で作ったということは本当にすごい。技術もさることながら、誰もが嬉しい適切な仕様を考えることが難しい。