コレ1枚で分かる「第3次AIブームとデータ流通量 2019年版」
コメント
選択しているユーザー
注目のコメント
自分ならこの線表に
2005 Amazon Mechanical Turk (クラウドワーキングサービス)スタート
を足したい。
ビッグデータはデータの量ばかりに注目が行きがちですが、それに誰が正解ラベルをふるのか?という問題があります。
例えば、物体検出のために画像中の物体にエリアと物体名のラベルをふる作業は1オブジェクトあたり(画像1枚あたりではありません)、15-30秒という報告があります。画像中に複数オブジェクトがあることを考えると画像1枚あたり1分。1日8時間作業をしまくっても1人あたり500枚しか作業できないことになります。100万枚の画像にこの作業をしたら何人月分の作業量が必要かおわかりいただけるでしょうか?
アルバイトを雇用してとか、社員総出で、というレベルではないのです。そこで、ネット上にタスクを投げてちょっと空き時間がある大量の人に手伝ってもらう。それによって安価にそしてすばやく正解データを作ることができるようになりました。いろいろ異論はありますが、こうやってコンパクトにまとめて公表して頂けるのは、とてもありがたいです。
2000-2020年の拡大図があると、さらに嬉しいです。
RoboCup, DARPA Grand Challenge(自動運転)あたりもAI応用面からは重要ですね。山崎さんのコメントが素晴らしいです。
恐れながら補足です。
データには収集・分析・活用の3フェーズがあります。
シンギュラリティまでは収集フェーズに特化して良いでしょう。
一つ一つはものすごい簡単な(今は)2択問題です。誰でもできます。
世界中の定年後高齢者、ニート、入院患者、幼児にすら収集させる。ゲームやクイズ感覚で暇つぶしに、ってやつです。
それでバイト代が貰えるなら、文字通り皆やりたいですよね。