中国のAI開発を支える人海戦術
コメント
注目のコメント
AIが教師データで学習するために、教師となるヒトが必要。教師データを作る作業を「アノテーション」と呼び、
①パンなどを見分ける「一般知識」
②言葉の意図などを解釈する「文化知識」
③病気画像などを診断する「専門知識」
がそれぞれ必要。
①が中国の人海戦術、②が日本のアノテーション代行サービス、③が専門家との共同研究になる。
ちなみに、AI案件を大手SI企業に「丸投げ」すると高価格なのは、この人海戦術を高単価の社員でやってることが一因。
賢い企業は、低単価のアノテーション代行サービスを使いこなす「発注能力」を身に付けると超おトク。そう、そうなのです、本当にこれ。僕も火星関係の機械学習の研究をやっとりますが、教師データをラベル付けするには火星の地質学の知識が必要。よって人海戦術に頼れないのです。Transfer learningで部分的に問題を緩和できますが、やはりデータ量のハンデは重い。だれか良い解決法を知っている方、ご教授ください。
超必読。医療AIを作る会社にいますが、「人がいなければAIは成立しない」という大前提を無視したAI信仰・礼賛が年々増えてきてしまっています。
AIの画像識別ひとつ取っても、深層学習・機械学習のフェーズに入る前段階で基礎アルゴリズムを作る際には、教師データの質の担保(いわゆるデータクレンジング)をほぼ人力で行う他ありません。僕らの会社も、画像診断支援システムを作るべく臨床研究中ですが、撮影した画像は一枚一枚医師が目視して定義しています。その先でようやく医師というか人間の目を超えた精度が実現していく。パラメータをきちんと定義しないと情報処理ができないのでExcel以下のままです。
「データ業界の『建設作業員』」とは言い得て妙で、深センでも香港でもなく河南省南宮市を深掘るのは流石のNewsPicks。気合い違う。