• 特集
  • 番組
  • トピックス
  • 学び
プレミアムを無料で体験

AIの挙動をAIで自動分析 OpenAI、モデルの理解や改善に向け一歩前進

140
Picks
このまま本文を読む
本文を読む

コメント


注目のコメント

  • badge
    三菱総合研究所 執行役員兼研究理事 生成AIラボセンター長

    この論文ですね。
    「Language models can explain neurons in language models」
    https://openai.com/research/language-models-can-explain-neurons-in-language-models

    完全には理解できませんが、以下のような手順みたいです。
    Step1:GPT-4を使って説明文を生成
    GPT-2のニューロン(の状態)をGPT-4を用いてテキストシーケンス(=文)化
    Step2:GTP-4を使ってシミュレート
    説明時に”発火"したニューロンの挙動をGPT-4を使ってシミュレート
    Step3:比較
    実際の説明文生成をどれ位上手くシミュレートできたかをスコア化

    これまで研究者が手作業でやっていた分析を自動化できたのが大きな成果とのこと。謎に包まれていた中間段階の挙動が言語化され、見通しが良くなるのは朗報でしょうね。

    特に「なぜこんな文章が生成されてしまったのか?」の分析には欠かせないツールになりえそうです。

    【追記】こちらの記事に仕組みが正確に説明されていました。
    https://newspicks.com/news/8432130


  • badge
    AI企業 旅する魔法使い

    GPT自体をGPTで分析する実験的な取り組みですね。

    なぜ、古いGPT-2の挙動を、最新のGPT-4で分析したかは、大きく2つの理由がありそうです。

    ・技術視点:この分析手法は、モデルが大きくなるほど、上手くいかないようです(論文より)。GPT-2は比較的モデルが小さいので、対象になったのでしょう。
    ・ビジネス視点:GPT-3.5以降は、ビジネス上の都合などでモデルの中身が公開されていません。なので、仮にGPT-4をGPT-4で分析出来たとしても、その結果が公開されることはなさそうです。


  • 以前はこんな技術があれば良いなと思っていることが、現実になりつつある感じがします。いずれはより高度なこともAIによりAIの開発が進み、半自動化が進み、これまでの開発スピードの労力、時間が大幅に減りそうな未来もそこまで遠くないのでは。


アプリをダウンロード

NewsPicks について

SNSアカウント


関連サービス


法人・団体向けサービス


その他


© Uzabase, Inc

マイニュースに代わり
フォローを今後利用しますか