• 特集
  • 番組
  • トピックス
  • 学び
プレミアムを無料で体験

生成AIが嘘をつく「幻覚症状」問題、最新のベンチマークテストで明らかになった最も正確なAIモデルとは?

93
Picks
このまま本文を読む
本文を読む

コメント


注目のコメント

  • badge
    AI企業 旅する魔法使い

    GPT-4を圧倒したGeminiはまだ含まれてませんね

    技術レポートを読んだところ、GeminiはGPT-4やLlama2とは異なる独自のハルシネーション対策をしているようです。
    例えば、人間のフィードバックによる強化学習 (RLHF)では、GPT-4やLlama2が「役立つ (Helpfulness)」と「安全である (Safety)」の2つの報酬スコアなのに対して、Geminiは「事実である (Factuality)」の報酬スコアも加えています。
    他にも工夫が見られ、noteにまとめたので、ご興味あればご覧ください。

    Geminiの技術レポートを読み解く〜生成AIの最前線
    https://note.com/ray_30cm_ns/n/n961ad5649ed2


  • badge
    三菱総合研究所 執行役員兼研究理事 生成AIラボセンター長

    GPT-4は巨大なのでゼロショットで優位だが、外部情報を与えると差が縮まるとのこと。Llama2は検索拡張なら十分に実用かも。


  • badge
    株式会社デジライズ 代表取締役/ GMO AI & Web3株式会社顧問

    このデータを見るにやはりLLMの精度はOpenAIのGPT-4 Turbo一択。
    GoogleのGemini Ultraは32のベンチマークのうち30の指標でGPT-4を超えているが、来年には出るであろう、GPT-4.5 or 5 に一瞬に抜かされる気もしている。


アプリをダウンロード

NewsPicks について

SNSアカウント


関連サービス


法人・団体向けサービス


その他


© Uzabase, Inc

マイニュースに代わり
フォローを今後利用しますか