プレミアムを無料で体験

生成AIが嘘をつく「幻覚症状」問題、最新のベンチマークテストで明らかになった最も正確なAIモデルとは？

AMP[アンプ]

2023/12/11

93

Picks

このまま本文を読む

本文を読む

コメント

注目のコメント

佐々木励
AI企業旅する魔法使い
・2023年12月11日
GPT-4を圧倒したGeminiはまだ含まれてませんね

技術レポートを読んだところ、GeminiはGPT-4やLlama2とは異なる独自のハルシネーション対策をしているようです。
例えば、人間のフィードバックによる強化学習 (RLHF)では、GPT-4やLlama2が「役立つ (Helpfulness)」と「安全である (Safety)」の2つの報酬スコアなのに対して、Geminiは「事実である (Factuality)」の報酬スコアも加えています。
他にも工夫が見られ、noteにまとめたので、ご興味あればご覧ください。

Geminiの技術レポートを読み解く〜生成AIの最前線
https://note.com/ray_30cm_ns/n/n961ad5649ed2
比屋根一雄
三菱総合研究所執行役員兼研究理事生成AIラボセンター長
・2023年12月11日
GPT-4は巨大なのでゼロショットで優位だが、外部情報を与えると差が縮まるとのこと。Llama2は検索拡張なら十分に実用かも。
茶圓将裕
株式会社デジライズ代表取締役/ GMO AI & Web3株式会社顧問
・2023年12月11日
このデータを見るにやはりLLMの精度はOpenAIのGPT-4 Turbo一択。
GoogleのGemini Ultraは32のベンチマークのうち30の指標でGPT-4を超えているが、来年には出るであろう、GPT-4.5 or 5 に一瞬に抜かされる気もしている。

配信メディア

AMP[アンプ]

関連する記事

今日のニュース

関連する企業

マイニュースに代わり
フォローを今後利用しますか