• 特集
  • 番組
  • トピックス
  • 学び
プレミアムを無料で体験

電撃発表、グーグルが「全力開発」した生成AI「Gemini」の全貌ChatGPT超えするか

7
Picks
このまま本文を読む
本文を読む

コメント


注目のコメント

  • badge
    POSTS 代表 / 新刊「生成AI時代を勝ち抜く事業・組織のつくり方」

    今までOpenAI/MS連合の後塵を拝してきたGoogleが満を持して肝入りの大規模言語モデルGeminiを出してきましたね。

    取り急ぎ以下つが主要なポイント↓

    1️⃣ 超マルチモーダル
    テキストだけでなく、画像、ビデオ、音声などの幅広いモーダルの入力に対応。更には画像生成、恐らく音声性など複数モーダルの出力にも対応。

    2️⃣ 他のLLMを凌駕
    一つ前のツイートで比較を紹介しましたが、あのGPT-4も完全に凌駕しています。更に多くの領域で人間の専門家と並ぶパフォーマンスを出しています。

    3️⃣ 3サイズ展開
    最高性能のUltra、バランスの良い中間サイズのPro、小型軽量のNanoという3サイズが提供。

    以下に動画の注目の箇所をクリップして日本語字幕付けておきました。
    https://twitter.com/kajikent/status/1732561344245965079

    また、Geminiの下のデモは最初にGPT-4の発表を見たときくらいの衝撃です…。
    https://twitter.com/kajikent/status/1732562706069360734

    Googleの人間がGeminiと戯れるという動画なんですが、カメラからの情報や人間の話す言葉から超柔軟に状況や会話の意図を理解。

    その上でほぼ人間のように聞こえるスピーチ生成しながら正確な答えやウィットに富んだ答えを返し、場合によっては画像生成やオーディオ生成して返したりもしてくれる。

    これもはやマシンというより、ちょっとした生物…笑


    また、GeminiはどうやらGPT-4が苦手な数学や物理などにも強いらしいです。

    以下動画のデモでは、手書きの物理のテスト用紙をアップロードすると回答が合ってるか間違ってるかを教えてくれて、間違った設問の解き方を教えてくれたりしています。
    https://twitter.com/kajikent/status/1732565324921463126

    OpenAIのクーデター騒動の原因にもなった「Q*」は数学の能力に関係するブレークスルーらしいですが、商業的にはそれをリリースする圧力が強まった感じがいます。


  • Tech Insider(BIJapan) 編集チーフ

    編集担当しました。
    グーグルのGemini、日本語対応はともかく、一気に色々な製品・サービスに乗ってきそうで楽しみ。


アプリをダウンロード

NewsPicks について

SNSアカウント


関連サービス


法人・団体向けサービス


その他


© Uzabase, Inc

マイニュースに代わり
フォローを今後利用しますか