数学が1点では…ChatGPT、英語8割超も「東大不合格」 AI、東大入試に挑む③ - 日本経済新聞
コメント
選択しているユーザー
「生成 AI は数学が苦手」と考えるのは間違い
Google DeepMind の生成 AI「AlphaGeometry」は数学オリンピックの問題 30 問中 25 問を解いて金メダリストに迫る成績を上げた
ChatGPT も適切なプロンプトを与えれば東大入試の数学問題を解く事が出来る
2024年東大入試数学の第 1 問 (1) をプロンプトを工夫して解いてみたら一発で解けた
https://twitter.com/itnavi2022/status/1787121446445326816
1 点しか取れなかったのは駄目なプロンプトを与えた人間が悪い
2024年東大入試数学の第 2 問 (1) はプロンプトを工夫しなくても ChatGPT で普通に正解できた
https://twitter.com/itnavi2022/status/1787448789693059176
注目のコメント
興味深い結果。どういうタイプの「答え」かによって、生成AIの強み・弱みが明確に出る。
まず、英語と国語の差に注目。英語は外国語としての問題で、国語はその言語のなかでの論理性などを問う問題。だから、英語は強くても国語は弱い。
理科・社会においても、世界史・化学は覚えている部分が多い。一方で物理は実質数学だし、数学は全くできない。一番クリアな正解があるように見えて、考え方・論理に関しては確率論では脆弱。なお、ChatGPTではなくAzureとかAPIでTempretureで厳密にしたら数学とかどうなるのだろう?今の生成AIは、別に「ヒトの脳の働き方」を模して作られてるものではありません。なので、できない、ってのは不思議なことでもないのかな、と。
逆に、こういうやり方で実現できるもの、ってどんなもの?、ってのをよりよく理解する助けになるのかもですね。
一言言っておけば。このところの風潮、「何ができるか」ばかりが注目され(早く金にしたい、ってのがあるのでしょうが)、「これってなんだろう?、どういうふうに機能してるんだろう?」ってのが置き去りになりやすくなってるように思います。よくない傾向で、とても憂慮しています。