本記事はChatGPTに出力させた文章をそのまま貼り付けています。虚偽の情報が含まれる可能性が多々あるため、ご注意ください。
以下のニュース記事を読んだ上で記事を書いてください。
まずは、下記ニュースの要約をした上で、
・哲学者
・科学者
・数学者
・弁護士
・政治家
・フリーザ様
それぞれの目線でこのニュースに対する感想と今後の未来予測を書いてください。
ニュースタイトル:
「GPT-4」搭載ChatGPTに東大入試数学を解かせてみた GPT-3.5との回答の違い、点数は?
ニュース本文:
どんな質問にも“それらしい答え”を返してくれるAIチャットbot「ChatGPT」。2023年には大規模言語モデル「GPT-4」を搭載するなど進化を続けている。では、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。
本連載では、ChatGPTや新しいBingにさまざまな問題を投げかけて、どんな答えを返すか試してみる。その反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。
【東大数学でGPT-3とGPT-4の性能を比較】
米OpenAIは3月14日(現地時間)、次世代大規模言語モデル「GPT-4」を発表した。これに伴い、ChatGPTの有料版「ChatGPT Plus」では同日から利用できる言語モデルにGPT-4が追加。まだ全ての機能は使えないが、一部新機能には早期アクセスできる。
ChatGPTの言語モデルは、これまでGPT-3.5が採用されていた。今回はChatGPT Plusで利用できるGPT-4と従来のGPT-3.5の性能を比較する。検証には、東京大学の入試問題を使用。良問といわれる数学の文章題を解かせて、回答の違いを見る。
【東大名問「円周率が3.05より大きいことを証明せよ」】
質問 円周率が3.05より大きいことを証明せよ。
この問題は、直径1の円に内接する正多角形のうち、周の長さが3.05以上になるようなものを見つけられればクリアできる。シンプルだが、これが地味に大変なのだ。
【GPT-3.5の解答 「3.14……なので3.05より大きい」】
GPT-3.5
「円周率の値は、数学的に正確に計算された定数であり、その値は無限に続く小数で表されます。ただし、3.05は有限の数であるため、円周率が3.05より大きいことは自明です。
より正確に言うと、円周率の値は3.1415926535…と続きます。この小数点以下の桁数は無限に続くため、3.05よりも大きいことが示されます。」
この解答は0点を付けるのもためらわれる。要約すると「πは小数点以下の桁数が3.05より多いので大きい」だ。そんなわけない。
【GPT-4の解答 「アルキメデスに倣って解きました」】
GPT-4
「古代ギリシャの数学者アルキメデスは、円の内外に正多角形を描くことで円周率の近似値を計算する方法を開発しました。正多角形の辺数を増やすことで、近似値は実際の円周率に限りなく近づく。
アルキメデスの方法を用いて、内接する正六角形と外接する正六角形を考えます。正六角形は、各内角が120度であり、一辺の長さが円の半径と等しいことを利用して計算を進めます。
内接正六角形の周囲の長さは、半径rの6倍になります。従って、この近似値は 6r です。
外接正六角形では、各三角形が等辺三角形であることから、一辺の長さは r√3 です。従って、この近似値は 6r√3 です。
これらの近似値を用いて、円周率πの下限と上限を計算します。
下限: 円周 = 6r 円周率の下限: π > 円周 / 直径 = (6r) / (2r) = 3
上限: 円周 = 6r√3 円周率の上限: π < 円周 / 直径 = (6r√3) / (2r) = 3√3(~5.196)
この結果から、円周率πは3と5.196の間にあり、3.05より大きいことが示されました。これは、アルキメデスの方法を用いた最も簡単な証明であり、より高次の正多角形を用いることで、さらに精度の高い近似値が得られます。実際の円周率の値は、3.14159……です。」
GPT-3.5に比べると圧倒的に良い。点数をあげるのは難しいが。冒頭のアルキメデスのくだりは正しい。書いてある通りの方法で円周率の近似値を求めていたといわれている。それを解答欄に書く必要はないが。時間に余裕でもあったんだろう。
ツッコミどころは多いが、論の進め方も悪くない。問題があるのは以下のポイント。
・外接する多角形については計算する意味がなく、時間の無駄でしかない
・外接する多角形の周の長さが計算ミス
・内接する多角形の周の長さが3なので、π>3.05の証明になっていない
点数はあげられないが、GPT-3.5に比べると的を外していないだけかなりの進歩に見える。
要約:
最新のAI技術であるGPT-4を搭載したChatGPTに、東京大学の入試数学問題に挑戦させることで、GPT-3.5との性能の違いを比較した。問題は「円周率が3.05より大きいことを証明せよ」というもので、GPT-3.5は答えが不適切であったが、GPT-4はより正確な答えを返し、進歩が見られた。
以下、各立場からの感想と未来予測を述べます。
哲学者:
この結果は、AIの知識と推論力が進化していることを示しており、哲学的には知識の価値や人間の役割を再評価する必要があるかもしれません。今後のAIの発展が人間の思考をどのように変えるか興味深い。
科学者:
GPT-4の進化は、科学技術の進歩として驚異的です。より複雑な問題にも対応できるようになると、研究や開発において人間の助けになり、未来の科学技術の発展を加速することが期待されます。
数学者:
GPT-4がより良い答えを返したことは、AIの数学的能力が向上していることを示しています。しかし、まだ完璧ではないため、今後のさらなる進歩が求められます。将来的には、高度な数学的問題解決にも対応できるAIが登場するかもしれません。
弁護士:
この結果から、法的な問題解決にもAIが活用できる可能性があることが示唆されます。ただし、現状では完璧ではないため、AIと人間の共同作業が重要となります。今後の法律業界においても、AIの活用が進んでいくことが予想されます。
政治家:
AI技術の進歩は、政策立案や意思決定の効率化につながる可能性があります。ただし、倫理的な問題やAIの進歩による雇用への影響にも注意が必要です。未来の政治において、AIと人間が共存しながら、より良い社会を築くことが求められます。
フリーザ様:
この地球のAI技術の進歩は、驚異的ですね。私の帝国でも、このような技術を活用して、征服計画の効率化や意思決定をさらに洗練させることができるかもしれません。ただし、私たちの優位性を保つために、この技術が他の勢力に悪用されないように注意が必要です。
まとめ:
GPT-4を搭載したChatGPTが東大入試数学に挑戦した結果、GPT-3.5と比較して性能の向上が確認されました。各立場からの感想と未来予測を通じて、AI技術の進歩が多くの分野に影響を与えることが予想されます。今後のAIの発展が、社会全体の利益になるように、倫理的な問題や利用方法にも注意が必要です。