AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む | Game*Spark - 国内・海外ゲーム情報サイト

ハードコアゲーマーのためのWebメディア

AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む

テストの結果は「OpenAI o1」が最も優れており、コストパフォーマンスでは「Gemini 2.5 Pro」に軍配があがると報告しています。

ゲーム文化 カルチャー
AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む
  • AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む
  • AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む

カリフォルニア大学サンディエゴ校の研究所「Hao AI Lab」は、AIモデルが『逆転裁判』をどこまでクリアできるかを調査する推論能力のテストを実施しました。その結果「OpenAI o1」が第2話終盤部分まで到達する目覚ましい成果を残しています。

無罪を勝ち取る法廷バトルをAIはクリアできるのか

『逆転裁判』は新米弁護士の「成歩堂龍一」が無実の罪を着せられた依頼人を救う法廷バトルアドベンチャーです。プレイヤーは事件に関係する情報や証拠品を集める探偵パートと、証拠品と尋問で証人たちの嘘を暴いて事件の真相を明らかにする法廷パートを通して真犯人を導き出します。

Hao AI Labは本作の法廷パートでは、過去の会話や証拠と照らし合わせて矛盾点を見つける長期的な文脈の推論、正確な根拠から矛盾を証明する証拠を選ぶ視覚的理解、変化する状況の中で正しいタイミングで異議を唱え証拠を提示する戦略的意思決定の能力が求められるとして、各AIモデルで推論能力テストを実施しました。

Xでは「OpenAI o1」「Gemini 2.5 Pro」「Claude 3.7 Sonnet」「Llama-4 Maverick」でのプレイ動画を公開。OpenAI o1は本作の第2話「逆転姉妹」の終盤まで到達しており、クリアには至りませんでしたが高い能力を示しました。Gemini 2.5 ProはClaude 3.7 Sonnetは第2話まで到達し、Llama-4 Maverickは第1話「はじめての逆転」で有罪判決となっています。

APIのコストパフォーマンスについてはGemini 2.5 Proが最も優れていると報告。OpenAI o1はAPIの呼び出し回数が最も少ないもののコストは一番高くなっており、Gemini 2.5 Proと比べると約6~15倍の費用が掛かっています。

Hao AI Labは『スーパーマリオブラザーズ』や『キャンディークラッシュ』などのタイトルでもAIモデルのテストを実施しており、「Claude 3.7 Sonnet」発表の際には『ポケットモンスター 赤』のクチバジムまでクリアできたと報告されました。人間のような理解力や対応力を見せているAIが、一緒にゲームをプレイするAIフレンドになる日も遠い未来ではないのかもしれません。



ライター:三ツ矢,編集:Akira Horie》

ライター/釣られゲーマー 三ツ矢

格闘ゲームやメトロイドヴァニアを中心にゆるく楽しむゲーマー。ストアページの紳士向けバナー画像によく釣られています。

+ 続きを読む
Akira Horie

編集/『ウィザードリィ外伝 五つの試練』Steam/Nintendo Switch好評発売中! Akira Horie

n/a

+ 続きを読む
【注目の記事】[PR]

編集部おすすめの記事

ゲーム文化 アクセスランキング

  1. 「日本ゲーマーと仲良くなりたい」と韓国ゲーム開発者!その理由は…日本のお国柄を感じさせられる?

    「日本ゲーマーと仲良くなりたい」と韓国ゲーム開発者!その理由は…日本のお国柄を感じさせられる?

  2. 任天堂のイメージといえば?「黒い任天堂」や性的表現の要素が海外で改めて話題。過去には「PLAYBOY」コラボも

    任天堂のイメージといえば?「黒い任天堂」や性的表現の要素が海外で改めて話題。過去には「PLAYBOY」コラボも

  3. 『プラグマタ』ディアナがインターネットで悪戯三昧!?『バイオ』や『モンハン』の公式Xをハッキングして大暴れ

    『プラグマタ』ディアナがインターネットで悪戯三昧!?『バイオ』や『モンハン』の公式Xをハッキングして大暴れ

  4. Evo責任者が運営の不手際について謝罪。「Evo LEGENDS LIVE - DAIGO vs MENARD」開始遅延や進行に批判相次ぐ

  5. 大手ポケモン攻略サイトに掲載された「ドサイドン」の習得技が抜けていた…が、他の攻略アプリも同様に抜けていてAIによる無断利用の疑いに苦言

  6. 「Hentai観てるから知ってるよ」―話題の新作セクシーインディー、海外ゲーマーは日本語ボイスの内容まで把握の上興奮していた!?

  7. 人気音ゲー続編『Muse Dash 2』はアーケードとモバイル向け!?中国で発表、日本でも「BitSummit PUNCH」にてお披露目か

  8. 「Steamで新作を出したけど100本も売れていない...」デッキ構築型ローグライク『DUNGEON WALK4』を手掛ける個人開発者が切実な苦境を訴える

  9. 上半身だけのパートナーと接合した状態で旅を進める!ポストサイバーパンク・サバイバルホラーRPG『GRAFT』

  10. “圧倒的に好評”の娘育成シム『まじかる☆プリンセス』確認されている不具合への対応方針を発表―ゲームプレイに影響大きい不具合から優先的に改修

アクセスランキングをもっと見る

page top