AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む | Game*Spark - 国内・海外ゲーム情報サイト

ハードコアゲーマーのためのWebメディア

AIは『逆転裁判』で無罪を勝ち取れるか―推論能力のテストで「OpenAI o1」や「Gemini 2.5 Pro」が法廷に挑む

テストの結果は「OpenAI o1」が最も優れており、コストパフォーマンスでは「Gemini 2.5 Pro」に軍配があがると報告しています。

ゲーム文化 カルチャー

カリフォルニア大学サンディエゴ校の研究所「Hao AI Lab」は、AIモデルが『逆転裁判』をどこまでクリアできるかを調査する推論能力のテストを実施しました。その結果「OpenAI o1」が第2話終盤部分まで到達する目覚ましい成果を残しています。

無罪を勝ち取る法廷バトルをAIはクリアできるのか

『逆転裁判』は新米弁護士の「成歩堂龍一」が無実の罪を着せられた依頼人を救う法廷バトルアドベンチャーです。プレイヤーは事件に関係する情報や証拠品を集める探偵パートと、証拠品と尋問で証人たちの嘘を暴いて事件の真相を明らかにする法廷パートを通して真犯人を導き出します。

Hao AI Labは本作の法廷パートでは、過去の会話や証拠と照らし合わせて矛盾点を見つける長期的な文脈の推論、正確な根拠から矛盾を証明する証拠を選ぶ視覚的理解、変化する状況の中で正しいタイミングで異議を唱え証拠を提示する戦略的意思決定の能力が求められるとして、各AIモデルで推論能力テストを実施しました。

Xでは「OpenAI o1」「Gemini 2.5 Pro」「Claude 3.7 Sonnet」「Llama-4 Maverick」でのプレイ動画を公開。OpenAI o1は本作の第2話「逆転姉妹」の終盤まで到達しており、クリアには至りませんでしたが高い能力を示しました。Gemini 2.5 ProはClaude 3.7 Sonnetは第2話まで到達し、Llama-4 Maverickは第1話「はじめての逆転」で有罪判決となっています。

APIのコストパフォーマンスについてはGemini 2.5 Proが最も優れていると報告。OpenAI o1はAPIの呼び出し回数が最も少ないもののコストは一番高くなっており、Gemini 2.5 Proと比べると約6~15倍の費用が掛かっています。

Hao AI Labは『スーパーマリオブラザーズ』や『キャンディークラッシュ』などのタイトルでもAIモデルのテストを実施しており、「Claude 3.7 Sonnet」発表の際には『ポケットモンスター 赤』のクチバジムまでクリアできたと報告されました。人間のような理解力や対応力を見せているAIが、一緒にゲームをプレイするAIフレンドになる日も遠い未来ではないのかもしれません。



ライター:三ツ矢,編集:Akira Horie》

ライター/釣られゲーマー 三ツ矢

格闘ゲームやメトロイドヴァニアを中心にゆるく楽しむゲーマー。ストアページの紳士向けバナー画像によく釣られています。

Akira Horie

編集/『ウィザードリィ外伝 五つの試練』Steam/Nintendo Switch好評発売中! Akira Horie

Game*Spark副編集長。平日日中のニュースデスクおよび料理連載や有志翻訳者連載の基本担当。 2021年版以降の『ウィザードリィ外伝 五つの試練』イード側のディレクターも兼務中。

【注目の記事】[PR]
コメント欄を非表示
※一度コメントを投稿した後は約120秒間投稿することができません
※コメントを投稿する際は「利用規約」を必ずご確認ください
  • スパくんのお友達 2025-04-21 8:47:39
    キャタツかハシゴの問題で思考の無限ループに陥ったりしないのだろうか
    1 Good
    返信
    他の返信を表示 返信を非表示
  • スパくんのお友達 2025-04-21 7:33:31
    AIはタクシュー節の理解が苦手そう
    これは英語版だけど
    0 Good
    返信
  • スパくんのお友達 2025-04-21 7:17:21
    証言の矛盾はともかく、画像を見てこれまでの証言と矛盾している所を選べというのは相当難しいのでは…
    1 Good
    返信
  • スパくんのお友達 2025-04-21 5:04:01
    geminiはあほそうやけどな。
    0 Good
    返信
  • スパくんのお友達 2025-04-21 4:36:59
    立法権、行政権、司法権にAIの力が及ぶの、すごく忌避感がある(語彙力)
    下手したら(裁判で)人の一生が決まるのにコストパフォーマンスとか勘弁してくれよ…そないなこと言い出したら肉体労働以外での人間ってコスパくっそ悪いってなるだろ。
    5 Good
    返信
  • スパくんのお友達 2025-04-21 4:32:04
    意外と難しいんだな…
    2 Good
    返信
  • スパくんのお友達 2025-04-21 4:31:20
    逆転裁判の1なんて簡単な方で内容も短いのにAIは苦手なんだなあ
    4 Good
    返信
  • スパくんのお友達 2025-04-21 3:46:00
    これってAIがどこまで画面の要素を理解してるかってのもあるから結構難しそうだな
    13 Good
    返信
  • スパくんのお友達 2025-04-21 3:42:21
    野獣先輩関連で肖像権とか著作権に違反していた可能性があるのですが、AIの力で無かったことにできないですかね?
    ついでに黒歴史も無かったことにして欲しいです。
    1 Good
    返信
    2件の返信を表示 返信を非表示

編集部おすすめの記事

ゲーム文化 アクセスランキング

  1. 『エルデンリング ナイトレイン』野良マルチ中、子供の世話で離席したことを謝るゲーマー。「ゲームより現実世界の方が大切」と温かい反応が寄せられる

    『エルデンリング ナイトレイン』野良マルチ中、子供の世話で離席したことを謝るゲーマー。「ゲームより現実世界の方が大切」と温かい反応が寄せられる

  2. 「PlayStation」歴代ハードが「figmaPLUS」でフィギュア化!初代PSからPS5、PSPにポケステも登場か

    「PlayStation」歴代ハードが「figmaPLUS」でフィギュア化!初代PSからPS5、PSPにポケステも登場か

  3. スイッチ2ではダウンロード版とパッケージ版のどちらが快適?『あつ森』では差があった!

    スイッチ2ではダウンロード版とパッケージ版のどちらが快適?『あつ森』では差があった!

  4. 『ゼンゼロ』新キャラ「橘福福」“最もフラットなボディ”との指摘―可愛さいっぱい、小柄でも威厳はある虎娘の大姉弟子

  5. 戦いは最前線だけじゃない! 後方支援にフォーカスしたミリタリーシム『Military Logistics Simulator』発表

  6. PS3で配信していたDL版『グラディウスV』購入不可に…KONAMIは「やむなく販売終了」、理由を訊いた

  7. 作り込みが凄すぎる『Mount & Blade II: Bannerlord』戦国時代Mod「織豊」リリース!

  8. 映画館を貸し切り大スクリーンでスイッチ2&Steam Deckをプレイするユーザー!お値段4時間で約8万5千円?

  9. 無料配布中の『ボーダーランズ2』レビュー荒らし発生でSteamレビュー「圧倒的に不評」。プレイヤーは利用規約に不満

  10. 『ペルソナ4 リバイバル』発表記念?大川ぶくぶ先生が里中千枝&天城雪子を描く!デフォルメ絵柄がキュート

アクセスランキングをもっと見る

page top
Game*Spark
ユーザー登録
ログイン
こんにちは、ゲストさん
Avatar
メディアメンバーシステム