ChatGPTの父が「言語モデルは行き止まり」と宣言する理由

AI界の重鎮ヤン・ルカンがMeta退社後に新会社設立。大規模言語モデルへの疑問と「世界モデル」という新たなAI開発アプローチの可能性を探る。

ChatGPTを生み出した技術の創始者の一人が、その技術を「行き止まり」だと断言している。

ヤン・ルカン氏は2024年11月、Metaでの10年以上にわたるAI研究責任者の職を離れた。興味深いのはそのタイミングだ。わずか6か月前、マーク・ザッカーバーグは大規模言語モデルを用いた「超知能」構築に数十億ドルを投じる新研究所を設立したばかりだった。

言語モデルへの根本的疑問

65歳のチューリング賞受賞者であるルカン氏が新たに立ち上げたAdvanced Machine Intelligence Labsは、2025年1月にウェブサイトを公開し、明確なメッセージを発信した。「真の知能は言語から始まらない。世界から始まるのだ」。

現在のAIシステムの根本的問題は、実際には何も「理解」していないことだとルカン氏は長年主張してきた。大規模言語モデルは次に来る単語を予測するよう訓練されている。詩を書き、コードをデバッグし、医師国家試験に合格するほど巧妙になったが、本質的にはパターンマッチングマシンに過ぎず、現実がどう機能するかの内部表現を持たない。

これは明らかな形で現れる。動画生成AIにコーヒーカップを置いて1分後に取り上げる様子を作らせると、カップの色が変わったり、テーブル上を移動したり、完全に消えたりする。AIには物体の永続性がない。これは大半の子どもが1歳までに習得する認知スキルだ。

広告掲載について

[email protected]

「世界モデル」という新たな道筋

ルカン氏らが提案するのは、世界が実際にどう機能するかの内部モデルを中心に構築されたAIシステムだ。コーヒーマグに手を伸ばす前に、それが温かく重いと予測し、腕をどう動かす必要があるかを予想できる人間の能力を考えてみてほしい。現在のAIはコーヒーについての詩は書けるが、コーヒーを注ぐことはできない。

このコンセプトは真剣な人材と資金を引き付けている。「AIの教母」と呼ばれるフェイフェイ・リー氏はスタンフォード大学を離れてWorld Labsを設立し、最近テキストプロンプトから探索可能な3D環境を生成するMarbleという製品を発表した。Google DeepMindはGenie 3を開発。これはAIエージェントが試行錯誤を通じて学習できるフォトリアリスティックな仮想世界を作り出すシステムだ。

エヌビディアのジェンスン・フアン氏は、ロボットや自動運転車を動かす「物理AI」の鍵として世界モデルを支持している。イーロン・マスクのxAIでさえ、エヌビディアからスタッフを引き抜いてゲーム向けの世界モデル構築に参入した。