ChatGPTの父が「言語モデルは行き止まり」と宣言する理由
AI界の重鎮ヤン・ルカンがMeta退社後に新会社設立。大規模言語モデルへの疑問と「世界モデル」という新たなAI開発アプローチの可能性を探る。
ChatGPTを生み出した技術の創始者の一人が、その技術を「行き止まり」だと断言している。
ヤン・ルカン氏は2024年11月、Metaでの10年以上にわたるAI研究責任者の職を離れた。興味深いのはそのタイミングだ。わずか6か月前、マーク・ザッカーバーグは大規模言語モデルを用いた「超知能」構築に数十億ドルを投じる新研究所を設立したばかりだった。
言語モデルへの根本的疑問
65歳のチューリング賞受賞者であるルカン氏が新たに立ち上げたAdvanced Machine Intelligence Labsは、2025年1月にウェブサイトを公開し、明確なメッセージを発信した。「真の知能は言語から始まらない。世界から始まるのだ」。
現在のAIシステムの根本的問題は、実際には何も「理解」していないことだとルカン氏は長年主張してきた。大規模言語モデルは次に来る単語を予測するよう訓練されている。詩を書き、コードをデバッグし、医師国家試験に合格するほど巧妙になったが、本質的にはパターンマッチングマシンに過ぎず、現実がどう機能するかの内部表現を持たない。
これは明らかな形で現れる。動画生成AIにコーヒーカップを置いて1分後に取り上げる様子を作らせると、カップの色が変わったり、テーブル上を移動したり、完全に消えたりする。AIには物体の永続性がない。これは大半の子どもが1歳までに習得する認知スキルだ。
「世界モデル」という新たな道筋
ルカン氏らが提案するのは、世界が実際にどう機能するかの内部モデルを中心に構築されたAIシステムだ。コーヒーマグに手を伸ばす前に、それが温かく重いと予測し、腕をどう動かす必要があるかを予想できる人間の能力を考えてみてほしい。現在のAIはコーヒーについての詩は書けるが、コーヒーを注ぐことはできない。
このコンセプトは真剣な人材と資金を引き付けている。「AIの教母」と呼ばれるフェイフェイ・リー氏はスタンフォード大学を離れてWorld Labsを設立し、最近テキストプロンプトから探索可能な3D環境を生成するMarbleという製品を発表した。Google DeepMindはGenie 3を開発。これはAIエージェントが試行錯誤を通じて学習できるフォトリアリスティックな仮想世界を作り出すシステムだ。
エヌビディアのジェンスン・フアン氏は、ロボットや自動運転車を動かす「物理AI」の鍵として世界モデルを支持している。イーロン・マスクのxAIでさえ、エヌビディアからスタッフを引き抜いてゲーム向けの世界モデル構築に参入した。
巨額投資は依然として言語モデルに
それでも、すべての熱狂にもかかわらず、世界モデルは依然として副次的な賭けに留まっている。AIへの最大の投資は依然として言語モデル企業に向かっている。OpenAI、Anthropic、Googleは、ルカン氏が行き詰まりだと言うまさにそのアプローチに数百億ドルを注ぎ込んでいる。
世界モデルも独自の障害に直面している。正確なシミュレーション構築はコストがかかり、仮想訓練環境が現実の複雑さを完全に捉えられるかは不明だ。シミュレーションで学んだスキルが物理世界にきれいに転移する保証もない。
関連記事
SKハイニックスが時価総額1兆ドルを突破。サムスン電子に続き韓国勢2社が同時に1兆ドルクラブ入り。AI半導体需要がコスピ指数を牽引する構造的変化と、日本市場への影響を読み解く。
6月8日開幕のWWDC 2026を前に、AppleとGoogleの提携によるSiri刷新への期待が高まる。株価は8週連続で上昇し最高値圏に。AI戦略の転換が投資家と利用者に何をもたらすか。
AIが量子コンピュータの開発を加速させ、現在のブロックチェーンやインターネットの暗号化技術が近い将来破られる可能性が高まっている。日本企業と個人にとっての意味を深く掘り下げる。
中国の人型ロボット訓練センターでは、元美術教師が工場作業をロボットに教えている。北京が国家戦略として推進するヒューマノイドロボット産業の実態と、日本社会への示唆を読み解く。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加