ChatGPTの父が「言語モデルは行き止まり」と宣言する理由
AI界の重鎮ヤン・ルカンがMeta退社後に新会社設立。大規模言語モデルへの疑問と「世界モデル」という新たなAI開発アプローチの可能性を探る。
ChatGPTを生み出した技術の創始者の一人が、その技術を「行き止まり」だと断言している。
ヤン・ルカン氏は2024年11月、Metaでの10年以上にわたるAI研究責任者の職を離れた。興味深いのはそのタイミングだ。わずか6か月前、マーク・ザッカーバーグは大規模言語モデルを用いた「超知能」構築に数十億ドルを投じる新研究所を設立したばかりだった。
言語モデルへの根本的疑問
65歳のチューリング賞受賞者であるルカン氏が新たに立ち上げたAdvanced Machine Intelligence Labsは、2025年1月にウェブサイトを公開し、明確なメッセージを発信した。「真の知能は言語から始まらない。世界から始まるのだ」。
現在のAIシステムの根本的問題は、実際には何も「理解」していないことだとルカン氏は長年主張してきた。大規模言語モデルは次に来る単語を予測するよう訓練されている。詩を書き、コードをデバッグし、医師国家試験に合格するほど巧妙になったが、本質的にはパターンマッチングマシンに過ぎず、現実がどう機能するかの内部表現を持たない。
これは明らかな形で現れる。動画生成AIにコーヒーカップを置いて1分後に取り上げる様子を作らせると、カップの色が変わったり、テーブル上を移動したり、完全に消えたりする。AIには物体の永続性がない。これは大半の子どもが1歳までに習得する認知スキルだ。
「世界モデル」という新たな道筋
ルカン氏らが提案するのは、世界が実際にどう機能するかの内部モデルを中心に構築されたAIシステムだ。コーヒーマグに手を伸ばす前に、それが温かく重いと予測し、腕をどう動かす必要があるかを予想できる人間の能力を考えてみてほしい。現在のAIはコーヒーについての詩は書けるが、コーヒーを注ぐことはできない。
このコンセプトは真剣な人材と資金を引き付けている。「AIの教母」と呼ばれるフェイフェイ・リー氏はスタンフォード大学を離れてWorld Labsを設立し、最近テキストプロンプトから探索可能な3D環境を生成するMarbleという製品を発表した。Google DeepMindはGenie 3を開発。これはAIエージェントが試行錯誤を通じて学習できるフォトリアリスティックな仮想世界を作り出すシステムだ。
エヌビディアのジェンスン・フアン氏は、ロボットや自動運転車を動かす「物理AI」の鍵として世界モデルを支持している。イーロン・マスクのxAIでさえ、エヌビディアからスタッフを引き抜いてゲーム向けの世界モデル構築に参入した。
巨額投資は依然として言語モデルに
それでも、すべての熱狂にもかかわらず、世界モデルは依然として副次的な賭けに留まっている。AIへの最大の投資は依然として言語モデル企業に向かっている。OpenAI、Anthropic、Googleは、ルカン氏が行き詰まりだと言うまさにそのアプローチに数百億ドルを注ぎ込んでいる。
世界モデルも独自の障害に直面している。正確なシミュレーション構築はコストがかかり、仮想訓練環境が現実の複雑さを完全に捉えられるかは不明だ。シミュレーションで学んだスキルが物理世界にきれいに転移する保証もない。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
SpaceXがAIコーディングスタートアップCursorを最大600億ドルで買収する権利を取得。イーロン・マスクのAI帝国構築とOpenAIとの競争激化が背景に。日本のソフトウェア産業への影響も解説。
ティム・クックの15年間の在任後、ハードウェア責任者のジョン・ターナスがアップルの新CEOに就任。4兆ドルの時価総額を誇る同社が、AIで出遅れた現状をどう打開するか、日本市場への影響も含めて考察します。
サム・アルトマン率いるWorldが「人間証明」システムを大幅刷新。TinderやZoom、DocuSignと連携し、AI時代のなりすまし問題に挑む。日本社会への影響と、虹彩スキャンが孕む問題を多角的に読み解く。
NvidiaがオープンソースAIモデル「Ising」を発表し、量子コンピューター関連株が週間で最大50%急騰。量子技術の商用化に向けた新たな局面と、日本企業への影響を読み解く。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加