ChatGPTの父が「言語モデルは行き止まり」と宣言する理由
AI界の重鎮ヤン・ルカンがMeta退社後に新会社設立。大規模言語モデルへの疑問と「世界モデル」という新たなAI開発アプローチの可能性を探る。
ChatGPTを生み出した技術の創始者の一人が、その技術を「行き止まり」だと断言している。
ヤン・ルカン氏は2024年11月、Metaでの10年以上にわたるAI研究責任者の職を離れた。興味深いのはそのタイミングだ。わずか6か月前、マーク・ザッカーバーグは大規模言語モデルを用いた「超知能」構築に数十億ドルを投じる新研究所を設立したばかりだった。
言語モデルへの根本的疑問
65歳のチューリング賞受賞者であるルカン氏が新たに立ち上げたAdvanced Machine Intelligence Labsは、2025年1月にウェブサイトを公開し、明確なメッセージを発信した。「真の知能は言語から始まらない。世界から始まるのだ」。
現在のAIシステムの根本的問題は、実際には何も「理解」していないことだとルカン氏は長年主張してきた。大規模言語モデルは次に来る単語を予測するよう訓練されている。詩を書き、コードをデバッグし、医師国家試験に合格するほど巧妙になったが、本質的にはパターンマッチングマシンに過ぎず、現実がどう機能するかの内部表現を持たない。
これは明らかな形で現れる。動画生成AIにコーヒーカップを置いて1分後に取り上げる様子を作らせると、カップの色が変わったり、テーブル上を移動したり、完全に消えたりする。AIには物体の永続性がない。これは大半の子どもが1歳までに習得する認知スキルだ。
「世界モデル」という新たな道筋
ルカン氏らが提案するのは、世界が実際にどう機能するかの内部モデルを中心に構築されたAIシステムだ。コーヒーマグに手を伸ばす前に、それが温かく重いと予測し、腕をどう動かす必要があるかを予想できる人間の能力を考えてみてほしい。現在のAIはコーヒーについての詩は書けるが、コーヒーを注ぐことはできない。
このコンセプトは真剣な人材と資金を引き付けている。「AIの教母」と呼ばれるフェイフェイ・リー氏はスタンフォード大学を離れてWorld Labsを設立し、最近テキストプロンプトから探索可能な3D環境を生成するMarbleという製品を発表した。Google DeepMindはGenie 3を開発。これはAIエージェントが試行錯誤を通じて学習できるフォトリアリスティックな仮想世界を作り出すシステムだ。
エヌビディアのジェンスン・フアン氏は、ロボットや自動運転車を動かす「物理AI」の鍵として世界モデルを支持している。イーロン・マスクのxAIでさえ、エヌビディアからスタッフを引き抜いてゲーム向けの世界モデル構築に参入した。
巨額投資は依然として言語モデルに
それでも、すべての熱狂にもかかわらず、世界モデルは依然として副次的な賭けに留まっている。AIへの最大の投資は依然として言語モデル企業に向かっている。OpenAI、Anthropic、Googleは、ルカン氏が行き詰まりだと言うまさにそのアプローチに数百億ドルを注ぎ込んでいる。
世界モデルも独自の障害に直面している。正確なシミュレーション構築はコストがかかり、仮想訓練環境が現実の複雑さを完全に捉えられるかは不明だ。シミュレーションで学んだスキルが物理世界にきれいに転移する保証もない。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
日本政府が2040年までに国産半導体の売上高40兆円、世界シェア30%を目標に掲げた。AIとデータセンター需要を追い風に、かつての半導体王国は復活できるのか。Rapidusや関連企業への影響を多角的に分析する。
AI投資エージェントが52.55%の収益を記録する中、個人投資家の84%が損失を出している現実。日本の投資家にとってAI活用は必須スキルとなるのか。
連邦準備制度理事会のシュミット総裁が、AI技術の普及と高齢化により企業の採用が停滞していると発言。日本の労働市場への示唆を探る。
AnthropicがDODから供給網リスクに指定される中、Google、Microsoft、Amazonは同社との協力継続を表明。AI時代の国家安全保障と民間企業の関係を問い直す
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加