人間のデータなしで学ぶAI——11億ドルが賭けた「超学習者」の正体
元DeepMind研究者David Silverが設立したIneffable Intelligenceが約1,600億円を調達。強化学習だけで「すべての知性」を構築するという壮大な賭けの意味を読み解く。
チェスも囲碁も、人間の棋譜を一切見せずに世界最強になれるとしたら——その証明をすでに成し遂げた研究者が今、「すべての知性」を一から作り直そうとしている。
2026年4月、英国のAIスタートアップ Ineffable Intelligence が11億ドル(約1,600億円)の資金調達を完了し、企業評価額51億ドルに達したと発表した。設立からわずか数ヶ月という異例のスピードだ。創業者はDeepMindの元主任研究者、David Silver氏。Sequoia Capital と Lightspeed Venture Partners が主導し、Index Ventures、Google、Nvidia、さらに英国政府系の British Business Bank と Sovereign AI(英国のソブリンAIファンド)も参加している。
AlphaZeroの父が挑む「次の問い」
Silver氏の名前は、AIの世界では特別な重みを持つ。DeepMindに10年以上在籍した彼は、強化学習チームを率い、チェスと囲碁で人間のプロ棋士を凌駕したプログラム AlphaZero の開発に深く関わった。AlphaZeroの特筆すべき点は、人間の棋譜を一切学習せず、ゲームのルールだけを与えられた状態で自己対戦を繰り返し、独自の戦略を「発見」したことだ。
その哲学を、Ineffable Intelligence はさらに根本的なレベルへと押し上げようとしている。同社が目指すのは「スーパーラーナー(superlearner)」——人間が生成したデータに依存せず、自らの経験だけで知識とスキルを発見できるAIだ。現在主流の大規模言語モデル(LLM)が膨大な人間の文章を学習して「人間らしさ」を模倣するのとは、根本的にアプローチが異なる。
同社のウェブサイトには、強気な宣言が掲げられている。「成功すれば、これはダーウィンに匹敵する科学的突破口となる。彼の法則がすべての生命を説明したように、我々の法則はすべての知性を説明し、構築するだろう」(原文のまま大文字表記)。Silver氏は個人ブログでこの会社を「生涯の仕事」と呼び、得られた収益は「できるだけ多くの命を救う高インパクト慈善団体に寄付する」とも述べている。
なぜ今、この規模の資金が集まるのか
投資家の反応を理解するには、現在のAI業界の地殻変動を知る必要がある。LLMは ChatGPT や Gemini の成功で一世を風靡したが、その限界も見えてきた。人間データに依存するため、データの偏りや著作権問題を抱え、「人間がすでに知っていること」の範囲を超えた発見が難しいという構造的な制約がある。強化学習ベースのアプローチは、この制約を原理的に回避できる可能性を持つ。
このタイミングで注目すべきは、同様の「スター研究者発ラウンド」が相次いでいることだ。先月には、チューリング賞受賞者で元Meta AI科学者の Yann LeCun 氏が共同創業した AMI Labs が10億3,000万ドルを調達(評価額35億ドル)。さらに、DeepMindの元主任科学者 Tim Rocktäschel 氏が共同創業した Recursive Superintelligence も5億ドル(最大10億ドルまで拡大可能)を調達したと報じられている。業界では、スター研究者の名前だけで巨額のシード資金が集まるこの現象を「ヤシの実ラウンド(coconut round)」と皮肉交じりに呼んでいる。
地理的にも重要な意味がある。これらの企業はいずれも英国、特にロンドンに拠点を置く。Google が2014年にDeepMindを買収して以来、ロンドンはAI人材の一大集積地となった。Jeff Bezos のAIラボ Project Prometheus もロンドンのGoogle AIハブ近くにオフィスを構える交渉中と報じられており、米国一強だったAI地政学に微妙な変化が生じている。
日本企業・日本社会への問い
この動きは、日本にとって対岸の火事ではない。強化学習の応用が最も期待される分野の一つはロボティクスだ。人間のデモンストレーションなしに自律的にスキルを習得できるロボットが実現すれば、製造業の現場は根本から変わる。少子高齢化による深刻な労働力不足を抱える日本にとって、これは脅威でもあり、機会でもある。ソニー、トヨタ、ファナックといった企業がロボティクスとAIの融合をどう捉えるか、注目が集まる。
一方、懐疑的な見方も根強い。「ダーウィンに匹敵する」という言葉は、研究者コミュニティの一部から「誇大広告だ」という批判を招いている。AlphaZeroが成功したのは、チェスや囲碁という明確なルールと報酬関数が存在する「閉じた世界」だったからだ。現実世界の複雑さ——曖昧なルール、遅延する報酬、無限の状態空間——を強化学習だけで乗り越えられるかどうかは、まだ誰にも分からない。
また、収益化の道筋が不透明なまま51億ドルの評価額がついていることも、冷静に見れば異例だ。ビジョンへの賭けとしては理解できるが、それが実際の価値創出につながるまでには、長い時間と多くの試行錯誤が必要になるだろう。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
スタンフォード大学の内側を暴いた新著『How to Rule the World』が問いかける。シリコンバレーの野心文化は、学生たちに何をもたらしているのか。成功の代償とは何か。
パンデミック期に急膨張したエドテック投資は2021年の167億ドルから2025年には30億ドル未満に急落。Byju'sの破綻、中国の規制、そしてAIシフトが示す教育ビジネスの次の姿とは。
スタンフォード大学の調査で、AIへの期待感が米国38%に対し中国84%と判明。シンガポールが示す「信頼×制度×投資」の方程式とは何か。日本への示唆も含めて読み解く。
MITテクノロジーレビューが選んだ「今AIで本当に重要な10のこと」。ChatGPTの銃撃事件関与疑惑からAnthropicの危険モデル流出まで、AIが社会インフラとなりつつある今、私たちは何を問うべきか。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加