人間のデータなしで学ぶAI——11億ドルが賭けた「超学習者」の正体

元DeepMind研究者David Silverが設立したIneffable Intelligenceが約1,600億円を調達。強化学習だけで「すべての知性」を構築するという壮大な賭けの意味を読み解く。

チェスも囲碁も、人間の棋譜を一切見せずに世界最強になれるとしたら——その証明をすでに成し遂げた研究者が今、「すべての知性」を一から作り直そうとしている。

2026年4月、英国のAIスタートアップ Ineffable Intelligence が11億ドル（約1,600億円）の資金調達を完了し、企業評価額51億ドルに達したと発表した。設立からわずか数ヶ月という異例のスピードだ。創業者はDeepMindの元主任研究者、David Silver氏。Sequoia Capital と Lightspeed Venture Partners が主導し、Index Ventures、Google、Nvidia、さらに英国政府系の British Business Bank と Sovereign AI（英国のソブリンAIファンド）も参加している。

AlphaZeroの父が挑む「次の問い」

Silver氏の名前は、AIの世界では特別な重みを持つ。DeepMindに10年以上在籍した彼は、強化学習チームを率い、チェスと囲碁で人間のプロ棋士を凌駕したプログラム AlphaZero の開発に深く関わった。AlphaZeroの特筆すべき点は、人間の棋譜を一切学習せず、ゲームのルールだけを与えられた状態で自己対戦を繰り返し、独自の戦略を「発見」したことだ。

その哲学を、Ineffable Intelligence はさらに根本的なレベルへと押し上げようとしている。同社が目指すのは「スーパーラーナー（superlearner）」——人間が生成したデータに依存せず、自らの経験だけで知識とスキルを発見できるAIだ。現在主流の大規模言語モデル（LLM）が膨大な人間の文章を学習して「人間らしさ」を模倣するのとは、根本的にアプローチが異なる。

同社のウェブサイトには、強気な宣言が掲げられている。「成功すれば、これはダーウィンに匹敵する科学的突破口となる。彼の法則がすべての生命を説明したように、我々の法則はすべての知性を説明し、構築するだろう」（原文のまま大文字表記）。Silver氏は個人ブログでこの会社を「生涯の仕事」と呼び、得られた収益は「できるだけ多くの命を救う高インパクト慈善団体に寄付する」とも述べている。

なぜ今、この規模の資金が集まるのか

広告掲載について

[email protected]

投資家の反応を理解するには、現在のAI業界の地殻変動を知る必要がある。LLMは ChatGPT や Gemini の成功で一世を風靡したが、その限界も見えてきた。人間データに依存するため、データの偏りや著作権問題を抱え、「人間がすでに知っていること」の範囲を超えた発見が難しいという構造的な制約がある。強化学習ベースのアプローチは、この制約を原理的に回避できる可能性を持つ。

このタイミングで注目すべきは、同様の「スター研究者発ラウンド」が相次いでいることだ。先月には、チューリング賞受賞者で元Meta AI科学者の Yann LeCun 氏が共同創業した AMI Labs が10億3,000万ドルを調達（評価額35億ドル）。さらに、DeepMindの元主任科学者 Tim Rocktäschel 氏が共同創業した Recursive Superintelligence も5億ドル（最大10億ドルまで拡大可能）を調達したと報じられている。業界では、スター研究者の名前だけで巨額のシード資金が集まるこの現象を「ヤシの実ラウンド（coconut round）」と皮肉交じりに呼んでいる。

地理的にも重要な意味がある。これらの企業はいずれも英国、特にロンドンに拠点を置く。Google が2014年にDeepMindを買収して以来、ロンドンはAI人材の一大集積地となった。Jeff Bezos のAIラボ Project Prometheus もロンドンのGoogle AIハブ近くにオフィスを構える交渉中と報じられており、米国一強だったAI地政学に微妙な変化が生じている。

日本企業・日本社会への問い

この動きは、日本にとって対岸の火事ではない。強化学習の応用が最も期待される分野の一つはロボティクスだ。人間のデモンストレーションなしに自律的にスキルを習得できるロボットが実現すれば、製造業の現場は根本から変わる。少子高齢化による深刻な労働力不足を抱える日本にとって、これは脅威でもあり、機会でもある。ソニー、トヨタ、ファナックといった企業がロボティクスとAIの融合をどう捉えるか、注目が集まる。

一方、懐疑的な見方も根強い。「ダーウィンに匹敵する」という言葉は、研究者コミュニティの一部から「誇大広告だ」という批判を招いている。AlphaZeroが成功したのは、チェスや囲碁という明確なルールと報酬関数が存在する「閉じた世界」だったからだ。現実世界の複雑さ——曖昧なルール、遅延する報酬、無限の状態空間——を強化学習だけで乗り越えられるかどうかは、まだ誰にも分からない。

また、収益化の道筋が不透明なまま51億ドルの評価額がついていることも、冷静に見れば異例だ。ビジョンへの賭けとしては理解できるが、それが実際の価値創出につながるまでには、長い時間と多くの試行錯誤が必要になるだろう。