AIの「無駄遣い」を終わらせる80億円の賭け
スタンフォード教授が創業したGimlet Labsが8000万ドルのシリーズAを調達。AIワークロードを複数チップに分散させる「マルチシリコン推論クラウド」で、データセンターの使用率を最大10倍改善すると主張する。日本企業への影響も含め解説。
あなたの会社が買ったAIサーバーは、今この瞬間、70〜85%の時間、何もしていない。
これは批判ではなく、業界の現実だ。Gimlet Labsの創業者Zain Asgarはこの「アイドル状態」こそが、AI時代最大の資源浪費だと指摘する。そして先週、その問題を解決するためにMenlo Ventures主導で8000万ドル(約120億円)のシリーズAを調達した。
なぜGPUはこれほど「眠って」いるのか
AIの推論処理(インフェレンス)は、一見シンプルに見えて実は複雑な工程の連続だ。Menlo VenturesのパートナーTim Tullyはブログ投稿でこう説明している。「推論はコンピューティング依存、デコードはメモリ依存、ツール呼び出しはネットワーク依存だ」。つまり、AIエージェントが一つのタスクを完了するだけで、異なる種類のハードウェアが次々と必要になる。
ところが現在のシステムは、すべての処理を同じGPUに押し付けようとする。CPUが得意な処理もGPUに、メモリ帯域が必要な処理もGPUに。結果として、高価なGPUは自分が最も苦手な処理を担わされ、その間に他のチップは待機している。Asgarによれば、既存ハードウェアの実際の使用率は「15〜30%」にとどまっているという。
Gimlet Labsが開発したのは、この問題を解くオーケストレーションソフトウェアだ。AIワークロードを細かく分解し、NVIDIA、AMD、Intel、ARM、Cerebras、d-Matrixといった異なるアーキテクチャのチップに同時並行で振り分ける。同社はこれを「マルチシリコン推論クラウド」と呼ぶ。同じコスト・同じ電力消費で、推論速度を3〜10倍に向上させると主張している。
同社はすでに昨年10月に公開ローンチを行い、初年度から8桁(1000万ドル以上)の売上を計上。その後4ヶ月で顧客数は倍増し、現在は大手モデルメーカーと大規模クラウドプロバイダーを顧客に持つという(社名は非公開)。今回の調達により、シード資金を含めた累計調達額は9200万ドルに達した。
「7兆ドル市場」への布石
McKinseyはデータセンター投資が2030年までに約7兆ドルに達すると試算している。この規模感を念頭に置くと、Gimletのアプローチが持つ意味が見えてくる。
単純な話だ。データセンターへの投資が増えれば増えるほど、「使われていないハードウェア」の絶対量も増える。Asgarが「数千億ドルを無駄にしている」と表現するこの問題は、投資額が大きくなるほど深刻になる。Gimletのソフトウェアは、新しいハードウェアを買わずに既存の資産から最大限の価値を引き出す、いわば「効率化レイヤー」として機能する。
ここで日本企業の視点から考えると、示唆は小さくない。NTTデータ、富士通、NECといった国内大手SIerは、顧客企業のAIインフラ構築を支援する立場にある。AIサーバーの導入コストが高騰する中、「既存ハードウェアをより賢く使う」というアプローチは、コスト意識の高い日本の製造業や金融機関にとって説得力を持つかもしれない。また、ソフトバンクがARM経由でGimletのパートナーチップメーカーに名を連ねていることも、無関係ではないだろう。
「ソフトウェアが勝つ」という賭けのリスク
ただし、この事業モデルには慎重に見るべき側面もある。
Gimletのアプローチが成立する前提は、「多様なチップが混在するデータセンター」が標準であり続けることだ。しかしNVIDIAがAI推論の主要ユースケースをすべてカバーする統合チップを開発した場合、あるいは主要クラウドプロバイダーが自社チップへの統一を進めた場合、「マルチシリコン」の価値は薄れる可能性がある。
さらに、NVIDIA自身がオーケストレーション層に参入してくるリスクも否定できない。同社はすでにNIM(NVIDIA Inference Microservices)というソフトウェアスタックを持っており、ハードウェアとソフトウェアの垂直統合を強化している。
それでもSequoiaのBill Coughran、スタンフォード教授のNick McKeown、元VMware CEO Raghu Raghuram、そしてIntel CEO Lip-Bu Tanといった錚々たる顔ぶれがエンジェル投資家として名を連ねている事実は、業界の重鎮たちがこの方向性に一定の確信を持っていることを示唆している。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
新興AI企業Littlebirdは、画面上のすべてをテキストで読み取り、ユーザーの文脈を蓄積する。Recallやリワインドとは何が違うのか。プライバシーと生産性の間で、私たちは何を選ぶのか。
英国の法廷でAIが弁護士の調査補助として活用され始めた。医療過誤訴訟を糸口に、AI法律支援の可能性と限界、日本の司法・医療への影響を考察する。
GrammarlyのAI機能が著名ジャーナリストの名前を無断使用した問題を起点に、AIプラットフォームと創作者の経済的関係、日本社会への示唆を深掘りします。
欧州でAIデータセンターの電力網接続待ちが急増。英国だけで30GW超が接続待ち。送電インフラ不足がAI競争の新たなボトルネックとなっている実態を解説。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加