インドのAI企業Sarvam、巨大モデルで挑む「小国の大戦略」
インドのSarvamが105Bパラメータの大規模言語モデルを発表。米中の巨大企業に対抗する「効率的なオープンソース戦略」の勝算は?
16兆のトークンで訓練された105BパラメータのAIモデル。インドのスタートアップSarvamが火曜日に発表したこの数字は、同社の野心的な挑戦を物語っている。OpenAIや中国の巨大企業が支配するAI市場で、「小さく効率的な」オープンソースモデルが勝機を見出せるのだろうか。
インドの「AI自立」戦略
Sarvamの新モデル発表は、ニューデリーで開催されたIndia AI Impact Summitで行われた。このタイミングは偶然ではない。インド政府が外国のAIプラットフォームへの依存を減らし、現地言語に特化したモデル開発を推進する政策と完全に一致している。
同社が発表したラインナップは多岐にわたる。30Bパラメータと105Bパラメータの大規模言語モデル、テキスト音声変換、音声テキスト変換、そして文書解析用の視覚モデルまで。2024年10月にリリースした2BパラメータのSarvam 1から、わずか4ヶ月で50倍以上の規模へと飛躍した。
特に注目すべきは、両モデルが採用する「Mixture-of-Experts」アーキテクチャだ。全パラメータの一部だけを同時に活性化することで、計算コストを大幅に削減する。30Bモデルは32,000トークンのコンテキストウィンドウでリアルタイム会話に特化し、105Bモデルは128,000トークンで複雑な多段階推論タスクに対応する。
「ゼロから」の挑戦
Sarvamが強調するのは、これらのモデルが既存のオープンソースシステムの微調整ではなく、「ゼロから」訓練されたことだ。30Bモデルは約16兆トークンで事前訓練され、105Bモデルは複数のインド言語を含む数兆トークンで訓練された。
この訓練は、インド政府支援のIndiaAI Missionの計算リソース、データセンター運営会社Yottaのインフラ支援、NVIDIAの技術支援を受けて実現した。政府、民間、外国企業の連携モデルは、インドのAI戦略の象徴的な事例と言える。
同社共同創設者のPratyush Kumar氏は発表会で、「スケーリングには慎重なアプローチを取りたい。無闇に拡大するのではなく、本当に重要なタスクを理解し、それに向けて構築したい」と述べた。この発言は、パラメータ数の競争に走りがちなAI業界への警鐘とも受け取れる。
日本企業への示唆
Sarvamのアプローチは、日本の企業にとって重要な示唆を含んでいる。ソニーやトヨタといった日本の大企業も、米中の巨大AI企業への依存を懸念している。特に、日本語に特化したAIモデルの必要性は高まっている。
Sarvamが計画する「Sarvam for Work」という企業向けツールや、「Samvaad」という対話AI エージェントプラットフォームは、日本企業が検討すべきB2B戦略のヒントを提供している。重要なのは、技術的な優位性よりも、実際のビジネス課題解決に焦点を当てることだ。
2023年創設のSarvamは、Lightspeed Venture Partners、Khosla Ventures、Peak XV Partners(旧Sequoia Capital India)から5000万ドル以上の資金調達を完了している。この投資額は、インドのAIスタートアップとしては大規模だが、OpenAIの数十億ドル規模と比較すれば、まさに「小さな巨人」の挑戦と言える。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
ByteDanceのAI動画モデル「Seedance 2.0」がハリウッドの猛反発を受け、グローバル展開を延期。著作権侵害をめぐる法的圧力が、AI動画生成の未来に問いを投げかけています。
Rivian創業者RJスカーリンジが新会社Mind Roboticsを設立。6億1500万ドルを調達し、製造現場のロボット化に挑む。人型ロボットの「複雑すぎる問題」とは何か。日本の製造業への示唆を探る。
GoogleがサイバーセキュリティのWizを320億ドルで買収。ベンチャー史上最大のM&Aが示す「AI時代のセキュリティ」の本質と、日本企業への示唆を読み解く。
Metaが全従業員の20%以上に相当するレイオフを検討中と報道。AI投資拡大の財源確保が目的とされるが、「AIウォッシング」批判も浮上。日本企業や労働市場への示唆を読み解く。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加