Liabooks Home|PRISM News
グーグル、新小型AI「FunctionGemma」を発表。スマホで直接動く「賢い司令塔」の登場
Tech

グーグル、新小型AI「FunctionGemma」を発表。スマホで直接動く「賢い司令塔」の登場

Source

グーグルが、デバイス上で直接動作する小型AI「FunctionGemma」をリリース。クラウド不要で、プライバシー、速度、コストの問題を解決する新しいアプローチ。開発者向けの新アーキテクチャを提案します。

PRISM Insight: AIの主戦場はクラウドからデバイスへ。グーグルが投じた「FunctionGemma」は、AIを会話ツールから実用的な「行動ツール」へと進化させる、ハイブリッドAIアーキテクチャへの移行を象徴する一手です。これは、単なる新モデルの発表ではなく、AI開発の設計思想そのものを変える動きと言えるでしょう。

グーグルは、最新大規模モデル「Gemini 3」が注目を集める中、AI開発の手を緩めることなく、新たなモデル「FunctionGemma」を公開しました。これは、現代のアプリケーション開発における根強い課題、すなわち「エッジデバイスでの信頼性」を解決するために設計された、2億7000万パラメータの特殊な小型言語モデル(SLM)です。

汎用的なチャットボットとは異なり、FunctionGemmaはたった一つの重要な役割に特化しています。それは、ユーザーが自然言語で入力した命令を、アプリやデバイスが実際に実行できる構造化されたコードへと、クラウドに接続することなく翻訳することです。

なぜ「デバイス上」が重要なのか?

このリリースは、グーグル DeepMindとGoogle AI Developersチームにとって、戦略的な方向転換を示唆しています。AI業界がクラウド上で数兆パラメータ規模のモデル開発競争を続ける一方で、FunctionGemmaはスマートフォンやブラウザ、IoTデバイス上でローカルに動作する「スモール言語モデル」への賭けです。この「ローカル第一主義」のアプローチには、3つの明確な利点があります。

  • プライバシー:カレンダーの予定や連絡先などの個人データが、デバイスの外に出ることがありません。
  • 低遅延:サーバーとの通信を待つ必要がなく、アクションが瞬時に実行されます。特にGPUやNPUなどのアクセラレータを利用できる場合、その処理速度は顕著です。
  • コスト:開発者は、簡単な操作のためにトークン単位のAPI利用料を支払う必要がなくなります。

性能の飛躍:特化が規模を上回る

FunctionGemmaの核心は、生成AIにおける「実行のギャップ」を埋めることにあります。標準的な大規模言語モデル(LLM)は会話に優れていますが、特にリソースが限られたデバイス上でソフトウェアのアクションを確実に実行させることには苦戦しがちです。

グーグルの社内評価「Mobile Actions」によると、汎用的な小型モデルが関数呼び出し(Function Calling)タスクで達成した精度は58%でした。しかし、この特定の目的に合わせてファインチューニングされたFunctionGemmaの精度は85%にまで跳ね上がりました。これは、はるかに大きなモデルと同等の成功率を、専門化によって達成できることを示しています。

開発者にとっての新しい設計パターン

FunctionGemmaは、AI開発者に対し、巨大な単一AIシステムから、複数のAIを組み合わせる複合システムへの移行を提案します。これは、ユーザーのすべてのリクエストをGPT-4やGemini 1.5 Proのような高価なクラウドモデルに送るのではなく、FunctionGemmaをデバイス上の賢い「交通整理役」として配置する新しいアーキテクチャです。

単純なコマンドはデバイス上で即座に処理し、高度な推論が必要な場合のみ、そのリクエストを大規模なクラウドモデルに転送します。このハイブリッドなアプローチにより、クラウドの推論コストと遅延を劇的に削減できます。

利用可能なリソースとライセンス

FunctionGemmaは、Hugging FaceとKaggleからすぐにダウンロード可能です。また、Google Playストアで「Google AI Edge Gallery」アプリをダウンロードすれば、実際の動作を確認できます。モデル本体に加え、開発者が独自のモデルを訓練するためのデータセットや、各種ライブラリとの互換性も提供されています。

ライセンスは、グーグル独自の「Gemma Terms of Use」に基づいています。これは、OSI(Open Source Initiative)が定義する厳密な「オープンソース」とは異なりますが、商用利用、再配布、改変は許可されています。ただし、ヘイトスピーチの生成など特定の用途は禁止されており、利用規約を事前に確認することが推奨されます。

AIグーグルスモール言語モデルエッジAIオンデバイスAI関数呼び出し

関連記事

AIスタートアップの次なる戦場はレストラン―パローナAIが示す「砂上の楼閣」を避ける技術戦略
TechJP
AIスタートアップの次なる戦場はレストラン―パローナAIが示す「砂上の楼閣」を避ける技術戦略

元グーグル・メタの技術者らが率いるパローナAIが、レストラン業界に特化した新製品を発表。不安定なLLM基盤の上で、いかにして信頼性の高い垂直型AIソリューションを構築したのか。その技術戦略と開発者への4つの教訓を解説します。

Anthropic、AIの「スキル」をオープン標準化へ。業界の共通インフラを狙う戦略
TechJP
Anthropic、AIの「スキル」をオープン標準化へ。業界の共通インフラを狙う戦略

AI開発のAnthropicが、AIアシスタントの能力を向上させる「エージェントスキル」をオープン標準として公開。マイクロソフトやOpenAIも追随する中、業界の共通インフラを築く戦略の狙いと今後の課題を解説します。

AI時代、専門家はもう古い?今、最も価値ある「ジェネラリスト」という新常識
TechJP
AI時代、専門家はもう古い?今、最も価値ある「ジェネラリスト」という新常識

AIの進化が仕事のルールを根底から変えています。専門知識よりも、学び、適応する「ジェネラリスト」がなぜ今、最も価値ある人材なのでしょうか。EliseAIのCTOが解説します。

GoogleのAI戦略を読み解く:ジョシュ・ウッドワード氏が担うGeminiの未来と競争の行方
TechJP
GoogleのAI戦略を読み解く:ジョシュ・ウッドワード氏が担うGeminiの未来と競争の行方

GoogleのAI戦略の中心人物、ジョシュ・ウッドワード氏がGeminiアプリの責任者に就任。AI競争激化の中、Google Labs兼任の彼のリーダーシップがGoogleの未来をどう形作るか、その重要性と業界への影響をPRISMが深掘り。