Liabooks Home|PRISM News
ブラウザAIは終わったのか?Googleの方針転換が示すもの
テックAI分析

ブラウザAIは終わったのか?Googleの方針転換が示すもの

6分で読めるSource

GoogleがProject Marinerのチームを縮小。ブラウザエージェントからコーディングエージェントへ——AI業界の大きな賭けが静かに変わりつつある。その意味を読み解く。

週間アクティブユーザー100万人以下。これは、世界中が注目したOpenAIのブラウザエージェントの現実の姿です。毎週数億人がChatGPTと会話しているのに対し、ブラウザエージェントの利用者数は「誤差の範囲」とも言える水準にとどまっています。そして今、Googleもこの分野への賭けを静かに見直しています。

GoogleがProject Marinierを縮小した理由

WIREDの報道によると、Googleは自社のブラウザ操作型AIエージェント「Project Mariner」のチームを再編しました。このプロジェクトに携わっていたGoogle Labsのスタッフの一部は、より優先度の高いプロジェクトへと異動しています。Googleの広報担当者はこの変更を認めつつも、「Project Marinerで開発されたコンピュータ操作技術は、今後のエージェント戦略に組み込まれる」と説明しました。すでに一部の機能は、最近リリースされたGemini Agentなどの製品に統合されているといいます。

Project Marinerは、昨年のGoogle I/OSundar Pichai CEOが自ら紹介した注目プロジェクトでした。ブラウザ上でクリック、スクロール、フォーム入力などを自動化するこのエージェントは、当時「次の大きな賭け」として業界から期待を集めていました。OpenAIPerplexityも同様のブラウザエージェントを相次いでリリースし、「オンライン作業を自動化する汎用アシスタント」という未来像が現実になりつつあるように見えました。

しかし現実は厳しいものでした。Perplexityの「Comet」ブラウザエージェントは2025年12月時点で週間アクティブユーザー280万人に達しましたが、OpenAIのChatGPTエージェントは最近100万人以下に落ち込んでいると報じられています。

なぜブラウザエージェントは普及しなかったのか

その理由の一つは、技術的な非効率性にあります。スタンフォード大学でAIを教えるKian Katanforoosh氏(AIスキルアッププラットフォームWorkeraのCEO)は、こう説明します。「ブラウザエージェントはウェブページのスクリーンショットを連続して撮影し、それをAIモデルに入力して次の行動を決定するという仕組みです。この処理は遅く、信頼性に欠けることがあります」

PRISM

広告掲載について

[email protected]

一方、Claude CodeOpenClawといったコーディングエージェントは、テキストベースのコマンドラインを使って作業します。LLM(大規模言語モデル)自体がテキストを扱うものである以上、この相性は抜群です。Katanforoosh氏によれば、「同じ成果を得るためのステップ数が10〜100分の1になる」といいます。

もちろん、ブラウザエージェントの研究が完全に行き詰まったわけではありません。スタートアップ「Standard Intelligence」は先月、スクリーンショットではなく動画を学習データとして使ったコンピュータ操作モデルを発表しました。同社は、従来のモデルと比べて50倍の効率改善を実現したと主張しており、そのデモではAIがサンフランシスコ市内を自律走行するという場面も披露されました。

また、元Google DeepMind研究者でコンピュータ操作エージェントのスタートアップSimularのCEO、Ang Li氏は「ターミナルで解決できる問題は多いが、GUI(グラフィカルユーザーインターフェース)が必要な場面は常に存在する」と指摘します。医療保険のウェブサイトや古いレガシーソフトウェアなど、APIを持たないシステムへのアクセスは、ブラウザエージェントなしには難しいのです。

「コーディングエージェント」という新しい賭け

AI業界の潮流は、ブラウザエージェントからコーディングエージェントへと明確にシフトしています。OpenAIは「Codex」をChatGPT内の汎用エージェントの中核に据えたい考えを示しています。Anthropicはすでに「Claude Cowork」という製品を展開しており、これはターミナルを開かずに使えるClaude Codeの派生版です。ブラウザエージェントに大きく賭けていたPerplexityも、「Personal Computer」という類似製品を最近リリースしました。

コーディングエージェントの利点は、コードを書くだけでなく、他のアプリケーションを操作したり、ファイルを変更したり、カスタムソフトウェアを作成したりできる点にあります。たとえば、銀行の明細書をアップロードすれば、エージェントが自動でカスタム家計ダッシュボードを作成してくれるといった使い方が可能です。

ただし、開発者の間では急速に普及しているコーディングエージェントが、一般ユーザーにどこまで広がるかは未知数です。GoogleOpenAIは「食料品の注文」や「レストランの予約」といった日常タスクの自動化を例に挙げていますが、エージェントがミスをしないという確信が持てない限り、人々がそこまで任せるかどうかは別問題です。

日本市場への影響という観点では、高齢化社会と慢性的な労働力不足という文脈で、AIエージェントへの期待は大きいといえます。しかし、日本のユーザーは特に「信頼性」と「正確さ」を重視する傾向があり、現時点でのエージェントの精度は、日本市場での本格普及には十分ではないかもしれません。ソニー富士通NTTといった企業が、このコーディングエージェントの波をどう自社サービスに取り込んでいくかも、注目すべき動向です。

本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。

意見

関連記事

PRISM

広告掲載について

[email protected]
PRISM

広告掲載について

[email protected]