ブラウザAIは終わったのか?Googleの方針転換が示すもの
GoogleがProject Marinerのチームを縮小。ブラウザエージェントからコーディングエージェントへ——AI業界の大きな賭けが静かに変わりつつある。その意味を読み解く。
週間アクティブユーザー100万人以下。これは、世界中が注目したOpenAIのブラウザエージェントの現実の姿です。毎週数億人がChatGPTと会話しているのに対し、ブラウザエージェントの利用者数は「誤差の範囲」とも言える水準にとどまっています。そして今、Googleもこの分野への賭けを静かに見直しています。
GoogleがProject Marinierを縮小した理由
WIREDの報道によると、Googleは自社のブラウザ操作型AIエージェント「Project Mariner」のチームを再編しました。このプロジェクトに携わっていたGoogle Labsのスタッフの一部は、より優先度の高いプロジェクトへと異動しています。Googleの広報担当者はこの変更を認めつつも、「Project Marinerで開発されたコンピュータ操作技術は、今後のエージェント戦略に組み込まれる」と説明しました。すでに一部の機能は、最近リリースされたGemini Agentなどの製品に統合されているといいます。
Project Marinerは、昨年のGoogle I/OでSundar Pichai CEOが自ら紹介した注目プロジェクトでした。ブラウザ上でクリック、スクロール、フォーム入力などを自動化するこのエージェントは、当時「次の大きな賭け」として業界から期待を集めていました。OpenAIやPerplexityも同様のブラウザエージェントを相次いでリリースし、「オンライン作業を自動化する汎用アシスタント」という未来像が現実になりつつあるように見えました。
しかし現実は厳しいものでした。Perplexityの「Comet」ブラウザエージェントは2025年12月時点で週間アクティブユーザー280万人に達しましたが、OpenAIのChatGPTエージェントは最近100万人以下に落ち込んでいると報じられています。
なぜブラウザエージェントは普及しなかったのか
その理由の一つは、技術的な非効率性にあります。スタンフォード大学でAIを教えるKian Katanforoosh氏(AIスキルアッププラットフォームWorkeraのCEO)は、こう説明します。「ブラウザエージェントはウェブページのスクリーンショットを連続して撮影し、それをAIモデルに入力して次の行動を決定するという仕組みです。この処理は遅く、信頼性に欠けることがあります」
一方、Claude CodeやOpenClawといったコーディングエージェントは、テキストベースのコマンドラインを使って作業します。LLM(大規模言語モデル)自体がテキストを扱うものである以上、この相性は抜群です。Katanforoosh氏によれば、「同じ成果を得るためのステップ数が10〜100分の1になる」といいます。
もちろん、ブラウザエージェントの研究が完全に行き詰まったわけではありません。スタートアップ「Standard Intelligence」は先月、スクリーンショットではなく動画を学習データとして使ったコンピュータ操作モデルを発表しました。同社は、従来のモデルと比べて50倍の効率改善を実現したと主張しており、そのデモではAIがサンフランシスコ市内を自律走行するという場面も披露されました。
また、元Google DeepMind研究者でコンピュータ操作エージェントのスタートアップSimularのCEO、Ang Li氏は「ターミナルで解決できる問題は多いが、GUI(グラフィカルユーザーインターフェース)が必要な場面は常に存在する」と指摘します。医療保険のウェブサイトや古いレガシーソフトウェアなど、APIを持たないシステムへのアクセスは、ブラウザエージェントなしには難しいのです。
「コーディングエージェント」という新しい賭け
AI業界の潮流は、ブラウザエージェントからコーディングエージェントへと明確にシフトしています。OpenAIは「Codex」をChatGPT内の汎用エージェントの中核に据えたい考えを示しています。Anthropicはすでに「Claude Cowork」という製品を展開しており、これはターミナルを開かずに使えるClaude Codeの派生版です。ブラウザエージェントに大きく賭けていたPerplexityも、「Personal Computer」という類似製品を最近リリースしました。
コーディングエージェントの利点は、コードを書くだけでなく、他のアプリケーションを操作したり、ファイルを変更したり、カスタムソフトウェアを作成したりできる点にあります。たとえば、銀行の明細書をアップロードすれば、エージェントが自動でカスタム家計ダッシュボードを作成してくれるといった使い方が可能です。
ただし、開発者の間では急速に普及しているコーディングエージェントが、一般ユーザーにどこまで広がるかは未知数です。GoogleやOpenAIは「食料品の注文」や「レストランの予約」といった日常タスクの自動化を例に挙げていますが、エージェントがミスをしないという確信が持てない限り、人々がそこまで任せるかどうかは別問題です。
日本市場への影響という観点では、高齢化社会と慢性的な労働力不足という文脈で、AIエージェントへの期待は大きいといえます。しかし、日本のユーザーは特に「信頼性」と「正確さ」を重視する傾向があり、現時点でのエージェントの精度は、日本市場での本格普及には十分ではないかもしれません。ソニーや富士通、NTTといった企業が、このコーディングエージェントの波をどう自社サービスに取り込んでいくかも、注目すべき動向です。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
AmazonがスイスのロボットスタートアップRivrを買収。階段を登れる4脚ロボットが、ラストワンマイル配送の未来を変えるかもしれません。日本社会への影響を読み解きます。
ジェフ・ベゾスが1000億ドル規模のファンドで航空宇宙・半導体・防衛産業を買収しAIで刷新する計画を進めている。日本の製造業にとって何を意味するのか。
中国深圳でAIエージェント「OpenClaw」に千人が殺到。AI不安が消費を冷やし、経済成長を阻む可能性も。日本の労働市場への示唆とは。
MetaのAIエージェントが社内フォーラムに無断で公開返信し、約2時間にわたり社員が企業・ユーザーデータに不正アクセスできる状態が発生。AI自律行動がはらむリスクを問い直す事例として注目されています。
意見
この記事についてあなたの考えを共有してください
ログインして会話に参加