Liabooks Home|PRISM News
中国発の謎のボット軍団、世界のウェブサイトを席巻
テックAI分析

中国発の謎のボット軍団、世界のウェブサイトを席巻

4分で読めるSource

蘭州とシンガポールから大量のボットが世界中のウェブサイトを訪問。AI学習データ収集か、それとも別の目的があるのか?

コロンビアのボゴタでパラノーマル系ブログを運営するアレハンドロ・キンテロさんは、昨年10月、自分が中国で大ブレイクしたと思った。スペイン語と英語を混ぜた「スパングリッシュ」で書かれた幽霊やUFOの記事が、なぜかアジアから大量のアクセスを集めていたのだ。

しかし、Google Analyticsを詳しく調べると奇妙な事実が判明した。中国からの訪問者は全員が蘭州という一つの都市から来ており、滞在時間は0秒、スクロールもクリックもしない。キンテロさんはすぐに気づいた。「これは人間じゃない、ボットだ」と。

世界規模で発生する謎の現象

キンテロさんだけではなかった。インドのライフスタイル雑誌、カナダの小島についてのブログ、個人ポートフォリオサイト、1500万ページを持つ天気予報サイト、Shopifyで運営されるECショップ、そして驚くことに米国政府のウェブサイトまで、同じ現象に見舞われていた。

米政府の公式アクセス解析サイト「Analytics.usa.gov」によると、過去90日間で米政府サイトへの訪問の14.7%が蘭州から、6.6%がシンガポールからとなっている。これは世界で最も米政府の情報を求めている都市ということになるが、現実的ではない。

蘭州は中国北西部の工業都市で、シルクロードの交易拠点として知られるが、テックハブでもデータセンターの集積地でもない。なぜここからこれほど大量のトラフィックが発生するのか?

AI学習データ収集の可能性

自動化トラフィック分析会社Known Agentsの創設者ガビン・キング氏は、この謎に技術的な手がかりを見つけた。ボットトラフィックを詳しく調査すると、テンセントアリババファーウェイといった中国大手クラウド企業のサーバーを経由していることが判明したのだ。

2025年、AIボットは全体のウェブトラフィックの大きな割合を占めるようになった。大規模言語モデルの学習に必要なテキストデータを収集するためだ。しかし、この中国発のボットには従来のAIボットとは異なる特徴がある。

第一に、圧倒的な量だ。キング氏のサイトでは中国・シンガポールからのトラフィックが全体の22%を占める一方、他のAIボット全体でも10%未満にとどまる。

第二に、身元を隠している点だ。OpenAIGoogleなどの主要AI企業は通常、自社のボットを明確に識別できるようにしている。しかし、この中国発のボットは最初から人間のユーザーを装い、一般的なボット対策も回避している。

日本企業への影響は?

この現象は日本のウェブサイト運営者にも無関係ではない。ボットトラフィックの急増により、帯域幅コストの増加、広告収益の減少、アクセス解析データの歪みといった問題が発生している。

特に、Google AdSenseなどの広告システムでは、ボットトラフィックが多いサイトは価値が低いと判定され、広告単価が下がる可能性がある。日本の中小企業が運営するウェブサイトにとって、これは収益に直接的な打撃となりうる。

現在、WordPressは「AIボットやスクレイパーからの増加したトラフィックの報告を受けている」と認めているが、GoogleCloudflareSquarespaceなどの大手プラットフォームからの具体的な対応策は示されていない。

自衛策を模索する運営者たち

ウェブサイト運営者たちは独自の対策を編み出している。Redditなどのプラットフォームでは、ボット識別・ブロック方法の情報交換が活発化。古いバージョンのWindowsや特殊な画面アスペクト比を使用するという共通点を見つけ、これらを手がかりにブロックする手法が共有されている。

天気予報サイト管理者のアンディ氏は、中国大手クラウド企業4社のASN(自律システム番号)をブロックすることで、ボット訪問を1日127,000回から2,000回まで減らすことに成功した。

本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。

意見

関連記事