神秘機器人大軍席捲全球網站,幕後黑手成謎
來自蘭州和新加坡的大量機器人訪問全球網站,疑似AI訓練數據收集,但真實目的仍不明
在波哥大經營超自然現象部落格的亞歷山德羅·金特羅,去年10月一度以為自己在中國爆紅了。這個用「西班牙英語」撰寫幽靈和外星人文章的網站,突然湧入大量來自中國和新加坡的流量,甚至占了過去12個月總訪問量的一半以上。
但當金特羅深入分析數據時,發現了詭異之處:所有中國訪客都來自蘭州這一個城市,平均停留時間0秒,既不滾動頁面也不點擊任何內容。「這些根本不是人類」,他很快意識到自己的網站正遭受機器人轟炸。
全球性異常現象
金特羅並非個案。印度的生活雜誌、加拿大小島部落格、個人作品集網站、擁有1500萬頁面的天氣預報平台、Shopify電商網站,甚至美國政府官網,都遭遇了相同狀況。
根據美國政府官方分析網站「Analytics.usa.gov」數據,過去90天內,美國政府網站14.7%的訪問來自蘭州,6.6%來自新加坡,使這兩個城市成為全球最「關心」美國政府資訊的地方——但這顯然不符合常理。
蘭州作為中國西北部的工業城市,以重工業和絲路貿易中心聞名,既非科技中心,也不是數據中心聚集地。為何會產生如此大量的網路流量?
雲端巨頭的影子
自動化流量分析公司Known Agents創辦人加文·金恩深入調查後,發現了關鍵線索。這些機器人流量都經由中國主要雲端服務商的伺服器路由,包括騰訊、阿里巴巴和華為的自治系統編號(ASN)。
2025年,AI機器人已占據網路流量的重要比例,它們爬取網路文本和資訊來餵養大型語言模型。但這波來自中國的機器人與其他AI機器人有顯著差異。
首先是數量龐大。在金恩的網站上,中國和新加坡流量占總流量的22%,而其他所有AI機器人加起來還不到10%。
其次是刻意偽裝。OpenAI、Google等主流AI公司通常會清楚標識自己的機器人,方便網站管理者識別和封鎖。但這些中國機器人從一開始就偽裝成正常人類用戶,甚至繞過了常見的機器人防護措施。
華人世界的不同反應
這個現象在華人世界引發了不同的討論。在台灣,網路安全專家擔心這可能是更大規模數據收集行動的一部分;在香港,科技業者關注這是否會影響本地網站的廣告收益;在東南亞華人社群中,則有人質疑這是否與地緣政治有關。
有趣的是,這些機器人雖然表面上來自中國大陸,但最終都通過新加坡的伺服器進行路由。這個技術細節讓人思考:在全球化的網路基礎設施中,「來源」的定義變得越來越模糊。
網站經營者的自救行動
面對平台業者的沉默,網站經營者開始自力救濟。在Reddit等社群平台上,受害者分享識別和封鎖這些機器人的方法:它們通常使用舊版Windows作業系統和不常見的螢幕比例。
天氣網站管理員安迪通過封鎖四個與中國雲端巨頭相關的ASN,成功將每日機器人訪問量從高峰期的12.7萬次降至2千次左右。
但這種「地理封鎖」策略也帶來了道德困境:是否應該因為機器人問題而拒絕整個國家或地區的真實用戶?
商業影響與數據扭曲
對於依賴廣告收入的網站經營者,這個問題更加嚴重。Google AdSense等廣告系統會將高機器人流量的網站視為低價值,導致廣告單價下降。金特羅抱怨:「這正在摧毀我的AdSense策略,因為系統認為我的網站只有機器人訪問,內容對觀眾沒有價值。」
此外,扭曲的分析數據也讓網站經營者難以了解真實的用戶行為和偏好,影響內容策略和商業決策。
相关文章
Anthropic在倫敦舉辦的Code with Claude開發者活動中,近半數與會者承認曾將AI生成的程式碼未經審查直接部署上線。這個趨勢對軟體產業意味著什麼?
Meta發布iPhone新應用Forum,將Facebook群組與AI聊天機器人整合,直接挑戰Reddit與ChatGPT。華人社群將如何回應這場社群媒體的AI化實驗?
美國一起空難的飛行員聲音遭AI復原並在網路流傳,NTSB緊急關閉公開資料庫。這起事件揭示了AI時代「公開資訊」與「隱私保護」之間正在崩解的界線。
Google I/O上,DeepMind執行長宣稱「站在奇點山麓」。從AlphaFold到Gemini for Science,科學AI的典範正在轉移,這對亞洲科研與產業意味著什麼?
观点
分享你对这篇文章的看法
登录加入讨论