神秘機器人大軍席捲全球網站,幕後黑手成謎
來自蘭州和新加坡的大量機器人訪問全球網站,疑似AI訓練數據收集,但真實目的仍不明
在波哥大經營超自然現象部落格的亞歷山德羅·金特羅,去年10月一度以為自己在中國爆紅了。這個用「西班牙英語」撰寫幽靈和外星人文章的網站,突然湧入大量來自中國和新加坡的流量,甚至占了過去12個月總訪問量的一半以上。
但當金特羅深入分析數據時,發現了詭異之處:所有中國訪客都來自蘭州這一個城市,平均停留時間0秒,既不滾動頁面也不點擊任何內容。「這些根本不是人類」,他很快意識到自己的網站正遭受機器人轟炸。
全球性異常現象
金特羅並非個案。印度的生活雜誌、加拿大小島部落格、個人作品集網站、擁有1500萬頁面的天氣預報平台、Shopify電商網站,甚至美國政府官網,都遭遇了相同狀況。
根據美國政府官方分析網站「Analytics.usa.gov」數據,過去90天內,美國政府網站14.7%的訪問來自蘭州,6.6%來自新加坡,使這兩個城市成為全球最「關心」美國政府資訊的地方——但這顯然不符合常理。
蘭州作為中國西北部的工業城市,以重工業和絲路貿易中心聞名,既非科技中心,也不是數據中心聚集地。為何會產生如此大量的網路流量?
雲端巨頭的影子
自動化流量分析公司Known Agents創辦人加文·金恩深入調查後,發現了關鍵線索。這些機器人流量都經由中國主要雲端服務商的伺服器路由,包括騰訊、阿里巴巴和華為的自治系統編號(ASN)。
2025年,AI機器人已占據網路流量的重要比例,它們爬取網路文本和資訊來餵養大型語言模型。但這波來自中國的機器人與其他AI機器人有顯著差異。
首先是數量龐大。在金恩的網站上,中國和新加坡流量占總流量的22%,而其他所有AI機器人加起來還不到10%。
其次是刻意偽裝。OpenAI、Google等主流AI公司通常會清楚標識自己的機器人,方便網站管理者識別和封鎖。但這些中國機器人從一開始就偽裝成正常人類用戶,甚至繞過了常見的機器人防護措施。
華人世界的不同反應
這個現象在華人世界引發了不同的討論。在台灣,網路安全專家擔心這可能是更大規模數據收集行動的一部分;在香港,科技業者關注這是否會影響本地網站的廣告收益;在東南亞華人社群中,則有人質疑這是否與地緣政治有關。
有趣的是,這些機器人雖然表面上來自中國大陸,但最終都通過新加坡的伺服器進行路由。這個技術細節讓人思考:在全球化的網路基礎設施中,「來源」的定義變得越來越模糊。
網站經營者的自救行動
面對平台業者的沉默,網站經營者開始自力救濟。在Reddit等社群平台上,受害者分享識別和封鎖這些機器人的方法:它們通常使用舊版Windows作業系統和不常見的螢幕比例。
天氣網站管理員安迪通過封鎖四個與中國雲端巨頭相關的ASN,成功將每日機器人訪問量從高峰期的12.7萬次降至2千次左右。
但這種「地理封鎖」策略也帶來了道德困境:是否應該因為機器人問題而拒絕整個國家或地區的真實用戶?
商業影響與數據扭曲
對於依賴廣告收入的網站經營者,這個問題更加嚴重。Google AdSense等廣告系統會將高機器人流量的網站視為低價值,導致廣告單價下降。金特羅抱怨:「這正在摧毀我的AdSense策略,因為系統認為我的網站只有機器人訪問,內容對觀眾沒有價值。」
此外,扭曲的分析數據也讓網站經營者難以了解真實的用戶行為和偏好,影響內容策略和商業決策。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
Wikipedia因DDoS攻擊和內容篡改全面禁用Archive.today,凸顯數位檔案保存的信任與監管難題。
烏克蘭男子協助北韓IT工作者使用竊取身份進入美國企業工作,資金流向核武計畫。揭露全球企業面臨的新型安全威脅。
OpenAI公布印度用戶數據:18-24歲佔ChatGPT訊息量50%,程式開發使用率為全球3倍。這對亞洲AI市場意味著什麼?
微軟員工博文建議使用哈利波特書籍訓練AI模型引發爭議後被刪除,凸顯AI訓練數據版權問題的複雜性。
观点
分享你对这篇文章的看法
登录加入讨论