科技AI分析
維基百科成AI訓練金礦:微軟、Meta 搶先簽署內容授權協議
2分钟阅读Source
微軟與 Meta 已與維基媒體基金會簽署協議,獲取維基百科數據以訓練 AI 模型。這場合作凸顯了高品質數據在 AI 競賽中的核心地位。PRISM 深度解析數據授權背後的產業變局。
數據即是 AI 時代的「石油」。根據路透社報導,維基百科的運營方維基媒體基金會(Wikimedia Foundation)已與微軟及Meta正式簽署協議,授權其使用維基百科的龐大內容進行 AI 模型訓練。這標誌著開源知識庫已正式成為大型語言模型不可或缺的商業基石。
微軟與 Meta 為何急於鎖定維基數據?
在 AI 領域,高品質的標註數據極其稀缺。維基百科憑藉其多語言、經過人工編輯且結構清晰的特點,成為訓練LLM(大型語言模型)的頂級教材。科技巨頭此舉旨在解決 AI 常見的「幻覺」問題,提升回答的準確性。
數據授權:從「無償抓取」到「有償購買」
隨著版權法規日趨嚴格,過去科技公司依賴網路爬蟲「白嫖」數據的做法已難以為繼。目前,維基媒體基金會已將此服務轉化為穩定的收入來源。據悉,這筆資金將用於維護基金會的日常運作,確保這座「網路百科全書」能持續服務全球讀者。
本内容由AI根据原文进行摘要和分析。我们力求准确,但可能存在错误,建议核实原文。
相关文章
科技CN
微軟新Xbox打破藩籬,遊戲主機市場將重新洗牌?
微軟Project Helix將同時支援Xbox與PC遊戲,挑戰傳統主機生態。分析對亞洲市場與華人玩家的影響
科技CN
微軟「Project Helix」揭曉:遊戲機與PC的邊界即將消失
微軟次世代Xbox「Project Helix」將支援PC遊戲運行,打破傳統主機限制。這對亞洲遊戲市場意味著什麼?
科技CN
Meta智慧眼鏡私密影像疑遭肯亞外包商檢視
瑞典媒體調查發現Meta智慧眼鏡錄製的浴室、親密畫面可能被送至肯亞人工審查員檢視,引發隱私權集體訴訟,凸顯全球科技巨頭數據處理透明度問題。
科技CN
Meta向歐盟讓步:WhatsApp暫時開放第三方AI,代價不菲
Meta為避免歐盟重大調查,宣布12個月內在歐洲開放WhatsApp Business API給第三方AI聊天機器人,但收費策略暗藏玄機
观点
分享你对这篇文章的看法
登录加入讨论