ウィキペディアのデータがAIの「燃料」に。マイクロソフトとメタが新たな契約を締結
マイクロソフトとメタがウィキメディア財団とAI学習用データの提供契約を締結。ウィキペディアの信頼性の高いデータを活用し、AIモデルの精度向上を狙います。テック界のデータ確保競争を編集長が分析。
AI開発の命運を分けるのは「データの質」です。ロイターの報道によると、ウィキペディアを運営するウィキメディア財団が、マイクロソフトおよびメタとの間でAI学習用のコンテンツ提供に関する契約を締結しました。これは、オープンな知識の宝庫が、巨大テック企業のAIモデルを支える公式な「基盤」となることを意味しています。
マイクロソフトとメタが狙う「信頼できるデータ」
なぜ、世界有数のテック企業がウィキペディアに巨額の対価を支払うのでしょうか。その理由は、AIモデルの信頼性にあります。LLM(大規模言語モデル)の学習において、インターネット上の雑多な情報よりも、人間によって精査され、引用元が明記されたウィキペディアのデータは極めて価値が高いのです。
- ウィキメディア・エンタープライズを通じて、リアルタイムかつ大量のデータアクセスを提供。
- AIの回答における「ハルシネーション(もっともらしい嘘)」を抑制する効果を期待。
データの有料化が進む背景
これまで多くのAI企業は、ウェブ上のデータを無償でスクレイピング(収集)してきました。しかし、著作権保護の観点や、学習データの枯渇が問題となる中で、公式なライセンス契約を結ぶ流れが加速しています。実際に、ウィキメディア財団は2021年に企業向け有料サービスを開始しており、今回の契約もその延長線上にあると見られています。
本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。
関連記事
25周年を迎えたWikipedia。政治的圧力とAIによるデータ搾取、そしてボランティア減少という多重苦に対し、知の共有地をどう守るべきか。その現在地を分析します。
マイクロソフトはインドのVaraha社と2029年までに10万トン以上の炭素除去クレジットを購入する契約を締結。AI拡大による排出量増加に対し、バイオ炭技術で対抗します。
マイクロソフトが2026年1月13日に発表した「Community-First AI Infrastructure」構想。データセンターの電気代全額負担と減税拒否を通じ、2030年に945 TWhまで急増する電力需要と地域社会の歪みに正面から向き合う戦略を分析します。
Windows 11のファイルエクスプローラーにAIアシスタント「Copilot」が統合される可能性が浮上。プレビュービルドで見つかった新機能の内容と、ユーザーからの反発について首席エディターが解説します。