Liabooks Home|PRISM News
ウィキペディアのデータがAIの「燃料」に。マイクロソフトとメタが新たな契約を締結
テックAI分析

ウィキペディアのデータがAIの「燃料」に。マイクロソフトとメタが新たな契約を締結

2分で読めるSource

マイクロソフトとメタがウィキメディア財団とAI学習用データの提供契約を締結。ウィキペディアの信頼性の高いデータを活用し、AIモデルの精度向上を狙います。テック界のデータ確保競争を編集長が分析。

AI開発の命運を分けるのは「データの質」です。ロイターの報道によると、ウィキペディアを運営するウィキメディア財団が、マイクロソフトおよびメタとの間でAI学習用のコンテンツ提供に関する契約を締結しました。これは、オープンな知識の宝庫が、巨大テック企業のAIモデルを支える公式な「基盤」となることを意味しています。

マイクロソフトとメタが狙う「信頼できるデータ」

なぜ、世界有数のテック企業がウィキペディアに巨額の対価を支払うのでしょうか。その理由は、AIモデルの信頼性にあります。LLM(大規模言語モデル)の学習において、インターネット上の雑多な情報よりも、人間によって精査され、引用元が明記されたウィキペディアのデータは極めて価値が高いのです。

  • ウィキメディア・エンタープライズを通じて、リアルタイムかつ大量のデータアクセスを提供。
  • AIの回答における「ハルシネーション(もっともらしい嘘)」を抑制する効果を期待。

データの有料化が進む背景

これまで多くのAI企業は、ウェブ上のデータを無償でスクレイピング(収集)してきました。しかし、著作権保護の観点や、学習データの枯渇が問題となる中で、公式なライセンス契約を結ぶ流れが加速しています。実際に、ウィキメディア財団2021年に企業向け有料サービスを開始しており、今回の契約もその延長線上にあると見られています。

本コンテンツはAIが原文記事を基に要約・分析したものです。正確性に努めていますが、誤りがある可能性があります。原文の確認をお勧めします。

意見

関連記事