위키피디아가 AI의 뇌가 된다면, 누가 그 뇌를 관리할까?
위키피디아가 아마존, 메타, 마이크로소프트 등 주요 AI 기업과 파트너십을 맺으면서, 전 세계 소수의 편집자들이 AI 시대 지식의 품질을 좌우하는 막중한 책임을 떠안게 됐다.
전 세계 ChatGPT와 Gemini 사용자들이 질문을 던질 때, 그 답변의 상당 부분이 이제 위키피디아에서 나온다. 1월 15일 위키미디어 재단이 아마존, 메타, 마이크로소프트, 미스트랄AI, 퍼플렉시티 등 주요 AI 기업과 파트너십을 발표하면서, 위키피디아는 사실상 AI의 '뇌'가 됐다.
이 파트너십을 통해 AI 모델들은 350개 언어의 위키피디아, 75개 언어의 위키북스, 190개 이상 언어의 위키낱말사전에 접근할 수 있게 됐다. 문제는 이 방대한 지식을 관리하는 사람들이 생각보다 적다는 것이다.
소수가 만드는 다수의 지식
영어 위키피디아에는 월 284,000명의 편집자가 활동하고, 이 중 30,000명이 월 5회 이상 편집한다. 프랑스어, 스페인어 위키피디아도 수만 명의 편집자를 보유하고 있다. 하지만 9,600만 명이 사용하는 텔루구어 위키피디아는 고작 수백 명의 편집자만 있을 뿐이다.
13년간 텔루구어 위키피디아에 10,700개 기사를 기여한 영화감독 프라나이라지 반가리는 "지역 기여자들은 AI가 절대 복제할 수 없는 언어적 미묘함과 문화적 맥락을 이해한다"며 "강력한 인간 개입 없이는 AI가 오히려 영어와 지역 언어 위키피디아 간 격차를 벌릴 수 있다"고 경고했다.
실제로 AI는 지역 언어로 기본적인 질문에도 제대로 답하지 못하는 경우가 많다. 스웨덴 살그렌스카 대학병원의 연구원 네타 후세인은 "편집자로서 이제는 단순히 기사를 쓰는 것을 넘어 지식 격차를 찾아 메우고, 검증을 강화하며, 중립성을 유지하는 데 더 많은 시간을 할애해야 한다"고 말했다.
AI와 싸우는 AI
역설적이게도 위키피디아 편집자들은 AI 생성 콘텐츠와 싸우기 위해 AI 도구를 사용하고 있다. 위키미디어 재단의 마셜 밀러 제품 총괄은 "자원봉사자들이 수년에 걸쳐 개발한 정교한 규칙과 도구들이 위키피디아의 면역 체계 역할을 한다"며 "현재 이들은 무책임하게 사용된 생성형 AI의 저품질 콘텐츠라는 새로운 도전에 맞서 면역 체계를 진화시키고 있다"고 설명했다.
2024년 이후 자원봉사자들은 4,800개 이상의 AI 생성 의심 기사를 신고했다. 프린스턴 대학교 연구에 따르면, 영어 위키피디아 신규 페이지의 5%가 AI 생성 텍스트를 포함하고 있었다. 문제는 지역 언어 편집자들이 더 적은 자원으로 같은 문제에 직면하고 있다는 점이다.
반가리는 "일반적인 언어, 신뢰할 수 없거나 가짜 인용문, 적절한 증거 없이 확신에 찬 주장들로 가득한 AI 생성 기사들을 마주쳤다"고 전했다.
한국에서는 어떨까?
한국어 위키피디아도 비슷한 도전에 직면해 있다. 네이버나 카카오가 자체 AI 서비스를 개발하면서 위키피디아 데이터를 활용할 가능성이 높은 상황에서, 한국어 콘텐츠의 품질 관리는 더욱 중요해졌다.
특히 K-팝, 한국 드라마, 한국 기업 관련 정보는 전 세계적으로 높은 관심을 받고 있어, 이러한 정보의 정확성이 한국의 소프트파워에도 영향을 미칠 수 있다.
텔루구어 위키피디아 편집자 라비 찬드라 에나간티는 "위키피디아가 검증되고 신뢰할 수 있는 출처를 기반으로 구축되기 때문에, AI 도구가 신뢰할 수 없는 출처보다는 우리 데이터를 스크래핑하는 것이 실제로 좋은 일"이라며 "인터넷의 '뇌'가 양질의 콘텐츠로 훈련되기를 원한다"고 말했다.
기자
관련 기사
월드 모델이 AI의 다음 단계로 주목받고 있다. 단순한 패턴 인식을 넘어 세계를 추론하는 AI는 무엇이 다르고, 우리 삶에 어떤 변화를 가져올까.
월스트리트저널 출신 기자 조애나 스턴이 1년간 AI와 함께 생활한 실험의 결론. 휴머노이드 로봇은 아직 멀었고, 웨어러블 AI는 가능성이 있다. 소비자 AI의 현주소를 냉정하게 진단한다.
LLM, RAG, 환각, 추론 모델… AI가 만들어낸 새 언어들의 실제 의미와 그 이면의 맥락을 짚는다. 기술 전문가도 헷갈리는 AI 핵심 개념 완전 해설.
AI는 이미 일상 깊숙이 들어왔다. 그런데 우리는 이 기술을 너무 많이 쓰는 걸까, 아직 덜 쓰는 걸까? MIT 테크놀로지 리뷰가 진단한 'AI 말레즈' 시대의 의미를 짚는다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요