Liabooks Home|PRISM News
메타는 왜 80테라바이트를 몰래 내려받았나
테크AI 분석

메타는 왜 80테라바이트를 몰래 내려받았나

5분 읽기Source

메타가 AI 학습 데이터 확보를 위해 불법 토렌트를 활용했다는 소송이 진행 중이다. 대법원 판례를 방패 삼은 메타의 법적 전략과 저작권 논쟁의 핵심을 짚는다.

80테라바이트. 책으로 환산하면 수천만 권 분량이다. 메타는 이것을 토렌트로 내려받았다.

그리고 지금, 법정에서 그 대가를 치르고 있다.

무슨 일이 있었나

메타는 현재 두 건의 저작권 소송에 동시에 휘말려 있다. 하나는 책 저자들이 제기한 집단소송 Kadrey v. Meta, 다른 하나는 Entrepreneur Media가 제기한 소송이다. 두 소송 모두 메타가 AI 모델 학습을 위해 저작권이 있는 콘텐츠를 무단으로 수집했다는 주장을 담고 있지만, 법적 공격 각도가 다르다.

저자들의 집단소송은 '직접 침해' 중에서도 '배포권 침해'를 주장한다. 이를 입증하려면 메타가 토렌트를 통해 저작물 전체를 다운로드했다는 증거가 필요하다. 기술적으로 까다로운 요건이다. 토렌트 방식은 파일을 수천 조각으로 쪼개 여러 서버에서 동시에 받는 구조라, 특정 작품 전체가 메타의 서버를 거쳤는지 증명하기가 쉽지 않다.

반면 Entrepreneur Media가 꺼낸 카드는 '기여 침해(contributory infringement)'다. 이 주장의 핵심은 단순하다. 메타가 토렌트의 작동 방식을 알면서도 시딩(seeding)에 참여했다면, 타인의 불법 다운로드를 돕는 데 기여한 것이라는 논리다. 토렌트에서 시딩이란 자신이 받은 파일을 다른 사람이 내려받을 수 있도록 업로드해주는 행위다. 즉, 메타가 단순히 파일을 받은 게 아니라, 불법 복제물의 유통 사슬에 능동적으로 가담했다는 것이다.

메타의 방어 전략: 대법원 판례를 방패로

메타는 최근 제출한 의견서에서 미국 대법원의 최신 판례를 전면에 내세웠다. 해당 판례는 인터넷 서비스 제공자(ISP)가 자신의 네트워크에서 발생하는 저작권 침해에 대해 책임을 지지 않는다고 판시한 것이다.

PRISM

광고주 모집

[email protected]

메타의 논리는 이렇다. "우리도 네트워크를 통해 데이터를 전송했을 뿐이다. ISP가 자신의 망을 타고 흐르는 불법 콘텐츠에 책임이 없듯, 우리도 마찬가지다."

그러나 이 비유에는 결정적인 약점이 있다. ISP는 콘텐츠를 수동적으로 통과시키는 파이프다. 반면 메타는 스스로 토렌트 클라이언트를 실행하고, 의도적으로 시딩에 참여했다는 혐의를 받고 있다. 법원이 이 차이를 어떻게 볼 것인지가 이 소송의 핵심 분기점이다.

왜 지금, 이 소송이 중요한가

AI 산업 전체가 이 법정을 주시하고 있다. 오픈AI, 구글, 앤트로픽 등 주요 AI 기업들이 모두 대규모 학습 데이터 확보 방식에 대한 법적 도전에 직면해 있기 때문이다. 메타의 사례는 그중에서도 특히 주목받는다. 토렌트라는 명백히 불법 복제와 연관된 경로를 사용했다는 점에서, 다른 기업들의 '웹 크롤링' 방식보다 법적 취약성이 훨씬 크다.

'기여 침해' 주장이 직접 침해보다 입증이 쉽다는 점도 중요하다. 만약 법원이 이 논리를 받아들인다면, AI 기업들이 학습 데이터를 수집하는 방식 전반에 경고등이 켜진다. 단순히 "우리가 직접 만든 게 아니다"라는 항변이 더 이상 통하지 않을 수 있다.

누가 어떻게 보는가

저작권자 입장에서 이 소송은 생존의 문제다. AI 기업들이 학습 데이터를 무상으로 긁어가는 동안, 그 데이터를 만든 창작자들은 아무런 보상도 받지 못했다. 소송의 승패와 무관하게, 이미 AI 학습 데이터 시장에서 저작권자의 협상력은 높아지고 있다. 뉴욕타임스오픈AI를 상대로 소송을 제기하고, 일부 출판사들이 라이선스 계약을 맺기 시작한 것이 그 신호다.

AI 개발자 입장에서는 불확실성이 가장 큰 문제다. 학습 데이터의 법적 지위가 명확하지 않은 상태에서, 어떤 데이터를 써도 되고 어떤 데이터는 안 되는지 기준이 없다. 이번 소송의 결과가 업계 전체의 가이드라인이 될 수 있다.

한국 기업 입장에서도 이 논쟁은 남의 일이 아니다. 네이버카카오는 자체 AI 모델을 개발하고 있고, 국내 스타트업들도 글로벌 오픈소스 데이터셋을 활용한다. 미국 법원의 판단이 글로벌 스탠더드가 된다면, 한국 기업들의 AI 학습 데이터 전략도 재검토가 불가피하다.

본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.

의견

관련 기사

PRISM

광고주 모집

[email protected]
PRISM

광고주 모집

[email protected]