유튜버들이 AI 기업들을 상대로 벌이는 '데이터 전쟁
구독자 620만 명을 보유한 유튜버들이 스냅챗까지 상대로 집단소송을 제기했다. AI 학습용 동영상 무단 수집에 맞서는 창작자들의 반격이 본격화되고 있다.
620만 명의 구독자를 보유한 유튜버들이 이번엔 스냅챗을 상대로 집단소송을 제기했다. 자신들의 동영상이 AI 학습에 무단으로 사용됐다는 이유에서다.
이들은 이미 엔비디아, 메타, 바이트댄스를 상대로 비슷한 소송을 진행 중이었다. 이번 스냅챗 소송으로 AI 기업들을 상대로 한 '데이터 전쟁'이 본격화되고 있는 모습이다.
스냅챗의 'HD-VILA-100M' 논란
지난 금요일 캘리포니아 중부지방법원에 제출된 소장에 따르면, 유튜버들은 스냅챗이 자사의 AI 기능인 '이매진 렌즈'를 위해 그들의 동영상 콘텐츠를 무단으로 학습시켰다고 주장한다. 이매진 렌즈는 사용자가 텍스트 명령어로 이미지를 편집할 수 있게 해주는 기능이다.
특히 문제가 된 것은 HD-VILA-100M이라는 대규모 비디오-언어 데이터셋이다. 이 데이터셋은 원래 학술 연구 목적으로만 설계됐지만, 스냅챗이 상업적 용도로 활용했다는 것이 원고들의 주장이다.
소송을 주도하는 것은 552만 명의 구독자를 보유한 'h3h3' 채널과 골프 관련 소규모 채널들이다. 이들은 스냅챓이 유튜브의 기술적 제한, 서비스 약관, 라이선스 제한을 우회해 자신들의 콘텐츠를 수집했다고 주장한다.
창작자 vs AI 기업, 승부의 향방은?
저작권 연합(Copyright Alliance)에 따르면, 현재 AI 기업들을 상대로 70건 이상의 저작권 침해 소송이 진행 중이다. 출판사, 작가, 신문사, 아티스트 등 다양한 창작자들이 AI 기업들과 법정에서 맞서고 있는 상황이다.
하지만 결과는 엇갈리고 있다. 메타와 작가들 간의 소송에서는 법원이 메타의 손을 들어줬다. 반면 앤트로픽은 작가들과 합의하며 배상금을 지급하기로 했다. 대부분의 소송은 여전히 진행 중이다.
이번 스냅챗 소송의 결과가 주목받는 이유는 단순히 한 기업의 문제가 아니기 때문이다. AI 기업들이 학습 데이터를 수집하는 방식 전반에 대한 법적 기준을 제시할 수 있는 사안이다.
한국 창작자들에게도 남의 일이 아닌 이유
이 문제는 한국 창작자들에게도 직결된다. 네이버의 하이퍼클로바X, 카카오의 AI 서비스들도 대량의 데이터 학습이 필요하기 때문이다. 국내 유튜버들의 콘텐츠가 AI 학습에 사용되고 있을 가능성을 배제할 수 없다.
특히 한국의 K-콘텐츠가 글로벌 AI 기업들의 주요 학습 대상이 될 수 있다는 점에서 더욱 그렇다. BTS부터 스쿼드 게임까지, 한국 창작자들의 콘텐츠가 해외 AI 기업들에 의해 무단으로 활용될 경우 어떤 보상을 받을 수 있을지는 여전히 불분명하다.
현재 국내에서는 AI 학습 데이터 수집에 대한 명확한 가이드라인이 부족한 상황이다. 미국에서 진행 중인 이런 소송들의 결과가 국내 정책 수립에도 영향을 미칠 가능성이 높다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
OpenAI CEO 샘 올트먼은 AI가 순수한 이익만 가져온다고 말한다. 그의 블로그 포스트 '부드러운 특이점'이 60만 명에게 읽혔다. 하지만 낙관론에는 항상 가려진 것이 있다.
AI 음악 플랫폼 Suno의 저작권 필터가 무료 소프트웨어만으로 쉽게 우회된다는 사실이 밝혀졌다. 비욘세, 블랙 사바스 등 유명 곡의 모방 생성이 가능한 이 취약점은 AI 저작권 논쟁에 새로운 국면을 열고 있다.
그래머리가 'Superhuman'으로 리브랜딩하며 AI 생산성 플랫폼으로 전환을 선언했다. 단순 맞춤법 교정 도구에서 업무 전반을 다루는 AI 에이전트로의 도약—이 전략이 성공할 수 있을까?
Anthropic이 Claude Code의 서드파티 도구 연동을 유료화했다. OpenClaw 창업자는 "오픈소스 고사 작전"이라 비판하고, Anthropic은 "지속 가능한 성장을 위한 불가피한 선택"이라 반박한다. 누구 말이 맞을까?
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요