Liabooks Home|PRISM News
유튜버들이 AI 기업들을 상대로 벌이는 '데이터 전쟁
테크AI 분석

유튜버들이 AI 기업들을 상대로 벌이는 '데이터 전쟁

4분 읽기Source

구독자 620만 명을 보유한 유튜버들이 스냅챗까지 상대로 집단소송을 제기했다. AI 학습용 동영상 무단 수집에 맞서는 창작자들의 반격이 본격화되고 있다.

620만 명의 구독자를 보유한 유튜버들이 이번엔 스냅챗을 상대로 집단소송을 제기했다. 자신들의 동영상이 AI 학습에 무단으로 사용됐다는 이유에서다.

이들은 이미 엔비디아, 메타, 바이트댄스를 상대로 비슷한 소송을 진행 중이었다. 이번 스냅챗 소송으로 AI 기업들을 상대로 한 '데이터 전쟁'이 본격화되고 있는 모습이다.

스냅챗의 'HD-VILA-100M' 논란

지난 금요일 캘리포니아 중부지방법원에 제출된 소장에 따르면, 유튜버들은 스냅챗이 자사의 AI 기능인 '이매진 렌즈'를 위해 그들의 동영상 콘텐츠를 무단으로 학습시켰다고 주장한다. 이매진 렌즈는 사용자가 텍스트 명령어로 이미지를 편집할 수 있게 해주는 기능이다.

특히 문제가 된 것은 HD-VILA-100M이라는 대규모 비디오-언어 데이터셋이다. 이 데이터셋은 원래 학술 연구 목적으로만 설계됐지만, 스냅챗이 상업적 용도로 활용했다는 것이 원고들의 주장이다.

소송을 주도하는 것은 552만 명의 구독자를 보유한 'h3h3' 채널과 골프 관련 소규모 채널들이다. 이들은 스냅챓이 유튜브의 기술적 제한, 서비스 약관, 라이선스 제한을 우회해 자신들의 콘텐츠를 수집했다고 주장한다.

창작자 vs AI 기업, 승부의 향방은?

저작권 연합(Copyright Alliance)에 따르면, 현재 AI 기업들을 상대로 70건 이상의 저작권 침해 소송이 진행 중이다. 출판사, 작가, 신문사, 아티스트 등 다양한 창작자들이 AI 기업들과 법정에서 맞서고 있는 상황이다.

하지만 결과는 엇갈리고 있다. 메타와 작가들 간의 소송에서는 법원이 메타의 손을 들어줬다. 반면 앤트로픽은 작가들과 합의하며 배상금을 지급하기로 했다. 대부분의 소송은 여전히 진행 중이다.

이번 스냅챗 소송의 결과가 주목받는 이유는 단순히 한 기업의 문제가 아니기 때문이다. AI 기업들이 학습 데이터를 수집하는 방식 전반에 대한 법적 기준을 제시할 수 있는 사안이다.

한국 창작자들에게도 남의 일이 아닌 이유

이 문제는 한국 창작자들에게도 직결된다. 네이버의 하이퍼클로바X, 카카오의 AI 서비스들도 대량의 데이터 학습이 필요하기 때문이다. 국내 유튜버들의 콘텐츠가 AI 학습에 사용되고 있을 가능성을 배제할 수 없다.

특히 한국의 K-콘텐츠가 글로벌 AI 기업들의 주요 학습 대상이 될 수 있다는 점에서 더욱 그렇다. BTS부터 스쿼드 게임까지, 한국 창작자들의 콘텐츠가 해외 AI 기업들에 의해 무단으로 활용될 경우 어떤 보상을 받을 수 있을지는 여전히 불분명하다.

현재 국내에서는 AI 학습 데이터 수집에 대한 명확한 가이드라인이 부족한 상황이다. 미국에서 진행 중인 이런 소송들의 결과가 국내 정책 수립에도 영향을 미칠 가능성이 높다.


본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.

의견

관련 기사