AI가 소설을 통째로 베끼고 있다
세계 최고 AI 모델들이 베스트셀러 소설을 거의 그대로 복사할 수 있다는 연구 결과가 공개되면서, AI 업계의 저작권 방어 논리가 흔들리고 있다.
OpenAI, 구글, 메타의 AI 모델들이 베스트셀러 소설을 거의 원문 그대로 복사해낼 수 있다는 충격적인 연구 결과가 나왔다. 이는 AI 업계가 수십 건의 저작권 소송에서 내세우던 핵심 방어막을 뒤흔드는 발견이다.
'학습'이 아니라 '저장'이었다
최근 일련의 연구들은 OpenAI, 구글, 메타, Anthropic, xAI의 대형 언어모델들이 훈련 데이터를 이전에 생각했던 것보다 훨씬 많이 '기억'한다는 사실을 밝혀냈다.
AI 업계는 그동안 "우리 모델은 저작권 작품을 '학습'할 뿐 복사본을 저장하지 않는다"고 주장해왔다. 하지만 이번 연구는 AI가 단순히 패턴을 학습하는 게 아니라 실제로 텍스트를 거의 그대로 암기하고 있음을 보여준다.
연구진이 적절한 프롬프트를 입력하자, AI 모델들은 베스트셀러 소설의 장문 구간을 거의 원문 그대로 생성해냈다. 이는 '창작적 변형'이나 '공정 이용'의 범주를 넘어서는 수준이다.
한국 콘텐츠 업계도 주목
국내 출판업계와 엔터테인먼트 기업들도 이 문제와 무관하지 않다. 네이버 웹툰, 카카오페이지 같은 플랫폼의 콘텐츠들도 AI 훈련 데이터에 포함됐을 가능성이 높기 때문이다.
한국의 K-콘텐츠가 글로벌 AI 모델의 '무료 교재'로 사용되고 있다면, 창작자와 플랫폼의 수익 구조에 직접적인 타격이 될 수 있다. 특히 웹소설, 웹툰처럼 디지털 텍스트 형태의 콘텐츠는 더욱 취약하다.
법정에서의 판도 변화
이번 발견은 현재 진행 중인 수십 건의 저작권 소송에서 게임 체인저가 될 수 있다. AI 기업들은 그동안 "저작물의 '아이디어'만 학습했지 '표현'은 복사하지 않았다"고 주장해왔다.
하지만 AI가 원문을 거의 그대로 재현할 수 있다는 것이 입증되면, 이는 명백한 '복제'에 해당한다. 법원이 이를 어떻게 판단할지가 AI 산업의 미래를 좌우할 전망이다.
AI 전문가들은 "이번 연구 결과가 AI 기업들의 법적 방어선을 크게 약화시킬 것"이라고 분석했다. 특히 미국과 유럽에서 진행 중인 집단소송들에서 원고 측에 유리한 증거가 될 가능성이 높다.
더 근본적인 질문은 이것이다: 창작의 가치는 '새로운 조합'에 있는가, 아니면 '인간의 경험과 감정'에 있는가?
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
가이드랩스가 공개한 Steerling-8B는 모든 출력을 학습 데이터까지 추적할 수 있는 '해석 가능한 AI'다. 블랙박스 AI 시대가 끝나고 있을까?
휴머노이드 로봇의 화려한 데모 뒤에 숨겨진 인간 노동자들. 물리적 AI 시대의 새로운 노동 형태와 프라이버시 문제를 탐구한다.
Citrini Research가 발표한 충격적인 보고서. AI 에이전트 도입이 2년 내 실업률 2배, 주식시장 3분의 1 하락을 가져올 수 있다는 시나리오를 분석한다.
미 국방부가 앤트로픽에 '공급망 위험' 지정 위협. AI 기업의 윤리 원칙과 군사 활용 사이 갈등 본격화. 한국 방산업계에도 영향 전망
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요