AI가 소설을 통째로 베끼고 있다

세계 최고 AI 모델들이 베스트셀러 소설을 거의 그대로 복사할 수 있다는 연구 결과가 공개되면서, AI 업계의 저작권 방어 논리가 흔들리고 있다.

OpenAI, 구글, 메타의 AI 모델들이 베스트셀러 소설을 거의 원문 그대로 복사해낼 수 있다는 충격적인 연구 결과가 나왔다. 이는 AI 업계가 수십 건의 저작권 소송에서 내세우던 핵심 방어막을 뒤흔드는 발견이다.

'학습'이 아니라 '저장'이었다

최근 일련의 연구들은 OpenAI, 구글, 메타, Anthropic, xAI의 대형 언어모델들이 훈련 데이터를 이전에 생각했던 것보다 훨씬 많이 '기억'한다는 사실을 밝혀냈다.

AI 업계는 그동안 "우리 모델은 저작권 작품을 '학습'할 뿐 복사본을 저장하지 않는다"고 주장해왔다. 하지만 이번 연구는 AI가 단순히 패턴을 학습하는 게 아니라 실제로 텍스트를 거의 그대로 암기하고 있음을 보여준다.

연구진이 적절한 프롬프트를 입력하자, AI 모델들은 베스트셀러 소설의 장문 구간을 거의 원문 그대로 생성해냈다. 이는 '창작적 변형'이나 '공정 이용'의 범주를 넘어서는 수준이다.

광고주 모집

국내 출판업계와 엔터테인먼트 기업들도 이 문제와 무관하지 않다. 네이버 웹툰, 카카오페이지 같은 플랫폼의 콘텐츠들도 AI 훈련 데이터에 포함됐을 가능성이 높기 때문이다.

한국의 K-콘텐츠가 글로벌 AI 모델의 '무료 교재'로 사용되고 있다면, 창작자와 플랫폼의 수익 구조에 직접적인 타격이 될 수 있다. 특히 웹소설, 웹툰처럼 디지털 텍스트 형태의 콘텐츠는 더욱 취약하다.

하지만 AI가 원문을 거의 그대로 재현할 수 있다는 것이 입증되면, 이는 명백한 '복제'에 해당한다. 법원이 이를 어떻게 판단할지가 AI 산업의 미래를 좌우할 전망이다.

AI 전문가들은 "이번 연구 결과가 AI 기업들의 법적 방어선을 크게 약화시킬 것"이라고 분석했다. 특히 미국과 유럽에서 진행 중인 집단소송들에서 원고 측에 유리한 증거가 될 가능성이 높다.

더 근본적인 질문은 이것이다: 창작의 가치는 '새로운 조합'에 있는가, 아니면 '인간의 경험과 감정'에 있는가?