AI가 소설을 통째로 베끼고 있다
세계 최고 AI 모델들이 베스트셀러 소설을 거의 그대로 복사할 수 있다는 연구 결과가 공개되면서, AI 업계의 저작권 방어 논리가 흔들리고 있다.
OpenAI, 구글, 메타의 AI 모델들이 베스트셀러 소설을 거의 원문 그대로 복사해낼 수 있다는 충격적인 연구 결과가 나왔다. 이는 AI 업계가 수십 건의 저작권 소송에서 내세우던 핵심 방어막을 뒤흔드는 발견이다.
'학습'이 아니라 '저장'이었다
최근 일련의 연구들은 OpenAI, 구글, 메타, Anthropic, xAI의 대형 언어모델들이 훈련 데이터를 이전에 생각했던 것보다 훨씬 많이 '기억'한다는 사실을 밝혀냈다.
AI 업계는 그동안 "우리 모델은 저작권 작품을 '학습'할 뿐 복사본을 저장하지 않는다"고 주장해왔다. 하지만 이번 연구는 AI가 단순히 패턴을 학습하는 게 아니라 실제로 텍스트를 거의 그대로 암기하고 있음을 보여준다.
연구진이 적절한 프롬프트를 입력하자, AI 모델들은 베스트셀러 소설의 장문 구간을 거의 원문 그대로 생성해냈다. 이는 '창작적 변형'이나 '공정 이용'의 범주를 넘어서는 수준이다.
한국 콘텐츠 업계도 주목
국내 출판업계와 엔터테인먼트 기업들도 이 문제와 무관하지 않다. 네이버 웹툰, 카카오페이지 같은 플랫폼의 콘텐츠들도 AI 훈련 데이터에 포함됐을 가능성이 높기 때문이다.
한국의 K-콘텐츠가 글로벌 AI 모델의 '무료 교재'로 사용되고 있다면, 창작자와 플랫폼의 수익 구조에 직접적인 타격이 될 수 있다. 특히 웹소설, 웹툰처럼 디지털 텍스트 형태의 콘텐츠는 더욱 취약하다.
법정에서의 판도 변화
이번 발견은 현재 진행 중인 수십 건의 저작권 소송에서 게임 체인저가 될 수 있다. AI 기업들은 그동안 "저작물의 '아이디어'만 학습했지 '표현'은 복사하지 않았다"고 주장해왔다.
하지만 AI가 원문을 거의 그대로 재현할 수 있다는 것이 입증되면, 이는 명백한 '복제'에 해당한다. 법원이 이를 어떻게 판단할지가 AI 산업의 미래를 좌우할 전망이다.
AI 전문가들은 "이번 연구 결과가 AI 기업들의 법적 방어선을 크게 약화시킬 것"이라고 분석했다. 특히 미국과 유럽에서 진행 중인 집단소송들에서 원고 측에 유리한 증거가 될 가능성이 높다.
더 근본적인 질문은 이것이다: 창작의 가치는 '새로운 조합'에 있는가, 아니면 '인간의 경험과 감정'에 있는가?
기자
관련 기사
구글이 AI 에이전트를 통해 사용자 개입 없이 스스로 정보를 검색하는 미래를 설계 중이다. 검색 엔진의 정의가 바뀌면 정보 권력의 구조도 바뀐다.
2026년 미국 졸업식에서 AI를 찬양한 기업인들이 학생들의 야유를 받았다. 취업 절벽 앞에 선 청년들의 분노가 바이럴 영상으로 번지며 AI 낙관론에 균열을 내고 있다.
구글이 IO 2026에서 공개한 Gmail Live는 자연어 음성으로 받은편지함을 검색하는 AI 기능이다. 편리함 이면의 데이터 의존과 AI 피로감 문제를 짚는다.
필리핀 가상 비서들이 AI를 이용해 LinkedIn 임원 계정을 대신 운영하는 산업의 실태. 하루 30~40개 댓글, 가짜 팔로워, '좋아요' 품앗이까지 — 직업적 진정성의 의미를 묻는다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요