AI가 소설을 통째로 베끼고 있다
세계 최고 AI 모델들이 베스트셀러 소설을 거의 그대로 복사할 수 있다는 연구 결과가 공개되면서, AI 업계의 저작권 방어 논리가 흔들리고 있다.
OpenAI, 구글, 메타의 AI 모델들이 베스트셀러 소설을 거의 원문 그대로 복사해낼 수 있다는 충격적인 연구 결과가 나왔다. 이는 AI 업계가 수십 건의 저작권 소송에서 내세우던 핵심 방어막을 뒤흔드는 발견이다.
'학습'이 아니라 '저장'이었다
최근 일련의 연구들은 OpenAI, 구글, 메타, Anthropic, xAI의 대형 언어모델들이 훈련 데이터를 이전에 생각했던 것보다 훨씬 많이 '기억'한다는 사실을 밝혀냈다.
AI 업계는 그동안 "우리 모델은 저작권 작품을 '학습'할 뿐 복사본을 저장하지 않는다"고 주장해왔다. 하지만 이번 연구는 AI가 단순히 패턴을 학습하는 게 아니라 실제로 텍스트를 거의 그대로 암기하고 있음을 보여준다.
연구진이 적절한 프롬프트를 입력하자, AI 모델들은 베스트셀러 소설의 장문 구간을 거의 원문 그대로 생성해냈다. 이는 '창작적 변형'이나 '공정 이용'의 범주를 넘어서는 수준이다.
한국 콘텐츠 업계도 주목
국내 출판업계와 엔터테인먼트 기업들도 이 문제와 무관하지 않다. 네이버 웹툰, 카카오페이지 같은 플랫폼의 콘텐츠들도 AI 훈련 데이터에 포함됐을 가능성이 높기 때문이다.
한국의 K-콘텐츠가 글로벌 AI 모델의 '무료 교재'로 사용되고 있다면, 창작자와 플랫폼의 수익 구조에 직접적인 타격이 될 수 있다. 특히 웹소설, 웹툰처럼 디지털 텍스트 형태의 콘텐츠는 더욱 취약하다.
법정에서의 판도 변화
이번 발견은 현재 진행 중인 수십 건의 저작권 소송에서 게임 체인저가 될 수 있다. AI 기업들은 그동안 "저작물의 '아이디어'만 학습했지 '표현'은 복사하지 않았다"고 주장해왔다.
하지만 AI가 원문을 거의 그대로 재현할 수 있다는 것이 입증되면, 이는 명백한 '복제'에 해당한다. 법원이 이를 어떻게 판단할지가 AI 산업의 미래를 좌우할 전망이다.
AI 전문가들은 "이번 연구 결과가 AI 기업들의 법적 방어선을 크게 약화시킬 것"이라고 분석했다. 특히 미국과 유럽에서 진행 중인 집단소송들에서 원고 측에 유리한 증거가 될 가능성이 높다.
더 근본적인 질문은 이것이다: 창작의 가치는 '새로운 조합'에 있는가, 아니면 '인간의 경험과 감정'에 있는가?
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
AI 생성 합성 미디어가 전쟁 정보전의 새 무기로 부상했다. 레고 스타일 선전 영상부터 단 1인치 조작 사진까지, 진짜와 가짜의 경계가 무너지는 지금 우리는 무엇을 믿어야 하는가.
링크드인이 사용자 브라우저 확장 프로그램을 무단 스캔했다는 혐의로 미국에서 집단소송 2건이 제기됐다. 개인정보 침해 논란의 배경과 의미를 짚는다.
미국 빅테크 규제 정치의 최전선, 워싱턴 D.C.에서 무슨 일이 벌어지고 있는가. 트럼프 행정부의 대이란 위협부터 빅테크 규제까지, 기술 정치의 지형이 흔들리고 있다.
데이터브릭스 CTO 마테이 자하리아가 ACM 컴퓨팅상을 수상했다. 그가 말하는 AGI의 현재, AI 에이전트의 위험, 그리고 AI 연구의 미래는 무엇인가.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요