일론 머스크가 캘리포니아와 맞붙은 진짜 이유
xAI가 AI 훈련 데이터 공개 의무화법에 반발한 배경과 AI 업계에 미치는 파급효과를 분석한다
일론 머스크의 xAI가 캘리포니아 법원에서 패했다. AB 2013이라는 법안 시행을 막으려던 가처분 신청이 기각된 것이다. 이 법은 AI 기업들에게 훈련 데이터의 출처를 공개하도록 강제한다.
머스크가 이토록 격렬하게 반발한 이유는 뭘까?
공개해야 하는 것들
AB 2013은 캘리포니아에서 접근 가능한 AI 모델을 만든 기업들에게 상당히 구체적인 정보 공개를 요구한다. 어떤 데이터셋을 사용했는지, 언제 수집했는지, 현재도 수집 중인지부터 시작해서 저작권이나 특허로 보호받는 데이터가 포함됐는지까지 밝혀야 한다.
개인정보 포함 여부, 데이터 구매나 라이선스 여부, 심지어 합성 데이터 비율까지 공개 대상이다. 합성 데이터 비율은 AI 모델의 품질을 가늠하는 지표로 활용될 수 있다.
xAI 측은 이런 공개 요구가 "신중하게 보호해온 영업비밀"을 강제로 드러내는 것이라고 주장했다.
머스크의 딜레마
흥미롭게도 머스크는 평소 AI 투명성을 강조해왔다. OpenAI를 비영리로 설립했던 이유도 "AI의 이익이 모든 인류에게 돌아가야 한다"는 신념 때문이었다. 그런데 왜 지금은 정반대 입장을 취하고 있을까?
답은 경쟁 구도에 있다. 현재 AI 시장에서 xAI는 후발주자다. OpenAI, 구글, 앤트로픽 같은 선두 기업들과 경쟁하려면 독창적인 훈련 방식이나 데이터 조합이 핵심 무기가 될 수밖에 없다.
특히 머스크는 트위터(현 X) 데이터를 xAI 훈련에 활용하고 있다. 이런 독특한 데이터 소스 조합이 공개되면 경쟁사들이 유사한 전략을 쉽게 모방할 수 있다.
업계 전체의 고민
사실 이 문제는 xAI만의 고민이 아니다. 모든 AI 기업들이 같은 딜레마에 직면해 있다. 훈련 데이터 공개는 투명성과 책임감을 높이지만, 동시에 경쟁력의 핵심을 노출시킨다.
더 복잡한 건 저작권 문제다. 많은 AI 모델들이 인터넷에서 수집한 텍스트, 이미지, 코드를 훈련에 사용했는데, 이 중 상당수는 저작권 보호를 받는다. 공개 의무가 생기면 이런 법적 리스크가 표면화될 수 있다.
국내 기업들도 예외가 아니다. 네이버의 HyperCLOVA나 카카오브레인의 KoGPT 같은 모델들도 비슷한 투명성 요구에 직면할 가능성이 높다.
기자
관련 기사
AI 지속가능성 연구자 사샤 루치오니가 빅테크의 에너지 정보 은폐를 비판하며 새 벤처를 설립했다. AI 사용의 환경 비용, 그리고 기업과 소비자가 알아야 할 것들.
받아쓰기 앱과 AI 코딩 도구의 결합으로 사무실 풍경이 바뀌고 있다. 속삭임, 어색함, 그리고 새로운 직장 예절의 탄생을 둘러싼 이야기.
중국 AI 스타트업 Moonshot AI가 기업가치 20조원에 2조원 투자 유치. Kimi 모델이 글로벌 LLM 시장에서 OpenAI·Anthropic과 경쟁하는 구도의 의미를 분석한다.
전 AMD Silo AI CEO 피터 사를린이 설립한 핀란드 AI 스타트업 QuTwo가 3800억원 기업가치로 290억원 엔젤 투자를 유치했다. 거대 VC 자금을 거절한 이유와 유럽 AI 주권의 맥락을 분석한다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요