일론 머스크가 캘리포니아와 맞붙은 진짜 이유

xAI가 AI 훈련 데이터 공개 의무화법에 반발한 배경과 AI 업계에 미치는 파급효과를 분석한다

일론 머스크의 xAI가 캘리포니아 법원에서 패했다. AB 2013이라는 법안 시행을 막으려던 가처분 신청이 기각된 것이다. 이 법은 AI 기업들에게 훈련 데이터의 출처를 공개하도록 강제한다.

머스크가 이토록 격렬하게 반발한 이유는 뭘까?

공개해야 하는 것들

AB 2013은 캘리포니아에서 접근 가능한 AI 모델을 만든 기업들에게 상당히 구체적인 정보 공개를 요구한다. 어떤 데이터셋을 사용했는지, 언제 수집했는지, 현재도 수집 중인지부터 시작해서 저작권이나 특허로 보호받는 데이터가 포함됐는지까지 밝혀야 한다.

개인정보 포함 여부, 데이터 구매나 라이선스 여부, 심지어 합성 데이터 비율까지 공개 대상이다. 합성 데이터 비율은 AI 모델의 품질을 가늠하는 지표로 활용될 수 있다.

xAI 측은 이런 공개 요구가 "신중하게 보호해온 영업비밀"을 강제로 드러내는 것이라고 주장했다.

광고주 모집

흥미롭게도 머스크는 평소 AI 투명성을 강조해왔다. OpenAI를 비영리로 설립했던 이유도 "AI의 이익이 모든 인류에게 돌아가야 한다"는 신념 때문이었다. 그런데 왜 지금은 정반대 입장을 취하고 있을까?

답은 경쟁 구도에 있다. 현재 AI 시장에서 xAI는 후발주자다. OpenAI, 구글, 앤트로픽 같은 선두 기업들과 경쟁하려면 독창적인 훈련 방식이나 데이터 조합이 핵심 무기가 될 수밖에 없다.

특히 머스크는 트위터(현 X) 데이터를 xAI 훈련에 활용하고 있다. 이런 독특한 데이터 소스 조합이 공개되면 경쟁사들이 유사한 전략을 쉽게 모방할 수 있다.

사실 이 문제는 xAI만의 고민이 아니다. 모든 AI 기업들이 같은 딜레마에 직면해 있다. 훈련 데이터 공개는 투명성과 책임감을 높이지만, 동시에 경쟁력의 핵심을 노출시킨다.

국내 기업들도 예외가 아니다. 네이버의 HyperCLOVA나 카카오브레인의 KoGPT 같은 모델들도 비슷한 투명성 요구에 직면할 가능성이 높다.