당신의 전직장 업무 파일이 AI를 훈련시킨다면? OpenAI 차세대 AI 모델 성능 평가의 이면

OpenAI가 차세대 AI 모델 성능 평가를 위해 계약직원들에게 실제 업무 파일 업로드를 요청했습니다. 인간 기준점 수립을 위한 데이터 확보 전략과 영업비밀 유출 리스크를 분석합니다.

실제 업무 현장에서 작성된 문서가 인공지능 성능을 측정하는 '표준'이 된다. OpenAI가 차세대 AI 모델의 성능을 평가하기 위해 외주 계약직원들에게 과거 또는 현재 직장에서 수행한 실제 업무 과제와 결과물 파일을 업로드하도록 요청한 사실이 확인됐다.

OpenAI 차세대 AI 모델 성능 평가를 위한 '인간 기준점' 수립

외신 와이어드(WIRED)가 입수한 OpenAI 및 데이터 학습 기업 핸드쉐이크 AI(Handshake AI)의 내부 기록에 따르면, 이번 프로젝트는 AI 모델이 인간 전문가의 업무 능력을 얼마나 따라잡았는지 측정하는 '인간 기준점(human baseline)'을 만들기 위한 작업의 일환이다. OpenAI는 2024년 9월부터 다양한 산업 분야의 전문가들과 AI 성능을 비교하는 새로운 평가 프로세스를 가동해 왔다.

요청된 데이터는 단순한 요약본이 아닌 실제 업무 결과물을 포함한다. 워드 문서, PDF, 파워포인트, 엑셀은 물론 소프트웨어 저장소(repo)까지 포함된다. 예컨대 초부유층을 위한 럭셔리 컨시어지 매니저가 작성한 2페이지 분량의 요트 여행 일정표와 같은 실제 사례가 AI의 성능을 검증하는 척도로 사용되는 식이다.

영업비밀 유출 및 법적 리스크 논란

하지만 이 과정에서 심각한 법적, 윤리적 문제가 제기되고 있다. OpenAI는 계약직원들에게 개인정보와 기업의 지적재산권(IP)을 삭제 또는 익명화할 것을 지시하며 '슈퍼스타 스크러빙(Superstar Scrubbing)'이라는 도구까지 제공했다. 그러나 전문가들은 개인이 기업의 비밀 정보를 완벽하게 가려내는 것은 불가능에 가깝다고 지적한다.

지적재산권 전문 변호사 에반 브라운은 계약직원이 전직장의 문서를 공유하는 행위가 비밀유지계약(NDA) 위반은 물론 영업비밀 침해 소송으로 이어질 수 있다고 경고했다. OpenAI는 과거에도 파산한 기업의 이메일 및 내부 통신 데이터를 구매하려 시도하는 등 데이터 확보를 위해 전방위적인 노력을 기울여온 것으로 알려졌다.

구분	내용
수집 대상	실제 업무 요청서 및 결과물 파일 (Word, PDF 등)
활용 목적	차세대 AI 모델의 인간 수준 성능 측정 (AGI 달성 지표)
주요 리스크	전직장 NDA 위반, 영업비밀 유출, 데이터 익명화 한계
관련 기업	OpenAI, Handshake AI, Surge, Scale AI

OpenAI 차세대 AI 모델 성능 평가를 위한 '인간 기준점' 수립

영업비밀 유출 및 법적 리스크 논란

관련 기사