당신의 전직장 업무 파일이 AI를 훈련시킨다면? OpenAI 차세대 AI 모델 성능 평가의 이면
OpenAI가 차세대 AI 모델 성능 평가를 위해 계약직원들에게 실제 업무 파일 업로드를 요청했습니다. 인간 기준점 수립을 위한 데이터 확보 전략과 영업비밀 유출 리스크를 분석합니다.
실제 업무 현장에서 작성된 문서가 인공지능 성능을 측정하는 '표준'이 된다. OpenAI가 차세대 AI 모델의 성능을 평가하기 위해 외주 계약직원들에게 과거 또는 현재 직장에서 수행한 실제 업무 과제와 결과물 파일을 업로드하도록 요청한 사실이 확인됐다.
OpenAI 차세대 AI 모델 성능 평가를 위한 '인간 기준점' 수립
외신 와이어드(WIRED)가 입수한 OpenAI 및 데이터 학습 기업 핸드쉐이크 AI(Handshake AI)의 내부 기록에 따르면, 이번 프로젝트는 AI 모델이 인간 전문가의 업무 능력을 얼마나 따라잡았는지 측정하는 '인간 기준점(human baseline)'을 만들기 위한 작업의 일환이다. OpenAI는 2024년 9월부터 다양한 산업 분야의 전문가들과 AI 성능을 비교하는 새로운 평가 프로세스를 가동해 왔다.
요청된 데이터는 단순한 요약본이 아닌 실제 업무 결과물을 포함한다. 워드 문서, PDF, 파워포인트, 엑셀은 물론 소프트웨어 저장소(repo)까지 포함된다. 예컨대 초부유층을 위한 럭셔리 컨시어지 매니저가 작성한 2페이지 분량의 요트 여행 일정표와 같은 실제 사례가 AI의 성능을 검증하는 척도로 사용되는 식이다.
영업비밀 유출 및 법적 리스크 논란
하지만 이 과정에서 심각한 법적, 윤리적 문제가 제기되고 있다. OpenAI는 계약직원들에게 개인정보와 기업의 지적재산권(IP)을 삭제 또는 익명화할 것을 지시하며 '슈퍼스타 스크러빙(Superstar Scrubbing)'이라는 도구까지 제공했다. 그러나 전문가들은 개인이 기업의 비밀 정보를 완벽하게 가려내는 것은 불가능에 가깝다고 지적한다.
지적재산권 전문 변호사 에반 브라운은 계약직원이 전직장의 문서를 공유하는 행위가 비밀유지계약(NDA) 위반은 물론 영업비밀 침해 소송으로 이어질 수 있다고 경고했다. OpenAI는 과거에도 파산한 기업의 이메일 및 내부 통신 데이터를 구매하려 시도하는 등 데이터 확보를 위해 전방위적인 노력을 기울여온 것으로 알려졌다.
| 구분 | 내용 |
|---|---|
| 수집 대상 | 실제 업무 요청서 및 결과물 파일 (Word, PDF 등) |
| 활용 목적 | 차세대 AI 모델의 인간 수준 성능 측정 (AGI 달성 지표) |
| 주요 리스크 | 전직장 NDA 위반, 영업비밀 유출, 데이터 익명화 한계 |
| 관련 기업 | OpenAI, Handshake AI, Surge, Scale AI |
기자
관련 기사
순다르 피차이가 구글 I/O 직후 인터뷰에서 밝힌 검색의 미래, AGI 타임라인, 그리고 웹 생태계의 변화. 구글 제로는 현실이 되고 있는가.
메타가 휴머노이드 로봇 스타트업 ARI를 인수했다. 소셜미디어 기업이 왜 로봇에 투자하는가? AGI로 가는 길이 물리적 세계를 통과해야 한다는 믿음이 빅테크의 전략을 바꾸고 있다.
AGI, LLM, 환각, 추론 모델… AI 업계가 쏟아내는 전문 용어들. 단순한 어휘 문제가 아니라, 기술 권력이 작동하는 방식의 문제입니다. 핵심 AI 용어 해설과 그 이면의 의미.
데이터브릭스 CTO 마테이 자하리아가 ACM 컴퓨팅상을 수상했다. 그가 말하는 AGI의 현재, AI 에이전트의 위험, 그리고 AI 연구의 미래는 무엇인가.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요