당신의 전직장 업무 파일이 AI를 훈련시킨다면? OpenAI 차세대 AI 모델 성능 평가의 이면
OpenAI가 차세대 AI 모델 성능 평가를 위해 계약직원들에게 실제 업무 파일 업로드를 요청했습니다. 인간 기준점 수립을 위한 데이터 확보 전략과 영업비밀 유출 리스크를 분석합니다.
실제 업무 현장에서 작성된 문서가 인공지능 성능을 측정하는 '표준'이 된다. OpenAI가 차세대 AI 모델의 성능을 평가하기 위해 외주 계약직원들에게 과거 또는 현재 직장에서 수행한 실제 업무 과제와 결과물 파일을 업로드하도록 요청한 사실이 확인됐다.
OpenAI 차세대 AI 모델 성능 평가를 위한 '인간 기준점' 수립
외신 와이어드(WIRED)가 입수한 OpenAI 및 데이터 학습 기업 핸드쉐이크 AI(Handshake AI)의 내부 기록에 따르면, 이번 프로젝트는 AI 모델이 인간 전문가의 업무 능력을 얼마나 따라잡았는지 측정하는 '인간 기준점(human baseline)'을 만들기 위한 작업의 일환이다. OpenAI는 2024년 9월부터 다양한 산업 분야의 전문가들과 AI 성능을 비교하는 새로운 평가 프로세스를 가동해 왔다.
요청된 데이터는 단순한 요약본이 아닌 실제 업무 결과물을 포함한다. 워드 문서, PDF, 파워포인트, 엑셀은 물론 소프트웨어 저장소(repo)까지 포함된다. 예컨대 초부유층을 위한 럭셔리 컨시어지 매니저가 작성한 2페이지 분량의 요트 여행 일정표와 같은 실제 사례가 AI의 성능을 검증하는 척도로 사용되는 식이다.
영업비밀 유출 및 법적 리스크 논란
하지만 이 과정에서 심각한 법적, 윤리적 문제가 제기되고 있다. OpenAI는 계약직원들에게 개인정보와 기업의 지적재산권(IP)을 삭제 또는 익명화할 것을 지시하며 '슈퍼스타 스크러빙(Superstar Scrubbing)'이라는 도구까지 제공했다. 그러나 전문가들은 개인이 기업의 비밀 정보를 완벽하게 가려내는 것은 불가능에 가깝다고 지적한다.
지적재산권 전문 변호사 에반 브라운은 계약직원이 전직장의 문서를 공유하는 행위가 비밀유지계약(NDA) 위반은 물론 영업비밀 침해 소송으로 이어질 수 있다고 경고했다. OpenAI는 과거에도 파산한 기업의 이메일 및 내부 통신 데이터를 구매하려 시도하는 등 데이터 확보를 위해 전방위적인 노력을 기울여온 것으로 알려졌다.
| 구분 | 내용 |
|---|---|
| 수집 대상 | 실제 업무 요청서 및 결과물 파일 (Word, PDF 등) |
| 활용 목적 | 차세대 AI 모델의 인간 수준 성능 측정 (AGI 달성 지표) |
| 주요 리스크 | 전직장 NDA 위반, 영업비밀 유출, 데이터 익명화 한계 |
| 관련 기업 | OpenAI, Handshake AI, Surge, Scale AI |
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
오픈AI가 매주 2억 3천만 명이 사용하는 건강 질문 수요를 겨냥해 '챗GPT 헬스'를 출시합니다. 애플 헬스 등 외부 데이터와의 연동 및 프라이버시 보호 정책을 확인하세요.
OpenAI가 개인 의료 기록과 건강 앱 데이터를 통합한 ChatGPT Health를 발표했습니다. Apple Health 등과 연동되는 이 서비스의 주요 기능과 보안 대책을 확인하세요.
알리바바의 고덕지도가 현실 세계를 시뮬레이션하는 월드 모델 'FantasyWorld'를 통해 공간 지능 경쟁에서 앞서나가고 있습니다. 스탠퍼드 벤치마크 1위를 기록한 이 기술은 AGI 구현의 핵심 단계로 평가받습니다.
소프트뱅크가 OpenAI에 총 410억 달러를 투자하며 지분 11%를 확보했습니다. 손정의 회장의 AGI 비전과 스타게이트 프로젝트를 포함한 대규모 투자 세부 내역을 확인하세요.