코딩도 이제 에이전트가 알아서? OpenAI의 새로운 도전

OpenAI가 macOS용 Codex 앱을 출시하며 AI 에이전트 기반 코딩 시장에 본격 진입. 개발자들의 일하는 방식이 어떻게 바뀔까?

몇 시간 만에 정교한 소프트웨어를 만든다면? OpenAI의 CEO 샘 알트만은 "아이디어를 타이핑하는 속도가 개발 속도의 한계"라고 말했다. 이제 그 말이 현실이 되고 있다.

AI가 코딩하는 시대의 새로운 경쟁자

OpenAI가 월요일 macOS용 Codex 앱을 출시했다. 이는 단순한 코딩 도구가 아니라, 여러 AI 에이전트가 동시에 작업하며 복잡한 개발 업무를 독립적으로 수행하는 시스템이다.

현재 AI 코딩 시장은 Claude Code와 Cowork 앱이 주도하고 있다. 이들은 '에이전틱 소프트웨어 개발'이라는 새로운 패러다임을 제시했다. AI 에이전트들이 인간의 지시 없이도 스스로 코딩 작업을 진행하는 방식이다.

OpenAI는 작년 4월 명령줄 도구로 시작해 한 달 후 웹 인터페이스로 확장한 Codex를 이제 본격적인 에이전트 기반 앱으로 발전시켰다. 특히 GPT-5.2-Codex 모델을 탑재해 경쟁사 대비 성능 우위를 주장하고 있다.

광고주 모집

알트만은 "복잡한 작업에서는 5.2가 압도적으로 강력한 모델"이라고 자신했다. 실제로 TerminalBench에서는 GPT-5.2가 1위를 차지했다. 하지만 상황은 그리 단순하지 않다.

Gemini 3와 Claude Opus의 에이전트들도 거의 비슷한 점수를 기록했다. 실제 소프트웨어 버그 수정 능력을 측정하는 SWE-bench에서도 GPT-5.2의 명확한 우위는 드러나지 않았다.

문제는 에이전트 기반 사용 사례를 정확히 측정하기 어렵다는 점이다. 벤치마크 점수와 실제 사용자 경험 사이에는 여전히 큰 차이가 있을 수 있다.

새 Codex 앱의 핵심은 자동화다. 백그라운드에서 자동으로 실행되는 작업을 예약할 수 있고, 결과는 큐에 저장되어 나중에 검토할 수 있다. 마치 야간에 돌아가는 개발팀을 두는 것과 같다.

흥미로운 점은 에이전트의 '성격'을 선택할 수 있다는 것이다. 실용적인 성향부터 공감적인 성향까지, 개발자의 작업 스타일에 맞춰 AI의 대화 방식을 조정할 수 있다.