코딩도 이제 에이전트가 알아서? OpenAI의 새로운 도전
OpenAI가 macOS용 Codex 앱을 출시하며 AI 에이전트 기반 코딩 시장에 본격 진입. 개발자들의 일하는 방식이 어떻게 바뀔까?
몇 시간 만에 정교한 소프트웨어를 만든다면? OpenAI의 CEO 샘 알트만은 "아이디어를 타이핑하는 속도가 개발 속도의 한계"라고 말했다. 이제 그 말이 현실이 되고 있다.
AI가 코딩하는 시대의 새로운 경쟁자
OpenAI가 월요일 macOS용 Codex 앱을 출시했다. 이는 단순한 코딩 도구가 아니라, 여러 AI 에이전트가 동시에 작업하며 복잡한 개발 업무를 독립적으로 수행하는 시스템이다.
현재 AI 코딩 시장은 Claude Code와 Cowork 앱이 주도하고 있다. 이들은 '에이전틱 소프트웨어 개발'이라는 새로운 패러다임을 제시했다. AI 에이전트들이 인간의 지시 없이도 스스로 코딩 작업을 진행하는 방식이다.
OpenAI는 작년 4월 명령줄 도구로 시작해 한 달 후 웹 인터페이스로 확장한 Codex를 이제 본격적인 에이전트 기반 앱으로 발전시켰다. 특히 GPT-5.2-Codex 모델을 탑재해 경쟁사 대비 성능 우위를 주장하고 있다.
벤치마크 vs 실제 사용 경험의 간극
알트만은 "복잡한 작업에서는 5.2가 압도적으로 강력한 모델"이라고 자신했다. 실제로 TerminalBench에서는 GPT-5.2가 1위를 차지했다. 하지만 상황은 그리 단순하지 않다.
Gemini 3와 Claude Opus의 에이전트들도 거의 비슷한 점수를 기록했다. 실제 소프트웨어 버그 수정 능력을 측정하는 SWE-bench에서도 GPT-5.2의 명확한 우위는 드러나지 않았다.
문제는 에이전트 기반 사용 사례를 정확히 측정하기 어렵다는 점이다. 벤치마크 점수와 실제 사용자 경험 사이에는 여전히 큰 차이가 있을 수 있다.
개발자의 일상을 바꿀 새로운 기능들
새 Codex 앱의 핵심은 자동화다. 백그라운드에서 자동으로 실행되는 작업을 예약할 수 있고, 결과는 큐에 저장되어 나중에 검토할 수 있다. 마치 야간에 돌아가는 개발팀을 두는 것과 같다.
흥미로운 점은 에이전트의 '성격'을 선택할 수 있다는 것이다. 실용적인 성향부터 공감적인 성향까지, 개발자의 작업 스타일에 맞춰 AI의 대화 방식을 조정할 수 있다.
기자
관련 기사
OpenAI가 보안 특화 AI 이니셔티브 'Daybreak'를 출시했다. Codex 에이전트를 활용해 취약점을 공격자보다 먼저 탐지·패치하는 이 서비스는 Anthropic의 Claude Mythos와 정면 경쟁 구도를 형성한다.
일론 머스크와 샘 올트먼의 세기의 재판 2주차. 그렉 브록만의 증언이 공개되며 OpenAI 창업 당시의 권력 다툼이 낱낱이 드러났다. 1조 달러 IPO가 흔들린다.
연방법원에 공개된 2017~2018년 이메일이 드러낸 MS-OpenAI 파트너십의 숨겨진 이면. 사티아 나델라와 임원들이 나눈 솔직한 내부 대화를 분석한다.
2023년 추수감사절 직전 샘 알트만 해고 사태의 내막이 머스크 대 알트만 소송 증언과 증거물로 처음 공개됐다. 미라 무라티 전 CTO가 중심에 있다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요