코딩도 이제 에이전트가 알아서? OpenAI의 새로운 도전
OpenAI가 macOS용 Codex 앱을 출시하며 AI 에이전트 기반 코딩 시장에 본격 진입. 개발자들의 일하는 방식이 어떻게 바뀔까?
몇 시간 만에 정교한 소프트웨어를 만든다면? OpenAI의 CEO 샘 알트만은 "아이디어를 타이핑하는 속도가 개발 속도의 한계"라고 말했다. 이제 그 말이 현실이 되고 있다.
AI가 코딩하는 시대의 새로운 경쟁자
OpenAI가 월요일 macOS용 Codex 앱을 출시했다. 이는 단순한 코딩 도구가 아니라, 여러 AI 에이전트가 동시에 작업하며 복잡한 개발 업무를 독립적으로 수행하는 시스템이다.
현재 AI 코딩 시장은 Claude Code와 Cowork 앱이 주도하고 있다. 이들은 '에이전틱 소프트웨어 개발'이라는 새로운 패러다임을 제시했다. AI 에이전트들이 인간의 지시 없이도 스스로 코딩 작업을 진행하는 방식이다.
OpenAI는 작년 4월 명령줄 도구로 시작해 한 달 후 웹 인터페이스로 확장한 Codex를 이제 본격적인 에이전트 기반 앱으로 발전시켰다. 특히 GPT-5.2-Codex 모델을 탑재해 경쟁사 대비 성능 우위를 주장하고 있다.
벤치마크 vs 실제 사용 경험의 간극
알트만은 "복잡한 작업에서는 5.2가 압도적으로 강력한 모델"이라고 자신했다. 실제로 TerminalBench에서는 GPT-5.2가 1위를 차지했다. 하지만 상황은 그리 단순하지 않다.
Gemini 3와 Claude Opus의 에이전트들도 거의 비슷한 점수를 기록했다. 실제 소프트웨어 버그 수정 능력을 측정하는 SWE-bench에서도 GPT-5.2의 명확한 우위는 드러나지 않았다.
문제는 에이전트 기반 사용 사례를 정확히 측정하기 어렵다는 점이다. 벤치마크 점수와 실제 사용자 경험 사이에는 여전히 큰 차이가 있을 수 있다.
개발자의 일상을 바꿀 새로운 기능들
새 Codex 앱의 핵심은 자동화다. 백그라운드에서 자동으로 실행되는 작업을 예약할 수 있고, 결과는 큐에 저장되어 나중에 검토할 수 있다. 마치 야간에 돌아가는 개발팀을 두는 것과 같다.
흥미로운 점은 에이전트의 '성격'을 선택할 수 있다는 것이다. 실용적인 성향부터 공감적인 성향까지, 개발자의 작업 스타일에 맞춰 AI의 대화 방식을 조정할 수 있다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
디즈니 신임 CEO 조시 다마로 취임 일주일 만에 OpenAI 소라 협업과 에픽게임즈 메타버스 투자가 동시에 위기를 맞았다. 디즈니의 디지털 전략은 어디로 가는가?
OpenAI가 2024년 말 공개한 영상 생성 AI Sora 앱을 종료한다고 발표했다. 창작자 커뮤니티의 충격과 함께, AI 제품의 생존 주기에 대한 질문이 제기된다.
미 국방부가 OpenAI, xAI 등 AI 기업의 모델을 기밀 데이터로 훈련시키는 방안을 검토 중이다. 이란 분쟁이 고조되는 시점, 이 결정이 가져올 파장을 다각도로 분석한다.
미 국방부가 Anthropic과의 계약을 파기하고 자체 LLM 개발에 착수했다. OpenAI와 xAI는 계약을 체결했고, Anthropic은 법정 싸움을 선택했다. AI 안전 원칙과 군사 활용 사이의 충돌이 본격화되고 있다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요