컴퓨터를 조작하는 AI가 나타났다
OpenAI GPT-5.4가 마우스와 키보드를 직접 조작할 수 있게 됐다. 사무직 업무의 판도가 바뀔 수 있을까?
마우스를 클릭하고, 키보드를 타이핑하고, 화면을 읽는다. 사람이 하는 일을 그대로 따라하는 AI가 등장했다. OpenAI가 공개한 GPT-5.4는 단순히 텍스트를 생성하는 수준을 넘어, 컴퓨터 화면을 보고 직접 조작할 수 있다.
이번 업데이트는 우연이 아니다. 최근 일부 사용자들이 Anthropic과 Google의 경쟁 모델로 이탈하면서, OpenAI가 서둘러 내놓은 대응책이다. 특히 '에이전트 작업'에 특화된 이 모델은 사무직 업무 환경을 겨냥했다.
화면을 보고 일하는 AI
GPT-5.4의 핵심은 '컴퓨터 사용' 능력이다. 주기적으로 데스크톱이나 애플리케이션 스크린샷을 찍어 상황을 파악하고, 필요에 따라 마우스 클릭이나 키보드 입력을 실행한다. 마치 옆자리 동료가 당신의 컴퓨터를 대신 조작하는 것과 같다.
OpenAI는 이를 "지식 업무를 위한 첫 번째 전용 모델"이라고 설명했다. 이메일 작성, 스프레드시트 정리, 보고서 작성 같은 반복적인 사무 업무를 자동화할 수 있다는 뜻이다.
하지만 기술적 혁신만으로는 설명되지 않는 배경이 있다. 최근 Anthropic의 Claude와 Google의 Gemini가 비슷한 기능을 먼저 선보이며 주목받았고, 일부 개발자들이 이탈하는 상황이 벌어졌다. GPT-5.4는 이런 경쟁 압박에 대한 OpenAI의 답변이다.
사무직의 미래가 바뀔까
가장 큰 변화를 체감할 곳은 사무실이다. 데이터 입력, 문서 정리, 일정 관리 같은 업무가 자동화되면서 직무의 성격 자체가 달라질 수 있다. 한국의 대기업들도 이미 주목하고 있다. 삼성전자와 LG는 내부 업무 효율화를 위한 AI 도입을 검토 중이며, 네이버와 카카오 같은 IT 기업들은 자체 AI 에이전트 개발에 박차를 가하고 있다.
하지만 모든 업무가 자동화되는 건 아니다. 창의적 판단, 고객 응대, 전략 수립 같은 영역은 여전히 사람의 몫이다. 오히려 단순 반복 업무에서 해방되면서 더 가치 있는 일에 집중할 수 있다는 긍정적 해석도 가능하다.
문제는 속도다. AI 기술 발전 속도에 비해 조직과 개인의 적응 속도가 느리다면, 일시적인 혼란이 불가피하다. 특히 중소기업이나 전통 산업에서 일하는 사무직 직장인들에게는 부담이 될 수 있다.
경쟁사들의 반격
OpenAI의 이번 발표는 AI 업계의 '군비 경쟁'을 더욱 치열하게 만들고 있다. Anthropic은 이미 Claude를 통해 컴퓨터 제어 기능을 선보였고, Google의 Gemini도 비슷한 기능을 탑재했다. 각 회사마다 접근 방식은 다르지만, 목표는 같다. 'AI 에이전트'라는 새로운 시장을 선점하는 것이다.
한국 기업들도 가만히 있지 않다. 네이버는 자체 개발한 HyperCLOVA X를 기반으로 업무 자동화 솔루션을 준비 중이며, 카카오는 KakaoBrain을 통해 기업용 AI 서비스를 확대하고 있다. 글로벌 빅테크와의 기술 격차를 줄이려는 노력이다.
문제는 데이터와 인프라다. AI가 컴퓨터를 조작하려면 방대한 학습 데이터와 실시간 처리 능력이 필요하다. 이 부분에서 OpenAI, Google, Microsoft 같은 글로벌 기업들이 압도적 우위를 점하고 있다.
기자
관련 기사
머스크 대 올트먼 재판이 공소시효 만료로 끝났다. 하지만 한 달간의 법정 공방이 드러낸 건 소송 결과가 아니라 AI 업계 최상층의 민낯이었다.
OpenAI가 ChatGPT와 Codex를 하나의 에이전트 플랫폼으로 통합하는 조직 개편을 단행했다. 그렉 브록만이 전체 프로덕트를 총괄하며, AI 에이전트 시대로의 전환을 선언했다.
일론 머스크가 OpenAI를 '두 번 죽이려 했다'는 샘 알트먼의 법정 증언. 세기의 기술 소송이 드러내는 실리콘밸리 권력 게임의 민낯.
19세 청년 샘 넬슨이 ChatGPT의 조언을 따라 크라톰과 자낙스를 혼합 복용한 뒤 사망했다. OpenAI를 상대로 한 부당사망 소송이 제기됐고, AI 신뢰 문제가 다시 수면 위로 떠올랐다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요