엔비디아 독점이 흔들린다 - OpenAI가 선택한 새로운 칩
OpenAI가 처음으로 엔비디아가 아닌 Cerebras 칩에서 GPT-5.3-Codex-Spark 모델을 구동. 15배 빠른 속도로 AI 칩 시장 판도 변화 예고
1,000토큰/초 - 이 숫자가 바꿀 것들
OpenAI가 목요일 발표한 소식은 단순한 신제품 출시가 아니었다. GPT-5.3-Codex-Spark 코딩 모델을 엔비디아가 아닌 Cerebras 칩에서 구동한다고 밝혔기 때문이다. 이는 OpenAI가 상용 모델에서 엔비디아 하드웨어를 벗어난 첫 사례다.
새 모델의 처리 속도는 초당 1,000토큰 이상. 이전 모델보다 15배 빨라진 수치다. 비교해보면 Anthropic의 Claude Opus 4.6 프리미엄 고속 모드가 표준 속도(68.2토큰/초)의 2.5배 정도 나오는 수준이다.
개발자들이 주목하는 이유
Codex-Spark는 월 200달러ChatGPT Pro 구독자에게 연구 미리보기로 제공된다. Codex 앱, 명령줄 인터페이스, VS Code 확장을 통해 접근할 수 있다. OpenAI는 선별된 파트너사에게 API 접근권도 제공하고 있다.
"Cerebras는 훌륭한 엔지니어링 파트너였으며, 빠른 추론을 새로운 플랫폼 기능으로 추가하게 되어 기쁩니다"라고 OpenAI 컴퓨팅 책임자 사친 카티가 밝혔다.
모델은 128,000토큰 컨텍스트 윈도우를 지원하며, 출시 시점에는 텍스트만 처리한다.
칩 전쟁의 새로운 국면
이번 발표가 중요한 건 기술적 성능을 넘어선다. 그동안 AI 업계는 엔비디아의 GPU에 의존해왔다. 공급 부족과 높은 가격이 스타트업과 중소기업의 발목을 잡았다.
Cerebras는 웨이퍼 스케일 엔진(WSE)이라는 독특한 접근법을 택했다. 일반적인 칩 여러 개를 연결하는 대신, 웨이퍼 전체를 하나의 거대한 칩으로 만드는 방식이다. 이로 인해 메모리 접근 속도가 극적으로 빨라진다.
국내 기업들도 주목할 만하다. 삼성전자와 SK하이닉스가 AI 메모리 반도체에서 강세를 보이고 있지만, 아직 AI 추론 칩 시장에서는 뚜렷한 존재감을 드러내지 못했다. 이번 사례는 엔비디아 외 선택지가 현실적으로 가능함을 보여준다.
개발자와 기업이 고민해야 할 것들
속도 향상은 분명 매력적이지만, 새로운 딜레마도 만든다. 개발자들은 이제 "어떤 칩에서 돌릴 것인가"를 고려해야 한다. 모델 최적화, 비용 구조, 공급업체 의존성까지.
특히 한국의 AI 스타트업들에게는 기회가 될 수 있다. 그동안 엔비디아 GPU 확보가 어려워 프로젝트를 미뤘던 기업들이 대안을 찾을 수 있기 때문이다. 하지만 새로운 하드웨어 생태계에 적응하는 비용도 만만치 않다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
펜타곤이 Anthropic과의 2억 달러 계약을 파기하고 OpenAI를 선택한 배경. 군사 AI의 통제권을 둘러싼 실리콘밸리와 국방부의 갈등을 분석합니다.
OpenAI GPT-5.4가 마우스와 키보드를 직접 조작할 수 있게 됐다. 사무직 업무의 판도가 바뀔 수 있을까?
트럼프 행정부가 AI 칩 수출에 대한 전면적 통제를 검토 중. 엔비디아·AMD 타격 예상되는 가운데 한국 반도체 업계에는 기회가 될 수 있을까?
OpenAI GPT-5.4, 컴퓨터 직접 조작 기능 탑재. AI 에이전트 시대의 시작인가, 새로운 위험의 시작인가?
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요