엔비디아 독점이 흔들린다 - OpenAI가 선택한 새로운 칩 | 테크

OpenAI가 처음으로 엔비디아가 아닌 Cerebras 칩에서 GPT-5.3-Codex-Spark 모델을 구동. 15배 빠른 속도로 AI 칩 시장 판도 변화 예고

1,000토큰/초 - 이 숫자가 바꿀 것들

OpenAI가 목요일 발표한 소식은 단순한 신제품 출시가 아니었다. GPT-5.3-Codex-Spark 코딩 모델을 엔비디아가 아닌 Cerebras 칩에서 구동한다고 밝혔기 때문이다. 이는 OpenAI가 상용 모델에서 엔비디아 하드웨어를 벗어난 첫 사례다.

새 모델의 처리 속도는 초당 1,000토큰 이상. 이전 모델보다 15배 빨라진 수치다. 비교해보면 Anthropic의 Claude Opus 4.6 프리미엄 고속 모드가 표준 속도(68.2토큰/초)의 2.5배 정도 나오는 수준이다.

Codex-Spark는 월 200달러ChatGPT Pro 구독자에게 연구 미리보기로 제공된다. Codex 앱, 명령줄 인터페이스, VS Code 확장을 통해 접근할 수 있다. OpenAI는 선별된 파트너사에게 API 접근권도 제공하고 있다.

"Cerebras는 훌륭한 엔지니어링 파트너였으며, 빠른 추론을 새로운 플랫폼 기능으로 추가하게 되어 기쁩니다"라고 OpenAI 컴퓨팅 책임자 사친 카티가 밝혔다.

모델은 128,000토큰 컨텍스트 윈도우를 지원하며, 출시 시점에는 텍스트만 처리한다.

광고주 모집

이번 발표가 중요한 건 기술적 성능을 넘어선다. 그동안 AI 업계는 엔비디아의 GPU에 의존해왔다. 공급 부족과 높은 가격이 스타트업과 중소기업의 발목을 잡았다.

Cerebras는 웨이퍼 스케일 엔진(WSE)이라는 독특한 접근법을 택했다. 일반적인 칩 여러 개를 연결하는 대신, 웨이퍼 전체를 하나의 거대한 칩으로 만드는 방식이다. 이로 인해 메모리 접근 속도가 극적으로 빨라진다.

국내 기업들도 주목할 만하다. 삼성전자와 SK하이닉스가 AI 메모리 반도체에서 강세를 보이고 있지만, 아직 AI 추론 칩 시장에서는 뚜렷한 존재감을 드러내지 못했다. 이번 사례는 엔비디아 외 선택지가 현실적으로 가능함을 보여준다.

속도 향상은 분명 매력적이지만, 새로운 딜레마도 만든다. 개발자들은 이제 "어떤 칩에서 돌릴 것인가"를 고려해야 한다. 모델 최적화, 비용 구조, 공급업체 의존성까지.

특히 한국의 AI 스타트업들에게는 기회가 될 수 있다. 그동안 엔비디아 GPU 확보가 어려워 프로젝트를 미뤘던 기업들이 대안을 찾을 수 있기 때문이다. 하지만 새로운 하드웨어 생태계에 적응하는 비용도 만만치 않다.