엔비디아 독점이 흔들린다 - OpenAI가 선택한 새로운 칩
OpenAI가 처음으로 엔비디아가 아닌 Cerebras 칩에서 GPT-5.3-Codex-Spark 모델을 구동. 15배 빠른 속도로 AI 칩 시장 판도 변화 예고
1,000토큰/초 - 이 숫자가 바꿀 것들
OpenAI가 목요일 발표한 소식은 단순한 신제품 출시가 아니었다. GPT-5.3-Codex-Spark 코딩 모델을 엔비디아가 아닌 Cerebras 칩에서 구동한다고 밝혔기 때문이다. 이는 OpenAI가 상용 모델에서 엔비디아 하드웨어를 벗어난 첫 사례다.
새 모델의 처리 속도는 초당 1,000토큰 이상. 이전 모델보다 15배 빨라진 수치다. 비교해보면 Anthropic의 Claude Opus 4.6 프리미엄 고속 모드가 표준 속도(68.2토큰/초)의 2.5배 정도 나오는 수준이다.
개발자들이 주목하는 이유
Codex-Spark는 월 200달러ChatGPT Pro 구독자에게 연구 미리보기로 제공된다. Codex 앱, 명령줄 인터페이스, VS Code 확장을 통해 접근할 수 있다. OpenAI는 선별된 파트너사에게 API 접근권도 제공하고 있다.
"Cerebras는 훌륭한 엔지니어링 파트너였으며, 빠른 추론을 새로운 플랫폼 기능으로 추가하게 되어 기쁩니다"라고 OpenAI 컴퓨팅 책임자 사친 카티가 밝혔다.
모델은 128,000토큰 컨텍스트 윈도우를 지원하며, 출시 시점에는 텍스트만 처리한다.
칩 전쟁의 새로운 국면
이번 발표가 중요한 건 기술적 성능을 넘어선다. 그동안 AI 업계는 엔비디아의 GPU에 의존해왔다. 공급 부족과 높은 가격이 스타트업과 중소기업의 발목을 잡았다.
Cerebras는 웨이퍼 스케일 엔진(WSE)이라는 독특한 접근법을 택했다. 일반적인 칩 여러 개를 연결하는 대신, 웨이퍼 전체를 하나의 거대한 칩으로 만드는 방식이다. 이로 인해 메모리 접근 속도가 극적으로 빨라진다.
국내 기업들도 주목할 만하다. 삼성전자와 SK하이닉스가 AI 메모리 반도체에서 강세를 보이고 있지만, 아직 AI 추론 칩 시장에서는 뚜렷한 존재감을 드러내지 못했다. 이번 사례는 엔비디아 외 선택지가 현실적으로 가능함을 보여준다.
개발자와 기업이 고민해야 할 것들
속도 향상은 분명 매력적이지만, 새로운 딜레마도 만든다. 개발자들은 이제 "어떤 칩에서 돌릴 것인가"를 고려해야 한다. 모델 최적화, 비용 구조, 공급업체 의존성까지.
특히 한국의 AI 스타트업들에게는 기회가 될 수 있다. 그동안 엔비디아 GPU 확보가 어려워 프로젝트를 미뤘던 기업들이 대안을 찾을 수 있기 때문이다. 하지만 새로운 하드웨어 생태계에 적응하는 비용도 만만치 않다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
AI 반도체 스타트업 세레브라스가 IPO를 재신청했다. OpenAI와 10조원 계약, AWS 입점까지 확보한 이 회사가 엔비디아의 아성에 도전하는 이유와 한국 반도체 산업에 주는 함의를 분석한다.
OpenAI의 소라 개발자 빌 피블스와 과학 연구 이니셔티브를 이끈 케빈 웨일이 동시에 퇴사했다. 단순한 인재 유출이 아니다. 이 회사가 무엇을 포기했는지에 대한 이야기다.
OpenAI가 AI 기반 개인 재무 스타트업 Hiro Finance를 인수했다. 단순한 인재 영입인가, 아니면 금융 서비스 진출의 신호탄인가? 카카오뱅크·토스 등 국내 핀테크에 미칠 파장을 분석한다.
OpenAI CEO 샘 올트먼의 샌프란시스코 자택이 사흘 사이 두 차례 공격을 받았다. 화염병에 이어 총격까지. 실리콘밸리 권력자를 향한 물리적 위협이 무엇을 의미하는지 짚는다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요