모방을 넘어선 진화: Absolute Zero Reasoner AI 자기주도 학습의 시대
Absolute Zero Reasoner(AZR) 프로젝트를 통해 AI가 스스로 질문하고 답하며 지능을 높이는 자기주도 학습의 시대가 열렸습니다. 인간 데이터를 넘어선 AI의 진화를 확인하세요.
AI가 인간의 가르침 없이 스스로 질문하고 답하며 진화할 수 있을까? 지금까지의 인공지능은 인간이 만든 데이터를 모방하는 '카피캣' 수준에 머물러 있었지만, 이제 스스로 문제를 정의하고 해결하며 지능을 확장하는 새로운 국면에 접어들었다.
Absolute Zero Reasoner AI 자기주도 학습의 작동 원리
칭화대학교와 베이징 범용 인공지능 연구원(BIGAI), 펜실베이니아 주립대학교 연구진은 최근 Absolute Zero Reasoner(AZR)라는 혁신적인 시스템을 공개했다. 이 시스템은 대규모 언어 모델이 스스로 도전적이지만 해결 가능한 파이썬 코딩 문제를 생성하도록 유도한다. 모델은 자신이 만든 문제를 직접 풀고, 실행 가능 여부를 확인하며 성공과 실패의 신호를 학습 데이터로 삼아 성능을 개선한다.
연구 결과에 따르면, 이 방식을 적용한 오픈소스 모델 Qwen의 70억개 및 140억개 파라미터 버전은 코딩과 추론 능력이 크게 향상되었다. 특히 인간이 정교하게 가공한 데이터를 학습한 기존 모델들보다 더 뛰어난 성능을 보였다는 점이 주목할 만하다. 이는 AI가 인간의 지식 한계를 넘어설 수 있는 가능성을 시사한다.
데이터 기근 해결과 슈퍼인텔리전스로의 경로
업계는 이러한 '셀프 플레이(Self-play)' 방식이 고갈되어 가는 양질의 인간 데이터를 대체할 핵심 기술이 될 것으로 보고 있다. 세일즈포스의 Agent0나 메타의 최근 연구들 역시 이와 유사한 자기주도 학습 패러다임을 지향하고 있다. 전문가들은 이러한 접근법이 향후 웹 브라우징이나 사무 자동화 같은 복잡한 에이전트 작업으로 확장될 경우, 인간의 개입 없이도 스스로 최적의 해법을 찾는 초지능(Superintelligence) 소프트웨어 에이전트의 기반이 될 것이라 분석한다.
본 콘텐츠는 AI가 원문 기사를 기반으로 요약 및 분석한 것입니다. 정확성을 위해 노력하지만 오류가 있을 수 있으며, 원문 확인을 권장합니다.
관련 기사
노우스 리서치가 엔비디아 B200 GPU 48개로 단 4일 만에 훈련한 NousCoder-14B를 공개했습니다. 인간의 2년 성장을 단 4일 만에 복제한 이 오픈소스 AI 모델의 성능과 의미를 분석합니다.
사티아 나델라 MS CEO가 생성형 AI 결과물을 '슬롭(Slop)'이라 부르는 것에 반대하며, 이를 '인지 증폭 도구'로 정의했습니다. MS 코드의 30%가 AI로 작성된 현황을 짚어봅니다.
2025년 OpenAI와 메타가 주춤한 사이 알리바바의 Qwen 등 중국산 오픈 소스 AI 모델이 글로벌 시장을 장악하고 있습니다. 엔비디아와 에어비앤비까지 선택한 Qwen의 성공 비결과 변화하는 AI 생태계 지형도를 분석합니다.
수십억 달러 규모의 AI 버블을 이끈 '초지능'부터 '챗봇 정신증'과 '슬롭'의 등장까지, 격동의 2025년 기술 업계를 형성한 핵심 AI 키워드들을 총정리한다.