두 번 말하면 똑똑해진다? LLM 프롬프트 반복 성능 향상의 비밀
구글 리서치의 최신 연구에 따르면 LLM 프롬프트 반복 성능이 비추론 작업에서 놀라운 효율을 보입니다. 텍스트를 두 번 입력하는 것만으로 정확도가 21%에서 97%로 수직 상승하는 원리를 분석합니다.
악수했지만 주먹은 쥐고 있다. AI 엔지니어들이 더 정확한 답변을 얻기 위해 '단계별 생각(CoT)'이나 '감정적 호소' 같은 복잡한 프롬프트 기법에 매달리는 사이, 정답은 의외로 단순한 곳에 있었다. 구글 리서치(Google Research)가 최근 발표한 논문에 따르면, 동일한 질문을 단순히 두 번 반복해서 입력하는 것만으로도 주요 모델의 성능이 비약적으로 향상된다는 사실이 밝혀졌다.
LLM 프롬프트 반복 성능 향상의 핵심 원리
구글의 연구진인 야니브 레비아단, 마탄 칼만, 요시 마티아스는 Gemini, GPT-4o, Claude 등 업계 표준 모델들을 대상으로 테스트를 진행했다. 그 결과, 단순 정보 추출이나 직접적인 답변이 필요한 '비추론' 작업에서 프롬프트를 복사해서 두 번 붙여넣는 방식이 기준 모델 대비 70회의 테스트 중 47회나 더 우수한 성적을 거뒀다. 패배는 단 한 건도 없었다.
이러한 현상이 발생하는 이유는 현대 AI의 근간인 트랜스포머(Transformer) 아키텍처의 한계 때문이다. 대부분의 LLM은 텍스트를 왼쪽에서 오른쪽으로 순차적으로 읽는다. 문장의 중간을 읽을 때는 뒤에 올 내용을 알 수 없는 '인과적 사각지대'가 발생한다. 하지만 프롬프트를 반복하면 모델이 두 번째 질문을 읽을 때 이미 첫 번째 질문의 전체 맥락을 파악한 상태가 된다. 사실상 '양방향 어텐션'과 유사한 효과를 얻는 셈이다.
공짜 점심은 있다: 속도 저하 없는 성능 최적화
더 놀라운 점은 사용자 체감 속도 변화가 거의 없다는 것이다. 연구에 따르면 제미나이 2.0 플래시 라이트(Gemini 2.0 Flash Lite) 모델의 경우 특정 이름 찾기 작업의 정확도가 21.33%에서 97.33%로 급등했다. 연산 과정에서 '프리필(Prefill)' 단계는 GPU를 통해 병렬 처리가 가능하므로, 입력 데이터가 두 배로 늘어나도 첫 번째 토큰이 생성되는 시간은 크게 지연되지 않는다.
기자
관련 기사
웨이모가 전기 미니밴 로보택시 '오하이'를 공개했다. 현대차 아이오닉5와의 협력, 중국 지리자동차 플랫폼 활용, 주당 50만 건 운행 데이터가 만들어낸 이 차량이 자율주행 산업의 수익화 방정식을 어떻게 바꿀지 분석한다.
스노우플레이크가 AWS와 6조원 규모 5년 계약을 체결했다. 핵심은 엔비디아 GPU가 아닌 아마존 자체 칩 그라비톤이다. 클라우드 빅3의 자체 칩 경쟁이 AI 인프라 판도를 바꾸고 있다.
중국이 AI 연구자와 스타트업 창업자의 해외 출국을 제한하기 시작했다. 스탠퍼드 AI 인덱스에 따르면 미중 AI 성능 격차는 2023년 31%에서 2026년 2.7%로 좁혀졌다. 베이징의 선택이 글로벌 AI 경쟁 구도를 어떻게 바꾸는가.
영국 비자 신청 대행 사이트 'UK Visa Portal'에서 10만 건 이상의 여권 사진과 셀피가 외부에 노출됐다. 피해자들은 공식 정부 사이트로 착각하고 개인정보를 제출했다.
의견
이 기사에 대한 생각을 나눠주세요
로그인하고 의견을 남겨보세요