1M이라 해도 실제로 신뢰할 수 있는 구간은 그보다 훨씬 짧습니다.
1M 토큰의 거짓말
광고된 컨텍스트 윈도우와 실제 신뢰할 수 있는 구간은 다릅니다. 내 문서가 진짜로 잘 들어가는지 확인해 보세요.
문서 길이 입력:
문서 언어:
추정 토큰: 17K
예시 프리셋:
모델별 실효성 분석
8개 모델 중 SAFE 8개 · 위험·초과 0개GPT-4o
OpenAI
광고 컨텍스트: 128K13%
실효 신뢰 구간: 64K27%
실효 비율: 50%+47K 여유
GPT-4.1
OpenAI
광고 컨텍스트: 1.0M2%
실효 신뢰 구간: 200K9%
실효 비율: 19%+183K 여유
Claude Opus 4
Anthropic
광고 컨텍스트: 200K9%
실효 신뢰 구간: 140K12%
실효 비율: 70%+123K 여유
Claude Sonnet 4
Anthropic
광고 컨텍스트: 200K9%
실효 신뢰 구간: 120K14%
실효 비율: 60%+103K 여유
Gemini 2.5 Pro (1M)
광고 컨텍스트: 1.0M2%
실효 신뢰 구간: 300K6%
실효 비율: 29%+283K 여유
Gemini 2.5 Pro (2M)
광고 컨텍스트: 2.1M1%
실효 신뢰 구간: 500K3%
실효 비율: 24%+483K 여유
Llama 3.3 70B
Meta
광고 컨텍스트: 128K13%
실효 신뢰 구간: 32K53%
실효 비율: 25%+15K 여유
Mistral Large 2
Mistral AI
광고 컨텍스트: 128K13%
실효 신뢰 구간: 50K34%
실효 비율: 39%+33K 여유
방법론 메모
실효 구간은 NIAH(needle-in-haystack) 벤치마크, RULER(2024), "Lost in the Middle"(Liu et al., 2023) 등 공개 연구를 기반으로 추정한 값입니다. 회수율이 눈에 띄게 떨어지기 시작하는 근사 임계값이며, 데이터 기준일은 2026-06입니다. 실제 성능은 태스크 특성, 프롬프트 구조, 모델 버전에 따라 다릅니다.