1M이라 해도 실제로 신뢰할 수 있는 구간은 그보다 훨씬 짧습니다.

1M 토큰의 거짓말

광고된 컨텍스트 윈도우와 실제 신뢰할 수 있는 구간은 다릅니다. 내 문서가 진짜로 잘 들어가는지 확인해 보세요.

문서 길이 입력:
문서 언어:

추정 토큰: 17K

예시 프리셋:

모델별 실효성 분석

8개 모델 중 SAFE 8개 · 위험·초과 0개

GPT-4o

OpenAI

✓ 안전
광고 컨텍스트: 128K13%
실효 신뢰 구간: 64K27%
실효 비율: 50%+47K 여유

GPT-4.1

OpenAI

✓ 안전
광고 컨텍스트: 1.0M2%
실효 신뢰 구간: 200K9%
실효 비율: 19%+183K 여유

Claude Opus 4

Anthropic

✓ 안전
광고 컨텍스트: 200K9%
실효 신뢰 구간: 140K12%
실효 비율: 70%+123K 여유

Claude Sonnet 4

Anthropic

✓ 안전
광고 컨텍스트: 200K9%
실효 신뢰 구간: 120K14%
실효 비율: 60%+103K 여유

Gemini 2.5 Pro (1M)

Google

✓ 안전
광고 컨텍스트: 1.0M2%
실효 신뢰 구간: 300K6%
실효 비율: 29%+283K 여유

Gemini 2.5 Pro (2M)

Google

✓ 안전
광고 컨텍스트: 2.1M1%
실효 신뢰 구간: 500K3%
실효 비율: 24%+483K 여유

Llama 3.3 70B

Meta

✓ 안전
광고 컨텍스트: 128K13%
실효 신뢰 구간: 32K53%
실효 비율: 25%+15K 여유

Mistral Large 2

Mistral AI

✓ 안전
광고 컨텍스트: 128K13%
실효 신뢰 구간: 50K34%
실효 비율: 39%+33K 여유

방법론 메모

실효 구간은 NIAH(needle-in-haystack) 벤치마크, RULER(2024), "Lost in the Middle"(Liu et al., 2023) 등 공개 연구를 기반으로 추정한 값입니다. 회수율이 눈에 띄게 떨어지기 시작하는 근사 임계값이며, 데이터 기준일은 2026-06입니다. 실제 성능은 태스크 특성, 프롬프트 구조, 모델 버전에 따라 다릅니다.