Claude, OpenAI, Gemini API 가격 비교 (2026년)
LLM API를 서비스에 도입하려고 하면 가격이 제일 먼저 궁금해진다. Claude, OpenAI, Gemini 세 가지 주요 API의 가격을 정리해봤다.
가격 비교표
가격은 100만 토큰(1M tokens) 기준이다. 대략 75만 단어 정도에 해당한다.
Claude (Anthropic)
| 모델 | Input | Output |
|---|---|---|
| Haiku 4.5 | $1.00 | $5.00 |
| Sonnet 4.5 | $3.00 | $15.00 |
| Opus 4.5 | $5.00 | $25.00 |
Claude는 세 가지 티어가 명확하다. Haiku는 빠르고 저렴한 경량 모델, Sonnet은 균형잡힌 중간급, Opus는 최고 성능 모델이다. 참고로 이전 Opus 4는 $15/$75였는데 4.5로 오면서 66%나 가격이 내려갔다.
OpenAI
| 모델 | Input | Output | Context |
|---|---|---|---|
| GPT-4o | $2.50 | $10.00 | 128K |
| GPT-4o Mini | $0.15 | $0.60 | 128K |
| GPT-4.1 | $2.00 | $8.00 | 1M |
GPT-4o Mini가 가격 대비 성능이 좋다. $0.15/$0.60은 거의 무료에 가깝다. GPT-4.1은 100만 토큰 컨텍스트를 지원해서 긴 문서 처리에 유리하다.
Gemini (Google)
| 모델 | Input | Output |
|---|---|---|
| Gemini 3 Pro | $2.00 | $12.00 |
| Gemini 2.5 Pro | $1.25 | $2.50 |
| Gemini 2.5 Flash-Lite | $0.10 | $0.40 |
Gemini의 강점은 무료 티어다. 일 1,000건까지 무료로 쓸 수 있어서 프로토타이핑이나 사이드 프로젝트에 부담이 없다. Flash-Lite는 $0.10/$0.40으로 가장 저렴한 옵션이다.
용도별 추천
비용이 최우선이라면
Gemini 2.5 Flash-Lite 를 쓰면 된다. Input $0.10, Output $0.40으로 가장 저렴하다. 무료 티어도 넉넉해서 테스트 비용도 안 든다.
GPT-4o Mini도 $0.15/$0.60으로 충분히 저렴하다. OpenAI 생태계에 익숙하다면 이쪽이 편할 수 있다.
긴 문서를 처리해야 한다면
GPT-4.1 이 100만 토큰 컨텍스트를 지원한다. 가격도 $2.00/$8.00으로 합리적이다. 긴 코드베이스 분석이나 대용량 문서 요약에 적합하다.
Claude도 200K 컨텍스트를 지원하는데, 200K를 넘어가면 가격이 올라간다. Sonnet 4.5 기준으로 $6.00/$22.50이 된다.
최고 품질이 필요하다면
Claude Opus 4.5 가 가장 강력하다. $5.00/$25.00으로 비싸긴 하지만 복잡한 추론이나 긴 글 작성에서 차이가 난다.
비용 절감 방법
세 서비스 모두 비슷한 비용 절감 옵션을 제공한다.
Batch API 는 급하지 않은 요청을 모아서 처리하면 50% 할인해준다. 대량 처리가 필요하고 실시간 응답이 필요 없다면 활용하면 좋다.
Prompt Caching 은 반복되는 프롬프트를 캐싱해서 비용을 줄인다. Claude는 최대 90%, Gemini는 75%까지 절감된다. 시스템 프롬프트가 길고 반복 호출이 많은 경우 효과가 크다.
정리
- 가장 저렴한 건 Gemini Flash-Lite ($0.10/$0.40)
- 무료 티어는 Gemini만 제공 (일 1,000건)
- 가성비 좋은 선택은 GPT-4o Mini ($0.15/$0.60)
- 긴 컨텍스트가 필요하면 GPT-4.1 (1M 토큰)
- 최고 품질은 Claude Opus 4.5
프로젝트 성격에 맞게 고르면 된다. 비용이 중요하면 Gemini나 GPT-4o Mini, 품질이 중요하면 Claude Opus, 긴 문서면 GPT-4.1이다.