Claude, OpenAI, Gemini API 가격 비교 (2026년)

LLM API를 서비스에 도입하려고 하면 가격이 제일 먼저 궁금해진다. Claude, OpenAI, Gemini 세 가지 주요 API의 가격을 정리해봤다.

가격 비교표

가격은 100만 토큰(1M tokens) 기준이다. 대략 75만 단어 정도에 해당한다.

Claude는 세 가지 티어가 명확하다. Haiku는 빠르고 저렴한 경량 모델, Sonnet은 균형잡힌 중간급, Opus는 최고 성능 모델이다. 참고로 이전 Opus 4는 $15/$75였는데 4.5로 오면서 66%나 가격이 내려갔다.

모델	Input	Output	Context
GPT-4o	$2.50	$10.00	128K
GPT-4o Mini	$0.15	$0.60	128K
GPT-4.1	$2.00	$8.00	1M

GPT-4o Mini가 가격 대비 성능이 좋다. $0.15/$0.60은 거의 무료에 가깝다. GPT-4.1은 100만 토큰 컨텍스트를 지원해서 긴 문서 처리에 유리하다.

Gemini의 강점은 무료 티어다. 일 1,000건까지 무료로 쓸 수 있어서 프로토타이핑이나 사이드 프로젝트에 부담이 없다. Flash-Lite는 $0.10/$0.40으로 가장 저렴한 옵션이다.

Gemini 2.5 Flash-Lite 를 쓰면 된다. Input $0.10, Output $0.40으로 가장 저렴하다. 무료 티어도 넉넉해서 테스트 비용도 안 든다.

GPT-4o Mini도 $0.15/$0.60으로 충분히 저렴하다. OpenAI 생태계에 익숙하다면 이쪽이 편할 수 있다.

GPT-4.1 이 100만 토큰 컨텍스트를 지원한다. 가격도 $2.00/$8.00으로 합리적이다. 긴 코드베이스 분석이나 대용량 문서 요약에 적합하다.

Claude도 200K 컨텍스트를 지원하는데, 200K를 넘어가면 가격이 올라간다. Sonnet 4.5 기준으로 $6.00/$22.50이 된다.

Claude Opus 4.5 가 가장 강력하다. $5.00/$25.00으로 비싸긴 하지만 복잡한 추론이나 긴 글 작성에서 차이가 난다.

세 서비스 모두 비슷한 비용 절감 옵션을 제공한다.

Batch API 는 급하지 않은 요청을 모아서 처리하면 50% 할인해준다. 대량 처리가 필요하고 실시간 응답이 필요 없다면 활용하면 좋다.

Prompt Caching 은 반복되는 프롬프트를 캐싱해서 비용을 줄인다. Claude는 최대 90%, Gemini는 75%까지 절감된다. 시스템 프롬프트가 길고 반복 호출이 많은 경우 효과가 크다.

프로젝트 성격에 맞게 고르면 된다. 비용이 중요하면 Gemini나 GPT-4o Mini, 품질이 중요하면 Claude Opus, 긴 문서면 GPT-4.1이다.