AI 3종 가이드 — Claude · Gemini · GPT

Claude·Gemini·GPT 세 AI의 특성, 모델 라인업, 강약점, 상황별 추천을 한 문서에 정리한다. 업데이트: 2026-03-08

핵심 요약

구분	내용
📖 정의	Claude(Anthropic) · Gemini(Google DeepMind) · GPT(OpenAI) — 2026년 현재 대표적인 세 LLM 플랫폼
💡 핵심	각 모델은 설계 원칙, 컨텍스트 크기, 생태계에서 뚜렷한 차이를 가진다
🎯 대상	어떤 AI를 선택할지 고민하는 개발자, 연구자, 기업 팀
⚠️ 주의	단일 AI를 모든 작업에 사용하는 것보다 작업별 적합한 AI를 선택하는 것이 효율적이다

문서 탐색

이전	다음
—	1.2 AI 실행 환경

Claude (Anthropic)

최신 모델: Claude Sonnet 4.6 / Opus 4.6 / Haiku 4.5

핵심 정체성

항목	내용
개발사	Anthropic
설계 원칙	Constitutional AI 기반 안전성 우선
핵심 강점	신뢰할 수 있는 추론, 긴 문서 처리
주요 대상	엔지니어링 팀, 연구자, 작가

모델 라인업

모델	특징	입력 (1M 토큰)	출력 (1M 토큰)
Haiku 4.5	가장 빠름, 대량 처리용	$1	$5
Sonnet 4.6	속도와 성능 균형	$3	$15
Opus 4.6	최고 추론 능력	$5	$25

핵심 강점

강점	내용	비고
긴 문맥 처리	1M 토큰 컨텍스트 윈도우 (Opus 4.6 / Sonnet 4.6 기준)	Haiku 4.5: 200K 토큰
Extended Thinking	복잡한 문제를 단계적으로 사고하는 추론 모드	수학, 논리, 디버깅에서 정확도 향상
SWE-Bench 성과	80.9%	실제 GitHub 이슈 해결 능력
글쓰기 & 협업	장문 초안 작성, 검토, 수정 사이클 최적화	기술 문서, 보고서, 코드 리뷰 탁월
에이전트 워크플로우	자율적인 다단계 작업 수행. Opus 4.6부터 Agent Teams 지원	MCP(Model Context Protocol) 지원
멀티클라우드 지원	Anthropic API, AWS Bedrock, Google Vertex AI	벤더 락인 없음

약점

약점	설명
멀티모달	이미지 이해는 가능하나 이미지/영상 생성 불가
지식 컷오프	실시간 웹 검색 없이는 최신 정보 부족
생태계 규모	ChatGPT 대비 서드파티 플러그인/통합 수 적음

이런 상황에 추천

상황	이유
복잡한 로직 디버깅, 코드 리팩토링	Extended Thinking으로 단계적 추론
긴 문서 분석 및 요약	200K 컨텍스트로 문서 전체 일관성 유지
에이전트 기반 자동화 파이프라인 구축	MCP 지원, 다단계 작업 자율 수행
글쓰기가 많은 워크플로우 (문서화, 보고서)	정교한 편집·피드백 능력
보안/컴플라이언스가 중요한 기업 환경	Constitutional AI 기반 설계, 멀티클라우드

Gemini (Google DeepMind)

최신 모델: Gemini 3.1 Pro Preview / Gemini 3 Flash / Gemini 3.1 Flash-Lite

핵심 정체성

항목	내용
개발사	Google DeepMind
핵심 무기	멀티모달 + 초거대 컨텍스트
최대 차별점	Google 생태계 깊은 통합
주요 대상	개발자, 일반 사용자, Google Workspace 팀

모델 라인업

모델	특징	입력 (1M 토큰)	출력 (1M 토큰)
Gemini 3 Flash	빠름, 경제적	$0.50	$3
Gemini 3.1 Pro Preview	최신 플래그십 (2026-02-19 출시), 추론 강화	$2 (200K 이하)	$12
Gemini 3.1 Flash-Lite	초경량, 고볼륨 최저가	$0.25	$1.50
Gemini Ultra	최고 성능, 기업용	별도 문의	별도 문의

핵심 강점

강점	내용	비고
컨텍스트 윈도우	1,000,000 토큰 (1M) 업계 최대	타 모델이 분할 처리해야 하는 작업을 단일 요청으로 처리
멀티모달	텍스트, 이미지, 동영상, 오디오 동시 이해	Imagen(이미지 생성), Veo(영상 생성)와 연동
Google 생태계 통합	Gmail, Docs, Calendar, Maps, Drive 네이티브 연동	Google Workspace 즉시 생산성 향상
실시간 검색 연동	Google Search 내장, 최신 정보 실시간 참조	지식 컷오프 문제 구조적 해결
벤치마크 성과	LMArena 리더보드 1위 달성 (2025년 3월 기준)	코딩, 수학, 창의적 글쓰기 상위권

약점

약점	설명
일관성	긴 대화에서 응답 품질이 불균일한 경우 있음
독립성	Google 서비스 외 환경에서는 통합 이점 감소
추론 깊이	단순 컨텍스트 처리는 뛰어나지만 심층 추론은 Claude/GPT 대비 약점

이런 상황에 추천

상황	이유
Google Workspace 중심으로 업무하는 팀	Gmail, Docs, Drive 네이티브 연동
대규모 코드베이스 전체를 한 번에 분석할 때	1M 토큰 컨텍스트
이미지/영상이 포함된 멀티모달 작업	Imagen, Veo 연동
실시간 최신 정보가 필요한 리서치	Google Search 내장
비용 효율이 중요한 고볼륨 워크플로우	Flash 모델 $0.50/1M 입력

GPT / ChatGPT (OpenAI)

최신 모델: GPT-5.4 Pro / GPT-5.4 Thinking / GPT-5.3 Instant (2026.03 기준)

핵심 정체성

항목	내용
개발사	OpenAI
위치	가장 널리 사용되는 AI
핵심 강점	생태계 규모, 다용도성
주요 대상	일반 사용자, 개발자, 기업 모두

모델 라인업

모델	특징	입력 (1M 토큰)	출력 (1M 토큰)
GPT-5.3 Instant	빠름, 경제적, 일상 작업 최적화	$0.25	$2
GPT-5.4 Thinking	복잡한 추론·전문 업무, 단계적 사고	$1.75	$14
GPT-5.4 Pro	최고 성능, 가장 까다로운 작업용	$21	$168
GPT-5.3-Codex	코딩 특화 에이전트 모델 (Gen + 추론 통합)	별도	별도

Batch API: 비긴급 작업 50% 비용 절감 / Cached Input: 90% 할인 주의: GPT-5.1 시리즈(Instant·Thinking·Pro)는 2026-03-11부로 ChatGPT에서 deprecated됨

핵심 강점

강점	내용	비고
생태계 규모	JetBrains, Warp, Notion, Shopify 등 광범위한 서드파티 통합	GPT Store: 수천 개 커스텀 GPT
멀티모달 올인원	텍스트, 이미지 이해(GPT-4V), 이미지 생성(DALL·E 3), 음성(TTS/STT)	하나의 인터페이스에서 모든 모달리티
Codex 클라우드 코딩 에이전트	클라우드 샌드박스에서 비동기 코딩 작업 위임	GitHub 연동, PR 자동 생성, 병렬 실행
Thinking 모드	복잡한 문제에서 단계적 내부 사고 후 답변	마이크로서비스 아키텍처 등 복잡한 설계
벤치마크 성과	SWE-Bench 80%, GPQA Diamond 92.4%, AIME 2025 100%	전반적인 최상위 벤치마크

약점

약점	설명
비용	Thinking 모드 출력 토큰당 비용 매우 높음 ($168/1M 출력)
장문 일관성	초장문 컨텍스트에서 Claude/Gemini 대비 약점
과도한 예의	때로 너무 조심스러운 답변, 직관적 답변 부족

이런 상황에 추천

상황	이유
미션 크리티컬한 코드 생성, 최종 검토	SWE-Bench 80%, GPQA 92.4% 최상위 벤치마크
멀티모달이 필요한 작업 (이미지 생성 + 분석)	DALL·E 3 + GPT-4V 하나의 인터페이스
광범위한 도구/서비스와의 통합	가장 큰 서드파티 생태계
일반 사용자 대상 AI 기능 빠른 프로토타이핑	GPT Store, 커스텀 GPT
비동기 클라우드 코딩 에이전트	Codex “fire and forget” 방식

3종 비교

핵심 스펙 비교

항목	Claude	Gemini	GPT
개발사	Anthropic	Google DeepMind	OpenAI
플래그십 모델	Opus 4.6	Gemini 3.1 Pro Preview	GPT-5.4 Pro
컨텍스트 윈도우	1M (Opus 4.6 / Sonnet 4.6) / 200K (Haiku 4.5)	1M	128K
멀티모달	이미지 이해 (생성 불가)	텍스트·이미지·동영상·오디오	텍스트·이미지 이해 + DALL·E 생성
추론 능력	Extended Thinking	Deep Think	Thinking 모드
코딩 CLI	Claude Code CLI	Gemini CLI	Codex CLI (GPT-5.4)
생태계	AWS Bedrock, Vertex AI	Google Workspace 통합	GPT Store, 광범위한 서드파티
실시간 정보	없음 (컷오프 기반)	Google Search 내장	선택적 웹 검색

벤치마크 비교

벤치마크	Claude Opus 4.6	Gemini 3.1 Pro	GPT-5.4 Pro	의미
SWE-Bench Verified	80.9%	~65%	80%	실제 GitHub 이슈 해결 능력
GPQA Diamond	—	—	92.4%	전문가 수준 지식 평가
ARC-AGI-2	—	77.1% (3.1 Pro)	—	새로운 논리 패턴 해결 능력
LMArena 리더보드	상위권	상위권	상위권	종합 사용자 선호도
컨텍스트 윈도우	1M (Opus 4.6 / Sonnet 4.6) / 200K (Haiku 4.5)	1M	128K	긴 문서/코드베이스 처리

가격 비교 (API 기준, 1M 토큰당)

모델	입력	출력	비고
Claude Haiku 4.5	$1	$5	가장 빠름, 대량 처리
Claude Sonnet 4.6	$3	$15	균형형
Claude Opus 4.6	$5	$25	최고 추론
Gemini 3 Flash	$0.50	$3	가장 저렴
Gemini 3.1 Flash-Lite	$0.25	$1.50	초경량 최저가
Gemini 3.1 Pro	$2	$12	200K 이하 기준, 최신 플래그십
GPT-5.3 Instant	$0.25	$2	빠른 일상 작업
GPT-5.4 Thinking	$1.75	$14	복잡한 추론 (참고: 추후 확인 필요)
GPT-5.4 Pro	$21	$168	최고 성능, 비용 주의

상황별 추천

상황	추천 AI	이유
긴 문서 분석 / 대형 코드베이스 전체 처리	Gemini	1M 토큰 컨텍스트
복잡한 로직 디버깅, 단계적 추론	Claude	Extended Thinking, SWE-Bench 1위
이미지 생성 + 텍스트 작업 동시	GPT	DALL·E 3 + GPT 하나의 인터페이스
Google Workspace 중심 팀	Gemini	Gmail, Docs, Drive 네이티브 연동
보안/컴플라이언스가 중요한 기업	Claude	Constitutional AI, 멀티클라우드
광범위한 서드파티 통합이 필요	GPT	GPT Store, 가장 큰 생태계
실시간 최신 정보가 필요한 리서치	Gemini	Google Search 내장
비용 효율이 중요한 고볼륨 처리	Gemini (Flash)	$0.50/1M 입력
미션 크리티컬 코드 생성, 최종 검토	GPT	GPQA 92.4%, 벤치마크 최상위
에이전트 기반 자동화 파이프라인	Claude	Claude Code CLI, MCP 지원
장문 글쓰기, 기술 문서화	Claude	정교한 편집·피드백, 일관성
오픈소스 CLI 커스터마이징	Gemini	Gemini CLI Apache 2.0

문서 탐색

이전	다음
—	2 AI 실행 환경

JW's AI_Stash

Explorer

1.1 AI 3종 가이드

AI 3종 가이드 — Claude · Gemini · GPT

핵심 요약

문서 탐색

목차

Claude (Anthropic)

핵심 정체성

모델 라인업

핵심 강점

약점

이런 상황에 추천

Gemini (Google DeepMind)

핵심 정체성

모델 라인업

핵심 강점

약점

이런 상황에 추천

GPT / ChatGPT (OpenAI)

핵심 정체성

모델 라인업

핵심 강점

약점

이런 상황에 추천

3종 비교

핵심 스펙 비교

벤치마크 비교

가격 비교 (API 기준, 1M 토큰당)

상황별 추천

문서 탐색

참고 자료

Graph View

Table of Contents

Backlinks