2.1 AI 에이전트란 무엇인가
AI 에이전트는 단순 응답을 넘어 목표를 분해하고, 도구를 실행하며, 결과를 검토해 다음 행동을 자율 결정하는 시스템이다.
업데이트: 2026-03-08
핵심 요약
| 구분 | 내용 |
|---|
| 📖 정의 | 목표를 스스로 분해하고, 도구를 선택·실행하며, 결과를 검토해 다음 행동을 결정하는 자율적 AI 시스템 |
| 💡 핵심 | 일반 AI 채팅과 달리, 에이전트는 목표→계획→실행→검증 루프를 반복하며 독립된 컨텍스트 창을 보유한다 |
| 🎯 대상 | 반복 작업, 병렬 처리, 전문화된 독립 작업이 필요한 개발자 및 팀 |
| ⚠️ 주의 | 단순 질답이나 일회성 작업에는 오버엔지니어링이 될 수 있으므로 상황에 맞게 선택한다 |
문서 탐색
목차
- 정의
- 에이전트를 지원하는 주요 AI 플랫폼
- 플랫폼별 에이전트 기능 비교
- 언제 에이전트를 사용해야 하는가
- 플랫폼 선택 가이드
1. 정의
**AI 에이전트(AI Agent)**란 단순히 질문에 답하는 것을 넘어, 목표를 스스로 분해하고, 도구를 선택·실행하며, 결과를 검토해 다음 행동을 결정하는 자율적 AI 시스템이다.
일반 AI 채팅과의 차이:
| 구분 | 일반 AI 채팅 | AI 에이전트 |
|---|
| 동작 방식 | 질문 → 답변 (1회성) | 목표 → 계획 → 실행 → 검증 (루프) |
| 도구 사용 | 없음 | 파일 읽기/쓰기, 검색, 코드 실행 등 |
| 자율성 | 사람이 매 단계 지시 | 중간 단계를 스스로 결정 |
| 컨텍스트 | 대화 내 | 독립된 컨텍스트 창 보유 가능 |
서브에이전트(Subagent)란
메인 AI가 특정 작업을 전문 에이전트에게 위임하는 구조다. 서브에이전트는 독립된 컨텍스트 창에서 실행되고, 지정된 도구만 사용하며, 결과를 메인 에이전트에게 반환한다.
graph TD
M["메인 에이전트 - 오케스트레이터"]
M --> A["서브에이전트 A\n코드 분석 전담"]
M --> B["서브에이전트 B\n웹 리서치 전담"]
M --> C["서브에이전트 C\n보안 검토 전담"]
🎯 핵심 가치: 컨텍스트 보호, 역할 전문화, 병렬 실행, 권한 최소화
2. 에이전트를 지원하는 주요 AI 플랫폼
Claude Code (Anthropic)
Claude Code는 가장 성숙한 서브에이전트 시스템을 갖고 있다. .claude/agents/ 디렉토리에 마크다운 파일로 에이전트를 정의하며, Claude가 작업을 판단해 자동으로 적합한 서브에이전트를 호출한다.
| 항목 | 내용 |
|---|
| 에이전트 정의 방식 | YAML frontmatter + 마크다운 시스템 프롬프트 |
| 저장 위치 | 프로젝트(./claude/agents/) 또는 글로벌(~/.claude/agents/) |
| 병렬 실행 | 최대 7개 서브에이전트 동시 실행 지원 |
| 모델 지정 | 에이전트별로 Opus/Sonnet/Haiku 선택 가능 |
| 공식 서브에이전트 라이브러리 | awesome-claude-code-subagents (100개 이상) |
Gemini CLI (Google)
Gemini CLI는 오픈소스 터미널 에이전트로, 서브에이전트 기능을 실험적으로 지원한다. Claude Code와 유사한 마크다운 파일 구조를 사용하며, Agent Skills 시스템으로 확장 가능하다.
| 항목 | 내용 |
|---|
| 에이전트 정의 방식 | YAML frontmatter + 마크다운 (.gemini/agents/) |
| Agent Skills | 자체 오픈 표준 기반, 지시사항·리소스·스크립트를 패키징 |
| Extensions | MCP 서버 번들 포함, 단일 명령으로 설치 가능 |
| Hooks | 에이전틱 루프를 커스터마이즈하는 이벤트 기반 자동화 |
OpenAI Codex (OpenAI)
OpenAI Codex는 CLI 도구와 클라우드 기반 에이전트 두 가지 형태로 제공된다. AGENTS.md 파일로 전역 지시사항을 설정하고, Skills 시스템으로 작업별 에이전트를 정의한다.
| 항목 | 내용 |
|---|
| 에이전트 정의 방식 | AGENTS.md (글로벌 지시) + SKILL.md (작업별 스킬) |
| Agents SDK 연동 | MCP 서버로 Codex CLI를 노출, SDK로 워크플로우 오케스트레이션 |
| 멀티에이전트 | 전문 에이전트를 병렬로 실행하고 결과를 취합 |
| 클라우드 에이전트 | ChatGPT 구독에 포함된 클라우드 기반 자율 코딩 에이전트 |
GitHub Copilot (Microsoft/GitHub)
VS Code 내 Custom Agents 기능으로 에이전트를 정의한다. GitHub 리포지토리, 이슈, PR과의 네이티브 통합이 강점이다.
| 항목 | 내용 |
|---|
| 에이전트 정의 방식 | .github/copilot-instructions.md + VS Code 설정 |
| GitHub 네이티브 통합 | 이슈·PR·리포지토리 직접 조작 |
| 엔터프라이즈 권한 | SSO, 팀 레벨 권한, 감사 로그 |
3. 플랫폼별 에이전트 기능 비교 (2026)
| 항목 | Claude Code | Gemini CLI | OpenAI Codex | GitHub Copilot |
|---|
| 에이전트 정의 방식 | YAML + MD | YAML + MD | AGENTS.md + SKILL.md | VS Code 설정 |
| 저장 위치 | .claude/agents/ | .gemini/agents/ | 프로젝트 루트 | .github/ |
| 병렬 실행 | 최대 7개 | 실험적 지원 | 지원 | 미지원 |
| 글로벌/프로젝트 에이전트 | 둘 다 지원 | 둘 다 지원 | 글로벌(AGENTS.md) | 프로젝트 중심 |
| 도구 권한 세분화 | 지원 (least-privilege) | 지원 | 지원 | 제한적 |
| 모델 지정 | 에이전트별 가능 | 제한적 | 제한적 | 불가 |
| 컨텍스트 창 | 200K (기본) | 1M 기본 | 가변 | 제한적 |
| 웹 검색 내장 | 없음 | 기본 내장 | 없음 | 없음 |
| 오픈소스 | 아니오 | 예 (Apache 2.0) | 예 | 아니오 |
| 무료 사용 | 없음 | 1,000회/일 | 제한적 | GitHub 구독 필요 |
| 에이전트 마켓플레이스 | subagents.app | Extensions 갤러리 | - | - |
| 성숙도 | 가장 높음 | 성장 중 | 성장 중 | 보통 |
4. 언제 에이전트를 사용해야 하는가
에이전트가 효과적인 상황
| 상황 | 설명 |
|---|
| 반복 작업 | 매번 같은 방식으로 처리하는 코드 리뷰, 보안 스캔, 문서화 |
| 컨텍스트 분리 | 탐색·조사는 서브에이전트가, 핵심 구현은 메인이 담당 |
| 병렬 처리 | 여러 주제를 동시에 리서치하거나 분석 |
| 권한 제한 | 특정 에이전트는 읽기 전용, 특정 에이전트만 쓰기 허용 |
| 전문화 | 특정 언어, 프레임워크, 도메인에 특화된 응답 필요 |
에이전트가 불필요한 상황
| 상황 | 설명 |
|---|
| 단순 질답이나 코드 설명 | 오버엔지니어링 |
| 1~2번 쓰고 말 일회성 작업 | 설정 비용이 사용 이득보다 크다 |
| 컨텍스트 공유가 필수인 작업 | 에이전트는 독립 컨텍스트로 분리됨 |
5. 플랫폼 선택 가이드
| 상황 | 추천 플랫폼 |
|---|
| 복잡한 멀티에이전트 워크플로우 | Claude Code |
| 웹 검색 기반 리서치 에이전트 | Gemini CLI |
| GitHub 이슈/PR 자동화 | GitHub Copilot |
| 오픈소스, 커스터마이즈 중심 | Codex CLI / Gemini CLI |
| 비용 최소화 | Gemini CLI (무료 1,000회/일) |
문서 탐색
참고 자료