Google Gemini AI 업데이트 정리
체크 날짜: 2026년 4월 3일 08:34
⚠️ 이 파일에는 2026-04-02_08-31.md 이후 새롭게 확인된 내역만 포함됩니다.
🌟 Gemma 4 공식 출시 — Apache 2.0 최초 적용, 멀티모달·128K~256K 컨텍스트 (2026년 4월 2일)
업데이트 날짜: 2026년 4월 2일
제목: Google Gemma 4 오픈소스 모델 출시 — E2B·E4B·26B MoE·31B Dense 4종, Apache 2.0 라이선스 최초 적용, 멀티모달 지원 및 최대 256K 컨텍스트
주요 업데이트 내역
- 4종 모델 라인업 출시: Effective 2B(E2B), Effective 4B(E4B), 26B Mixture of Experts(MoE), 31B Dense — 경량부터 고성능까지 단계적 선택 가능
- Apache 2.0 라이선스 최초 적용: Gemma 시리즈 최초로 완전 개방적인 Apache 2.0 라이선스 채택 — 상업적 활용, 파생 모델 배포, 기업 내부 사용 제한 없음
- 멀티모달 지원: 텍스트, 이미지, 오디오를 함께 이해·처리하는 멀티모달 능력 내장 — 기존 Gemma 대비 대폭 확장
- 확장된 컨텍스트 창: E2B·E4B는 128K 토큰, 26B·31B는 256K 토큰 컨텍스트 — 전체 코드베이스나 대용량 문서를 단일 프롬프트에 포함 가능
- 네이티브 함수 호출 및 구조화 JSON: 4개 모델 모두 함수 호출과 구조화된 JSON 출력 기본 지원 — 에이전트 개발에 즉시 활용 가능
- 대폭 향상된 속도: 이전 버전 대비 최대 4배 빠른 추론 속도, 최대 60% 배터리 소비 감소 (E2B는 E4B 대비 3배 빠름)
- 광범위한 배포 지원: Android·iOS(CPU/GPU), Windows·Linux·macOS, WebGPU(브라우저 실행) 모두 지원
- Android AICore Developer Preview: Gemma 4가 Android AICore를 통해 기기 내 직접 실행 가능 — 온디바이스 에이전트 AI 새 표준 제시
- NVIDIA RTX 최적화: NVIDIA가 Gemma 4 모델을 로컬 RTX AI 환경에 최적화, 데스크탑에서 직접 실행 지원
상세 내용
Gemma 4는 Google의 오픈소스 AI 전략의 전환점을 나타냅니다. 특히 Gemma 시리즈 최초의 Apache 2.0 라이선스 채택은 Meta의 Llama 시리즈와 같은 수준의 개방성을 확보한 것으로, 기업들이 법적 제약 없이 모델을 상업적으로 활용하고 파생 모델을 배포할 수 있게 됩니다. 4종의 모델 크기 옵션과 멀티모달 지원의 결합은 스마트폰에서의 경량 실시간 처리부터 서버에서의 복잡한 멀티모달 추론까지, 단일 모델 패밀리로 다양한 사용 사례를 커버합니다. 256K 토큰의 대용량 컨텍스트는 대형 코드베이스 전체 분석, 긴 기술 문서 처리, 복잡한 멀티턴 에이전트 작업에서 특히 강점을 발휘합니다. Android AICore 통합은 Gemma 4를 온디바이스 AI의 새로운 표준으로 자리매김시키려는 Google의 전략적 포석입니다.
활용방법 예시
- 스타트업 개발자가 Gemma 4 E4B(Apache 2.0)를 자사 제품에 완전 통합하여 서버 비용 없이 엣지 디바이스 멀티모달 AI 기능 구현 — Meta Llama 대신 Gemma 4를 선택할 강력한 이유 확보
- Android 앱 개발자가 Gemma 4의 Android AICore Developer Preview를 활용하여 인터넷 연결 없이 기기에서 직접 동작하는 오프라인 멀티모달 AI 어시스턴트 개발
💾 Google AI Pro 플랜 — 2TB→5TB 대용량 스토리지 무료 업그레이드 (2026년 4월 2일)
업데이트 날짜: 2026년 4월 2일
제목: Google AI Pro 플랜($19.99/월), 클라우드 스토리지 2TB→5TB로 3배 무료 확장 — 가격 변동 없이 Google Drive·Photos·Gmail 공동 활용
주요 업데이트 내역
- 스토리지 2TB → 5TB 무료 업그레이드: AI Pro 플랜($19.99/월) 구독자 대상으로 추가 비용 없이 3TB 스토리지 무료 증가
- Google Drive·Photos·Gmail 통합 활용: 확장된 5TB 스토리지는 Google Drive, Google Photos, Gmail 전체에서 공유하여 사용
- Workspace Gemini 협업 기능 강화: Docs, Sheets, Slides, Drive 전반에 걸쳐 파일·이메일·웹 컨텍스트를 연결하는 새로운 Gemini 협업 경험 추가
- Chrome 자율 브라우징 기능: AI Pro·AI Ultra 구독자(미국 우선)에게 Chrome에서 복잡한 멀티스텝 작업을 자율적으로 수행하는 ‘Chrome auto browse’ 기능 제공
- Google Home Premium 포함: AI Pro·AI Ultra 플랜에 Google Home Premium이 추가 포함 — 스마트홈 기기에 Gemini 기반 AI 제어 기능 확장
상세 내용
Google이 AI Pro 플랜에 대규모 혜택 업그레이드를 단행하면서도 월 $19.99라는 가격을 동결했습니다. 특히 스토리지 3배 확장은 사용자들이 AI 작업(이미지 생성, 동영상 제작, 코드 파일 등)으로 축적되는 대용량 데이터를 추가 비용 없이 저장할 수 있게 해줍니다. Chrome auto browse 기능은 사용자가 Claude Code나 ChatGPT의 에이전트 기능과 유사하게 브라우저 수준에서 복잡한 멀티스텝 작업(폼 작성, 데이터 수집, 예약 등)을 AI에 위임할 수 있는 새로운 차원을 열어줍니다. Google Home Premium 포함은 AI Pro를 스마트홈 제어 플랫폼으로도 포지셔닝하는 전략으로, Apple Intelligence나 Amazon Alexa와의 스마트홈 AI 경쟁에서 차별화 포인트가 됩니다. 해당 업그레이드는 전 세계에 순차적으로 배포 중이며 적용까지 수 시간에서 하루가 걸릴 수 있습니다.
활용방법 예시
- AI Pro 구독자인 콘텐츠 크리에이터가 Veo 3.1 Lite로 생성한 대용량 영상 파일을 5TB Google Drive에 체계적으로 저장하고, Gemini 기반 Docs 연동으로 영상 기획·스크립트·편집 메모를 통합 관리
- 스마트홈 구축 중인 사용자가 AI Pro에 새로 포함된 Google Home Premium을 통해 Gemini 음성 명령으로 조명·온도·보안 카메라를 통합 제어하는 환경 구성
⚖️ Gemini API — Flex·Priority 추론 티어 도입 (2026년 4월 1일)
업데이트 날짜: 2026년 4월 1일
제목: Gemini API에 Flex·Priority 인퍼런스 티어 신규 출시 — 비용 대 응답 속도 최적화 옵션으로 개발자 배포 유연성 대폭 확대
주요 업데이트 내역
- Flex 티어: 비용을 우선시하는 추론 옵션 — 응답 지연을 허용하는 대신 더 낮은 가격으로 모델 실행 가능
- Priority 티어: 응답 속도를 우선시하는 추론 옵션 — 더 높은 비용을 지불하고 빠른 응답 보장
- 기존 표준 티어와 함께 3단계 선택 구조: 개발자가 서비스 특성(실시간 챗봇 vs. 비동기 배치)에 따라 최적 티어 선택
gemini-2.5-flash-lite-preview-09-2025모델 종료: 구형 Flash Lite Preview 모델이 동시에 서비스 종료
상세 내용
Gemini API의 Flex·Priority 티어 도입은 개발자들이 서비스 요구사항에 따라 비용과 속도를 세밀하게 조율할 수 있는 중요한 변화입니다. 이전까지는 단일 가격 구조였다면, 이제 야간 배치 처리, 대용량 문서 분석 등 응답 지연이 허용되는 작업에는 Flex 티어로 비용을 절감하고, 실시간 고객 응대나 인터랙티브 앱에는 Priority 티어로 빠른 응답을 보장하는 전략적 배포가 가능해집니다. 이는 OpenAI의 Batch API(50% 할인)나 Anthropic의 Message Batches API와 유사한 방향의 비용 최적화 전략이지만, 실시간 추론 단계에서도 가격-속도 트레이드오프를 선택할 수 있다는 점이 차별화됩니다.
활용방법 예시
- 대용량 데이터 분석 서비스를 운영하는 팀이 야간 리포트 생성 작업에 Gemini Flex 티어를 적용하여 Priority 티어 대비 API 비용을 절감하면서, 실시간 사용자 쿼리에는 Priority 티어를 유지하는 혼합 전략 구현
- 교육 플랫폼이 학생의 숙제 자동 채점(비실시간)에 Flex 티어, 실시간 학습 튜터링에 Priority 티어를 적용하여 전체 AI 운영 비용을 최적화
참고 출처: Gemma 4 공식 블로그 — Google | Gemma 4 Hugging Face | Gemma 4 Android AICore — Android Developers | NVIDIA Gemma 4 최적화 | Google AI Pro 5TB 업그레이드 — 9to5Google | Google AI Pro 업그레이드 — Tom’s Guide | Gemini API 체인지로그