GKE 생성형 AI 기능을 사용하여 AI 모델 추론을 시작하세요.

GKE 기반 AI/ML 조정 문서

Google Kubernetes Engine(GKE)은 전체 AI/ML 수명 주기를 조정할 수 있는 통합형 단일 플랫폼을 제공합니다. 학습, 추론, 에이전트 워크로드를 강화할 수 있는 강력한 기능과 유연성을 제공하므로 인프라를 간소화하고 결과를 제공할 수 있습니다. GKE의 최첨단 조정 기능은 다음을 제공합니다.

하드웨어 가속기: 학습과 추론을 위해 필요한 강력한 GPU 및 TPU에 액세스하고 이를 대규모로 관리합니다.
스택 유연성: 이미 알고 있고 신뢰할 수 있는 분산 컴퓨팅, 데이터 처리, 모델 서빙 프레임워크와 통합합니다.
관리형 Kubernetes의 간편함: 관리형 플랫폼의 모든 이점을 활용하여 유연성을 유지하면서 전체 AI/ML 수명 주기를 자동화 및 확장하고 보안을 강화합니다.

Google의 블로그, 튜토리얼, 권장사항을 살펴보고 GKE에서 AI/ML 워크로드를 최적화하는 방법을 알아보세요. 이점 및 사용 가능한 기능에 대한 자세한 내용은 GKE의 AI/ML 워크로드 소개 개요를 참조하세요.

무료로 시작하기

무료 크레딧 $300로 개념 증명 시작

Gemini 2.0 Flash Thinking 이용
AI API 및 BigQuery를 포함하여 인기 제품 월별 무료 사용량
자동 청구, 약정 없음

무료 제품 혜택 보기

20개가 넘는 항상 무료 제품을 계속 살펴보기

AI API, VM, 데이터 웨어하우스 등 일반적인 사용 사례에 20개가 넘는 무료 제품을 사용할 수 있습니다.

문서 리소스

빠른 시작 및 가이드를 찾고 주요 참조를 검토하며 일반적인 문제에 대한 도움을 받을 수 있습니다.

GKE 생성형 AI 기능을 사용하여 AI 모델 추론을 시작하세요.

GKE 기반 AI/ML 조정 문서

무료 크레딧 $300로 개념 증명 시작

20개가 넘는 항상 무료 제품을 계속 살펴보기

AI 인프라 및 가속기 관리

대규모 AI 모델 학습

추론을 위한 AI 모델 서빙

관련 동영상