Cloud AI의 응용 연구 및 엔지니어링에 대해 알아보기

추천 도움말

대규모 언어 모델 (LLM)의 환경이 진화함에 따라 '머신당 하나의 모델' 배포 패턴이 기업의 LLM 서빙 비용 효율성에 심각한 병목 현상이 되고 있습니다. 모델 공동 호스팅은 여러 모델 인스턴스가 동일한 가상 머신 및 GPU 리소스를 공유할 수 있도록 하여 이러한 효율성 격차를 해결합니다. 이 기술 블로그에서는 모델 공동 호스팅을 프로덕션 지원 클라우드 서비스로 가져오는 Vertex AI 엔지니어링의 프로세스를 자세히 설명합니다.

최근 도움말