Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud AI의 응용 연구 및 엔지니어링에 대해 알아보기

추천 도움말

Vertex AI를 사용한 모델 공동 호스팅으로 LLM 제공의 효율성 격차 해소

대규모 언어 모델 (LLM)의 환경이 진화함에 따라 '머신당 하나의 모델' 배포 패턴이 기업의 LLM 서빙 비용 효율성에 심각한 병목 현상이 되고 있습니다. 모델 공동 호스팅은 여러 모델 인스턴스가 동일한 가상 머신 및 GPU 리소스를 공유할 수 있도록 하여 이러한 효율성 격차를 해결합니다. 이 기술 블로그에서는 모델 공동 호스팅을 프로덕션 지원 클라우드 서비스로 가져오는 Vertex AI 엔지니어링의 프로세스를 자세히 설명합니다.

자료 읽기