이 문서에서는 Google Cloud에서 사용할 수 있는 학습 방법 간의 주요 차이점을 설명합니다. 어떤 방식을 선택할지는 팀의 전문성, 필요한 제어 수준, 인프라 선호도에 따라 달라집니다.
AutoML을 사용하면 최소한의 기술적 노력으로 모델을 만들고 학습시킬 수 있습니다. 개발에 투자하기에 앞서 AutoML을 사용하여 빠르게 모델의 프로토타입을 제작하고 새로운 데이터 세트를 살펴볼 수 있습니다. 예를 들어 이를 사용해서 특정 데이터 세트에 가장 적합한 기능을 확인할 수 있습니다.
커스텀 학습을 사용하면 목표한 결과에 최적화된 학습 애플리케이션을 만들 수 있습니다. 단일 노드 작업부터 대규모 다중 노드 분산 학습까지 학습 애플리케이션 기능을 전적으로 제어할 수 있습니다. 즉, 어떤 목표도 설정할 수 있고, 어떤 알고리즘이든 사용할 수 있으며, 고유한 손실 함수나 측정항목을 개발하거나 기타 원하는 대로 맞춤설정할 수 있습니다.
Colab Enterprise 서버리스 학습: 이 방식은 학습 작업을 제출하면 가 필요한 컴퓨팅 리소스를 프로비저닝, 관리, 해제하는 서버리스 방식입니다. Google Cloud 이는 실험 단계나 보장된 용량이 필요하지 않은 작업에 적합합니다.
Colab Enterprise Training 클러스터 는 대규모 고성능 학습 작업을 위해 설계된 커스텀 학습 기능의 일부입니다. 이 기능을 사용하면 강력한 컴퓨팅 리소스 (A100 또는 H100 GPU 등)로 구성된 전용 클러스터를 단독으로 예약할 수 있으며, 미션 크리티컬하거나 장시간 실행되는 학습 작업에 필요한 용량과 성능을 보장할 수 있습니다.
Agent Platform 기반 Ray를 사용하면 Ray의 분산 컴퓨팅 프레임워크를 인프라에서 활용할 수 있습니다. Google Cloud Agent Platform 기반 Ray는 구성 가능한 컴퓨팅 리소스, Agent Platform Inference 및 BigQuery와의 서비스 통합, 분산 워크로드 개발 및 실행을 위한 유연한 네트워킹 옵션을 갖춘 관리형 환경을 제공합니다.
BigQuery를 사용하면 BigQuery에서 직접 BigQuery 데이터를 사용하여 모델을 학습시킬 수 있습니다. SQL 명령어를 사용하면 모델을 빠르게 만들어 일괄 추론을 수행할 수 있습니다.
각 서비스에 필요한 다양한 기능과 전문성을 비교하려면 다음 표를 검토하세요.
| AutoML | 서버리스 학습 | 클러스터 학습 | BigQuery의 Ray | BigQuery ML | |
|---|---|---|---|---|---|
| 필요한 데이터 과학 전문 지식 | 아니요 | 예. 학습 애플리케이션 개발과 데이터 준비에 필요합니다. | 예. 학습 애플리케이션 개발과 데이터 준비에 필요합니다. | 기본적인 ML 개념과 데이터 워크플로 이해가 있으면 도움이 됩니다. | 아니요 |
| 프로그래밍 능력 필요 | 아니요. AutoML은 코딩이 필요하지 않습니다. | 예. 학습 애플리케이션 개발에 필요합니다. | 예. 학습 애플리케이션 개발에 필요합니다. | 예. | 예. |
| 모델 학습 소요 시간 | 짧음. 필요한 데이터 준비 작업이 적고 개발이 필요하지 않습니다. | 김. 코드 개발과 각 작업마다 주문형 리소스 프로비저닝 시간이 필요합니다. | 김. 코드 개발이 필요하지만 리소스가 이미 예약되어 있으므로 대기열 및 프로비저닝 시간이 제거되어 시작 속도는 더 빠릅니다. | 학습 시간은 코드 논리(데이터 준비 및 학습)와 리소스 프로비저닝 시간에 따라 달라집니다. | 짧음. BigQuery ML은 BigQuery 연산 엔진을 활용해 학습, 평가, 추론을 수행하므로 모델 개발 속도가 빠릅니다. |
| 지원하는 머신러닝 목표의 제한 여부 | 예. AutoML이 제공하는 사전 정의된 목표 중 하나를 선택해야 합니다. | 아니요 | 아니요 | 아니요 | 예 |
| 하이퍼파라미터 조정을 통한 수동 모델 성능 최적화 가능 여부 | 아니요. AutoML이 자동 조정을 수행하지만 값을 직접 수정할 수는 없습니다. | 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. | 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. | 예. 커스텀 학습 코드를 제공하므로 하이퍼파라미터 값을 완전히 제어할 수 있습니다. | 예. BigQuery ML은 모델 학습 시 하이퍼파라미터 조정을 지원합니다. |
| 학습 환경 요소 제어 가능 여부 | 제한적. 학습 시간 예산을 지정하고 조기 중단만 사용 설정할 수 있습니다. | 예. 각 작업의 Compute Engine 머신 유형, 디스크 크기, 컨테이너 이미지를 지정할 수 있습니다. | 예. 특정 고성능 머신 유형 (예: H100), 디스크 구성, 네트워크 설정을 단독으로 예약해 용량을 보장받을 수 있습니다. | 예. 커스텀 Docker 이미지, 헤드 및 워커 노드의 머신 유형, 가속기(GPU) 수량, 유형까지 다양한 요소를 제어할 수 있습니다. | 아니요 |
| 데이터 크기 제한 여부 | 예. 데이터 크기 제한은 데이터 세트 유형에 따라 달라집니다. | 아니요 | 아니요 | 아니요. 다만 BigQuery 읽기 시 최대 쿼리 응답 크기는 10GB입니다. | 예. BigQuery ML에서는 프로젝트 단위로 적절한 할당량을 적용합니다. 자세한 내용은 할당량 및 한도를 참조하세요. |
다음 단계
- Vertex AI Training을 시작하려면 입문 튜토리얼을 선택합니다.
- AutoML 모델 학습에 대해 자세히 알아보세요.
- Colab Enterprise 서버리스 학습에 대해 알아보세요.
- Colab Enterprise Training 클러스터에 대해 알아보세요.
- BigQuery의 Ray에 대해 자세히 알아보세요.