이 문서에서는 Vertex AI에서 AutoML, 커스텀 학습, Vertex AI의 Ray를 사용하여 모델을 학습시키는 것과 BigQuery ML을 사용하여 모델을 학습시키는 것의 주요 차이점을 설명합니다.
AutoML을 사용하면 최소한의 기술적 노력으로 모델을 만들고 학습시킬 수 있습니다. 개발에 투자하기에 앞서 AutoML을 사용하여 빠르게 모델의 프로토타입을 제작하고 새로운 데이터 세트를 살펴볼 수 있습니다. 예를 들어 이를 사용해서 특정 데이터 세트에 가장 적합한 기능을 확인할 수 있습니다.
커스텀 학습을 사용하면 목표한 결과에 최적화된 학습 애플리케이션을 만들 수 있습니다. 애플리케이션 기능 학습을 완벽하게 제어할 수 있습니다. 즉, 목표를 지정하거나, 알고리즘을 사용하거나, 자체 손실 함수 또는 측정항목을 개발하거나, 기타 맞춤설정을 수행할 수 있습니다.
Vertex AI 기반 Ray를 사용하면 Google Cloud 인프라에서 Ray의 분산 컴퓨팅 프레임워크를 사용할 수 있습니다. Vertex AI의 Ray는 구성 가능한 컴퓨팅 리소스, Vertex AI 추론 및 BigQuery와 같은 서비스와의 통합, 분산 워크로드를 개발하고 실행하기 위한 유연한 네트워킹 옵션을 갖춘 관리형 환경을 제공합니다.
BigQuery를 사용하면 BigQuery에서 직접 BigQuery 데이터를 사용하여 모델을 학습시킬 수 있습니다. SQL 명령어를 사용하면 모델을 빠르게 만들어 일괄 추론을 수행할 수 있습니다.
각 서비스에 필요한 다양한 기능과 전문성을 비교하려면 다음 표를 검토하세요.
AutoML | 커스텀 학습 | Vertex AI 기반 Ray | BigQuery ML | |
---|---|---|---|---|
필요한 데이터 과학 전문 지식 | 아니요 | 예. 학습 애플리케이션을 개발하고 특성 추출과 같은 일부 데이터 준비 작업을 수행합니다. | 머신러닝 개념 및 데이터 과학 워크플로에 대한 기본적인 이해가 있으면 도움이 됩니다. | 아니요 |
프로그래밍 능력 필요 | 아니요. AutoML에는 코딩이 필요하지 않습니다. | 예. 학습 애플리케이션을 개발하는 데 필요합니다. | 예. | 예. |
모델 학습 시간 | 상대적으로 적게 걸림. 필요한 데이터 준비가 적고 개발이 필요하지 않습니다. | 상대적으로 많이 걸림. 필요한 데이터 준비가 많고 학습 애플리케이션 개발도 필요합니다. 분산 학습을 사용하면 모델을 학습하는 데 걸리는 시간을 줄일 수 있습니다. | 학습 시간은 코드 로직(데이터 준비 및 학습)과 리소스 프로비저닝 시간에 따라 달라집니다. | 상대적으로 적게 걸림. BigQuery ML은 BigQuery 연산 엔진을 활용하기에 일괄 추론 또는 모델 학습에 필요한 인프라를 빌드할 필요가 없으므로 모델 개발 속도가 빨라집니다. 따라서 학습, 평가, 추론 속도가 빨라집니다. |
머신러닝 목표 한도 | 예. AutoML의 사전 정의된 목표 중 하나를 타겟팅해야 합니다. | 아니요 | 아니요 | 예 |
초매개변수 조정으로 모델 성능을 수동으로 최적화할 수 있습니다. | 아니요. AutoML은 일부 자동화된 초매개변수 조정을 수행하지만 사용되는 값을 수정할 수는 없습니다. | 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. | 예. 커스텀 학습 코드를 제공하므로 Vertex AI에서 Ray 작업을 시작하기 전에 초매개변수 값을 수동으로 설정하거나 조정할 수 있습니다. | 예. BigQuery ML은 `CREATE MODEL` 문을 사용하여 ML 모델을 학습시킬 때 초매개변수 조정을 지원합니다. |
학습 환경의 측면을 제어할 수 있습니다. | 제한적으로 가능. 이미지 및 테이블 형식 데이터 세트의 경우 학습시킬 노드 시간 및 학습 조기 중단 허용 여부를 지정할 수 있습니다. | 예. Compute Engine 머신 유형, 디스크 크기, 머신러닝 프레임워크, 노드 수와 같은 환경의 측면은 물론 학습에 사용할 Docker 이미지도 지정할 수 있습니다. | 예. 학습 환경의 다양한 측면을 크게 제어할 수 있습니다. 예를 들어 Vertex AI 기반 Ray 클러스터에 자체 커스텀 Docker 컨테이너 이미지를 가져올 수 있습니다. Ray 클러스터를 만들 때 사용할 가속기 (GPU)의 수와 유형을 비롯하여 헤드 노드와 작업자 노드의 머신 유형을 지정할 수 있습니다. | 아니요 |
데이터 크기 제한 |
예. AutoML은 관리형 데이터 세트를 사용합니다. 데이터 크기 제한은 데이터 세트 유형에 따라 다릅니다. 구체적인 내용은 다음 주제 중 하나를 참조하세요. |
관리되지 않는 데이터 세트의 경우에는 데이터 크기 제한이 없습니다. 관리형 데이터 세트에는 BigQuery에서 생성되고 호스팅되는 관리형 데이터 세트 객체와 동일한 한도가 적용되며 AutoML 모델을 학습시키는 데 사용됩니다. | 아니요. 하지만 BigQuery 읽기의 경우 최대 쿼리 응답 크기는 10GB입니다. 이는 BigQuery API 응답 크기의 제한이며, 반복 또는 병렬 쿼리를 통해 Vertex AI의 Ray가 BigQuery에서 처리할 수 있는 총 데이터 양의 제한은 아닙니다. | 예. BigQuery ML에서는 프로젝트 단위로 적절한 할당량을 적용합니다. 자세한 내용은 할당량 및 한도를 참조하세요. |
다음 단계
- Vertex AI Training을 시작하려면 입문 튜토리얼을 선택합니다.
- AutoML 모델 학습에 대해 자세히 알아보세요.
- Python을 사용하여 커스텀 학습 작업 만들기에 대해 알아보기
- Vertex AI 기반 Ray에 대해 자세히 알아보세요.