학습 방법 선택

이 문서에서는 Vertex AI에서 AutoML, 커스텀 학습, Vertex AI의 Ray를 사용하여 모델을 학습시키는 것과 BigQuery ML을 사용하여 모델을 학습시키는 것의 주요 차이점을 설명합니다.

  • AutoML을 사용하면 최소한의 기술적 노력으로 모델을 만들고 학습시킬 수 있습니다. 개발에 투자하기에 앞서 AutoML을 사용하여 빠르게 모델의 프로토타입을 제작하고 새로운 데이터 세트를 살펴볼 수 있습니다. 예를 들어 이를 사용해서 특정 데이터 세트에 가장 적합한 기능을 확인할 수 있습니다.

  • 커스텀 학습을 사용하면 목표한 결과에 최적화된 학습 애플리케이션을 만들 수 있습니다. 애플리케이션 기능 학습을 완벽하게 제어할 수 있습니다. 즉, 목표를 지정하거나, 알고리즘을 사용하거나, 자체 손실 함수 또는 측정항목을 개발하거나, 기타 맞춤설정을 수행할 수 있습니다.

  • Vertex AI 기반 Ray를 사용하면 Google Cloud 인프라에서 Ray의 분산 컴퓨팅 프레임워크를 사용할 수 있습니다. Vertex AI의 Ray는 구성 가능한 컴퓨팅 리소스, Vertex AI 추론 및 BigQuery와 같은 서비스와의 통합, 분산 워크로드를 개발하고 실행하기 위한 유연한 네트워킹 옵션을 갖춘 관리형 환경을 제공합니다.

  • BigQuery를 사용하면 BigQuery에서 직접 BigQuery 데이터를 사용하여 모델을 학습시킬 수 있습니다. SQL 명령어를 사용하면 모델을 빠르게 만들어 일괄 추론을 수행할 수 있습니다.

각 서비스에 필요한 다양한 기능과 전문성을 비교하려면 다음 표를 검토하세요.

AutoML 커스텀 학습 Vertex AI 기반 Ray BigQuery ML
필요한 데이터 과학 전문 지식 아니요 예. 학습 애플리케이션을 개발하고 특성 추출과 같은 일부 데이터 준비 작업을 수행합니다. 머신러닝 개념 및 데이터 과학 워크플로에 대한 기본적인 이해가 있으면 도움이 됩니다. 아니요
프로그래밍 능력 필요 아니요. AutoML에는 코딩이 필요하지 않습니다. 예. 학습 애플리케이션을 개발하는 데 필요합니다. 예. 예.
모델 학습 시간 상대적으로 적게 걸림. 필요한 데이터 준비가 적고 개발이 필요하지 않습니다. 상대적으로 많이 걸림. 필요한 데이터 준비가 많고 학습 애플리케이션 개발도 필요합니다. 분산 학습을 사용하면 모델을 학습하는 데 걸리는 시간을 줄일 수 있습니다. 학습 시간은 코드 로직(데이터 준비 및 학습)과 리소스 프로비저닝 시간에 따라 달라집니다. 상대적으로 적게 걸림. BigQuery ML은 BigQuery 연산 엔진을 활용하기에 일괄 추론 또는 모델 학습에 필요한 인프라를 빌드할 필요가 없으므로 모델 개발 속도가 빨라집니다. 따라서 학습, 평가, 추론 속도가 빨라집니다.
머신러닝 목표 한도 예. AutoML의 사전 정의된 목표 중 하나를 타겟팅해야 합니다. 아니요 아니요
초매개변수 조정으로 모델 성능을 수동으로 최적화할 수 있습니다. 아니요. AutoML은 일부 자동화된 초매개변수 조정을 수행하지만 사용되는 값을 수정할 수는 없습니다. 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. 예. 커스텀 학습 코드를 제공하므로 Vertex AI에서 Ray 작업을 시작하기 전에 초매개변수 값을 수동으로 설정하거나 조정할 수 있습니다. 예. BigQuery ML은 `CREATE MODEL` 문을 사용하여 ML 모델을 학습시킬 때 초매개변수 조정을 지원합니다.
학습 환경의 측면을 제어할 수 있습니다. 제한적으로 가능. 이미지 및 테이블 형식 데이터 세트의 경우 학습시킬 노드 시간 및 학습 조기 중단 허용 여부를 지정할 수 있습니다. 예. Compute Engine 머신 유형, 디스크 크기, 머신러닝 프레임워크, 노드 수와 같은 환경의 측면은 물론 학습에 사용할 Docker 이미지도 지정할 수 있습니다. 예. 학습 환경의 다양한 측면을 크게 제어할 수 있습니다. 예를 들어 Vertex AI 기반 Ray 클러스터에 자체 커스텀 Docker 컨테이너 이미지를 가져올 수 있습니다. Ray 클러스터를 만들 때 사용할 가속기 (GPU)의 수와 유형을 비롯하여 헤드 노드와 작업자 노드의 머신 유형을 지정할 수 있습니다. 아니요
데이터 크기 제한

예. AutoML은 관리형 데이터 세트를 사용합니다. 데이터 크기 제한은 데이터 세트 유형에 따라 다릅니다. 구체적인 내용은 다음 주제 중 하나를 참조하세요.

관리되지 않는 데이터 세트의 경우에는 데이터 크기 제한이 없습니다. 관리형 데이터 세트에는 BigQuery에서 생성되고 호스팅되는 관리형 데이터 세트 객체와 동일한 한도가 적용되며 AutoML 모델을 학습시키는 데 사용됩니다. 아니요. 하지만 BigQuery 읽기의 경우 최대 쿼리 응답 크기는 10GB입니다. 이는 BigQuery API 응답 크기의 제한이며, 반복 또는 병렬 쿼리를 통해 Vertex AI의 Ray가 BigQuery에서 처리할 수 있는 총 데이터 양의 제한은 아닙니다. 예. BigQuery ML에서는 프로젝트 단위로 적절한 할당량을 적용합니다. 자세한 내용은 할당량 및 한도를 참조하세요.

다음 단계