학습 방법 선택

이 문서에서는 Google Cloud에서 사용할 수 있는 학습 방법 간의 주요 차이점을 설명합니다. 어떤 방식을 선택할지는 팀의 전문성, 필요한 제어 수준, 인프라 선호도에 따라 달라집니다.

  • AutoML을 사용하면 최소한의 기술적 노력으로 모델을 만들고 학습시킬 수 있습니다. 개발에 투자하기에 앞서 AutoML을 사용하여 빠르게 모델의 프로토타입을 제작하고 새로운 데이터 세트를 살펴볼 수 있습니다. 예를 들어 이를 사용해서 특정 데이터 세트에 가장 적합한 기능을 확인할 수 있습니다.

  • 커스텀 학습을 사용하면 목표한 결과에 최적화된 학습 애플리케이션을 만들 수 있습니다. 단일 노드 작업부터 대규모 다중 노드 분산 학습까지 학습 애플리케이션 기능을 전적으로 제어할 수 있습니다. 즉, 어떤 목표도 설정할 수 있고, 어떤 알고리즘이든 사용할 수 있으며, 고유한 손실 함수나 측정항목을 개발하거나 기타 원하는 대로 맞춤설정할 수 있습니다.

    • Vertex AI 서버리스 학습: 이 방식은 학습 작업을 제출하면 Google Cloud 가 필요한 컴퓨팅 리소스를 프로비저닝, 관리, 해제하는 서버리스 방식입니다. 이는 실험 단계나 보장된 용량이 필요하지 않은 작업에 적합합니다.

    • Vertex AI Training 클러스터는 대규모 고성능 학습 작업을 위해 설계된 커스텀 학습 기능의 일부입니다. 이 기능을 사용하면 강력한 컴퓨팅 리소스(A100 또는 H100 GPU 등)로 구성된 전용 클러스터를 단독으로 예약할 수 있으며, 미션 크리티컬하거나 장시간 실행되는 학습 작업에 필요한 용량과 성능을 보장할 수 있습니다.

  • Vertex AI 기반 Ray를 사용하면 Google Cloud 인프라에서 Ray의 분산 컴퓨팅 프레임워크를 활용할 수 있습니다. Vertex AI 기반 Ray는 구성 가능한 컴퓨팅 리소스, Vertex AI Inference 및 BigQuery와의 서비스 통합, 분산 워크로드 개발 및 실행을 위한 유연한 네트워킹 옵션을 갖춘 관리형 환경을 제공합니다.

  • BigQuery를 사용하면 BigQuery에서 직접 BigQuery 데이터를 사용하여 모델을 학습시킬 수 있습니다. SQL 명령어를 사용하면 모델을 빠르게 만들어 일괄 추론을 수행할 수 있습니다.

각 서비스에 필요한 다양한 기능과 전문성을 비교하려면 다음 표를 검토하세요.

AutoML 서버리스 학습 클러스터 학습 Vertex AI 기반 Ray BigQuery ML
필요한 데이터 과학 전문 지식 아니요 예. 학습 애플리케이션 개발과 데이터 준비에 필요합니다. 예. 학습 애플리케이션 개발과 데이터 준비에 필요합니다. 기본적인 ML 개념과 데이터 워크플로 이해가 있으면 도움이 됩니다. 아니요
프로그래밍 능력 필요 아니요. AutoML은 코딩이 필요하지 않습니다. 예. 학습 애플리케이션 개발에 필요합니다. 예. 학습 애플리케이션 개발에 필요합니다. 예. 예.
모델 학습 소요 시간 짧음. 필요한 데이터 준비 작업이 적고 개발이 필요하지 않습니다. 김. 코드 개발과 각 작업마다 주문형 리소스 프로비저닝 시간이 필요합니다. 김. 코드 개발이 필요하지만 리소스가 이미 예약되어 있으므로 대기열 및 프로비저닝 시간이 제거되어 시작 속도는 더 빠릅니다. 학습 시간은 코드 논리(데이터 준비 및 학습)와 리소스 프로비저닝 시간에 따라 달라집니다. 짧음. BigQuery ML은 BigQuery 연산 엔진을 활용해 학습, 평가, 추론을 수행하므로 모델 개발 속도가 빠릅니다.
지원하는 머신러닝 목표의 제한 여부 예. AutoML이 제공하는 사전 정의된 목표 중 하나를 선택해야 합니다. 아니요 아니요 아니요
하이퍼파라미터 조정을 통한 수동 모델 성능 최적화 가능 여부 아니요. AutoML이 자동 조정을 수행하지만 값을 직접 수정할 수는 없습니다. 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. 예. 각 학습 실행 중에 실험 및 비교를 위해 모델을 조정할 수 있습니다. 예. 커스텀 학습 코드를 제공하므로 하이퍼파라미터 값을 완전히 제어할 수 있습니다. 예. BigQuery ML은 모델 학습 시 하이퍼파라미터 조정을 지원합니다.
학습 환경 요소 제어 가능 여부 제한적. 학습 시간 예산을 지정하고 조기 중단만 사용 설정할 수 있습니다. 예. 각 작업의 Compute Engine 머신 유형, 디스크 크기, 컨테이너 이미지를 지정할 수 있습니다. 예. 특정 고성능 머신 유형(예: H100), 디스크 구성, 네트워크 설정을 단독으로 예약해 용량을 보장받을 수 있습니다. 예. 커스텀 Docker 이미지, 헤드 및 워커 노드의 머신 유형, 가속기(GPU) 수량, 유형까지 다양한 요소를 제어할 수 있습니다. 아니요
데이터 크기 제한 여부 예. 데이터 크기 제한은 데이터 세트 유형에 따라 달라집니다. 아니요 아니요 아니요. 다만 BigQuery 읽기 시 최대 쿼리 응답 크기는 10GB입니다. 예. BigQuery ML에서는 프로젝트 단위로 적절한 할당량을 적용합니다. 자세한 내용은 할당량 및 한도를 참조하세요.

다음 단계