Gemini로 클러스터 설계 및 최적화

이 문서에서는 Gemini에 프롬프트를 입력하여 클러스터를 계획하고 설계하는 방법을 설명합니다.

Google Cloud 콘솔에서 Gemini를 AI 기반 인터페이스로 사용하여 하드웨어 옵션을 평가하고, 배포 비용을 추정하고, 클러스터에 권장되는 구성을 확인할 수 있습니다. Gemini는 추천을 맞춤설정하기 위해 할당량 한도, 기존 예약, 약정 사용 할인 (CUD), 기본 리전 및 영역, 리소스 위치 제약 조건을 확인하여 Google Cloud 프로젝트를 평가합니다. Gemini를 사용하여 계획을 세우면 클러스터를 만들거나 수정하기 전에 워크로드에 최적화된 구성을 만들 수 있습니다.

클러스터를 만들기 전이나 만들 때 구성해야 하는 구성요소에 대해 자세히 알아보려면 배포 옵션 개요를 참고하세요.

제한사항

Google Cloud 콘솔에서 Gemini에 프롬프트를 입력하는 경우 Gemini를 사용하여 리소스를 생성, 수정 또는 삭제할 수 없습니다.

시작하기 전에

Google Cloud 콘솔을 사용하여 Google Cloud 서비스 및 API에 액세스하는 경우 인증을 설정할 필요가 없습니다.

필요한 역할

Gemini에 액세스하고 프롬프트를 표시하는 데 필요한 권한을 얻으려면 관리자에게 프로젝트에 대한 클러스터 디렉터 뷰어 (roles/hypercomputecluster.viewer) IAM 역할을 부여해 달라고 요청하세요. 역할 부여에 대한 자세한 내용은 프로젝트, 폴더, 조직에 대한 액세스 관리를 참조하세요.

이 사전 정의된 역할에는 Gemini에 액세스하고 프롬프트를 표시하는 데 필요한 권한이 포함되어 있습니다. 필요한 정확한 권한을 보려면 필수 권한 섹션을 펼치세요.

필수 권한

Gemini에 액세스하고 프롬프트를 사용하려면 다음 권한이 필요합니다.

  • 클러스터 목록을 보려면 다음을 실행하세요. hypercomputecluster.clusters.list

커스텀 역할이나 다른 사전 정의된 역할을 사용하여 이 권한을 부여받을 수도 있습니다.

Google Cloud 콘솔에서 Gemini에 액세스

Google Cloud 콘솔에서 Gemini에 액세스하려면 다음 단계를 완료하세요.

  1. Google Cloud 콘솔에서 개요 페이지로 이동합니다.

    개요로 이동

  2. Compute Advisor로 인프라 설계 섹션에서 새 채팅 시작을 클릭합니다.

  3. 컴퓨트 어드바이저 페이지에서 다음을 확인할 수 있습니다.

    Compute Advisor 페이지와 이를 구성하는 UI 요소의 스크린샷

    앞의 스크린샷에 표시된 UI 요소는 다음과 같습니다.

    • 대화 기록 측면 패널: 최근 채팅을 표시합니다. 이 패널은 다음과 같이 상호작용할 수 있습니다.

      • 새 대화를 시작하려면 새 채팅을 클릭합니다.

      • 최근 대화를 다시 시작하려면 최근 채팅 섹션에서 대화를 클릭합니다.

      • 모든 대화 목록을 보려면 모두 보기를 클릭합니다. 내 기록 페이지에서 이전 대화의 세부정보를 확인하고 대화를 다시 시작하거나 더 이상 필요하지 않은 대화를 삭제할 수 있습니다.

    • 빠른 작업 프롬프트 카드: 각각 샘플 프롬프트가 포함된 카드 세트입니다. 카드를 클릭하면 Google Cloud 콘솔에서 프롬프트 상자에 샘플 프롬프트를 자동으로 채웁니다.

    • 프롬프트 상자: 이 필드에서 프롬프트를 입력하고 제출할 수 있습니다. 프롬프트를 제출하려면 프롬프트 제출을 클릭합니다.

Gemini에 프롬프트 입력하기

프롬프트를 제출하면 Gemini가 대답을 생성하기 시작합니다. 창이 표시되고 Google Cloud 콘솔에 프롬프트에 대한 대답이 창에 표시됩니다(다음 스크린샷 참고).

프롬프트를 제출한 후의 Compute Advisor 페이지 스크린샷

프롬프트에 따라 대답 창에는 다음 요소가 포함됩니다.

  • 컨텍스트 기반 그라운딩: Gemini는 프로젝트 컨텍스트를 자동으로 평가하여 할당량 한도, 기존 예약, CUD, 기본 리전 및 영역, 리소스 위치 제약 조건 등 맞춤설정된 추천을 제공합니다.

  • 대화형 코드 스니펫: Gemini가 gcloud 명령어, REST API 메서드 또는 Terraform 리소스를 생성합니다. 이러한 코드 스니펫을 복사하여 붙여넣거나 Cloud Shell에서 실행할 수 있습니다.

  • 시각적 캔버스: Gemini가 추천을 구조화된 표와 나란히 비교로 정리합니다. 이 보기를 사용하면 제품 기능과 아키텍처 접근 방식을 평가할 수 있습니다. 또한 사용 사례에 대한 구현 계획을 제공합니다.

다음 섹션에서는 프롬프트 작성에 관한 권장사항과 클러스터를 만들거나 수정하기 전에 사용할 수 있는 프롬프트의 예를 간략하게 설명합니다.

프롬프트 권장사항

Gemini로부터 가장 정확하고 실행 가능한 추천을 받으려면 코드 블록을 작성하는 것과 같은 방식으로 프롬프트를 구성하는 것이 좋습니다. 이 접근 방식은 명확한 매개변수 선언, 역할 정의, 구체적인 지침, 명시적인 출력 형식을 사용하여 생성형 AI를 안내합니다.

Gemini에 프롬프트를 입력할 때는 다음 권장사항을 고려하세요.

  • 설계 및 계획에 집중: Gemini에 클러스터 오류 문제 해결을 요청하지 않는 것이 좋습니다. 이러한 오류를 해결하려면 컴퓨팅 인스턴스 생성, 업데이트, 삭제 문제 해결을 참고하세요.

  • 페르소나 또는 역할 지정: Gemini가 채택할 대상 역할 또는 페르소나(예: IT 관리자, AI 연구원, 플랫폼 엔지니어)를 선언합니다. 이 접근 방식은 결과 추천의 어조, 깊이, 전문성 수준을 안내합니다.

  • 명시적이고 번호가 매겨진 요청 사항 제공: 목표를 구체적인 단계별 질문이나 작업으로 분류합니다. 이 접근 방식은 Gemini의 추론 프로세스를 구조화하고 Gemini가 모든 요구사항을 충족하도록 지원합니다.

  • 특정 출력 형식 정의: 둘러보기 설명, Markdown 비교 표, 바로 사용할 수 있는 gcloud 코드 블록 등 추천의 형식을 명시적으로 지정합니다.

  • 자동 컨텍스트 그라운딩 활용: 프롬프트에 기본 리전 또는 영역, 사용 가능한 할당량, CUD 또는 리소스 위치 제약 조건을 포함하지 않아도 됩니다. Gemini는 Google Cloud 프로젝트에서 이 정보에 액세스할 수 있습니다.

  • 디자인 반복적으로 개선: 새 프롬프트를 전송하여 Gemini가 생성한 대답을 수정하거나 확장할 수 있습니다. 예를 들어 새 대화를 시작하지 않고 어시스턴트에게 네트워킹 권장사항을 배포 계획에 추가하거나 스토리지 요구사항을 수정해 달라고 요청할 수 있습니다.

프롬프트 예시

다음은 클러스터를 설계하고 최적화하는 데 사용할 수 있는 프롬프트의 예입니다.

  • 클러스터 토폴로지 및 배치 전략: 고성능 AI 워크로드에 최적화된 배포 모델과 배치 정책을 결정하려면 다음과 같은 프롬프트를 사용하세요.

    Act as an AI researcher. I need to design a cluster topology in
    Cluster Director for training a large language model that balances high
    accelerator performance with guaranteed capacity.
    
    Please provide the following:
    1. A side-by-side comparison of deploying A3 Mega VMs across different
       regions.
    2. An explanation of how topology-aware scheduling minimizes network
       latency.
    3. The optimal reservation configuration for this training workload.
    
    Format the comparison as a Markdown table, and provide the deployment steps
    as a ready-to-use gcloud code block.
    
  • 모델 프로비저닝 및 비용 최적화: 프로비저닝 모델을 평가하고 일괄 처리 비용을 줄이려면 다음과 같은 프롬프트를 사용하세요.

    Act as an IT administrator. I need to find the cheapest way to run large,
    interruptible batch jobs on our clusters in Cluster Director
    without risking data loss.
    
    Please provide the following:
    1. A cost and reliability comparison of standard discounted VMs against
       Spot VMs.
    2. An explanation of how to provision all our compute power at the exact
       same time.
    3. A deployment script that gives our jobs a two-minute warning before a
       Spot VM gets reclaimed.
    
    Format the comparison as a Markdown table, and provide the steps to take in
    the Google Cloud console.
    

다음 단계