이 가이드에서는 Gemini Enterprise Agent Platform Vision을 사용하기 위해 Google Cloud 프로젝트를 설정하는 방법을 설명합니다.
프로젝트 설정
- 계정에 로그인합니다. Google Cloud 를 처음 사용하는 경우 Google Cloud 계정을 만들어 실제 시나리오에서 제품이 어떻게 작동하는지 평가하세요. 신규 고객에게는 워크로드를 실행, 테스트, 배포하는 데 사용할 수 있는 $300의 무료 크레딧이 제공됩니다.
-
Google Cloud CLI를 설치합니다.
-
외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.
-
gcloud CLI를 초기화하려면, 다음 명령어를 실행합니다.
gcloud init -
프로젝트를 만들거나 Google Cloud 선택합니다.
프로젝트를 선택하거나 만드는 데 필요한 역할
- 프로젝트 선택: 프로젝트를 선택하는 데 특정 IAM 역할이 필요하지 않습니다. 역할이 부여된 프로젝트를 선택할 수 있습니다.
-
프로젝트 만들기: 프로젝트를 만들려면
resourcemanager.projects.create권한이 포함된 프로젝트 생성자 역할 (roles/resourcemanager.projectCreator)이 필요합니다. 역할을 부여하는 방법을 알아보세요.
-
프로젝트 만들기: Google Cloud
gcloud projects create PROJECT_ID
PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다. -
생성한 Google Cloud 프로젝트를 선택합니다.
gcloud config set project PROJECT_ID
PROJECT_ID를 Google Cloud 프로젝트 이름으로 바꿉니다.
Vertex AI Vision API를 사용 설정합니다.
API 사용 설정에 필요한 역할
API를 사용 설정하려면 역할 (
roles/serviceusage.serviceUsageAdmin)이 포함된 서비스 사용량 관리자 IAMserviceusage.services.enable권한이 필요합니다. 역할을 부여하는 방법을 알아보세요.gcloud services enable visionai.googleapis.com
-
인증을 설정합니다.
-
서비스 계정 만들기 IAM 역할
(
roles/iam.serviceAccountCreator) 및 프로젝트 IAM 관리자 역할 (roles/resourcemanager.projectIamAdmin)이 있는지 확인합니다. 역할을 부여하는 방법을 알아보세요. -
서비스 계정을 만듭니다.
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
SERVICE_ACCOUNT_NAME을 서비스 계정 이름으로 바꿉니다. -
서비스 계정에
roles/visionai.editorIAM 역할을 부여합니다.gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor
다음을 바꿉니다.
SERVICE_ACCOUNT_NAME: 서비스 계정의 이름입니다.PROJECT_ID: 서비스 계정을 만든 프로젝트 ID입니다.
-
키 파일을 생성합니다.
gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
다음을 바꿉니다.
FILE_NAME: 키 파일의 이름입니다.SERVICE_ACCOUNT_NAME: 서비스 계정의 이름입니다.PROJECT_ID: 서비스 계정을 만든 프로젝트 ID입니다.
-
서비스 계정 만들기 IAM 역할
(
-
환경 변수
GOOGLE_APPLICATION_CREDENTIALS를 사용자 인증 정보가 포함된 JSON 파일의 경로로 설정합니다. 이 변수는 현재 셸 세션에만 적용되므로 새 세션을 열면 변수를 다시 설정합니다. -
Google Cloud CLI를 설치합니다.
-
외부 ID 공급업체(IdP)를 사용하는 경우 먼저 제휴 ID로 gcloud CLI에 로그인해야 합니다.
-
gcloud CLI를 초기화하려면, 다음 명령어를 실행합니다.
gcloud init -
프로젝트를 만들거나 Google Cloud 선택합니다.
프로젝트를 선택하거나 만드는 데 필요한 역할
- 프로젝트 선택: 프로젝트를 선택하는 데 특정 IAM 역할이 필요하지 않습니다. 역할이 부여된 프로젝트를 선택할 수 있습니다.
-
프로젝트 만들기: 프로젝트를 만들려면
resourcemanager.projects.create권한이 포함된 프로젝트 생성자 역할 (roles/resourcemanager.projectCreator)이 필요합니다. 역할을 부여하는 방법을 알아보세요.
-
프로젝트 만들기: Google Cloud
gcloud projects create PROJECT_ID
PROJECT_ID를 만들려는 Google Cloud 프로젝트의 이름으로 바꿉니다. -
생성한 Google Cloud 프로젝트를 선택합니다.
gcloud config set project PROJECT_ID
PROJECT_ID를 Google Cloud 프로젝트 이름으로 바꿉니다.
Vertex AI Vision API를 사용 설정합니다.
API 사용 설정에 필요한 역할
API를 사용 설정하려면 역할 (
roles/serviceusage.serviceUsageAdmin)이 포함된 서비스 사용량 관리자 IAMserviceusage.services.enable권한이 필요합니다. 역할을 부여하는 방법을 알아보세요.gcloud services enable visionai.googleapis.com
-
인증을 설정합니다.
-
서비스 계정 만들기 IAM 역할
(
roles/iam.serviceAccountCreator) 및 프로젝트 IAM 관리자 역할 (roles/resourcemanager.projectIamAdmin)이 있는지 확인합니다. 역할을 부여하는 방법을 알아보세요. -
서비스 계정을 만듭니다.
gcloud iam service-accounts create SERVICE_ACCOUNT_NAME
SERVICE_ACCOUNT_NAME을 서비스 계정 이름으로 바꿉니다. -
서비스 계정에
roles/visionai.editorIAM 역할을 부여합니다.gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor
다음을 바꿉니다.
SERVICE_ACCOUNT_NAME: 서비스 계정의 이름입니다.PROJECT_ID: 서비스 계정을 만든 프로젝트 ID입니다.
-
키 파일을 생성합니다.
gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com
다음을 바꿉니다.
FILE_NAME: 키 파일의 이름입니다.SERVICE_ACCOUNT_NAME: 서비스 계정의 이름입니다.PROJECT_ID: 서비스 계정을 만든 프로젝트 ID입니다.
-
서비스 계정 만들기 IAM 역할
(
-
환경 변수
GOOGLE_APPLICATION_CREDENTIALS를 사용자 인증 정보가 포함된 JSON 파일의 경로로 설정합니다. 이 변수는 현재 셸 세션에만 적용되므로 새 세션을 열면 변수를 다시 설정합니다.
특정 작업을 수행하려면 Agent Platform Vision 외에 추가 Google Cloud 제품을 사용해야 합니다. 다른 Google Cloud 제품을 사용하려면 추가 설정 작업을 실행해야 할 수 있습니다.
Gemini Enterprise Agent Platform Vision SDK
Agent Platform Vision 소프트웨어 개발 키트 (SDK)에는 Agent Platform Vision으로 프로그램과 커스텀 워크플로를 개발하는 데 사용할 수 있는 도구와 라이브러리가 포함되어 있습니다.
이러한 도구는 Agent Platform Vision을 사용하여 솔루션을 사용하거나 개발할 때 생산성을 높이는 데 도움이 되는 바이너리 소스 파일 집합을 나타냅니다. 이러한 바이너리 소스 파일을 스크립팅에 추가하여 대규모 배포를 관리할 수도 있습니다. 명령줄 인터페이스 (CLI) vaictl이 이 카테고리의 예입니다.
라이브러리는 Agent Platform Vision으로 다양한 형식의 I/O를 프로그래매틱 방식으로 관리, 제어, 실행하는 데 사용할 수 있는 프로그래밍 API 집합을 나타냅니다. C++ 프로그래밍 API가 이 카테고리의 예입니다.
도구와 라이브러리의 코드는 모두 오픈소스이며 개발자가 직접 빌드할 수 있습니다. 도구의 경우 직접 사용할 수 있도록 다운로드할 수 있는 특정 플랫폼의 사전 빌드된 바이너리 파일도 제공합니다. 플랫폼이 직접 지원되지 않는 경우 Docker 이미지도 제공합니다.
기본 요건
Gemini Enterprise Agent Platform Vision SDK를 사용하기 전에 다음 기본 요건을 고려하세요.
지원되는 플랫폼
Debian 기반 Linux 배포판을 실행하는 x86 머신만 직접 지원합니다. 다른 플랫폼을 사용하는 경우 도구가 이미 빌드되고 설치된 Docker 이미지도 제공합니다.
추가 소프트웨어 요구사항
Gemini Enterprise Agent Platform Vision SDK에 필요한 대부분의 서드 파티 소프트웨어 종속 항목은 사전 빌드된 바이너리를 설치할 때 자동으로 관리됩니다. 하지만 SDK 기능 및 워크플로의 특정 측면을 사용하려면 추가 종속 항목을 설치해야 합니다. 이 섹션에서는 이러한 예외와 다운로드 및 설치 방법을 설명합니다.
Python SDK
Python pip 패키지는 모든 종속 항목을 자동으로 설치합니다. 하지만 기본 Python 설치는 다음 조건을 충족해야 합니다.
- Python >= 3.8.
소스 종속 항목에서 빌드
대부분의 사용자는 워크플로에 사전 빌드된 SDK 바이너리를 사용할 수 있습니다. 소스에서 SDK를 개발하고 빌드하려면 시스템이 다음 요구사항을 충족하는지 확인해야 합니다.
- Bazel을 설치합니다. 설치 안내는 Bazel 문서를 참조하세요.
Ubuntu 20.04에서는 여러 시스템 종속 항목도 필요합니다. 다음 명령어를 사용하여 설치할 수 있습니다.
apt-get install -y --no-install-recommends \ autoconf \ automake \ build-essential \ ca-certificates \ flex \ bison \ python3 \ nasm \ libjpeg-dev
사전 빌드된 바이너리 가져오기
vaictl 도구는 Agent Platform Vision을 제어하고 처리하는 데이터를 주고받는 데 사용할 수 있는 즉시 사용 가능한 바이너리 도구입니다.
이 섹션에서는 이 도구를 다운로드하고 설치하는 방법을 보여줍니다.
Debian 패키지 설치
I/O (스트림 데이터)로 작업하는 데 필요한 vaictl 명령줄 도구를 사용하는 방법에는 두 가지가 있습니다.
- 명령줄 도구를 로컬로 설치 (OS: Debian GNU/Linux, CPU 아키텍처: x86_64) 또는
- 모든 종속 항목이 설치된 Docker 이미지에서 명령어를 실행합니다.
다음 단계에 따라 vaictl 명령줄 도구를 가져옵니다.
패키지 다운로드
직접 설치의 경우 Debian/Ubuntu 배포판만 지원합니다.
Gemini Enterprise Agent Platform Vision SDK GitHub 출시 페이지에서 이 Debian 패키지를 다운로드할 수도 있습니다.
(선택사항)
vaictl의 이전 버전을 삭제합니다.vaictl명령줄 도구를 설치하려면 먼저 머신에서 이전 버전의 도구를 삭제해야 합니다.sudo apt-get remove visionai
- 필요한 패키지를 다운로드합니다. GitHub 출시 페이지에서 패키지를 다운로드하거나 다음 명령어를 사용할 수 있습니다.
wget https://github.com/google/visionai/releases/download/v0.0.5/visionai_0.0-5_amd64.deb
- 패키지를 다운로드한 후 파일을 다운로드한 디렉터리에서 다음 명령어를 실행합니다:
sudo apt install ./visionai_0.0-5_amd64.deb
- 설치를 확인합니다.
vaictl --help
Docker 가져오기
Gemini Enterprise Agent Platform Vision SDK와 모든
종속 항목이 이미 사전 설치된 Docker 이미지를 가져올 수 있습니다. 이 Docker 이미지는
gcr.io/visionai-public-images/vaictl에서 사용할 수 있습니다.
- Container Registry에서 이미지를 다운로드합니다.
docker pull gcr.io/visionai-public-images/vaictl
- 대화형 컨테이너 터미널을 실행합니다.
docker run -it --rm gcr.io/visionai-public-images/vaictl /bin/bash
- 기능을 확인합니다.
vaictl --help
소스 코드 가져오기
Gemini Enterprise Agent Platform Vision SDK는 오픈소스이며 GitHub에서 공개적으로 사용할 수 있습니다.
SDK는 서비스 API 정의에 종속되지만 이 종속 항목은
Bazel에서 이미 자동으로 관리하므로 명시적으로 가져올 필요가
없습니다. 하지만 서비스 API에 직접 액세스해야 하는 경우
googleapis GitHub 저장소에서 가져올 수 있습니다.
Python 프로그래밍 SDK
Agent Platform Vision은 Python SDK도 지원합니다. 이 SDK로 프로그래밍하려면, Python SDK를 설치하기 전에 기본 Python SDK 종속 항목을 충족했는지 확인하세요.Python SDK를 설치하기 전에
SDK 참조 정보는 Python SDK 참조를 확인하세요.
Python SDK를 사용하는 예시 코드는
Python SDK로 얼굴 흐리게 처리 튜토리얼을 참고하거나
소스 배포에서 일부 예시를 확인하세요.
visionai/python/examples/
Python SDK 패키지 가져오기
Gemini Enterprise Agent Platform Vision SDK에는 Python 라이브러리도 포함되어 있습니다. 다음 안내에 따라 사전 빌드된 버전의 Python SDK를 다운로드하고 설치합니다.
패키지를 다운로드합니다.
Gemini Enterprise Agent Platform Vision SDK GitHub 출시 페이지에서 Python SDK 패키지를 다운로드하거나 다음 명령어를 실행할 수 있습니다.
wget https://github.com/google/visionai/releases/download/v0.0.5/visionai-0.0.5-py3-none-any.whl선택사항입니다. 새 가상 환경을 만들고 활성화합니다.
python3 -m venv vaivenv source vaivenv/bin/activate패키지를 설치합니다.
pip3 install visionai-0.0.5-py3-none-any.whl선택사항입니다. 설치가 작동하는지 확인합니다.
python3import visionai선택사항입니다. 가상 환경을 비활성화합니다.
deactivate
C++ 프로그래밍 SDK
C++은 Google에서 지원하는 첫 번째 프로그래밍 SDK입니다. C++ 공개 SDK는 visionai/public/streams.h에 있습니다. 참조 정보는 참조
문서를 확인하세요.
다음 단계
- 선택사항: C++ SDK를 사용하여 빌드하고 테스트하는 방법을 알아봅니다.
- 앱에 데이터를 수집하는 방법을 알아보고 앱 빌드에서 추가할 수 있는 처리 구성요소에 관해 알아보세요.
- 데이터 대상에 앱 출력 연결에서 출력 스토리지 및 처리 옵션을 알아봅니다.
- 콘솔에서 Warehouse 데이터를 검색하는 방법을 알아보세요.