プロジェクトと開発環境を設定する

このガイドでは、 Google Cloud プロジェクトを設定して Gemini Enterprise Agent Platform Vision を使用する方法について説明します。

プロジェクトを設定する

  1. アカウントにログインします。 Google Cloud を初めて使用する場合は、 アカウントを作成して、 実際のシナリオでプロダクトがどのように機能するかを評価してください。 Google Cloud新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。
  2. Google Cloud CLI をインストールします。

  3. 外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。

  4. gcloud CLI を初期化するには、次のコマンドを実行します:

    gcloud init
  5. プロジェクトを作成または選択します Google Cloud

    プロジェクトを選択または作成するために必要なロール

    • プロジェクトを選択する: プロジェクトの選択に特定の IAM ロールは必要ありません。ロールが付与されているプロジェクトを選択できます。
    • プロジェクトを作成する: プロジェクトを作成するには、プロジェクト作成者ロール (roles/resourcemanager.projectCreator)が必要です。これには resourcemanager.projects.create 権限が含まれています。ロールを付与する方法について学習する
    • プロジェクトを作成する: Google Cloud

      gcloud projects create PROJECT_ID

      PROJECT_ID は、作成する Google Cloud プロジェクトの名前に置き換えます。

    • 作成した Google Cloud プロジェクトを選択します。

      gcloud config set project PROJECT_ID

      PROJECT_ID は、 Google Cloud プロジェクトの名前に置き換えます。

  6. プロジェクトで課金が有効になっていることを確認します Google Cloud 。

  7. Vertex AI Vision API を有効にする

    API を有効にするために必要なロール

    API を有効にするには、 権限を含む Service Usage 管理者 IAM ロール(roles/serviceusage.serviceUsageAdmin)が必要です。serviceusage.services.enableロールを付与する方法について学習する

    gcloud services enable visionai.googleapis.com
  8. 認証を設定します。

    1. サービス アカウント作成者 IAM ロール (roles/iam.serviceAccountCreator)とプロジェクト IAM 管理者ロール (roles/resourcemanager.projectIamAdmin)があることを確認します。ロールを付与する方法について学習する
    2. サービス アカウントを作成します。

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME

      SERVICE_ACCOUNT_NAME をサービス アカウントの名前に置き換えます。

    3. サービス アカウントに roles/visionai.editor IAM ロールを付与します。

      gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor

      以下を置き換えます。

      • SERVICE_ACCOUNT_NAME: サービス アカウントの名前
      • PROJECT_ID: サービス アカウントを作成したプロジェクト ID
    4. 鍵ファイルを生成します。

      gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

      次のように置き換えます。

      • FILE_NAME: 鍵ファイルの名前
      • SERVICE_ACCOUNT_NAME: サービス アカウントの名前
      • PROJECT_ID: サービス アカウントを作成したプロジェクト ID
  9. 環境変数 GOOGLE_APPLICATION_CREDENTIALS を、認証情報を含む JSON ファイルのパスに設定します。 この変数は現在のシェル セッションにのみ適用されるため、新しいセッションを開く場合は、変数を再度設定する必要があります。

  10. Google Cloud CLI をインストールします。

  11. 外部 ID プロバイダ(IdP)を使用している場合は、まず連携 ID を使用して gcloud CLI にログインする必要があります。

  12. gcloud CLI を初期化するには、次のコマンドを実行します:

    gcloud init
  13. プロジェクトを作成または選択します Google Cloud

    プロジェクトを選択または作成するために必要なロール

    • プロジェクトを選択する: プロジェクトの選択に特定の IAM ロールは必要ありません。ロールが付与されているプロジェクトを選択できます。
    • プロジェクトを作成する: プロジェクトを作成するには、プロジェクト作成者ロール (roles/resourcemanager.projectCreator)が必要です。これには resourcemanager.projects.create 権限が含まれています。ロールを付与する方法について学習する
    • プロジェクトを作成する: Google Cloud

      gcloud projects create PROJECT_ID

      PROJECT_ID は、作成する Google Cloud プロジェクトの名前に置き換えます。

    • 作成した Google Cloud プロジェクトを選択します。

      gcloud config set project PROJECT_ID

      PROJECT_ID は、 Google Cloud プロジェクトの名前に置き換えます。

  14. プロジェクトで課金が有効になっていることを確認します Google Cloud 。

  15. Vertex AI Vision API を有効にする

    API を有効にするために必要なロール

    API を有効にするには、 権限を含む Service Usage 管理者 IAM ロール(roles/serviceusage.serviceUsageAdmin)が必要です。serviceusage.services.enableロールを付与する方法について学習する

    gcloud services enable visionai.googleapis.com
  16. 認証を設定します。

    1. サービス アカウント作成者 IAM ロール (roles/iam.serviceAccountCreator)とプロジェクト IAM 管理者ロール (roles/resourcemanager.projectIamAdmin)があることを確認します。ロールを付与する方法について学習する
    2. サービス アカウントを作成します。

      gcloud iam service-accounts create SERVICE_ACCOUNT_NAME

      SERVICE_ACCOUNT_NAME をサービス アカウントの名前に置き換えます。

    3. サービス アカウントに roles/visionai.editor IAM ロールを付与します。

      gcloud projects add-iam-policy-binding PROJECT_ID --member="serviceAccount:SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com" --role=roles/visionai.editor

      以下を置き換えます。

      • SERVICE_ACCOUNT_NAME: サービス アカウントの名前
      • PROJECT_ID: サービス アカウントを作成したプロジェクト ID
    4. 鍵ファイルを生成します。

      gcloud iam service-accounts keys create FILE_NAME.json --iam-account=SERVICE_ACCOUNT_NAME@PROJECT_ID.iam.gserviceaccount.com

      次のように置き換えます。

      • FILE_NAME: 鍵ファイルの名前
      • SERVICE_ACCOUNT_NAME: サービス アカウントの名前
      • PROJECT_ID: サービス アカウントを作成したプロジェクト ID
  17. 環境変数 GOOGLE_APPLICATION_CREDENTIALS を、認証情報を含む JSON ファイルのパスに設定します。 この変数は現在のシェル セッションにのみ適用されるため、新しいセッションを開く場合は、変数を再度設定する必要があります。

特定のタスクでは、Agent Platform Vision に加えて追加の Google Cloud プロダクトを使用する必要があります。他の Google Cloud プロダクトを使用するには、追加の設定タスクが 必要になる場合があります。

Gemini Enterprise Agent Platform Vision SDK

Agent Platform Vision ソフトウェア開発キット(SDK)には、Agent Platform Vision でプログラムとカスタム ワークフローを開発するためのツールとライブラリが含まれています。

これらのツールは、Agent Platform Vision を使用してソリューションを使用または開発する際に生産性を高めるのに役立つバイナリ ソースファイルのセットを指します。これらのバイナリ ソースファイルをスクリプトに追加して、大規模なデプロイを管理することもできます。このカテゴリの例として、コマンドライン インターフェース(CLI)vaictl があります。

ライブラリは、Agent Platform Vision でさまざまな形式の I/O をプログラムで管理、制御、実行するために使用できるプログラミング API のセットを指します。このカテゴリの例として、C++ プログラミング API があります。

ツールとライブラリの両方のコードはオープンソースであり、デベロッパーが直接ビルドすることを歓迎します。ツールについては、特定のプラットフォームでビルド済みのバイナリ ファイルも提供しています。これらをダウンロードして直接使用できます。プラットフォームが直接サポートされていない場合は、Docker イメージも提供しています。

前提条件

Gemini Enterprise Agent Platform Vision SDK を使用する前に、次の前提条件を確認してください。

対応プラットフォーム

Debian ベースの Linux ディストリビューションを実行する x86 マシンのみを直接サポートしています。別のプラットフォームを使用する場合は、ツールがすでにビルドされてインストールされている Docker イメージも提供しています。

その他のソフトウェア要件

Gemini Enterprise Agent Platform Vision SDK で必要なサードパーティ ソフトウェアの依存関係のほとんどは、ビルド済みのバイナリをインストールすると自動的に管理されます。ただし、SDK の機能とワークフローの特定の側面を使用するには、追加の依存関係をインストールする必要があります。このセクションでは、これらの例外と、ダウンロードしてインストールする方法について説明します。

Python SDK

Python pip パッケージは、すべての依存関係を自動的にインストールします。 ただし、基本的な基盤となる Python インストールは、次の条件を満たしている必要があります。

  • Python >= 3.8

ソースからビルドする依存関係

ほとんどのユーザーは、ワークフローにビルド済みの SDK バイナリを使用できます。 ソースから SDK を開発してビルドする場合は、システムが次の要件を満たしていることを確認する必要があります。

  • Bazel をインストールします。インストール手順については、 Bazel のドキュメントをご覧ください。
  • Ubuntu 20.04 では、いくつかのシステム依存関係も必要です。次のコマンドでインストールできます。

    apt-get install -y --no-install-recommends \
        autoconf \
        automake \
        build-essential \
        ca-certificates \
        flex \
        bison \
        python3 \
        nasm \
        libjpeg-dev
    

ビルド済みのバイナリを取得する

vaictl ツールは、Agent Platform Vision の制御や、処理するデータの送受信に使用できる既製のバイナリツールです。

このセクションでは、このツールをダウンロードしてインストールする方法について説明します。

Debian パッケージをインストールする

I/O(ストリームデータ)を操作するために必要な vaictl コマンドライン ツールを使用するには、次の 2 つの方法があります。

  • コマンドライン ツールをローカルにインストールする (OS: Debian GNU/Linux、CPU アーキテクチャ: x86_64) または
  • すべての依存関係がインストールされている Docker イメージでコマンドを実行する。

次の手順で vaictl コマンドライン ツールを取得します。

パッケージをダウンロードする

直接インストールする場合は、Debian/Ubuntu ディストリビューションのみがサポートされます。

この Debian パッケージは、 Gemini Enterprise Agent Platform Vision SDK GitHub リリースページからダウンロードすることもできます。

  1. (省略可)以前のバージョンの vaictl を削除します。

    vaictl コマンドライン ツールをインストールする前に、お使いのマシンにこのツールの以前のバージョンがあれば削除する必要があります。

    sudo apt-get remove visionai
  2. 必要なパッケージをダウンロードします。パッケージは GitHub リリースページからダウンロードするか、 次のコマンドを使用します。
    wget https://github.com/google/visionai/releases/download/v0.0.5/visionai_0.0-5_amd64.deb
  3. パッケージをダウンロードしたら、ファイルをダウンロードしたディレクトリで次のコマンドを実行します。
    sudo apt install ./visionai_0.0-5_amd64.deb
  4. インストールを確認します。
    vaictl --help

Docker を取得する

Gemini Enterprise Agent Platform Vision SDK とそのすべての 依存関係がすでにプリインストールされている Docker イメージを取得できます。この Docker イメージは gcr.io/visionai-public-images/vaictl で入手できます。

  1. Container Registry からイメージをダウンロードします。
    docker pull gcr.io/visionai-public-images/vaictl
  2. インタラクティブ コンテナ ターミナルを実行します。
    docker run -it --rm gcr.io/visionai-public-images/vaictl /bin/bash
  3. 機能を確認します。
    vaictl --help

ソースコードを取得する

Gemini Enterprise Agent Platform Vision SDK はオープンソースであり、 GitHub で一般公開されています。

SDK はサービス API の定義に依存しますが、この依存関係は Bazel によって自動的に管理されるため、明示的に取得する必要はありません。ただし、サービス API に直接アクセスする必要がある場合は、 googleapis GitHub リポジトリで取得できます。

Python プログラミング SDK

Agent Platform Vision は Python SDK もサポートしています。この SDK でプログラミングするには、 Python SDK をインストールする前に、基本的な Python SDK の依存関係を満たしていることを確認してください。

SDK リファレンス情報については、 Python SDK リファレンスをご覧ください。

Python SDK を使用するサンプルコードについては、 Python SDK を使用した顔のぼかしのチュートリアルをご覧ください。 または、ソース ディストリビューションの visionai/python/examples/ ディレクトリにあるサンプルをご覧ください。

Python SDK パッケージを取得する

Gemini Enterprise Agent Platform Vision SDK には Python ライブラリも含まれています。次の手順で、ビルド済みのバージョンの Python SDK をダウンロードしてインストールします。

  1. パッケージをダウンロードします。

    Python SDK パッケージは、 Gemini Enterprise Agent Platform Vision SDK GitHub リリースページからダウンロードするか、 次のコマンドを実行します。

    wget https://github.com/google/visionai/releases/download/v0.0.5/visionai-0.0.5-py3-none-any.whl
    
  2. 省略可。新しい仮想環境を作成して有効にします。

    python3 -m venv vaivenv
    source vaivenv/bin/activate
    
  3. パッケージをインストールします。

    pip3 install visionai-0.0.5-py3-none-any.whl
    
  4. 省略可。インストールが機能したことを確認します。

    python3
    
    import visionai
    
  5. 省略可。仮想環境を無効にします。

    deactivate
    

C++ プログラミング SDK

C++ は、サポートする最初のプログラミング SDK です。C++ 公開 SDK は visionai/public/streams.h にあります。リファレンス情報については、リファレンス ドキュメントをご覧ください。

次のステップ