次の例は、Llama 3 を使用して Hugging Face Text Generation Inference(TGI)ツールキットを実行するバックエンド サービスの実行方法を示しています。Hugging Face TGI はオープンな大規模言語モデル(LLM)であり、GPU が有効になっている Cloud Run サービスにデプロイしてサービングできます。
サンプル全体については、Cloud Run で TGI DLC を使用して Llama 3.1 8B をデプロイするをご覧ください。
次の例は、Llama 3 を使用して Hugging Face Text Generation Inference(TGI)ツールキットを実行するバックエンド サービスの実行方法を示しています。Hugging Face TGI はオープンな大規模言語モデル(LLM)であり、GPU が有効になっている Cloud Run サービスにデプロイしてサービングできます。
サンプル全体については、Cloud Run で TGI DLC を使用して Llama 3.1 8B をデプロイするをご覧ください。
特に記載のない限り、このページのコンテンツはクリエイティブ・コモンズの表示 4.0 ライセンスにより使用許諾されます。コードサンプルは Apache 2.0 ライセンスにより使用許諾されます。詳しくは、Google Developers サイトのポリシーをご覧ください。Java は Oracle および関連会社の登録商標です。
最終更新日 2025-12-18 UTC。