以下示例展示了如何运行使用 Llama 3 的 Hugging Face 文本生成推理 (TGI) 工具包的后端服务。Hugging Face TGI 是一种开放式大语言模型 (LLM),可在启用 GPU 的 Cloud Run 服务上部署和应用。
如需查看完整示例,请参阅在 Cloud Run 上使用 TGI DLC 部署 Llama 3.1 8B。
以下示例展示了如何运行使用 Llama 3 的 Hugging Face 文本生成推理 (TGI) 工具包的后端服务。Hugging Face TGI 是一种开放式大语言模型 (LLM),可在启用 GPU 的 Cloud Run 服务上部署和应用。
如需查看完整示例,请参阅在 Cloud Run 上使用 TGI DLC 部署 Llama 3.1 8B。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-12-22。