您可以在 Cloud Run 作业上使用 Meta 的 Llama 3.2-1b LLM 和 vLLM 运行批量推理,然后使用 Cloud Run 卷装载将结果直接写入 Cloud Storage。
如需查看分步说明 Codelab,请参阅如何对 Cloud Run 作业运行批量推理。
您可以在 Cloud Run 作业上使用 Meta 的 Llama 3.2-1b LLM 和 vLLM 运行批量推理,然后使用 Cloud Run 卷装载将结果直接写入 Cloud Storage。
如需查看分步说明 Codelab,请参阅如何对 Cloud Run 作业运行批量推理。
如未另行说明,那么本页面中的内容已根据知识共享署名 4.0 许可获得了许可,并且代码示例已根据 Apache 2.0 许可获得了许可。有关详情,请参阅 Google 开发者网站政策。Java 是 Oracle 和/或其关联公司的注册商标。
最后更新时间 (UTC):2025-10-19。