Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

示例

培训

在 Trillium 上使用 JAX、Ray 和 GKE 训练 Llama 3-8B

使用 JAX、Ray Train 和 TPU v6e (Trillium) 在 GKE 上对 Llama 3-8B 模型执行分布式训练，并使用 MaxText 优化多主机伸缩。
使用 Ironwood 上的 GKE 集群预训练 Llama 3.1-70B

使用 MaxText 框架在 TPU7x (Ironwood) 上训练 Llama 3.1-70B 模型。
使用 Ironwood 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用针对大规模混合专家 (MoE) 架构优化的 recipe 在 TPU7x 上训练 DeepSeek 3-671B 模型。
使用 Ironwood 上的 GKE 集群预训练 GPT OSS-120B

使用针对大规模分布式训练进行了优化的 recipe 在 TPU7x 上训练 GPT OSS-120B 推理模型。
使用 Ironwood 上的 GKE 集群对 Qwen 3-235B 进行预训练

使用针对高性能推理进行了优化的 recipe 在 TPU7x 上训练 Qwen 3-235B-A22B MoE 模型。
使用 Ironwood 上的 GKE 集群预训练 Wan 2.1-14B

使用优化的 recipe 在 TPU7x 上训练 Wan 2.1-14B 视频生成模型，以实现高性能视频合成。
使用 Trillium 上的 GKE 集群预训练 GPT3-175B

使用 MaxText 和针对大规模、经济高效的性能优化的配方，在 TPU v6e 上训练 GPT3-175B 模型。
使用 Trillium 上的 GKE 集群预训练 Gemma3-12B

使用 MaxText 和优化后的配方在 TPU v6e 上训练 Gemma3-12B 模型，以实现高性能的开放模型开发。
使用 Trillium 上的 GKE 集群预训练 Llama 3.1-70B

使用 MaxText 和针对高吞吐量的大规模模型训练进行了优化的 recipe 在 TPU v6e 上训练 Llama 3.1-70B。
使用 Trillium 上的 GKE 集群预训练 Llama 3.1-8B

使用 MaxText 在 TPU v6e 上训练 Llama 3.1-8B，并采用此优化配方实现可伸缩的高性能预训练。
使用 Trillium 上的 GKE 集群预训练 Mixtral-8x22B

使用 MaxText 在 TPU v6e 上训练 Mixtral-8x22B，以优化性能和效率。
使用 Trillium 上的 GKE 集群预训练 Mixtral-8x7B

在 TPU v6e 上使用 MaxText 训练 Mixtral-8x7B，并采用优化配置，以在 Google Cloud 上实现高吞吐量 MoE 性能。
使用 v5p 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用 MaxText 在 TPU v5p 上训练和部署 DeepSeek 3-671B 模型，以实现优化的大规模性能。
使用 v5p 上的 GKE 集群对 GPT3-175B 进行预训练

使用 MaxText 在 TPU v5p 上训练 GPT3-175B 模型，并针对大规模分布式训练优化配置。
使用 v5p 上的 GKE 集群预训练 Mixtral-8x7B

使用 MaxText 在 TPU v5p 上训练 Mixtral-8x7B，并针对高性能 MoE 工作负载优化配置。
使用 v5p 上的 GKE 集群预训练 SDXL

使用 MaxDiffusion 在 TPU v5p 上训练和扩缩 Stable Diffusion XL (SDXL)，以实现高性能的生成式 AI 工作负载。

示例

培训

在 Trillium 上使用 JAX、Ray 和 GKE 训练 Llama 3-8B

使用 Ironwood 上的 GKE 集群预训练 Llama 3.1-70B

使用 Ironwood 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用 Ironwood 上的 GKE 集群预训练 GPT OSS-120B

使用 Ironwood 上的 GKE 集群对 Qwen 3-235B 进行预训练

使用 Ironwood 上的 GKE 集群预训练 Wan 2.1-14B

使用 Trillium 上的 GKE 集群预训练 GPT3-175B

使用 Trillium 上的 GKE 集群预训练 Gemma3-12B

使用 Trillium 上的 GKE 集群预训练 Llama 3.1-70B

使用 Trillium 上的 GKE 集群预训练 Llama 3.1-8B

使用 Trillium 上的 GKE 集群预训练 Mixtral-8x22B

使用 Trillium 上的 GKE 集群预训练 Mixtral-8x7B

使用 v5p 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用 v5p 上的 GKE 集群对 GPT3-175B 进行预训练

使用 v5p 上的 GKE 集群预训练 Mixtral-8x7B

使用 v5p 上的 GKE 集群预训练 SDXL

推理

在 Trillium 上使用 GKE 和 vLLM 部署 Llama 3.1-70B

通过 KubeRay 使用 GKE 部署 LLM

使用 GKE 和 Terraform 部署开放 LLM

使用 GKE 应用 Stable Diffusion XL (SDXL)

使用 Ironwood 上的 GKE 集群通过 vLLM 提供 GPT OSS-120B

使用 Ironwood 上的 GKE 集群通过 vLLM 部署 Qwen3-Coder-480B

在 Trillium 上使用 vLLM 部署 Llama 3.1-8B

在 Trillium 上使用 vLLM 提供 Qwen 3 服务

在 Trillium 上使用 vLLM 提供 Qwen2.5-32B

在 Trillium 上使用 vLLM 提供 Qwen2.5-VL 服务

示例 使用集合让一切井井有条 根据您的偏好保存内容并对其进行分类。

在 Trillium 上使用 JAX、Ray 和 GKE 训练 Llama 3-8B

使用 Ironwood 上的 GKE 集群预训练 Llama 3.1-70B

使用 Ironwood 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用 Ironwood 上的 GKE 集群预训练 GPT OSS-120B

使用 Ironwood 上的 GKE 集群对 Qwen 3-235B 进行预训练

使用 Ironwood 上的 GKE 集群预训练 Wan 2.1-14B

使用 Trillium 上的 GKE 集群预训练 GPT3-175B

使用 Trillium 上的 GKE 集群预训练 Gemma3-12B

使用 Trillium 上的 GKE 集群预训练 Llama 3.1-70B

使用 Trillium 上的 GKE 集群预训练 Llama 3.1-8B

使用 Trillium 上的 GKE 集群预训练 Mixtral-8x22B

使用 Trillium 上的 GKE 集群预训练 Mixtral-8x7B

使用 v5p 上的 GKE 集群对 DeepSeek 3-671B 进行预训练

使用 v5p 上的 GKE 集群对 GPT3-175B 进行预训练

使用 v5p 上的 GKE 集群预训练 Mixtral-8x7B

使用 v5p 上的 GKE 集群预训练 SDXL

在 Trillium 上使用 GKE 和 vLLM 部署 Llama 3.1-70B

通过 KubeRay 使用 GKE 部署 LLM

使用 GKE 和 Terraform 部署开放 LLM

使用 GKE 应用 Stable Diffusion XL (SDXL)

使用 Ironwood 上的 GKE 集群通过 vLLM 提供 GPT OSS-120B

使用 Ironwood 上的 GKE 集群通过 vLLM 部署 Qwen3-Coder-480B

在 Trillium 上使用 vLLM 部署 Llama 3.1-8B

在 Trillium 上使用 vLLM 提供 Qwen 3 服务

在 Trillium 上使用 vLLM 提供 Qwen2.5-32B

在 Trillium 上使用 vLLM 提供 Qwen2.5-VL 服务

示例