Well-Architected Framework: Pilar de sustentabilidad

Last reviewed 2026-01-28 UTC

El pilar de sostenibilidad del Google Cloud Well-Architected Framework proporciona recomendaciones para diseñar, compilar y administrar cargas de trabajo en Google Cloudque sean energéticamente eficientes y tengan en cuenta las emisiones de carbono.

El público objetivo de este documento incluye a los responsables de la toma de decisiones, los arquitectos, los administradores, los desarrolladores y los operadores que diseñan, compilan, implementan y mantienen cargas de trabajo en Google Cloud.

Las decisiones operativas y de arquitectura tienen un impacto significativo en el uso de energía, el impacto hídrico y la huella de carbono que generan tus cargas de trabajo en la nube. Todas las cargas de trabajo, ya sean un sitio web pequeño o un modelo de AA a gran escala, consumen energía y contribuyen a las emisiones de carbono y a la intensidad de los recursos hídricos. Cuando integras la sustentabilidad en tu arquitectura de nube y en tu proceso de diseño, creas sistemas eficientes, rentables y sustentables para el medio ambiente. Una arquitectura sustentable es resiliente y está optimizada, lo que crea un ciclo de retroalimentación positiva de mayor eficiencia, menor costo y menor impacto ambiental.

Sustentabilidad por diseño: Resultados comerciales integrales

La sustentabilidad no es un intercambio con otros objetivos comerciales principales, sino que las prácticas de sustentabilidad ayudan a acelerar tus otros objetivos comerciales. Las opciones de arquitectura que priorizan los recursos y las operaciones con bajas emisiones de carbono te ayudan a crear sistemas que también son más rápidos, económicos y seguros. Estos sistemas se consideran sostenibles por diseño, ya que la optimización de la sostenibilidad genera resultados positivos generales en cuanto a rendimiento, costo, seguridad, resiliencia y experiencia del usuario.

Optimización del rendimiento

Los sistemas que están optimizados para el rendimiento usan menos recursos de forma inherente. Una aplicación eficiente que completa una tarea más rápido requiere recursos de procesamiento durante un período más corto. Por lo tanto, el hardware subyacente consume menos kilovatios-hora (kWh) de energía. El rendimiento optimizado también genera una latencia más baja y una mejor experiencia del usuario. Los recursos no pierden tiempo ni energía esperando procesos ineficientes. Cuando usas hardware especializado (por ejemplo, GPUs y TPUs), adoptas algoritmos eficientes y maximizas el procesamiento paralelo, mejoras el rendimiento y reduces la huella de carbono de tu carga de trabajo en la nube.

Optimización de costos

Los gastos operativos de la nube dependen del uso de recursos. Debido a esta correlación directa, cuando optimizas los costos de forma continua, también reduces el consumo de energía y las emisiones de carbono. Cuando ajustas el tamaño de las VMs, implementas un ajuste de escala automático agresivo, archivas datos antiguos y eliminas recursos inactivos, reduces el uso de recursos y los costos de la nube. También reduces la huella de carbono de tus sistemas, ya que los centros de datos consumen menos energía para ejecutar tus cargas de trabajo.

Seguridad y resiliencia

La seguridad y la confiabilidad son requisitos previos para un entorno de nube sostenible. Un sistema vulnerado (por ejemplo, un sistema afectado por un ataque de denegación de servicio [DoS] o una violación de la seguridad de los datos no autorizada) puede aumentar drásticamente el consumo de recursos. Estos incidentes pueden provocar picos masivos de tráfico, crear ciclos de procesamiento descontrolados para la mitigación y requerir operaciones prolongadas y de alta energía para el análisis forense, la limpieza y la restauración de datos. Las medidas de seguridad sólidas pueden ayudar a evitar picos innecesarios en el uso de recursos, de modo que tus operaciones sigan siendo estables, predecibles y eficientes en el consumo de energía.

Experiencia del usuario

Los sistemas que priorizan la eficiencia, el rendimiento, la accesibilidad y el uso mínimo de datos pueden ayudar a reducir el consumo de energía de los usuarios finales. Una aplicación que carga un modelo más pequeño o procesa menos datos para entregar resultados más rápido ayuda a reducir la energía que consumen los dispositivos de red y los dispositivos del usuario final. Esta reducción en el uso de energía beneficia particularmente a los usuarios que tienen un ancho de banda limitado o que usan dispositivos más antiguos. Además, la arquitectura sostenible ayuda a minimizar el daño planetario y demuestra tu compromiso con la tecnología socialmente responsable.

Valor de sustentabilidad de la migración a la nube

Migrar las cargas de trabajo locales a la nube puede ayudar a reducir la huella ambiental de tu organización. La transición a la infraestructura de la nube puede reducir el uso de energía y las emisiones asociadas entre 1.4 y 2 veces en comparación con las implementaciones locales típicas. Los centros de datos de la nube son instalaciones modernas y con diseño personalizado que se construyen para lograr una alta eficacia del uso de energía (PUE). Los centros de datos locales más antiguos suelen carecer de la escala necesaria para justificar las inversiones en sistemas avanzados de enfriamiento y distribución de energía.

Responsabilidad compartida y destino compartido

Responsabilidades y destino compartidos en Google Cloud describe cómo la seguridad de las cargas de trabajo en la nube es una responsabilidad compartida entre Google y tú, el cliente. Este modelo de responsabilidad compartida también se aplica a la sustentabilidad.

Google es responsable de la sustentabilidad de Google Cloud, lo que significa la eficiencia energética y la gestión sustentable del agua de nuestros centros de datos, infraestructura y servicios principales. Invertimos continuamente en energía renovable, refrigeración que tiene en cuenta el clima y optimización de hardware. Para obtener más información sobre la estrategia y el progreso de sustentabilidad de Google, consulta el Informe de impacto ambiental de Google Sustainability 2025.

Tú, el cliente, eres responsable de la sustentabilidad en la nube, lo que significa optimizar tus cargas de trabajo para que sean eficientes en el consumo de energía. Por ejemplo, puedes ajustar el tamaño de los recursos, usar servicios sin servidores que se ajusten a cero y administrar los ciclos de vida de los datos de manera eficaz.

También defendemos un modelo de destino compartido: la sustentabilidad no es solo una división de tareas, sino una asociación colaborativa entre tú y Google para reducir la huella ambiental de todo el ecosistema.

Usa la IA para generar impacto en la empresa

El pilar de sostenibilidad del Framework de Well-Architected (este documento) incluye orientación para ayudarte a diseñar sistemas de IA sostenibles. Sin embargo, una estrategia de sustentabilidad integral va más allá del impacto ambiental de las cargas de trabajo de IA. La estrategia debe incluir formas de usar la IA para optimizar las operaciones y crear nuevo valor comercial.

La IA actúa como catalizador de la sustentabilidad, ya que transforma grandes conjuntos de datos en estadísticas prácticas. Permite a las organizaciones pasar del cumplimiento reactivo a la optimización proactiva, como en las siguientes áreas:

Eficiencia operativa: Optimiza las operaciones a través de una mejor administración del inventario, la optimización de la cadena de suministro y la administración inteligente de la energía.
Transparencia y riesgo: Usa los datos para obtener una transparencia detallada de la cadena de suministro, cumplir con las reglamentaciones y modelar el riesgo climático.
Valor y crecimiento: Desarrolla nuevos flujos de ingresos en finanzas sostenibles y recommerce.

Google ofrece los siguientes productos y funciones para ayudarte a obtener estadísticas a partir de los datos y desarrollar capacidades para un futuro sustentable:

IA de Google Earth: Utiliza datos geoespaciales a escala planetaria para analizar los cambios ambientales y supervisar los impactos en la cadena de suministro.
WeatherNext: Proporciona previsiones meteorológicas avanzadas y análisis de riesgos climáticos para ayudarte a generar resiliencia ante la volatilidad climática.
Estadísticas geoespaciales con Google Earth: Utiliza datos geoespaciales para agregar datos contextuales enriquecidos a las ubicaciones, lo que permite una selección de sitios, una planificación de recursos y operaciones más inteligentes.
Optimización de rutas de Google Maps: Optimiza las rutas de logística y entrega para aumentar la eficiencia y reducir el consumo de combustible y las emisiones del transporte.

Colaboraciones con socios y clientes

Google Cloud y TELUS se asociaron para promover la sustentabilidad de la nube a través de la migración de cargas de trabajo a la infraestructura neutra en carbono de Google y el aprovechamiento del análisis de datos para optimizar las operaciones. Esta colaboración proporciona beneficios sociales y ambientales a través de iniciativas como la tecnología de ciudades inteligentes, que utiliza datos en tiempo real para reducir la congestión del tráfico y las emisiones de carbono en los municipios de Canadá. Para obtener más información sobre esta colaboración, consulta Google Cloud y TELUS colaboran en pos de la sustentabilidad.

Principios básicos

Las recomendaciones del pilar de sostenibilidad del Framework de Well-Architected se asignan a los siguientes principios básicos:

Colaboradores

Autor: Brett Tackaberry | Arquitecto principal

Otros colaboradores:

Alex Stepney | Arquitecto principal líder
Daniel Lees | Arquitecto de Seguridad en la Nube
Denise Pearl | Líder de Marketing Global, Sustentabilidad
Autor: Kumar Dhanagopal | Desarrollador de soluciones entre productos
Laura Hyatt | Ingeniero de Atención al cliente, FSI
Nicolas Pintaux | Ingeniero de Atención al Cliente y especialista en modernización de aplicaciones
Radhika Kanakam | Líder del programa, Google Cloud Well-Architected Framework

Usa regiones que consuman energía con bajas emisiones de carbono

Este principio del pilar de sustentabilidad del Google Cloud framework de Well-Architected proporciona recomendaciones para ayudarte a seleccionar regiones con bajas emisiones de carbono para tus cargas de trabajo en Google Cloud.

Descripción general del principio

Cuando planeas implementar una carga de trabajo en Google Cloud, una decisión arquitectónica importante es la elección de la región de Google Cloud para la carga de trabajo. Esta decisión afecta la huella de carbono de tu carga de trabajo. Para minimizar la huella de carbono, tu estrategia de selección de regiones debe incluir los siguientes elementos:

Selección basada en datos: Para identificar y priorizar regiones, ten en cuenta el indicador de bajas emisiones de CO₂ y la métrica de energía libre de carbono (CFE).
Gobernanza basada en políticas: Restringe la creación de recursos a ubicaciones óptimas para el medio ambiente con la restricción de ubicaciones de recursos en el servicio de políticas de la organización.
Flexibilidad operativa: Usa técnicas como el cambio de horario y la programación que tiene en cuenta las emisiones de carbono para ejecutar cargas de trabajo por lotes durante las horas en que la intensidad de carbono de la red eléctrica es más baja.

La electricidad que se usa para alimentar tu aplicación y tus cargas de trabajo en la nube es un factor importante que afecta tu elección de Google Cloud regiones. Además, ten en cuenta los siguientes factores:

Residencia y soberanía de los datos: La ubicación en la que necesitas almacenar tus datos es un factor fundamental que determina tu elección de la región de Google Cloud. Esta elección afecta el cumplimiento de los requisitos locales de residencia de datos.
Latencia para los usuarios finales: La distancia geográfica entre los usuarios finales y las regiones en las que implementas aplicaciones afecta la experiencia del usuario y el rendimiento de la aplicación.
Costo: El precio de los recursos de Google Cloud puede variar según la región.

La herramienta Google Cloud Selector de regiones te ayuda a seleccionar regiones Google Cloud óptimas según tus requisitos de huella de carbono, costo y latencia. También puedes usar Cloud Location Finder para encontrar ubicaciones en la nube en Google Cloud y otros proveedores según tus requisitos de proximidad, uso de energía sin emisiones de carbono (CFE) y otros parámetros.

Recomendaciones

Para implementar tus cargas de trabajo en la nube en regiones con bajas emisiones de carbono, ten en cuenta las recomendaciones de las siguientes secciones. Estas recomendaciones se basan en la guía de Energía sin emisiones de carbono para regiones de Google Cloud .

Comprende la intensidad de carbono de las regiones de la nube

Los centros de datos deGoogle Cloud en una región usan energía de la red eléctrica en la que se encuentra la región. Google mide el impacto de carbono de una región con la métrica de CFE, que se calcula cada hora. El CFE indica el porcentaje de energía sin emisiones de carbono del total de energía que se consume durante una hora. La métrica de CFE depende de dos factores:

Es el tipo de centrales eléctricas que abastecen la red durante un período determinado.
Energía limpia atribuida a Google que se suministra a la red durante ese período.

Para obtener información sobre el CFE% promedio agregado por hora de cada región deGoogle Cloud , consulta Energía sin emisiones de carbono para las regiones de Google Cloud . También puedes obtener estos datos en un formato legible por máquina desde el repositorio Carbon free energy for Google Cloud regions en GitHub y un conjunto de datos públicos de BigQuery.

Incorpora el CFE en tu estrategia de selección de ubicaciones

Ten en cuenta las siguientes recomendaciones:

Selecciona la región más limpia para tus aplicaciones. Si planeas ejecutar una aplicación durante un período prolongado, hazlo en la región que tenga el CFE% más alto. En el caso de las cargas de trabajo por lotes, tienes mayor flexibilidad para elegir una región, ya que puedes predecir cuándo se debe ejecutar la carga de trabajo.
Selecciona regiones con bajas emisiones de carbono. Algunas páginas del sitio web de Google Cloud y los selectores de ubicación de la consola de Google Cloud muestran el indicador de CO₂ bajo para las regiones que tienen el impacto de carbono más bajo.
Restringe la creación de recursos a regiones Google Cloudespecíficas con bajas emisiones de carbono usando la restricción de la política de la organización de ubicaciones de recursos. Por ejemplo, para permitir la creación de recursos solo en regiones con bajas emisiones de carbono ubicadas en EE.UU., crea una restricción que especifique el grupo de valores in:us-low-carbon-locations.

Cuando selecciones ubicaciones para tus recursos de Google Cloud , también ten en cuenta las prácticas recomendadas para la selección de regiones, incluidos factores como los requisitos de residencia de los datos, la latencia para los usuarios finales, la redundancia de la aplicación, la disponibilidad de los servicios y los precios.

Cómo usar la programación por hora del día

La intensidad de carbono de una red eléctrica puede variar significativamente a lo largo del día. La variación depende de la combinación de fuentes de energía que abastecen la red. Puedes programar cargas de trabajo, en especial las que son flexibles o no urgentes, para que se ejecuten cuando la red eléctrica se abastezca con una mayor proporción de CFE.

Por ejemplo, muchas redes tienen porcentajes de CFE más altos durante las horas no pico o cuando las fuentes renovables, como la energía solar y eólica, suministran más energía a la red. Si programas tareas que requieren mucha capacidad de procesamiento, como el entrenamiento de modelos y la inferencia por lotes a gran escala, durante las horas con mayor CFE, puedes reducir significativamente las emisiones de carbono asociadas sin afectar el rendimiento ni el costo. Este enfoque se conoce como cambio de horario, en el que se usa la naturaleza dinámica de la intensidad de carbono de una red para optimizar las cargas de trabajo en función de la sustentabilidad.

Optimiza las cargas de trabajo de IA y AA para lograr eficiencia energética

Este principio del pilar de sustentabilidad del Google Cloud Well-Architected Framework proporciona recomendaciones para optimizar las cargas de trabajo de IA y AA con el objetivo de reducir su uso de energía y su huella de carbono.

Descripción general del principio

Para optimizar las cargas de trabajo de IA y AA en función de la sustentabilidad, debes adoptar un enfoque integral para diseñar, implementar y operar las cargas de trabajo. Seleccionamos modelos adecuados y hardware especializado, como las unidades de procesamiento tensorial (TPU), ejecutamos las cargas de trabajo en regiones con bajas emisiones de carbono, optimizamos el uso de recursos y aplicamos prácticas recomendadas operativas.

Las prácticas operativas y de arquitectura que optimizan el costo y el rendimiento de las cargas de trabajo de IA y AA generan, de forma inherente, un menor consumo de energía y una menor huella de carbono. La perspectiva de IA y AA del Framework de Well-Architected describe principios y recomendaciones para diseñar, compilar y administrar cargas de trabajo de IA y AA que cumplan con tus objetivos operativos, de seguridad, confiabilidad, costo y rendimiento. Además, el Centro de arquitectura de Cloud proporciona arquitecturas de referencia detalladas y guías de diseño para cargas de trabajo de IA y AA en Google Cloud.

Recomendaciones

Para optimizar las cargas de trabajo de IA y AA en función de la eficiencia energética, considera las recomendaciones de las siguientes secciones.

Diseña para la eficiencia energética con las TPU

Las cargas de trabajo de IA y AA pueden requerir un procesamiento intensivo. El consumo de energía de las cargas de trabajo de IA y AA es una consideración clave para la sustentabilidad. Las TPU te permiten mejorar significativamente la eficiencia energética y la sustentabilidad de tus cargas de trabajo de IA y AA.

Las TPU son aceleradores de diseño personalizado creados específicamente para cargas de trabajo de IA y AA. La arquitectura especializada de las TPU las hace muy eficaces para la multiplicación de matrices a gran escala, que es la base del aprendizaje profundo. Las TPU pueden realizar tareas complejas a gran escala con mayor eficiencia que los procesadores de uso general, como las CPU o las GPU.

Las TPU proporcionan los siguientes beneficios directos para la sustentabilidad:

Menor consumo energético: Las TPU están diseñadas para lograr una eficiencia energética óptima. Ofrecen más cálculos por vatio de energía consumida. Su arquitectura especializada reduce significativamente las demandas de energía de las tareas de inferencia y entrenamiento a gran escala, lo que genera una disminución de los costos operativos y un menor consumo de energía.
Entrenamiento e inferencia más rápidos: El rendimiento excepcional de las TPU te permite entrenar modelos de IA complejos en horas en lugar de días. Esta reducción significativa en el tiempo de procesamiento total contribuye directamente a una menor huella ambiental.
Menor necesidad de enfriamiento: Las TPU incorporan un sistema avanzado de enfriamiento líquido, que proporciona una administración térmica eficiente y reduce significativamente la energía que se usa para enfriar el centro de datos.
Optimización del ciclo de vida de la IA: Al integrar hardware y software, las TPU proporcionan una solución optimizada en todo el ciclo de vida de la IA, desde el procesamiento de datos hasta la entrega de modelos.

Sigue las prácticas recomendadas de las 4 M para la selección de recursos

Google recomienda un conjunto de prácticas recomendadas para reducir significativamente el uso de energía y las emisiones de carbono en las cargas de trabajo de IA y AA. Llamamos a estas prácticas recomendadas las 4Ms:

Modelo: Selecciona arquitecturas de modelos de AA eficientes. Por ejemplo, los modelos dispersos mejoran la calidad del AA y reducen la computación de 3 a 10 veces en comparación con los modelos densos.
Máquina: Elige procesadores y sistemas optimizados para el entrenamiento de AA. Estos procesadores mejoran el rendimiento y la eficiencia energética entre 2 y 5 veces en comparación con los procesadores de uso general.
Mecanización: Implementa tus cargas de trabajo con alto consumo de procesamiento en la nube. Tus cargas de trabajo usan menos energía y generan entre 1.4 y 2 veces menos emisiones en comparación con las implementaciones locales. Los centros de datos de Cloud usan almacenes más nuevos y con diseño personalizado que se construyen para la eficiencia energética y tienen una alta proporción de eficacia del uso de energía (PUE). Los centros de datos locales suelen ser más antiguos y pequeños, por lo que las inversiones en sistemas de distribución de energía y enfriamiento eficientes podrían no ser económicas.
Mapa: Selecciona Google Cloud ubicaciones que usan la energía más limpia. Este enfoque ayuda a reducir la huella de carbono bruta de tus cargas de trabajo entre 5 y 10 veces. Para obtener más información, consulta Energía sin emisiones de carbono para las regiones de Google Cloud .

Para obtener más información sobre las prácticas recomendadas y las métricas de eficiencia de las 4 M, consulta los siguientes documentos de investigación:

La huella de carbono del entrenamiento del aprendizaje automático se estabilizará y, luego, se reducirá
The data center as a computer: An introduction to the design of warehouse-scale machines, second edition (El centro de datos como una computadora: Introducción al diseño de máquinas a escala de almacén, segunda edición)

Optimizar los modelos y algoritmos de IA para el entrenamiento y la inferencia

La arquitectura de un modelo de IA y los algoritmos que se usan para el entrenamiento y la inferencia tienen un impacto significativo en el consumo de energía. Ten en cuenta las siguientes recomendaciones.

Selecciona modelos de IA eficientes

Elige modelos de IA más pequeños y eficientes que cumplan con tus requisitos de rendimiento. No selecciones el modelo más grande disponible como opción predeterminada. Por ejemplo, una versión más pequeña y sintetizada del modelo, como DistilBERT, puede ofrecer un rendimiento similar con una sobrecarga computacional significativamente menor y una inferencia más rápida que un modelo más grande, como BERT.

Usar soluciones hiper eficientes y específicas del dominio

Elige soluciones de AA especializadas que proporcionen un mejor rendimiento y requieran mucha menos potencia de procesamiento que un modelo fundamental grande. Estas soluciones especializadas suelen estar previamente entrenadas y optimizadas. Pueden proporcionar reducciones significativas en el consumo de energía y el esfuerzo de investigación para las cargas de trabajo de entrenamiento y de inferencia. A continuación, se incluyen ejemplos de soluciones especializadas específicas del dominio:

Earth AI es una solución de eficiencia energética que sintetiza grandes cantidades de datos geoespaciales globales para proporcionar estadísticas oportunas, precisas y prácticas.
WeatherNext produce pronósticos meteorológicos globales más rápidos, eficientes y precisos en comparación con los métodos convencionales basados en la física.

Aplica técnicas de compresión de modelos adecuadas

A continuación, se muestran ejemplos de técnicas que puedes usar para la compresión de modelos:

Poda: Quita los parámetros innecesarios de una red neuronal. Son parámetros que no contribuyen de manera significativa al rendimiento de un modelo. Esta técnica reduce el tamaño del modelo y los recursos de procesamiento necesarios para la inferencia.
Cuantización: Reduce la precisión de los parámetros del modelo. Por ejemplo, reduce la precisión de punto flotante de 32 bits a números enteros de 8 bits. Esta técnica puede ayudar a reducir de manera significativa el uso de memoria y el consumo de energía sin una reducción notable en la precisión.
Destilación de conocimiento: Entrena un modelo estudiante más pequeño para imitar el comportamiento de un modelo profesor más grande y complejo. El modelo estudiante puede alcanzar un alto nivel de rendimiento con menos parámetros y con un menor consumo de energía.

Usar hardware especializado

Como se mencionó en Sigue las prácticas recomendadas de las 4M para la selección de recursos, elige procesadores y sistemas optimizados para el entrenamiento de AA. Estos procesadores mejoran el rendimiento y la eficiencia energética de 2 a 5 veces en comparación con los procesadores de uso general.

Usa el ajuste eficiente de parámetros

En lugar de ajustar todos los miles de millones de parámetros de un modelo (ajuste completo), usa métodos de ajuste eficiente de parámetros (PEFT) como la adaptación de bajo rango (LoRA). Con esta técnica, detienes los pesos del modelo original y solo entrenas una pequeña cantidad de capas nuevas y ligeras. Este enfoque ayuda a reducir el costo y el consumo de energía.

Sigue las prácticas recomendadas para las operaciones de IA y AA

Las prácticas operativas afectan significativamente la sostenibilidad de tus cargas de trabajo de IA y AA. Ten en cuenta las siguientes recomendaciones.

Optimiza los procesos de entrenamiento de modelos

Usa las siguientes técnicas para optimizar los procesos de entrenamiento de tu modelo:

Interrupción anticipada: Supervisa el proceso de entrenamiento y deténlo cuando no observes más mejoras en el rendimiento del modelo en comparación con el conjunto de validación. Esta técnica te ayuda a evitar cálculos y consumo de energía innecesarios.
Carga de datos eficiente: Usa canalizaciones de datos eficientes para garantizar que las GPUs y las TPUs siempre se utilicen y no esperen datos. Esta técnica ayuda a maximizar el uso de los recursos y reducir el desperdicio de energía.
Ajuste de hiperparámetros optimizado: Para encontrar hiperparámetros óptimos de manera más eficiente, usa técnicas como la optimización bayesiana o el aprendizaje por refuerzo. Evita las búsquedas exhaustivas en cuadrícula, que pueden ser operaciones que consumen muchos recursos.

Mejora la eficiencia de la inferencia

Para mejorar la eficiencia de las tareas de inferencia de IA, usa las siguientes técnicas:

Procesamiento por lotes: Agrupa varias solicitudes de inferencia en lotes y aprovecha el procesamiento paralelo en GPUs y TPUs. Esta técnica ayuda a reducir el costo de energía por predicción.
Almacenamiento en caché avanzado: Implementa una estrategia de almacenamiento en caché de varias capas, que incluye el almacenamiento en caché de clave-valor (KV) para la generación autorregresiva y el almacenamiento en caché de instrucciones semánticas para las respuestas de la aplicación. Esta técnica ayuda a evitar los cálculos redundantes del modelo y puede generar reducciones significativas en el uso de energía y las emisiones de carbono.

Medición y supervisión

Supervisa y mide los siguientes parámetros:

Uso y costo: Usa las herramientas adecuadas para hacer un seguimiento del uso de tokens, el consumo de energía y la huella de carbono de tus cargas de trabajo de IA. Estos datos te ayudan a identificar oportunidades de optimización y a informar el progreso hacia los objetivos de sustentabilidad.
Rendimiento: Supervisa continuamente el rendimiento del modelo en producción. Identificar problemas como la desviación de los datos, que puede indicar que el modelo debe volver a ajustarse Si necesitas volver a entrenar el modelo, puedes usar el modelo original ajustado como punto de partida y ahorrar una cantidad significativa de tiempo, dinero y energía en las actualizaciones.
- Para hacer un seguimiento de las métricas de rendimiento, usa Cloud Monitoring.
- Para correlacionar los cambios en el modelo con las mejoras en las métricas de rendimiento, usa las anotaciones de eventos.

Para obtener más información sobre cómo poner en práctica la mejora continua, consulta Cómo medir y mejorar la sustentabilidad de forma continua.

Implementa la programación que tiene en cuenta las emisiones de carbono

Diseña tus trabajos de canalización de AA para que se ejecuten en regiones con la combinación de energía más limpia. Usa el informe de Huella de carbono para identificar las regiones con menor intensidad de carbono. Programa tareas que consumen muchos recursos como trabajos por lotes durante los períodos en los que la red eléctrica local tiene un mayor porcentaje de energía sin emisiones de carbono (CFE).

Optimiza las canalizaciones de datos

Las operaciones de AA y el ajuste fino requieren un conjunto de datos limpio y de alta calidad. Antes de iniciar trabajos de AA, usa servicios administrados de procesamiento de datos para preparar los datos de manera eficiente. Por ejemplo, usa Dataflow para el procesamiento por lotes y de transmisión, y Dataproc para las canalizaciones administradas de Spark y Hadoop. Una canalización de datos optimizada ayuda a garantizar que tu carga de trabajo de ajuste fino no espere datos, por lo que puedes maximizar la utilización de recursos y ayudar a reducir el desperdicio de energía.

Adopta las MLOps

Para automatizar y administrar todo el ciclo de vida del AA, implementa prácticas de operaciones de AA (MLOps). Estas prácticas ayudan a garantizar que los modelos se supervisen, validen y vuelvan a implementar de forma eficiente, lo que ayuda a evitar el entrenamiento innecesario o la asignación de recursos.

Usa servicios administrados

En lugar de administrar tu propia infraestructura, usa servicios administrados en la nube, como Vertex AI. La plataforma de nube controla la administración de recursos subyacente, lo que te permite enfocarte en el proceso de ajuste. Usa servicios que incluyan herramientas integradas para el ajuste de hiperparámetros, la supervisión de modelos y la administración de recursos.

¿Qué sigue?

Optimiza el uso de recursos para la sustentabilidad

Este principio del pilar de sustentabilidad del Google Cloud framework de Well-Architected proporciona recomendaciones para ayudarte a optimizar el uso de recursos de tus cargas de trabajo en Google Cloud.

Descripción general del principio

Optimizar el uso de recursos es fundamental para mejorar la sustentabilidad de tu entorno de nube. Cada recurso aprovisionado, desde los ciclos de procesamiento hasta el almacenamiento de datos, afecta directamente el uso de energía, la intensidad del agua y las emisiones de carbono. Para reducir la huella ambiental de tus cargas de trabajo, debes tomar decisiones fundamentadas cuando aprovisiones, administres y uses recursos de la nube.

Recomendaciones

Para optimizar el uso de recursos, considera las recomendaciones de las siguientes secciones.

Implementa el ajuste de escala automático y dinámico

El ajuste de escala dinámico y automatizado garantiza que el uso de recursos sea óptimo, lo que ayuda a evitar el desperdicio de energía de la infraestructura inactiva o con exceso de aprovisionamiento. La reducción del desperdicio de energía se traduce en costos y emisiones de carbono más bajos.

Usa las siguientes técnicas para implementar la escalabilidad dinámica y automática.

Usa el escalamiento horizontal

El escalamiento horizontal es la técnica de escalamiento preferida para la mayoría de las aplicaciones que priorizan la nube. En lugar de aumentar el tamaño de cada instancia, lo que se conoce como escalamiento vertical, agregas instancias para distribuir la carga. Por ejemplo, puedes usar grupos de instancias administrados (MIG) para escalar horizontalmente de forma automática un grupo de VMs de Compute Engine. La infraestructura escalada horizontalmente es más resiliente porque la falla de una instancia no afecta la disponibilidad de la aplicación. El escalamiento horizontal también es una técnica eficiente en cuanto a recursos para las aplicaciones que tienen niveles de carga variables.

Configura políticas de ajuste de escala adecuadas

Configura los parámetros del ajuste de escala automático según los requisitos de tus cargas de trabajo. Define métricas y umbrales personalizados que sean específicos del comportamiento de la aplicación. En lugar de depender únicamente del uso de la CPU, considera métricas como la profundidad de la cola para las tareas asíncronas, la latencia de las solicitudes y las métricas personalizadas de la aplicación. Para evitar el ajuste de escala frecuente e innecesario o el aleteo, define políticas de ajuste de escala claras. Por ejemplo, para las cargas de trabajo que implementas en Google Kubernetes Engine (GKE), configura una política de ajuste automático de escala del clúster adecuada.

Combina el ajuste de escala reactivo y proactivo

Con el ajuste de escala reactivo, el sistema se ajusta en respuesta a los cambios de carga en tiempo real. Esta técnica es adecuada para las aplicaciones que tienen picos de carga impredecibles.

El ajuste de escala proactivo es adecuado para cargas de trabajo con patrones predecibles, como horarios comerciales diarios fijos y generación de informes semanales. Para esas cargas de trabajo, usa el ajuste de escala automático programado para aprovisionar recursos previamente, de modo que puedan controlar un nivel de carga anticipado. Esta técnica evita la lucha por los recursos y garantiza una experiencia del usuario más fluida y eficiente. Esta técnica también te ayuda a planificar de forma proactiva los aumentos conocidos en la carga, como los eventos de ventas importantes y las iniciativas de marketing enfocadas.

Google Cloud Los servicios y las funciones administrados, como GKE Autopilot, Cloud Run y los MIG, administran automáticamente el escalamiento proactivo aprendiendo de tus patrones de carga de trabajo. De forma predeterminada, cuando un servicio de Cloud Run no recibe tráfico, se reduce a cero instancias.

Diseña aplicaciones sin estado

Para que una aplicación se escale horizontalmente, sus componentes deben carecer de estado. Esto significa que la sesión o los datos de un usuario específico no están vinculados a una sola instancia de procesamiento. Cuando almacenas el estado de la sesión fuera de la instancia de procesamiento, por ejemplo, en Memorystore para Redis, cualquier instancia de procesamiento puede controlar las solicitudes de cualquier usuario. Este enfoque de diseño permite un escalamiento horizontal eficiente y sin inconvenientes.

Usa la programación y los lotes

El procesamiento por lotes es ideal para cargas de trabajo a gran escala y no urgentes. Los trabajos por lotes pueden ayudarte a optimizar tus cargas de trabajo en términos de eficiencia energética y costos.

Usa las siguientes técnicas para implementar trabajos por lotes y de programación.

Programar para una baja intensidad de carbono

Programa tus trabajos por lotes para que se ejecuten en regiones con bajas emisiones de carbono y durante los períodos en los que la red eléctrica local tenga un alto porcentaje de energía limpia. Para identificar los momentos del día con menor intensidad de carbono en una región, usa el informe de Huella de carbono.

Usa VMs Spot para cargas de trabajo no críticas

Las VMs Spot te permiten aprovechar la capacidad sin usar de Compute Engine con un gran descuento. Las VMs Spot se pueden interrumpir, pero proporcionan una forma rentable de procesar grandes conjuntos de datos sin necesidad de recursos dedicados y siempre activos. Las VMs Spot son ideales para trabajos por lotes no críticos y tolerantes a errores.

Consolida y paraleliza los trabajos

Para reducir la sobrecarga de iniciar y detener trabajos individuales, agrupa los trabajos similares en un solo lote grande. Ejecuta estas cargas de trabajo de gran volumen en servicios como Batch. El servicio aprovisiona y administra automáticamente la infraestructura necesaria, lo que ayuda a garantizar un uso óptimo de los recursos.

Usa servicios administrados

Los servicios administrados, como Batch y Dataflow, controlan automáticamente el aprovisionamiento, la programación y la supervisión de recursos. La plataforma en la nube se encarga de la optimización de recursos. Puedes enfocarte en la lógica de la aplicación. Por ejemplo, Dataflow ajusta automáticamente la cantidad de trabajadores según el volumen de datos en la canalización, por lo que no pagas por los recursos inactivos.

Cómo hacer coincidir las familias de máquinas de VM con los requisitos de la carga de trabajo

Los tipos de máquinas que puedes usar para tus VMs de Compute Engine se agrupan en familias de máquinas, que se optimizan para diferentes cargas de trabajo. Elige las familias de máquinas adecuadas según los requisitos de tus cargas de trabajo.

Familia de máquinas	Tipos de cargas de trabajo recomendadas	Orientación sobre sustentabilidad
Instancias de uso general (E2, N2, N4, Tau T2A/T2D): Estas instancias proporcionan una proporción equilibrada de CPU a memoria.	Servidores web, microservicios, bases de datos pequeñas a medianas y entornos de desarrollo	La serie E2 es muy rentable y eficiente en el uso de energía debido a su asignación dinámica de recursos. La serie Tau T2A usa procesadores basados en Arm, que suelen ser más eficientes en cuanto al consumo de energía por unidad de rendimiento para cargas de trabajo a gran escala.
Instancias optimizadas para procesamiento (C2 y C3): Estas instancias proporcionan una alta proporción de CPU virtuales por unidad de memoria y un alto rendimiento por núcleo.	Computación de alto rendimiento (HPC), procesamiento por lotes, servidores de juegos y análisis de datos basados en CPU	Una instancia de la serie C te permite completar tareas que requieren un uso intensivo de la CPU más rápido, lo que reduce el tiempo total de procesamiento y el consumo de energía del trabajo.
Instancias con optimización de memoria (M3 y M2): Estas instancias están diseñadas para cargas de trabajo que requieren una gran cantidad de memoria.	Bases de datos y almacenes de datos en memoria grandes, como SAP HANA o análisis en memoria	Las instancias con optimización de memoria permiten consolidar cargas de trabajo que requieren mucha memoria en menos nodos físicos. Esta consolidación reduce la energía total que se requiere en comparación con el uso de varias instancias más pequeñas. La memoria de alto rendimiento reduce la latencia de acceso a los datos, lo que puede reducir el tiempo total que la CPU pasa en un estado activo.
Instancias optimizadas para almacenamiento (Z3): Estas instancias proporcionan almacenamiento SSD local de alta capacidad de procesamiento y baja latencia.	Almacenamiento de datos, análisis de registros y bases de datos SQL, NoSQL y vectoriales	Las instancias optimizadas para el almacenamiento procesan conjuntos de datos masivos de forma local, lo que ayuda a eliminar la energía que se usa para la transferencia de datos de red entre ubicaciones. Cuando usas almacenamiento local para tareas con una gran cantidad de IOPS, evitas el aprovisionamiento excesivo de varias instancias estándar.
Instancias optimizadas para aceleradores (A3, A2 y G2): Estas instancias se compilan para cargas de trabajo aceleradas por GPU y TPU, como IA, AA y HPC.	Entrenamiento e inferencia de modelos de AA, y simulaciones científicas	Las TPU están diseñadas para ofrecer una eficiencia energética óptima. Ofrecen más cálculos por vatio. Una instancia acelerada por GPU, como la serie A3 con GPU NVIDIA H100, puede ser mucho más eficiente en términos de energía para entrenar modelos grandes que una alternativa solo con CPU. Si bien una instancia acelerada por GPU tiene un consumo de energía nominal más alto, la tarea se completa mucho más rápido.

Actualiza a los tipos de máquinas más recientes

El uso de los tipos de máquinas más recientes puede ayudar a mejorar la sustentabilidad. Cuando se actualizan los tipos de máquinas, a menudo se diseñan para que sean más eficientes en el consumo de energía y proporcionen un mayor rendimiento por vatio. Las VMs que usan los tipos de máquinas más recientes pueden completar la misma cantidad de trabajo con un menor consumo de energía.

Las CPU, las GPU y las TPU suelen beneficiarse de los avances técnicos en la arquitectura de los chips, como los siguientes:

Núcleos especializados: Los avances en los procesadores suelen incluir núcleos o instrucciones especializados para cargas de trabajo comunes. Por ejemplo, las CPUs pueden tener núcleos dedicados para operaciones vectoriales o aceleradores de IA integrados. Cuando estas tareas se descargan de la CPU principal, se completan de manera más eficiente y consumen menos energía.
Administración de energía mejorada: Los avances en las arquitecturas de chips suelen incluir funciones de administración de energía más sofisticadas, como el ajuste dinámico del voltaje y la frecuencia según la carga de trabajo. Estas funciones de administración de energía permiten que los chips funcionen con la máxima eficiencia y entren en estados de bajo consumo cuando están inactivos, lo que minimiza el consumo de energía.

Las mejoras técnicas en la arquitectura del chip proporcionan los siguientes beneficios directos para la sustentabilidad y el costo:

Mayor rendimiento por vatio: Esta es una métrica clave para la sustentabilidad. Por ejemplo, las VMs C4 demuestran un 40% más de rendimiento en relación con el precio en comparación con las VMs C3 para el mismo consumo de energía. El procesador C4A proporciona un 60% más de eficiencia energética que los procesadores x86 comparables. Estas capacidades de rendimiento te permiten completar tareas más rápido o usar menos instancias para la misma carga.
Menor consumo total de energía: Con los procesadores mejorados, los recursos de procesamiento se utilizan durante un período más corto para una tarea determinada, lo que reduce el consumo general de energía y la huella de carbono. El impacto de carbono es particularmente alto para las cargas de trabajo de corta duración y con uso intensivo de procesamiento, como los trabajos por lotes y el entrenamiento de modelos de AA.
Uso óptimo de los recursos: Los tipos de máquinas más recientes suelen ser más adecuados para el software moderno y más compatibles con las funciones avanzadas de las plataformas en la nube. Por lo general, estos tipos de máquinas permiten una mejor utilización de los recursos, lo que reduce la necesidad de un aprovisionamiento excesivo y ayuda a garantizar que cada vatio de energía se use de manera productiva.

Implementa aplicaciones en contenedores

Puedes usar servicios completamente administrados basados en contenedores, como GKE y Cloud Run, como parte de tu estrategia para la computación en la nube sostenible. Estos servicios ayudan a optimizar el uso de los recursos y automatizar la administración de recursos.

Aprovecha la capacidad de escalar a cero de Cloud Run

Cloud Run proporciona un entorno sin servidores administrado que escala automáticamente las instancias a cero cuando no hay tráfico entrante para un servicio o cuando se completa un trabajo. El ajuste de escala automático ayuda a eliminar el consumo de energía de la infraestructura inactiva. Los recursos solo se activan cuando procesan solicitudes de forma activa. Esta estrategia es muy eficaz para las cargas de trabajo intermitentes o controladas por eventos. Para las cargas de trabajo de IA, puedes usar GPUs con Cloud Run, que te permite consumir y pagar por las GPUs solo cuando se usan.

Automatiza la optimización de recursos con GKE

GKE es una plataforma de organización de contenedores que garantiza que las aplicaciones usen solo los recursos que necesitan. Para ayudarte a automatizar la optimización de recursos, GKE proporciona las siguientes técnicas:

Compresión: GKE Autopilot comprime de forma inteligente varios contenedores en los nodos disponibles. El empaquetamiento de contenedores maximiza el uso de cada nodo y reduce la cantidad de nodos inactivos o subutilizados, lo que ayuda a reducir el consumo de energía.
Ajuste de escala automático horizontal de Pods (HPA): Con el HPA, la cantidad de réplicas de contenedores (Pods) se ajusta automáticamente en función de métricas predefinidas, como el uso de CPU o métricas personalizadas específicas de la aplicación. Por ejemplo, si tu aplicación experimenta un aumento repentino en el tráfico, GKE agrega Pods para satisfacer la demanda. Cuando el tráfico disminuye, GKE reduce la cantidad de Pods. Este ajuste de escala dinámico evita el aprovisionamiento excesivo de recursos, por lo que no pagas ni enciendes capacidad de procesamiento innecesaria.
Ajuste de escala automático vertical de Pods (VPA): Puedes configurar GKE para que ajuste automáticamente las asignaciones y los límites de CPU y memoria para contenedores individuales. Esta configuración garantiza que no se asignen más recursos de los necesarios a un contenedor, lo que ayuda a evitar el aprovisionamiento excesivo de recursos.
Ajuste de escala automático multidimensional de Pods en GKE: En el caso de cargas de trabajo complejas, puedes configurar HPA y VPA de forma simultánea para optimizar la cantidad de Pods y el tamaño de cada Pod. Esta técnica ayuda a garantizar la menor huella de energía posible para el rendimiento requerido.
Programación basada en la topología (TAS): TAS mejora la eficiencia de la red para las cargas de trabajo de IA y AA en GKE colocando Pods según la estructura física de la infraestructura del centro de datos. TAS coloca estratégicamente las cargas de trabajo para minimizar los saltos de red. Esta ubicación conjunta ayuda a reducir la latencia de comunicación y el consumo de energía. Al optimizar la alineación física de los nodos y el hardware especializado, TAS acelera la finalización de las tareas y maximiza la eficiencia energética de las cargas de trabajo de IA y AA a gran escala.

Configura la programación que tiene en cuenta las emisiones de carbono

En Google, trasladamos continuamente nuestras cargas de trabajo a ubicaciones y horarios que proporcionan la electricidad más limpia. También reutilizamos o aprovechamos equipos más antiguos para casos de uso alternativos. Puedes usar esta estrategia de programación que tiene en cuenta las emisiones de carbono para garantizar que tus cargas de trabajo en contenedores usen energía limpia.

Para implementar la programación que tiene en cuenta las emisiones de carbono, necesitas información sobre la combinación de fuentes de energía que alimentan los centros de datos de una región en tiempo real. Puedes obtener esta información en un formato legible por máquina desde el repositorio Carbon free energy for Google Cloud regions en GitHub o desde un conjunto de datos públicos de BigQuery. Los datos de intensidad de carbono y de combinación de red por hora que se usan para calcular el conjunto de datos anuales de carbono de Google provienen de Electricity Maps.

Para implementar la programación que tiene en cuenta las emisiones de carbono, te recomendamos las siguientes técnicas:

Cambio geográfico: Programa tus cargas de trabajo para que se ejecuten en regiones que usan una mayor proporción de fuentes de energía renovable. Este enfoque te permite usar redes eléctricas más limpias.
Desplazamiento temporal: Para las cargas de trabajo flexibles y no críticas, como el procesamiento por lotes, configura las cargas de trabajo para que se ejecuten durante las horas no pico o cuando la energía renovable sea más abundante. Este enfoque se conoce como desplazamiento temporal y ayuda a reducir la huella de carbono general, ya que aprovecha las fuentes de energía más limpias cuando están disponibles.

Diseña una recuperación ante desastres con eficiencia energética

La preparación para la recuperación ante desastres (DR) suele implicar el aprovisionamiento previo de recursos redundantes en una región secundaria. Sin embargo, los recursos inactivos o infrautilizados pueden causar un desperdicio significativo de energía. Elige estrategias de DR que maximicen el uso de recursos y minimicen el impacto de carbono sin comprometer tus objetivos de tiempo de recuperación (RTO).

Optimiza la eficiencia del inicio en frío

Usa los siguientes enfoques para minimizar o eliminar los recursos activos en tu región secundaria (DR):

Prioriza el DR en frío: Mantén los recursos de la región de DR apagados o en un estado de reducción a cero. Este enfoque ayuda a eliminar la huella de carbono de los recursos de procesamiento inactivos.
Aprovecha la conmutación por error sin servidores: Usa servicios administrados sin servidores, como Cloud Run, para los extremos de DR. Cloud Run se ajusta a cero cuando no está en uso, por lo que puedes mantener una topología de DR que no consuma energía hasta que el tráfico se desvíe a la región de DR.
Automatiza la recuperación con infraestructura como código (IaC): En lugar de mantener los recursos en el sitio de DR en ejecución (cálido), usa una herramienta de IaC, como Terraform, para aprovisionar rápidamente los entornos solo cuando sea necesario.

Equilibra la redundancia y la utilización

La redundancia de recursos es uno de los principales factores que generan desperdicio de energía. Para reducir la redundancia, usa los siguientes enfoques:

Prefiere la configuración activa-activa a la activa-pasiva: En una configuración activa-pasiva, los recursos del sitio pasivo están inactivos, lo que genera un desperdicio de energía. Una arquitectura activa/activa con un tamaño óptimo garantiza que todos los recursos aprovisionados en ambas regiones atiendan el tráfico de forma activa. Este enfoque te ayuda a maximizar la eficiencia energética de tu infraestructura.
Redundancia del tamaño adecuado: Replica los datos y los servicios en las regiones solo cuando la replicación sea necesaria para cumplir con los requisitos de alta disponibilidad o DR. Cada réplica adicional aumenta el costo de energía del almacenamiento persistente y la salida de red.

Desarrolla software con eficiencia energética

Este principio del pilar de sustentabilidad del Google Cloud Framework de Well-Architected proporciona recomendaciones para escribir software que minimice el consumo de energía y la carga del servidor.

Descripción general del principio

Cuando sigues las prácticas recomendadas para compilar tus aplicaciones en la nube, optimizas la energía que utilizan los recursos de infraestructura de la nube: IA, procesamiento, almacenamiento y red. También ayudas a reducir los requisitos de agua de los centros de datos y la energía que consumen los dispositivos de los usuarios finales cuando acceden a tus aplicaciones.

Para crear software eficiente en el uso de energía, debes integrar consideraciones de sustentabilidad en todo el ciclo de vida del software, desde el diseño y el desarrollo hasta la implementación, el mantenimiento y el archivado. Para obtener orientación detallada sobre cómo usar la IA para compilar software que minimice el impacto ambiental de las cargas de trabajo en la nube, consulta el Google Cloud libro electrónicoBuild Software Sustainably.

Recomendaciones

Las recomendaciones de esta sección se agrupan en las siguientes áreas de enfoque:

Minimiza el trabajo computacional: Prefiere el código eficiente y enfocado que elimina la lógica redundante y evita los cálculos innecesarios o el exceso de funciones.
Usa algoritmos y estructuras de datos eficientes: Elige algoritmos eficientes en términos de tiempo y memoria que reduzcan la carga de la CPU y minimicen el uso de memoria.
Optimiza las operaciones de procesamiento y datos: Desarrolla con el objetivo de usar de manera eficiente todos los recursos disponibles, incluidos la CPU, la memoria, la E/S de disco y la red. Por ejemplo, cuando reemplazas los bucles de espera con lógica basada en eventos, evitas el sondeo innecesario.
Implementa la optimización del frontend: Para reducir la energía que consumen los dispositivos de los usuarios finales, usa estrategias como la minimización, la compresión y la carga diferida de imágenes y recursos.

Minimiza el trabajo computacional

Para escribir software eficiente en términos de energía, debes minimizar la cantidad total de trabajo computacional que realiza tu aplicación. Cada instrucción innecesaria, bucle redundante y función adicional consume energía, tiempo y recursos. Usa las siguientes recomendaciones para compilar software que realice cálculos mínimos.

Escribe código eficiente y enfocado

Para escribir el código mínimo que es esencial para lograr los resultados requeridos, usa los siguientes enfoques:

Elimina la lógica redundante y el exceso de funciones: Escribe código que solo realice las funciones esenciales. Evita las funciones que aumentan la sobrecarga y la complejidad computacionales, pero no proporcionan un valor medible para tus usuarios.
Refactoriza: Para mejorar la eficiencia energética con el tiempo, audita periódicamente tus aplicaciones para identificar las funciones que no se usan. Toma medidas para quitar o refactorizar esas funciones según corresponda.
Evita operaciones innecesarias: No calcules un valor ni ejecutes una acción hasta que se necesite el resultado. Usa técnicas como la evaluación diferida, que retrasa los cálculos hasta que un componente dependiente de la aplicación necesite el resultado.
Prioriza la legibilidad y la reutilización del código: Escribe código que sea legible y reutilizable. Este enfoque minimiza la duplicación y sigue el principio de no repetición (DRY), que puede ayudar a reducir las emisiones de carbono del desarrollo y el mantenimiento de software.

Usa el almacenamiento en caché de backend

El almacenamiento en caché del backend garantiza que una aplicación no realice el mismo trabajo de forma repetida. Una proporción alta de aciertos de caché genera una reducción casi lineal en el consumo de energía por solicitud. Para implementar el almacenamiento en caché del backend, usa las siguientes técnicas:

Almacena en caché los datos frecuentes: Almacena los datos a los que se accede con frecuencia en una ubicación de almacenamiento temporal de alto rendimiento. Por ejemplo, usa un servicio de almacenamiento en caché en la memoria, como Memorystore. Cuando una aplicación recupera datos de una caché, se reduce el volumen de consultas de bases de datos y operaciones de E/S de disco. En consecuencia, disminuye la carga en las bases de datos y los servidores del backend.
Almacena en caché las respuestas de la API: Para evitar llamadas de red redundantes y costosas, almacena en caché los resultados de las solicitudes frecuentes a la API.
Prioriza el almacenamiento en caché en la memoria: Para eliminar las operaciones lentas de E/S de disco y las consultas complejas de bases de datos, almacena los datos en la memoria de alta velocidad (RAM).
Selecciona las estrategias de escritura en caché adecuadas:
- La estrategia de escritura directa garantiza que los datos se escriban de forma síncrona en la caché y en el almacén persistente. Esta estrategia aumenta la probabilidad de aciertos de caché, por lo que el almacenamiento persistente recibe menos solicitudes de lectura que consumen mucha energía.
- La estrategia de escritura diferida (write-behind) mejora el rendimiento de las aplicaciones con muchas operaciones de escritura. Los datos se escriben primero en la caché y, luego, la base de datos se actualiza de forma asíncrona. Esta estrategia reduce la carga de escritura inmediata en las bases de datos más lentas.
Usa políticas de descarte inteligentes: Mantén la caché optimizada y eficiente. Para quitar los datos inactivos o de baja utilidad y maximizar el espacio disponible para los datos solicitados con frecuencia, usa políticas como el tiempo de actividad (TTL), el uso menos reciente (LRU) y el uso menos frecuente (LFU).

Usa algoritmos y estructuras de datos eficientes

Los algoritmos y las estructuras de datos que elijas determinarán la complejidad computacional sin procesar de tu software. Cuando seleccionas algoritmos y estructuras de datos adecuados, minimizas la cantidad de ciclos de CPU y operaciones de memoria que se requieren para completar una tarea. Menos ciclos de CPU y operaciones de memoria generan un menor consumo de energía.

Elige algoritmos para una complejidad temporal óptima

Prioriza los algoritmos que logran el resultado requerido en la menor cantidad de tiempo. Este enfoque ayuda a reducir la duración del uso de recursos. Para seleccionar algoritmos que optimicen el uso de recursos, usa los siguientes enfoques:

Enfócate en reducir la complejidad: Para evaluar la complejidad, considera la complejidad teórica del algoritmo, más allá de las métricas de tiempo de ejecución. Por ejemplo, en comparación con la ordenación de burbuja, la ordenación por fusión reduce significativamente la carga computacional y el consumo de energía para los conjuntos de datos grandes.
Evita el trabajo redundante: Usa funciones integradas y optimizadas en el lenguaje de programación o el framework que elijas. Estas funciones suelen implementarse en un lenguaje de nivel inferior y más eficiente en términos de energía, como C o C++, por lo que están mejor optimizadas para el hardware subyacente en comparación con las funciones codificadas de forma personalizada.

Selecciona estructuras de datos para lograr eficiencia

Las estructuras de datos que elijas determinarán la velocidad a la que se pueden recuperar, insertar o procesar los datos. Esta velocidad afecta el uso de CPU y memoria. Para seleccionar estructuras de datos eficientes, usa los siguientes enfoques:

Optimiza la búsqueda y la recuperación: Para las operaciones comunes, como verificar si existe un elemento o recuperar un valor específico, prefiere las estructuras de datos optimizadas para la velocidad. Por ejemplo, los mapas de hash o los conjuntos de hash permiten búsquedas en tiempo casi constante, lo que es un enfoque más eficiente en términos de energía que buscar linealmente en un array.
Minimiza la huella de memoria: Las estructuras de datos eficientes ayudan a reducir la huella de memoria general de una aplicación. La reducción del acceso y la administración de la memoria genera un menor consumo de energía. Además, un perfil de memoria más eficiente permite que los procesos se ejecuten de manera más eficaz, lo que te permite posponer las actualizaciones de recursos.
Usa estructuras especializadas: Utiliza estructuras de datos creadas específicamente para un problema determinado. Por ejemplo, usa una estructura de datos de árbol de prefijos para realizar búsquedas rápidas de prefijos de cadenas y una cola de prioridad cuando necesites acceder solo al valor más alto o más bajo de manera eficiente.

Optimiza las operaciones de procesamiento y datos

Cuando desarrolles software, enfócate en el uso eficiente y proporcional de los recursos en toda la pila de tecnología. Considera la CPU, la memoria, el disco y la red como recursos limitados y compartidos. Reconoce que el uso eficiente de los recursos genera reducciones tangibles en los costos y el consumo de energía.

Optimiza el uso de la CPU y el tiempo de inactividad

Para minimizar el tiempo que la CPU dedica a un estado activo que consume energía sin realizar un trabajo significativo, usa los siguientes enfoques:

Prefiere la lógica controlada por eventos en lugar del sondeo: Reemplaza los bucles ocupados que consumen muchos recursos o la verificación constante (sondeo) con lógica controlada por eventos. Una arquitectura basada en eventos garantiza que los componentes de una aplicación solo funcionen cuando se activan por eventos relevantes. Este enfoque permite el procesamiento a pedido, lo que elimina la necesidad de sondeos que consumen muchos recursos.
Evita la alta frecuencia constante: Escribe código que no fuerce a la CPU a funcionar constantemente a su frecuencia más alta. Para minimizar el consumo de energía, los sistemas inactivos deben poder entrar en estados de bajo consumo o modos de suspensión.
Usa el procesamiento asíncrono: Para evitar que los subprocesos se bloqueen durante los tiempos de espera inactivos, usa el procesamiento asíncrono. Este enfoque libera recursos y genera un mayor uso general de los recursos.

Administra la memoria y las E/S del disco de manera eficiente

El uso ineficiente de la memoria y el disco genera un procesamiento innecesario y un mayor consumo de energía. Para administrar la memoria y las E/S de manera eficiente, usa las siguientes técnicas:

Administración estricta de la memoria: Toma medidas para liberar de forma proactiva los recursos de memoria no utilizados. Evita mantener objetos grandes en la memoria durante períodos más largos de lo necesario. Este enfoque evita los cuellos de botella en el rendimiento y reduce la energía que se consume para el acceso a la memoria.
Optimiza las E/S del disco: Reduce la frecuencia de las interacciones de lectura y escritura de tu aplicación con los recursos de almacenamiento persistente. Por ejemplo, usa un búfer de memoria intermedio para almacenar datos. Escribe los datos en el almacenamiento persistente en intervalos fijos o cuando el búfer alcanza un tamaño determinado.
Operaciones por lotes: Consolida las operaciones de disco pequeñas y frecuentes en menos operaciones por lotes más grandes. Una operación por lotes consume menos energía que muchas transacciones pequeñas individuales.
Usa compresión: Reduce la cantidad de datos que se escriben en los discos o se leen de ellos aplicando técnicas de compresión de datos adecuadas. Por ejemplo, para comprimir los datos que almacenas en Cloud Storage, puedes usar la transcodificación descompresiva.

Minimiza el tráfico de red

Los recursos de red consumen una cantidad significativa de energía durante las operaciones de transferencia de datos. Para optimizar la comunicación de red, usa las siguientes técnicas:

Minimiza el tamaño de la carga útil: Diseña tus APIs y aplicaciones para transferir solo los datos necesarios para una solicitud. Evita recuperar o devolver estructuras JSON o XML grandes en los casos en que solo se requieren algunos campos. Asegúrate de que las estructuras de datos que se devuelven sean concisas.
Reduce los viajes de ida y vuelta: Para reducir la cantidad de viajes de ida y vuelta de la red que se requieren para completar una acción del usuario, usa protocolos más inteligentes. Por ejemplo, prefiere HTTP/3 a HTTP/1.1, elige GraphQL en lugar de REST, usa protocolos binarios y consolida las llamadas a la API. Cuando reduces la cantidad de llamadas de red, disminuyes el consumo de energía tanto de tus servidores como de los dispositivos de los usuarios finales.

Implementa la optimización del frontend

La optimización del frontend minimiza los datos que deben descargar y procesar los usuarios finales, lo que ayuda a reducir la carga en los recursos de los dispositivos de los usuarios finales.

Minimiza el código y los recursos

Cuando los usuarios finales necesitan descargar y procesar recursos más pequeños y estructurados de manera más eficiente, sus dispositivos consumen menos energía. Para minimizar el volumen de descargas y la carga de procesamiento en los dispositivos de los usuarios finales, usa las siguientes técnicas:

Minimización y compresión: En el caso de los archivos JavaScript, CSS y HTML, quita los caracteres innecesarios, como los espacios en blanco y los comentarios, con las herramientas de minimización adecuadas. Asegúrate de que los archivos, como las imágenes, estén comprimidos y optimizados. Puedes automatizar la minimización y la compresión de los recursos web con una canalización de CI/CD.
Carga diferida: Carga imágenes, videos y recursos no críticos solo cuando sean necesarios, por ejemplo, cuando estos elementos se desplazan al viewport de una página web. Este enfoque reduce el volumen de transferencia de datos inicial y la carga de procesamiento en los dispositivos de los usuarios finales.
Paquetes de JavaScript más pequeños: Elimina el código sin usar de tus paquetes de JavaScript con agrupadores de módulos modernos y técnicas como la eliminación de código no utilizado. Este enfoque genera archivos más pequeños que se cargan más rápido y usan menos recursos del servidor.
Almacenamiento en caché del navegador: Usa encabezados de almacenamiento en caché HTTP para indicarle al navegador del usuario que almacene los recursos estáticos de forma local. El almacenamiento en caché del navegador ayuda a evitar descargas repetidas y tráfico de red innecesario en visitas posteriores.

Prioriza una experiencia del usuario (UX) ligera

El diseño de tu interfaz de usuario puede tener un impacto significativo en la complejidad computacional para renderizar el contenido del frontend. Para compilar interfaces de frontend que proporcionen una UX ligera, usa las siguientes técnicas:

Renderización eficiente: Evita la manipulación frecuente y que requiere muchos recursos del Modelo de objetos del documento (DOM). Escribe código que minimice la complejidad de la renderización y elimine la volver a renderizar innecesaria.
Patrones de diseño ligeros: Cuando sea apropiado, prefiere los sitios estáticos o las apps web progresivas (AWP). Estos sitios y apps se cargan más rápido y requieren menos recursos del servidor.
Accesibilidad y rendimiento: Los sitios responsivos y de carga rápida suelen ser más sostenibles y accesibles. Un diseño optimizado y sin desorden reduce los recursos que se consumen cuando se renderiza el contenido. Los sitios web optimizados para el rendimiento y la velocidad pueden ayudar a generar mayores ingresos. Según un estudio de investigación de Deloitte y Google, Milliseconds Make Millions, una mejora de 0.1 segundos (100 ms) en la velocidad del sitio genera un aumento del 8.4% en las conversiones para los sitios de venta minorista y un aumento del 9.2% en el valor promedio del pedido.

Optimiza los datos y el almacenamiento para la sustentabilidad

Este principio del pilar de sostenibilidad del Google Cloud framework de Well-Architected proporciona recomendaciones para ayudarte a optimizar la eficiencia energética y la huella de carbono de tus recursos de almacenamiento en Google Cloud.

Descripción general del principio

Los datos almacenados no son un recurso pasivo. La energía se consume y las emisiones de carbono se producen durante todo el ciclo de vida de los datos. Cada gigabyte de datos almacenados requiere infraestructura física que se alimenta, enfría y administra de forma continua. Para lograr una arquitectura de nube sostenible, trata los datos como un recurso valioso, pero costoso para el medio ambiente, y prioriza la administración de datos proactiva.

Tus decisiones sobre la retención, la calidad y la ubicación de los datos pueden ayudarte a lograr reducciones significativas en los costos de la nube y el consumo de energía. Minimiza los datos que almacenas, optimiza dónde y cómo los almacenas, y aplica estrategias automatizadas de eliminación y archivo. Cuando reduces el desorden de datos, mejoras el rendimiento del sistema y reduces fundamentalmente la huella ambiental a largo plazo de tus datos.

Recomendaciones

Para optimizar el ciclo de vida de los datos y los recursos de almacenamiento en pos de la sustentabilidad, ten en cuenta las recomendaciones de las siguientes secciones.

Prioriza los datos de alto valor

Los datos almacenados que no se usan, están duplicados o son obsoletos siguen consumiendo energía para alimentar la infraestructura subyacente. Para reducir la huella de carbono relacionada con el almacenamiento, usa las siguientes técnicas.

Identifica y elimina la duplicación

Establece políticas para evitar la replicación innecesaria de conjuntos de datos en varios Google Cloud proyectos o servicios. Usa repositorios de datos centrales, como conjuntos de datos de BigQuery o buckets de Cloud Storage, como fuentes únicas de verdad y otorga el acceso adecuado a estos repositorios.

Cómo quitar los datos ocultos y los datos no utilizados

Los datos oscuros son datos cuya utilidad o propietario se desconocen. Datos sombra significa copias no autorizadas de datos. Analiza tus sistemas de almacenamiento y encuentra datos ocultos y datos sombra con una solución de descubrimiento y catalogación de datos como Dataplex Universal Catalog. Audita estos hallazgos con regularidad y, luego, implementa un proceso para archivar o borrar los datos ocultos y los datos sombra según corresponda.

Minimiza el volumen de datos para las cargas de trabajo de IA

Almacena solo los atributos y los datos procesados que se requieren para el entrenamiento y la entrega del modelo. Cuando sea posible, usa técnicas como el muestreo de datos, la agregación y la generación de datos sintéticos para lograr el rendimiento del modelo sin depender de conjuntos de datos sin procesar masivos.

Integra verificaciones de la calidad de los datos

Implementa canalizaciones automáticas de validación y limpieza de datos con servicios como Dataproc, Dataflow o Dataplex Universal Catalog en el punto de transferencia de datos. Los datos de baja calidad generan un desperdicio de espacio de almacenamiento. También genera un consumo de energía innecesario cuando los datos se usan más adelante para el entrenamiento de la IA o el análisis.

Revisa la densidad de valor de los datos

Revisa periódicamente los conjuntos de datos de gran volumen, como los registros y los flujos de IoT. Determina si se pueden resumir, agregar o reducir los datos para mantener la densidad de información requerida y reducir el volumen de almacenamiento físico.

Evalúa de forma crítica la necesidad de copias de seguridad

Evalúa la necesidad de copias de seguridad de los datos que puedes regenerar con un esfuerzo mínimo. Algunos ejemplos de estos datos incluyen los resultados intermedios de ETL, los cachés efímeros y los datos de entrenamiento que se derivan de una fuente estable y permanente. Conserva copias de seguridad solo de los datos que son únicos o costosos de recrear.

Optimiza la administración del ciclo de vida del almacenamiento

Automatiza el ciclo de vida del almacenamiento para que, cuando disminuya la utilidad de los datos, estos se muevan a una clase de almacenamiento eficiente en el uso de energía o se retiren, según corresponda. Usa las siguientes técnicas.

Selecciona una clase de Cloud Storage adecuada

Automatiza la transición de datos en Cloud Storage a clases de almacenamiento con menos emisiones de carbono según la frecuencia de acceso con la Administración del ciclo de vida de los objetos.

Usa Standard Storage solo para los conjuntos de datos que se usan de forma activa, como los modelos de producción actuales.
Transiciona los datos, como los conjuntos de datos de entrenamiento de IA más antiguos o las copias de seguridad a las que se accede con menos frecuencia, a Nearline o Coldline Storage.
Para la retención a largo plazo, usa Archive Storage, que está optimizado para la eficiencia energética a gran escala.

Implementa políticas de ciclo de vida de los datos agresivas

Define políticas de tiempo de actividad (TTL) claras y automatizadas para los datos no esenciales, como los archivos de registro, los artefactos de modelos temporales y los resultados intermedios desactualizados. Usa reglas de ciclo de vida para borrar automáticamente esos datos después de un período definido.

Exige el etiquetado de recursos

Exige el uso de etiquetas y rótulos de recursos coherentes para todos tus buckets de Cloud Storage, conjuntos de datos de BigQuery y discos persistentes. Crea etiquetas que indiquen el propietario de los datos, el propósito de los datos y el período de retención. Usa las restricciones del Servicio de políticas de la organización para garantizar que las etiquetas requeridas, como el período de retención, se apliquen a los recursos. Las etiquetas te permiten automatizar la administración del ciclo de vida, crear informes detallados de FinOps y generar informes de emisiones de carbono.

Redimensiona y desaprovisiona el almacenamiento de procesamiento

Audita periódicamente los discos persistentes conectados a las instancias de Compute Engine y asegúrate de que no se hayan aprovisionado en exceso. Usa instantáneas solo cuando sean necesarias para la copia de seguridad. Borra las instantáneas antiguas que no se usen. En el caso de las bases de datos, usa políticas de retención de datos para reducir el tamaño de los discos persistentes subyacentes.

Optimiza el formato de almacenamiento

Para el almacenamiento que admite cargas de trabajo de análisis, prefiere los formatos comprimidos basados en columnas, como Parquet o Avro optimizado, en lugar de los formatos basados en filas, como JSON o CSV. El almacenamiento columnar reduce significativamente los requisitos de espacio físico en el disco y mejora la eficiencia de lectura. Esta optimización ayuda a reducir el consumo de energía de las operaciones de E/S y procesamiento asociadas.

Optimiza la regionalización y el movimiento de datos

La ubicación física y el movimiento de tus datos afectan el consumo de recursos de red y la energía necesaria para el almacenamiento. Optimiza la regionalidad de los datos con las siguientes técnicas.

Selecciona regiones de almacenamiento con bajas emisiones de carbono

Según tus requisitos de cumplimiento, almacena los datos en Google Cloud regiones que usen un mayor porcentaje de energía sin emisiones de carbono (CFE) o que tengan una menor intensidad de carbono en la red. Restringe la creación de buckets de almacenamiento en regiones con altas emisiones de carbono con la restricción de la política de la organización ubicaciones de recursos. Si deseas obtener información sobre los datos de CFE y de intensidad de carbono para las regiones de Google Cloud , consulta Energía sin emisiones de carbono para las regiones de Google Cloud .

Minimiza la replicación

Replica los datos entre regiones solo para cumplir con los requisitos obligatorios de recuperación ante desastres (DR) o alta disponibilidad (HA). Las operaciones de replicación multirregión y entre regiones aumentan significativamente el costo energético y la huella de carbono de tus datos.

Optimiza las ubicaciones de procesamiento de datos

Para reducir el consumo de energía en la transferencia de datos de red, implementa cargas de trabajo con uso intensivo de procesamiento, como el entrenamiento de IA y el procesamiento de BigQuery, en la misma región que la fuente de datos.

Optimiza el movimiento de datos para tus socios y clientes

Para transferir grandes volúmenes de datos entre servicios, ubicaciones y proveedores de la nube, recomienda a tus socios y clientes que usen el Servicio de transferencia de almacenamiento o las APIs de uso compartido de datos. Evita las volcados masivos de datos. En el caso de los conjuntos de datos públicos, usa buckets de Requester Pays para transferir los costos de procesamiento y transferencia de datos, y el impacto ambiental a los usuarios finales.

Medir y mejorar la sustentabilidad de forma continua

Este principio del pilar de sustentabilidad del Google Cloud framework de Well-Architected proporciona recomendaciones para ayudarte a medir y mejorar continuamente la sustentabilidad de tus cargas de trabajo en Google Cloud.

Descripción general del principio

Para garantizar que tus cargas de trabajo en la nube sigan siendo sostenibles, necesitas métricas precisas y transparentes. Las métricas verificables te permiten traducir los objetivos de sustentabilidad en acciones. Cada recurso que creas en la nube tiene una huella de carbono asociada. Para crear y mantener arquitecturas de nube sostenibles, debes integrar la medición de los datos de carbono en tu ciclo de retroalimentación operativa.

Las recomendaciones de esta sección proporcionan un marco de trabajo para usar la Huella de carbono y cuantificar las emisiones de carbono, identificar los puntos críticos de carbono, implementar optimizaciones de cargas de trabajo específicas y verificar los resultados de los esfuerzos de optimización. Este marco de trabajo te permite alinear de manera eficiente tus objetivos de optimización de costos con objetivos verificables de reducción de carbono.

Metodología de los informes Huella de carbono

Huella de carbono proporciona un informe transparente, auditable y alineado a nivel mundial de tus emisiones relacionadas con la nube. El informe cumple con los estándares internacionales, principalmente con el Protocolo de Gases de Efecto Invernadero (GEI) para la contabilidad y los informes de carbono. El informe de Huella de carbono utiliza métodos de contabilidad basados en la ubicación y en el mercado. La contabilización basada en la ubicación se basa en el factor de emisiones de la red local. La contabilización basada en el mercado tiene en cuenta las compras de energía sin emisiones de carbono (CFE) de Google. Este enfoque doble te ayuda a comprender tanto el impacto en la red física como el beneficio en términos de carbono de tus cargas de trabajo en Google Cloud.

Para obtener más información sobre cómo se prepara el informe de Huella de carbono, incluidas las fuentes de datos que se usan, las inclusiones de Alcance 3 y el modelo de asignación al cliente, consulta la Metodología de los informes de Huella de carbono.

Recomendaciones

Para usar la medición de carbono y lograr una mejora continua, considera las recomendaciones de las siguientes secciones. Las recomendaciones se estructuran como fases de madurez para implementar operaciones en la nube sostenibles por diseño:

Fase 1: Establece un valor de referencia
Fase 2: Identifica las zonas críticas
Fase 3: Implementa la optimización segmentada
Fase 4: Institucionalizar las prácticas y los informes de sostenibilidad

Fase 1: Establece un valor de referencia

En esta fase, configurarás las herramientas necesarias y te asegurarás de que los datos sean accesibles y estén integrados correctamente.

Otorga permisos: Otorga permisos a equipos como FinOps, SecOps y de ingeniería de plataformas para que puedan acceder al panel de huella de carbono en la consola de Google Cloud . Otorga el rol de visualizador de la huella de carbono (roles/billing.carbonViewer) en Identity and Access Management (IAM) para la cuenta de facturación adecuada.
Automatiza la exportación de datos: Configura la exportación automática de datos de Huella de carbono a BigQuery. Los datos exportados te permiten realizar análisis detallados, correlacionar los datos de carbono con los datos de costos y uso, y generar informes personalizados.
Define indicadores clave de rendimiento (KPI) relacionados con el carbono: Establece métricas que conecten las emisiones de carbono con el valor comercial. Por ejemplo, la intensidad de carbono es una métrica que indica la cantidad de kilogramos de equivalente de CO₂ por cliente, transacción o unidad de ingresos.

Fase 2: Identifica las zonas críticas de emisiones de carbono

Analiza los datos detallados del informe de Huella de carbono para identificar las áreas que tienen el mayor impacto ambiental. Usa las siguientes técnicas para este análisis:

Prioriza por alcance: Para identificar rápidamente los mayores emisores brutos de carbono, analiza los datos del panel por proyecto, región y servicio.
Usa la contabilidad doble: Cuando evalúes el impacto de carbono en una región, considera las emisiones basadas en la ubicación (el impacto ambiental de la red eléctrica local) y las emisiones basadas en el mercado (el beneficio de las inversiones de CFE de Google).
Correlaciona con el costo: Une los datos de carbono en BigQuery con tus datos de facturación y evalúa el impacto de las acciones de optimización en la sustentabilidad y el costo. A menudo, los costos altos pueden correlacionarse con emisiones de carbono elevadas.
Anota los datos para medir el retorno de la inversión (ROI): Anota los datos de carbono en BigQuery con eventos específicos, como ajustar el tamaño de un recurso o dar de baja un servicio grande. Las anotaciones te permiten atribuir las reducciones en las emisiones de carbono y los costos a iniciativas de optimización específicas, de modo que puedas medir y demostrar el resultado de cada iniciativa.

Fase 3: Implementa la optimización segmentada

Esta es la fase de ejecución para implementar operaciones en la nube sostenibles por diseño. Usa las siguientes estrategias para optimizar los recursos específicos que identifiques como factores importantes de los costos y las emisiones de carbono:

Da de baja los proyectos sin supervisión: Revisa periódicamente el recomendador de proyectos sin supervisión que se integra con los datos de Huella de carbono. Para lograr reducciones inmediatas y verificadas en las emisiones de carbono y los costos, automatiza la revisión y la eliminación final de los proyectos que no se usan.
Ajusta el tamaño de los recursos: Haz coincidir la capacidad de recursos aprovisionada con el uso real a través de los recomendadores de ajuste de tamaño de Active Assist, como las recomendaciones de tipo de máquina para las VMs de Compute Engine. Para las tareas que requieren mucha capacidad de procesamiento y las cargas de trabajo de IA, usa los tipos de máquinas y los modelos de IA más eficientes.
Adopta la programación que tiene en cuenta las emisiones de carbono: Para las cargas de trabajo por lotes que no son urgentes, integra datos regionales de CFE en la lógica de programación. Cuando sea posible, limita la creación de recursos nuevos a regiones con bajas emisiones de carbono usando la restricción de ubicaciones de recursos en el Servicio de políticas de la organización.
Reduce la dispersión de datos: Implementa políticas de administración de datos para garantizar que los datos a los que se accede con poca frecuencia se transfieran a una clase de almacenamiento en frío adecuada (Nearline, Coldline o Archive) o se borren de forma permanente. Esta estrategia ayuda a reducir el costo energético de tus recursos de almacenamiento.
Refina el código de la aplicación: Corrige las ineficiencias a nivel del código que provocan un uso excesivo de recursos o un procesamiento innecesario.

Para obtener más información, consulta lo siguiente:

Fase 4: Institucionaliza tus prácticas y tus informes de sustentabilidad

En esta fase, incorporarás la medición de carbono a tu marco de trabajo de gobernanza. Este enfoque ayuda a garantizar que tu organización tenga las capacidades y los controles necesarios para realizar mejoras continuas en la sustentabilidad y generar informes verificables.

Implementa la gobernanza de GreenOps: Establece una función o un grupo de trabajo formal de GreenOps para integrar los datos de la Huella de carbono con los datos de la Facturación de Cloud. Esta función debe definir la responsabilidad de los objetivos de reducción de carbono en todos los proyectos, alinear la optimización de costos con los objetivos de sustentabilidad y, además, implementar informes para hacer un seguimiento de la eficiencia del carbono en relación con la inversión.
Usa los datos de Huella de carbono para informes y cumplimiento: Usa los datos verificados y auditables de Huella de carbono en BigQuery para crear divulgaciones formales sobre aspectos ambientales, sociales y de gobernanza (ESG). Este enfoque te permite satisfacer las demandas de transparencia de las partes interesadas y ayuda a garantizar el cumplimiento de las reglamentaciones obligatorias y voluntarias.
Invierte en capacitación y concientización: Implementa capacitación obligatoria en sustentabilidad para los equipos técnicos y no técnicos pertinentes. Tus equipos deben saber cómo acceder a los datos de la huella de carbono y cómo interpretarlos, así como aplicar las recomendaciones de optimización en sus flujos de trabajo diarios y opciones de diseño. Para obtener más información, consulta Proporciona capacitación sobre sustentabilidad basada en roles.
Define los requisitos de carbono: Incorpora métricas de emisiones de carbono como requisitos no funcionales (RNF) en los criterios de aceptación de tu aplicación para las implementaciones nuevas. Esta práctica ayuda a garantizar que los arquitectos y desarrolladores prioricen las opciones de diseño con bajas emisiones de carbono desde el inicio del ciclo de vida del desarrollo de la aplicación.
Automatiza GreenOps: Automatiza la implementación de las recomendaciones de Active Assist con secuencias de comandos, plantillas y canalizaciones de infraestructura como código (IaC). Esta práctica garantiza que los equipos apliquen las recomendaciones de manera coherente y rápida en toda la organización.

Promueve una cultura de sustentabilidad

Este principio del pilar de sustentabilidad del Google Cloud Well-Architected Framework proporciona recomendaciones para ayudarte a crear una cultura en la que los equipos de tu organización conozcan y dominen las prácticas de sustentabilidad.

Descripción general del principio

Para aplicar prácticas de sustentabilidad, necesitas más que herramientas y técnicas. Necesitas un cambio cultural impulsado por la educación y la responsabilidad. Tus equipos deben conocer las inquietudes sobre la sustentabilidad y tener un dominio práctico de las prácticas de sustentabilidad.

El conocimiento de la sustentabilidad es el conocimiento contextual de que cada decisión arquitectónica y operativa tiene efectos tangibles en la sustentabilidad. Los equipos deben reconocer que la nube no es una colección abstracta de recursos virtuales, sino que se basa en recursos físicos que consumen energía y producen emisiones de carbono.
La competencia en prácticas de sustentabilidad incluye el conocimiento para interpretar los datos de emisiones de carbono, la experiencia en la implementación de la gobernanza de la sustentabilidad en la nube y las habilidades técnicas para refactorizar el código en pos de la eficiencia energética.

Para alinear las prácticas de sustentabilidad con los objetivos de la organización, tus equipos deben comprender cómo el uso de energía de la infraestructura y el software de la nube contribuye a la huella de carbono de la organización. Una capacitación bien planificada ayuda a garantizar que todos tus interesados, desde desarrolladores y arquitectos hasta profesionales de finanzas e ingenieros de operaciones, comprendan el contexto de sustentabilidad de su trabajo diario. Esta comprensión compartida permite a los equipos ir más allá del cumplimiento pasivo y pasar a la optimización activa, lo que hace que tus cargas de trabajo en la nube sean sostenibles por diseño. La sustentabilidad se convierte en un requisito no funcional (RNF) fundamental, al igual que otros requisitos de seguridad, costo, rendimiento y confiabilidad.

Recomendaciones

Para generar conciencia sobre los problemas de sustentabilidad y desarrollar la competencia en las prácticas de sustentabilidad, considera las recomendaciones de las siguientes secciones.

Proporciona contexto comercial y alineación con los objetivos de la organización

La sustentabilidad no es solo un ejercicio técnico, sino que requiere un cambio cultural que alinee las acciones individuales con la misión ambiental de tu organización. Cuando los equipos comprenden el por qué de las iniciativas de sustentabilidad, es más probable que las adopten como principios fundamentales en lugar de tareas opcionales.

Conéctate con el panorama general

Ayuda a tus equipos a comprender cómo las decisiones arquitectónicas individuales, como seleccionar una región con bajas emisiones de carbono u optimizar una canalización de datos, contribuyen a los compromisos generales de sostenibilidad de la organización. Comunica explícitamente cómo estas elecciones afectan a la comunidad local y a la industria. Transformar las métricas de carbono abstractas en indicadores tangibles de progreso hacia los objetivos de responsabilidad social corporativa (RSC).

Por ejemplo, un mensaje como el siguiente informa a los equipos sobre el resultado positivo y el reconocimiento ejecutivo de una decisión para migrar una carga de trabajo a una región con bajas emisiones de carbono y usar un tipo de máquina con eficiencia energética. El mensaje hace referencia al equivalente de CO₂, lo que ayuda a tu equipo a contextualizar el impacto de las medidas de reducción de carbono.

"Al migrar nuestro motor de análisis de datos a la región us-central1 con bajas emisiones de CO₂ y actualizar nuestros clústeres a instancias basadas en Axion C4A, cambiamos fundamentalmente nuestro perfil de carbono. Este cambio generó una reducción del 75% en la intensidad de carbono de nuestro motor de análisis de datos, lo que se traduce en una reducción de 12 toneladas métricas de CO₂ equivalente este trimestre. Esta migración tuvo un impacto significativo en nuestros objetivos comerciales y se incluyó en el boletín informativo del cuarto trimestre que se envió a nuestra junta directiva".

Comunica los objetivos financieros y de sustentabilidad

La transparencia es fundamental para alinear las prácticas de sustentabilidad con los objetivos. En la medida de lo posible, comparte ampliamente los objetivos y el progreso de la sustentabilidad en toda la organización. Destaca el progreso en materia de sustentabilidad en los estados financieros anuales. Esta comunicación garantiza que los equipos técnicos vean su trabajo como una parte vital de los compromisos públicos y la salud financiera de la organización.

Adopta una mentalidad de destino compartido

Capacita a los equipos sobre la naturaleza colaborativa de la sustentabilidad en la nube. Google es responsable de la sustentabilidad de la nube, lo que incluye la eficiencia de la infraestructura y los centros de datos. Tú (el cliente) eres responsable de la sostenibilidad de tus recursos y cargas de trabajo en la nube. Cuando presentas esta colaboración como una asociación de destino compartido, refuerzas la comprensión de que tu organización y Google trabajan en conjunto para lograr resultados ambientales óptimos.

Brinda capacitación sobre sustentabilidad basada en roles

Para garantizar que la sustentabilidad sea una habilidad práctica en lugar de un concepto teórico, adapta la capacitación en sustentabilidad a los roles laborales específicos. Las herramientas y técnicas de sostenibilidad que puede usar un científico de datos son muy diferentes de las que tiene a su disposición un analista de FinOps, como se describe en la siguiente tabla:

Rol	Enfoque de la capacitación
Ingenieros de AA y científicos de datos	Intensidad de carbono de la computación: Demuestra las diferencias entre ejecutar trabajos de entrenamiento de IA en sistemas heredados y en aceleradores de IA creados específicamente. Destaca cómo un modelo con menos parámetros puede producir la precisión requerida con un consumo de energía significativamente menor.
Desarrolladores	Eficiencia del código y consumo de recursos: Ilustra cómo el código de alta latencia o los bucles ineficientes se traducen directamente en un tiempo de ejecución de la CPU extendido y un mayor consumo de energía. Enfatiza la importancia de los contenedores ligeros y la necesidad de optimizar el rendimiento de las aplicaciones para reducir la huella ambiental del software.
Arquitectos	Sustentable por diseño: Se enfoca en la selección de regiones y la ubicación de las cargas de trabajo. Mostrar cómo elegir una región con bajas emisiones de CO₂ y un alto porcentaje de energía renovable (como `northamerica-northeast1`) cambia fundamentalmente el perfil de carbono de toda la pila de aplicaciones antes de que escribas una sola línea de código
Ingenieros de plataforma y de operaciones	Maximizar la utilización: Destaca el costo ambiental de los recursos inactivos y el aprovisionamiento excesivo. Presentar situaciones de ajuste de escala y redimensionamiento automáticos para garantizar que los recursos de la nube se utilicen de manera eficiente Explicar cómo crear y hacer un seguimiento de las métricas relacionadas con la sustentabilidad, como la utilización, y cómo traducir métricas como el tiempo de procesamiento en métricas equivalentes de emisiones de carbono
FinOps	Economía unitaria del carbono: Se enfoca en la relación entre la inversión financiera y el impacto ambiental. Demuestra cómo las prácticas de GreenOps permiten a una organización hacer un seguimiento del carbono por transacción, lo que ayuda a convertir la sustentabilidad en un indicador clave de rendimiento (KPI) tan importante como los KPI convencionales, como el costo y la utilización.
Gerentes de producto	La sustentabilidad como función: Demuestra cómo integrar los objetivos de reducción de carbono en las hojas de ruta de los productos. Mostrar cómo los recorridos del usuario simplificados pueden ayudar a reducir el consumo de energía de los recursos de la nube y los dispositivos de los usuarios finales
Líderes empresariales	Alineación estratégica y generación de informes: Enfócate en cómo la sustentabilidad en la nube afecta las puntuaciones ambientales, sociales y de gobernanza (ESG) y la reputación pública. Ilustrar cómo las decisiones de sustentabilidad ayudan a reducir el riesgo regulatorio y cumplir con los compromisos con la comunidad y la industria

Promueve la sustentabilidad y reconoce el éxito

Para mantener el progreso a largo plazo, debes ir más allá de las correcciones técnicas internas y comenzar a influir en tus socios y en la industria.

Capacita a los administradores para que promuevan la sustentabilidad

Proporcionar a los administradores los datos y permisos que necesitan para priorizar el impacto ambiental de manera similar a otras métricas comerciales, como la velocidad de lanzamiento al mercado y el costo Cuando los administradores tienen estos datos, comienzan a ver la sustentabilidad como un estándar de calidad y eficiencia, en lugar de una capacidad deseable que ralentiza la producción. Abogan activamente por nuevas funciones de proveedores de servicios en la nube, como datos de carbono más detallados y procesadores más nuevos y ecológicos en regiones específicas.

Alinearse con los estándares y frameworks de la industria

Para garantizar que tus iniciativas de sustentabilidad sean creíbles y medibles, alinea las prácticas internas con los estándares globales y regionales reconocidos. Para obtener más información, consulta Cómo alinear las prácticas de sustentabilidad con los lineamientos de la industria.

Incentiva las iniciativas de sustentabilidad

Para garantizar que la sustentabilidad se convierta en una parte duradera de la cultura de ingeniería, los equipos deben comprender el valor de priorizar la sustentabilidad. Pasa de objetivos generales a KPIs específicos y medibles que recompensen la mejora y la eficiencia.

Define los KPI y los NFR de carbono

Considera la sustentabilidad como un requisito técnico fundamental. Cuando defines KPI de carbono, como los gramos de CO₂ equivalente por millón de solicitudes o la intensidad de carbono por ejecución de entrenamiento de AA, haces que el impacto en la sustentabilidad sea visible y práctico. Por ejemplo, integra la sustentabilidad en los NFR de cada proyecto nuevo. En otras palabras, así como un sistema debe cumplir con un objetivo específico de latencia o disponibilidad, también debe mantenerse dentro de un presupuesto definido de emisiones de carbono.

Mide el retorno de la inversión del esfuerzo

Ayuda a tus equipos a identificar los logros de sustentabilidad de alto impacto y bajo esfuerzo, como cambiar un trabajo por lotes a otra región, en comparación con un ejercicio complejo de refactorización de código que podría proporcionar ganancias mínimas. Proporciona visibilidad del retorno de la inversión (ROI) del esfuerzo. Cuando un equipo elige una familia de procesadores más eficiente, debe saber exactamente cuántas emisiones de carbono evitó en relación con el tiempo y el esfuerzo que se requieren para migrar al nuevo procesador.

Reconocer y celebrar la reducción de emisiones de carbono

El impacto en la sustentabilidad suele ocultarse en el segundo plano de la infraestructura. Para generar impulso en el progreso de la sustentabilidad, haz que los logros sean visibles para toda la organización. Por ejemplo, usa anotaciones en los paneles de supervisión para marcar cuándo un equipo implementó una optimización de sostenibilidad específica. Esta visibilidad permite que los equipos señalen los datos en el panel y reclamen el reconocimiento por sus logros.

Alinear las prácticas de sustentabilidad con los lineamientos de la industria

Este principio del pilar de sustentabilidad del Google Cloud Well-Architected Framework proporciona una descripción general de los lineamientos y marcos de trabajo de la industria con los que debes alinear tus esfuerzos de sustentabilidad.

Descripción general del principio

Para asegurarte de que tus iniciativas de sustentabilidad se basen en métodos reconocidos a nivel mundial para la medición, la generación de informes y la verificación, te recomendamos que las alinees con los siguientes lineamientos de la industria:

Lineamientos de sustentabilidad web del W3C
Green Software Foundation
Protocolo de Gases de Efecto Invernadero

Cuando alineas tus iniciativas de sustentabilidad con estos lineamientos externos compartidos, tus iniciativas obtienen la credibilidad y la capacidad de auditoría que exigen los inversores, los organismos reguladores y otras partes interesadas externas. También fomentas la responsabilidad en los equipos de ingeniería, incorporas la sustentabilidad en la capacitación de los empleados y logras integrar las operaciones en la nube en los compromisos de toda la empresa para los informes de factores ambientales, sociales y de gobernanza (ESG).

Lineamientos de sustentabilidad web del W3C

Los Lineamientos de sustentabilidad web (WSG) del W3C son un marco de trabajo emergente de prácticas recomendadas desarrollado por un grupo de trabajo del W3C para abordar el impacto ambiental de los productos y servicios digitales. Los lineamientos abarcan todo el ciclo de vida de una solución digital, incluida la estrategia comercial y de productos, el diseño de la experiencia del usuario (UX), el desarrollo web, el hosting, la infraestructura y los sistemas. El objetivo principal de WSG es permitir que los desarrolladores y los arquitectos creen sitios web y aplicaciones web que sean más eficientes en el uso de energía y que reduzcan el tráfico de red, el procesamiento del cliente y el consumo de recursos del servidor. Estos lineamientos sirven como punto de referencia fundamental para alinear la sostenibilidad a nivel de la aplicación con las decisiones arquitectónicas a nivel de la nube.

Green Software Foundation

La Green Software Foundation (GSF) se enfoca en crear un ecosistema de la industria en torno al software sustentable. Su misión es impulsar la creación de software que se diseñe, compile y opere para minimizar la huella de carbono. El GSF desarrolló la especificación de intensidad de carbono del software (SCI), que proporciona un estándar común para medir la tasa de emisiones de carbono de cualquier software. La alineación con el GSF ayuda a los desarrolladores a conectar la eficiencia de una aplicación directamente con el impacto de carbono del entorno de nube.

Protocolo de Gases de Efecto Invernadero

El Protocolo de Gases de Efecto Invernadero (GEI) es un conjunto de estándares ampliamente utilizado para medir, administrar y divulgar públicamente las emisiones de gases de efecto invernadero. El protocolo se desarrolló a través de una asociación entre el Instituto de Recursos Mundiales (WRI) y el Consejo Empresarial Mundial para el Desarrollo Sostenible (WBCSD). El Protocolo de GEI proporciona el marco de trabajo esencial para la contabilización del clima corporativo. El informe de Huella de carbono proporciona datos sobre los alcances de las emisiones que son relevantes para el uso de la nube. Para obtener más información, consulta la Metodología de los informes Huella de carbono.

El cumplimiento del Protocolo de GEI ayuda a garantizar que tus iniciativas de sustentabilidad tengan credibilidad y que las partes externas puedan auditar tus datos de emisiones de carbono. También ayudas a evitar la percepción de lavado verde y satisfaces los requisitos de diligencia debida de tus inversores, reguladores y partes interesadas externas. Los datos verificados y auditados ayudan a tu organización a demostrar responsabilidad y generar confianza en los compromisos de sostenibilidad públicos.

Well-Architected Framework: Pilar de sustentabilidad Organiza tus páginas con colecciones Guarda y categoriza el contenido según tus preferencias.

Sustentabilidad por diseño: Resultados comerciales integrales

Optimización del rendimiento

Optimización de costos

Seguridad y resiliencia

Experiencia del usuario

Valor de sustentabilidad de la migración a la nube

Responsabilidad compartida y destino compartido

Usa la IA para generar impacto en la empresa

Colaboraciones con socios y clientes

Principios básicos

Colaboradores

Usa regiones que consuman energía con bajas emisiones de carbono

Descripción general del principio

Recomendaciones

Comprende la intensidad de carbono de las regiones de la nube

Incorpora el CFE en tu estrategia de selección de ubicaciones

Cómo usar la programación por hora del día

Optimiza las cargas de trabajo de IA y AA para lograr eficiencia energética

Descripción general del principio

Recomendaciones

Diseña para la eficiencia energética con las TPU

Sigue las prácticas recomendadas de las 4 M para la selección de recursos

Optimizar los modelos y algoritmos de IA para el entrenamiento y la inferencia

Selecciona modelos de IA eficientes

Usar soluciones hiper eficientes y específicas del dominio

Aplica técnicas de compresión de modelos adecuadas

Usar hardware especializado

Usa el ajuste eficiente de parámetros

Sigue las prácticas recomendadas para las operaciones de IA y AA

Optimiza los procesos de entrenamiento de modelos

Mejora la eficiencia de la inferencia

Medición y supervisión

Implementa la programación que tiene en cuenta las emisiones de carbono

Optimiza las canalizaciones de datos

Adopta las MLOps

Usa servicios administrados

¿Qué sigue?

Optimiza el uso de recursos para la sustentabilidad

Descripción general del principio

Recomendaciones

Implementa el ajuste de escala automático y dinámico

Usa el escalamiento horizontal

Configura políticas de ajuste de escala adecuadas

Combina el ajuste de escala reactivo y proactivo

Diseña aplicaciones sin estado

Usa la programación y los lotes

Programar para una baja intensidad de carbono

Usa VMs Spot para cargas de trabajo no críticas

Consolida y paraleliza los trabajos

Usa servicios administrados

Cómo hacer coincidir las familias de máquinas de VM con los requisitos de la carga de trabajo

Actualiza a los tipos de máquinas más recientes

Implementa aplicaciones en contenedores

Aprovecha la capacidad de escalar a cero de Cloud Run

Automatiza la optimización de recursos con GKE

Configura la programación que tiene en cuenta las emisiones de carbono

Diseña una recuperación ante desastres con eficiencia energética

Optimiza la eficiencia del inicio en frío

Equilibra la redundancia y la utilización

Desarrolla software con eficiencia energética

Descripción general del principio

Recomendaciones

Minimiza el trabajo computacional

Escribe código eficiente y enfocado

Usa el almacenamiento en caché de backend

Usa algoritmos y estructuras de datos eficientes

Elige algoritmos para una complejidad temporal óptima

Selecciona estructuras de datos para lograr eficiencia

Optimiza las operaciones de procesamiento y datos

Optimiza el uso de la CPU y el tiempo de inactividad

Administra la memoria y las E/S del disco de manera eficiente

Minimiza el tráfico de red

Implementa la optimización del frontend

Minimiza el código y los recursos

Prioriza una experiencia del usuario (UX) ligera

Optimiza los datos y el almacenamiento para la sustentabilidad

Descripción general del principio

Recomendaciones

Prioriza los datos de alto valor

Well-Architected Framework: Pilar de sustentabilidad