Cookbook d'IA Cloud Run

Cette page fournit une liste organisée de ressources pour vous aider à créer et à déployer des solutions d'IA sur Cloud Run.

Cloud Run est une plate-forme d'applications entièrement gérée qui vous permet d'exécuter votre code, votre fonction ou votre conteneur sur l'infrastructure hautement évolutive de Google. Vous pouvez utiliser Cloud Run pour exécuter diverses solutions d'IA, telles que des points de terminaison d'inférence d'IA, des API de modèles génératifs, des pipelines de génération augmentée par récupération (RAG) entiers, et plus encore.

Utilisez les catégories et les liens ci-dessous pour parcourir les guides officiels, les guides de démarrage rapide et les contenus utiles de la communauté. Pour obtenir de la documentation et des recommandations sur Cloud Run, consultez Explorer les solutions d'IA sur Cloud Run.

Remarque sur les ressources de la communauté

Le contenu portant le libellé "Communauté" est une sélection de ressources de la communauté des développeurs. Il n'est pas développé ni géré par Google. Tenez compte des avertissements suivants lorsque vous utilisez ces ressources :

  • Audit de sécurité : examinez toujours attentivement tout code, en particulier la façon dont il gère les informations privées, les entrées utilisateur et l'accès au réseau.
  • Obsolescence et mises à jour : le code de la communauté peut devenir obsolète ou cesser de fonctionner avec les nouvelles fonctionnalités Cloud Run ou les nouvelles versions de l'IA sans avertissement. Vérifiez sa date de dernière mise à jour et s'il est toujours activement géré.
  • Rentabilité : bien que ces configurations visent souvent à réduire les coûts, elles ne suivent pas forcément les bonnes pratiques de Google pour économiser de l'argent dans les projets en direct. Surveillez attentivement votre facturation.
  • Conformité des licences : assurez-vous de comprendre et de respecter la licence Open Source pour tout code ou toute bibliothèque de la communauté que vous ajoutez à votre application.
  • Testez avant de déployer : vérifiez tous les paramètres importants et essayez les solutions de la communauté dans un environnement de test avant de les utiliser pour des projets en production.

Filtrer par catégorie ou par mot clé

Utilisez les filtres ou le champ de recherche pour trouver du contenu par catégorie ou par mot clé.


Filtrer par :
Catégories Titre et description Date de publication
Blog
Démarrages à froid
Déploiement

Guide sur les démarrages à froid de l'IA sur Cloud Run

Cet article de blog aborde le problème des démarrages à froid pour les applications d'IA sur Cloud Run et décrit les optimisations des paramètres de configuration, d'architecture et d'exécution pour améliorer la latence lors du scaling à zéro.

2026-05-28
ADK
Agents
Atelier de programmation
MCP
Sécurité

Gérer les charges de travail agentiques avec Agent Gateway sur Gemini Enterprise Agent Platform

Cet atelier de programmation explique comment utiliser Agent Gateway pour régir et sécuriser un agent ADK s'exécutant dans Agent Runtime lorsqu'il se connecte à des outils externes hébergés en tant que serveurs MCP sur Cloud Run.

2026-05-28
Agents
Communauté
MCP
Sécurité

Sécuriser les agents IA avec l'autorisation MCP

Cet article explique comment configurer et appliquer l'autorisation MCP pour sécuriser les systèmes agentiques déployant des outils MCP à distance sur Cloud Run.

2026-05-26
AI Studio
Blog
Cloud SQL
Firebase
Vibe coding

AI Studio permet de coder des applications full stack avec Cloud Run, Firebase et Cloud SQL, sans carte de crédit.

Cet article présente les nouveautés concernant le vibe coding full stack dans Google AI Studio. Il détaille les intégrations avec Firebase et Cloud SQL, ainsi qu'un parcours d'intégration sans carte de crédit pour déployer des applications sur Cloud Run.

2026-05-21
ADK
Flutter
Go
Vidéo

Créer une application d'agent d'IA avec Go ADK, Cloud Run et Flutter

Cette vidéo montre comment créer une application d'agent IA à l'aide du kit de développement d'agent Go (ADK), la déployer en tant que service de conteneur sur Cloud Run et y accéder à partir d'une interface utilisateur Flutter multiplate-forme.

2026-05-21
AI Studio
Cloud SQL
Vidéo

Créer des applications Full Stack avec Google AI Studio, Cloud Run et Cloud SQL

Cette vidéo explique comment créer des applications full stack dans le mode Créer de Google AI Studio et les déployer dans Cloud Run avec provisionnement automatique de la base de données.

2026-05-21
AlloyDB
BigQuery
Atelier de programmation
MCP Toolbox
MongoDB

Créer un catalogue d'e-commerce intelligent avec persistance multidatabase

Créez un catalogue e-commerce intelligent à l'aide d'AlloyDB, MongoDB, Cloud Storage, BigQuery et MCP Toolbox sur Cloud Run, puis déployez une application de chat multi-agents.

2026-04-22
Agents
Atelier de programmation
Gemini Enterprise

Keynote Next '26 : le tissu de l'intelligence unifiée

Déployez un système multi-agents sur Cloud Run et orchestrez-le à l'aide de Gemini Enterprise avec un contexte partagé pour illustrer la structure de l'intelligence unifiée.

2026-04-22
ADK
Agents
Atelier de programmation
MCP

Créer et déployer un agent Passeport pour animaux de compagnie sur Cloud Run

Cet atelier de programmation vous explique comment créer et déployer un agent Passeport pour animaux de compagnie utilisant des outils à l'aide de l'ADK et des serveurs Google MCP (Model Context Protocol) sur Cloud Run.

2026-04-22
ADK
Agents
Atelier de programmation
Eventarc

Créer des agents d'IA événementielle avec Eventarc, Cloud Run et ADK

Découvrez comment créer et déployer des agents d'IA asynchrones basés sur des événements sur Cloud Run à l'aide d'Eventarc et de l'Agent Development Kit (ADK).

2026-04-22
Agents
Atelier de programmation
MCP
Sécurité

Déployer un agent d'entreprise compatible avec la gouvernance avec MCP et Cloud Run

Dans la deuxième partie de cette série, découvrez comment déployer un serveur Model Context Protocol (MCP) sur Cloud Run pour qu'il serve de plan de contrôle des données et comment le connecter à un agent ADK compatible avec la gouvernance.

2026-04-16
ADK
Agents
Atelier de programmation
Model Armor
Sécurité

Créer un agent sécurisé avec Model Armor et Identity

Créez un agent d'IA sécurisé de qualité production à l'aide de l'Agent Development Kit (ADK) et déployez-le sur Google Cloud. Ce guide explique comment implémenter Model Armor pour le filtrage des entrées/sorties et l'identité de l'agent pour le contrôle des accès.

2026-04-16
ADK
Agents
Atelier de programmation
MCP

Retour à la maison – Niveau 1 : Localiser l'emplacement

Créer un système d'IA multi-agent à l'aide de l'Agent Development Kit (ADK) qui intègre des serveurs MCP personnalisés et l'intégration OneMCP BigQuery

2026-04-16
AI Studio
Atelier de programmation
Déploiement
Vibe coding

Vibe coder avec Gemini dans Google AI Studio

Cet atelier de programmation vous explique comment utiliser le mode Créer dans Google AI Studio pour prototyper rapidement une application React et la déployer sur Cloud Run en un clic.

2026-04-15
Atelier de programmation
Gemma 4
GPU
LLM

Exécuter l'inférence du modèle Gemma 4 sur Cloud Run avec le GPU RTX 6000 Pro et vLLM

Cet atelier de programmation explique comment déployer un modèle Gemma 4 sur un GPU Cloud Run NVIDIA RTX Pro 6000 à l'aide de vLLM pour une inférence sans serveur à haut débit.

2026-04-13
ADK
Agents
Communauté

Comment j'ai créé et déployé de véritables agents IA à l'aide de Google ADK sur Cloud Run

Créez un planificateur de voyage multi-agents à l'aide de Google Agent Development Kit (ADK) et déployez-le sur Google Cloud Run.

2026-04-10
Agents
Automatisation
Communauté
SRE
Cas d'utilisation

De l'incident à la requête d'extraction : créer un agent SRE optimisé par l'IA sur GCP

Créez un agent SRE qui automatise l'analyse des causes premières et les correctifs logiciels à l'aide de Gemini, Spring Boot et Cloud Run.

2026-04-10
Agents
Atelier de programmation
Frameworks
LangChain

Déployer l'agent LangChain sur Cloud Run

Créez un agent d'IA basé sur LangChain, empaquetez-le dans un conteneur et déployez-le sur Google Cloud Run pour le diffuser.

2026-03-27
Agents
Communauté
Elasticsearch
Gemini
Multimodal

Snap, Plan, Go : créer un agent de voyage multimodal avec Google Cloud, Elasticsearch et Gemini

Créez un agent de voyage multimodal qui identifie les points de repère à partir d'images et suggère des itinéraires à l'aide de Gemini sur Cloud Run.

2026-02-22
AI Studio
Atelier de programmation
Déploiement
Vibe coding

Déployer depuis AI Studio vers Cloud Run

Dans cet atelier de programmation, vous allez créer une application Web simple à l'aide de la programmation Vibe dans Google AI Studio et la déployer sur Cloud Run.

2026-02-18
Frameworks
Gemini
LangChain

Guide de démarrage rapide : Créer et déployer une application Web Python (LangChain) sur Cloud Run

Ce guide de démarrage rapide vous explique comment créer et déployer une application LangChain à l'aide de Cloud Run et de Gemini pour répondre aux requêtes sur les capitales de villes.

2026-02-03
Agents
Frameworks
Gemini

Guide de démarrage rapide : Créer et déployer une application Web Python (smolagents) sur Cloud Run

Ce guide de démarrage rapide explique comment compiler et déployer une application smolagents à l'aide de Cloud Run et de Gemini.

28/01/2026
Agents
Antigravity
Vidéo

Arrêtez de coder, commencez à concevoir : Google Antigravity + Cloud Run

Cette vidéo présente Antigravity, l'IDE agentique de Google. Utilisez-le pour créer et déployer une application Full Stack sur Cloud Run à partir de zéro. Regardez cette vidéo pour écrire une fiche technique pour l'IA, la forcer à utiliser Node.js moderne (sans étapes de compilation !), et la voir déboguer de manière autonome une incompatibilité de port lors du déploiement en modifiant un fichier de configuration.

2025-12-08
Atelier de programmation
Outils

Déployer et exécuter n8n sur Google Cloud Run

Cet atelier de programmation explique comment déployer une instance prête pour la production de l'outil d'automatisation de workflow n8n sur Cloud Run, avec une base de données Cloud SQL pour la persistance et Secret Manager pour les données sensibles.

2025-11-20
Blog
Gemma 3

Exercice pratique avec Gemma 3 sur Google Cloud

Cet article de blog annonce deux ateliers de programmation qui montrent aux développeurs comment déployer Gemma 3 sur Google Cloud en utilisant Cloud Run pour une approche sans serveur ou Google Kubernetes Engine (GKE) pour une approche de plate-forme.

2025-11-17
Agents
GPU
Ollama
Vidéo

Cet agent d'IA s'exécute sur Cloud Run + GPU NVIDIA

Cette vidéo montre comment créer une application d'agent d'IA réelle sur un GPU NVIDIA sans serveur. Découvrez une démonstration d'un agent de santé intelligent qui utilise des modèles Open Source tels que Gemma avec Ollama sur Cloud Run, et LangGraph pour créer un workflow multi-agents (RAG + outils).

2025-11-13
Atelier de programmation
GPU
LLM

Exécuter l'inférence LLM sur les GPU Cloud Run avec vLLM et le SDK Python OpenAI

Cet atelier de programmation explique comment déployer le modèle Gemma 2 2b ajusté aux instructions de Google sur Cloud Run avec des GPU, en utilisant vLLM comme moteur d'inférence et le SDK Python OpenAI pour effectuer la complétion de phrases.

2025-11-13
ADK
Agents
Atelier de programmation

Déployer, gérer et observer un agent ADK sur Cloud Run

Cet atelier de programmation vous explique comment déployer, gérer et surveiller un agent puissant créé avec l'Agent Development Kit (ADK) sur Cloud Run.

2025-11-12
Blog
Outils

Automatisation simple des workflows d'IA : déployer n8n sur Cloud Run

Cet article de blog explique comment déployer des agents à l'aide de l'outil d'automatisation de workflow n8n sur Cloud Run pour créer des workflows optimisés par l'IA et s'intégrer à des outils tels que Google Workspace.

2025-11-07
MCP
Vidéo

Optimisez vos agents IA avec les outils MCP sur Google Cloud Run

Cette vidéo présente le protocole MCP (Model Context Protocol) et explique comment il facilite la vie des développeurs d'agents d'IA. Découvrez comment créer un serveur MCP à l'aide de FastMCP et déployer un agent ADK sur Cloud Run. Découvrez comment le code gère l'authentification de service à service à l'aide des jetons OIDC intégrés de Cloud Run.

2025-11-06
Model Armor
Sécurité
Vidéo

Nous avons essayé de jailbreaker notre IA (et Model Armor l'a empêché)

Cette vidéo montre un exemple d'utilisation de Model Armor de Google pour bloquer les menaces avec un appel d'API.

2025-10-30
Atelier de programmation
Gemini CLI
MCP

Déployer un serveur MCP sécurisé sur Cloud Run

Cet atelier de programmation vous explique comment déployer un serveur MCP (Model Context Protocol) sécurisé sur Cloud Run et vous y connecter depuis la CLI Gemini.

2025-10-28
ADK
Agents
Atelier de programmation
MCP

Créer et déployer un agent ADK qui utilise un serveur MCP sur Cloud Run

Cet atelier de programmation vous guide dans la création et le déploiement d'un agent IA utilisant des outils avec l'Agent Development Kit (ADK). L'agent se connecte à un serveur MCP distant pour ses outils et est déployé en tant que conteneur sur Cloud Run.

2025-10-27
Benchmarking
Vertex AI
Vidéo

Ne devinez pas : comment évaluer vos requêtes d'IA

Cette vidéo montre comment utiliser Vertex AI pour créer des applications d'IA générative fiables à l'aide des outils Google Cloud. Les développeurs apprendront à utiliser les outils Google Cloud pour le prototypage rapide, à obtenir des chiffres précis grâce à des benchmarks basés sur les données et, enfin, à créer un pipeline CI/CD automatisé pour un véritable contrôle qualité, tout en évitant les pièges courants.

2025-10-23
Modèles d'IA
Jobs Cloud Run
Atelier de programmation
Réglage du modèle

Affiner un LLM à l'aide de Cloud Run Jobs

Cet atelier de programmation fournit un guide par étapes sur l'utilisation de Cloud Run Jobs avec des GPU pour affiner un modèle Gemma 3 sur l'ensemble de données Text2Emoji, puis diffuser le modèle obtenu sur un service Cloud Run avec vLLM.

2025-10-21
Inférence par lot
Jobs Cloud Run
Atelier de programmation

Exécuter une inférence par lot sur des jobs Cloud Run

Cet atelier de programmation explique comment utiliser un job Cloud Run avec GPU pour exécuter une inférence par lot sur un modèle Llama 3.2-1b et écrire les résultats directement dans un bucket Cloud Storage.

2025-10-21
ADK
Multi-agent
Vidéo

Créer une application multi-agent avec ADK et Gemini

Cette vidéo montre comment créer une application à l'aide de l'ADK (Agent Development Toolkit) de Google, qui vous aide à affiner du contenu et à collaborer dessus. Découvrez pourquoi les multi-agents avec état fonctionnent mieux qu'un seul agent.

2025-10-16
Communauté
Sécurité

Appeler votre service Cloud Run de manière sécurisée, où que vous soyez

Cet article fournit un exemple de code Python qui acquiert un jeton d'identité pour appeler de manière sécurisée un service Cloud Run authentifié depuis n'importe quel environnement. L'exemple utilise les identifiants par défaut de l'application (ADC) pour authentifier l'appel.

2025-10-15
Gemini
Vidéo

Créer une application d'IA qui regarde des vidéos à l'aide de Gemini

Cette vidéo montre comment créer une application qui regarde et comprend des vidéos YouTube à l'aide de Gemini 2.5 Pro. Utilisez des requêtes intelligentes pour personnaliser le résultat de votre application pour des articles de blog, des résumés, des quiz et plus encore. Cette vidéo explique comment intégrer Gemini pour générer du contenu textuel et des images d'en-tête à partir d'une entrée vidéo, aborde les considérations de coût et explique comment gérer les vidéos plus longues avec des requêtes par lot.

2025-10-06
ADK
Agents
Atelier de programmation
GPU
LLM
MCP

Atelier 3 : Du prototype à la production : déployer votre agent ADK sur Cloud Run avec GPU

Cet atelier de programmation explique comment déployer un agent Agent Development Kit (ADK) prêt pour la production avec un backend Gemma accéléré par GPU sur Cloud Run. Il aborde le déploiement, l'intégration et les tests de performances.

2025-10-03
Agents
Atelier de programmation

Déployer une application frontend Gradio qui appelle un agent ADK de backend, tous deux exécutés sur Cloud Run

Cet atelier de programmation explique comment déployer une application à deux niveaux sur Cloud Run, composée d'un frontend Gradio et d'un backend d'agent ADK, en mettant l'accent sur l'implémentation d'une communication sécurisée et authentifiée entre services.

2025-09-29
Modèles d'IA
Communauté
RAG

IA sans serveur : EmbeddingGemma avec Cloud Run

Cet article fournit un guide pas à pas sur la façon de conteneuriser et de déployer le modèle EmbeddingGemma sur Cloud Run avec des GPU, puis de l'utiliser pour créer une application RAG.

2025-09-24
Blog
Extensions
Gemini

Automatisez le déploiement d'applications et l'analyse de la sécurité avec les nouvelles extensions Gemini CLI

Cet article de blog annonce l'extension Cloud Run dans Gemini CLI pour simplifier le déploiement d'applications avec une seule commande /deploy.

2025-09-10
Communauté
Sécurité

Chaîne de confiance pour l'IA : sécuriser l'architecture MCP Toolbox sur Cloud Run

Cet article décompose une application de réservation d'hôtel simple conçue sur Google Cloud. Il présente un modèle de sécurité robuste et zéro confiance utilisant des identités de service, et montre comment une chaîne de confiance sécurisée est établie de l'utilisateur final à la base de données.

03/09/2025
Modèles d'IA
Communauté
Conteneurisation
Docker
Ollama
RAG

IA sans serveur : embeddings Qwen3 avec Cloud Run

Cet article fournit un tutoriel sur le déploiement du modèle d'embedding Qwen3 sur Cloud Run avec des GPU. L'article aborde également la conteneurisation avec Docker et Ollama, et fournit un exemple d'utilisation dans une application RAG.

2025-08-20
Architecture
Communauté
LLM

Vous packagez encore des modèles d'IA dans des conteneurs ? Faites plutôt ceci sur Cloud Run

Cet article préconise une architecture plus efficace et évolutive pour diffuser des grands modèles de langage (LLM) sur Cloud Run en dissociant les fichiers de modèle du conteneur d'application et en utilisant plutôt Cloud Storage FUSE.

2025-08-11
Modèles d'IA
Communauté

Créer un générateur de podcasts optimisé par l'IA avec Gemini et Cloud Run

Cet article explique en détail comment créer un générateur de podcasts sans serveur optimisé par l'IA qui utilise Gemini pour résumer le contenu et Cloud Run. L'exemple orchestre le pipeline automatisé pour générer et diffuser des briefings audio quotidiens à partir de flux RSS.

2025-08-11
GenAI
Vidéo

Créons une application d'IA générative sur Cloud Run

Cette vidéo vous présente l'architecture et le code, en utilisant l'IA pour vous aider à chaque étape.

2025-07-17
Blog
Extensions
Gemini

Du localhost au lancement : simplifiez le déploiement d'applications d'IA avec Cloud Run et Docker Compose

Cet article de blog annonce une collaboration entre Google Cloud et Docker qui simplifie le déploiement d'applications d'IA complexes en permettant aux développeurs d'utiliser la commande gcloud run compose up pour déployer leurs fichiers compose.yaml directement sur Cloud Run.

2025-07-10
Agents
Firebase
Vidéo

Créer des agents IA avec Cloud Run et Firebase Genkit

Cette vidéo explique comment créer des agents d'IA avec Cloud Run et Firebase Genkit, un outil de création d'agents d'IA sans serveur.

2025-07-10
Communauté
MCP

Alimenter vos serveurs MCP avec Google Cloud Run

Cet article explique l'objectif du protocole MCP (Model Context Protocol) et fournit un tutoriel sur la création et le déploiement d'un serveur MCP sur Cloud Run pour exposer des ressources en tant qu'outils pour les applications d'IA.

2025-07-09
AI Studio
Firebase
Gemini
LLM
Vidéo

IA Cloud : une simple API

Cette vidéo montre comment créer rapidement une application d'assistance technique à l'aide d'AI Studio, de Cloud Functions et de Firebase Hosting. Découvrez comment exploiter les grands modèles de langage (LLM) et consultez un exemple pratique d'intégration de l'IA dans une application Web traditionnelle.

2025-06-19
Blog
MCP

Créer et déployer un serveur MCP distant sur Google Cloud Run en moins de 10 minutes

Cet article de blog fournit un guide détaillé pour créer et déployer un serveur MCP (Model Context Protocol) distant et sécurisé sur Google Cloud Run en moins de 10 minutes à l'aide de FastMCP, puis le tester à partir d'un client local.

2025-06-07
Communauté
Modèles de ML
Surveillance

Déployer et surveiller des modèles de ML avec Cloud Run : léger, évolutif et économique

Cet article explique comment déployer, surveiller et mettre à l'échelle automatiquement un modèle de machine learning sur Cloud Run, en utilisant une pile de surveillance légère avec les services Google Cloud pour suivre les performances et contrôler les coûts.

2025-05-29
Modèles d'IA
AI Studio
Communauté
LLM

Déployer Gemma directement depuis AI Studio vers Cloud Run

Cet article fournit un tutoriel pas à pas sur la façon de prendre un modèle Gemma depuis AI Studio, d'adapter son code pour la production et de le déployer en tant qu'application Web conteneurisée sur Cloud Run.

2025-05-29
ADK
Agents
Communauté
MCP

La triade de l'architecture d'agent : ADK, MCP et Cloud Run

Cet article explique comment créer une architecture agentique d'IA en configurant un workflow ADK (Agent Development Kit) qui communique avec un serveur MCP (Model Context Protocol) hébergé sur Cloud Run pour gérer les réservations de vols.

2025-05-27
ADK
Agents
Frameworks
LangGraph
Vertex AI
Vidéo

Créer des agents d'IA sur Google Cloud

Cette vidéo montre comment créer et déployer des agents d'IA à l'aide de Cloud Run et Vertex AI. Découvrez des concepts clés tels que l'appel d'outils, l'agnosticisme des modèles et l'utilisation de frameworks tels que LangGraph et l'Agent Development Kit (ADK).

2025-05-21
Agents
AI Studio
Blog
MCP

Déploiement d'IA simplifié : déployez votre application sur Cloud Run depuis AI Studio ou des agents d'IA compatibles avec MCP

Cet article de blog présente des méthodes permettant de simplifier les déploiements d'IA grâce au déploiement en un clic d'AI Studio vers Cloud Run, au déploiement direct des modèles Gemma 3 et à un serveur MCP pour les déploiements basés sur des agents.

2025-05-20
A2A
Agents
Communauté
Frameworks
Cas d'utilisation

Explorer le protocole Agent2Agent (A2A) avec le cas d'utilisation du concierge d'achat sur Cloud Run

Cet article explique le protocole Agent2Agent (A2A) et montre comment l'utiliser avec une application de concierge d'achat. L'application Cloud Run contient plusieurs agents d'IA, conçus avec différents frameworks, qui collaborent entre eux pour traiter la commande d'un utilisateur.

2025-05-15
Modèles d'IA
Automatisation
CI/CD
Communauté
GitHub

Automatiser le déploiement de modèles de ML avec GitHub Actions et Cloud Run

Cet article fournit un guide complet sur la création d'un pipeline CI/CD avec GitHub Actions pour automatiser la compilation et le déploiement de modèles de machine learning en tant que services conteneurisés sur Cloud Run.

2025-05-08
Modèles d'IA
GPU
Ollama
Vidéo

Découvrez comment héberger DeepSeek avec des GPU Cloud Run en trois étapes

Cette vidéo montre comment simplifier l'hébergement du modèle DeepSeek AI avec les GPU Cloud Run. Découvrez comment déployer et gérer de grands modèles de langage (LLM) sur Google Cloud en trois commandes. Regardez la vidéo et découvrez les fonctionnalités de Cloud Run et de l'outil de ligne de commande Ollama, qui permettent aux développeurs d'exploiter rapidement les applications d'IA grâce à l'allocation et au scaling des ressources à la demande.

2025-04-24
Agents
Blog
Cas d'utilisation

Fusion 50% plus rapide et 50% moins de bugs : comment CodeRabbit a créé son agent de revue de code par IA avec Google Cloud Run

Cet article explique comment CodeRabbit, un outil d'examen de code basé sur l'IA, utilise Cloud Run pour créer une plate-forme évolutive et sécurisée permettant d'exécuter du code non fiable, ce qui permet de réduire de moitié le temps d'examen du code et le nombre de bugs.

2025-04-22
Communauté
LLM
Sécurité

Créer des solutions d'IA souveraines avec Google Cloud – Cloud Run

Cet article vous explique comment créer et déployer une solution d'IA souveraine sur Google Cloud à l'aide des contrôles de souveraineté par les partenaires. Les exemples exécutent un modèle Gemma sur Cloud Run, ce qui garantit la résidence des données et la conformité avec les réglementations européennes.

2025-04-03
Atelier de programmation
Gemini

Déployer une application de chatbot FastAPI sur Cloud Run à l'aide de Gemini

Cet atelier de programmation vous explique comment déployer une application de chatbot FastAPI sur Cloud Run.

2025-04-02
Fonctions Cloud Run
Atelier de programmation
LLM

Héberger un LLM dans un side-car pour une fonction Cloud Run

Cet atelier de programmation vous explique comment héberger un modèle gemma3:4b dans un side-car pour une fonction Cloud Run.

2025-03-27
Blog
Déploiement

Déployer l'IA sans serveur avec Gemma 3 sur Cloud Run

Cet article de blog annonce la sortie de Gemma 3, une famille de modèles d'IA ouverts et légers, et explique comment les déployer sur Cloud Run pour des applications d'IA sans serveur évolutives et économiques.

2025-03-12
Architecture
RAG
Vertex AI

Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et Vector Search

Ce document présente une architecture de référence pour la création d'une application d'IA générative avec génération augmentée par récupération (RAG) sur Google Cloud, en utilisant la recherche vectorielle pour la mise en correspondance de similarités à grande échelle et Vertex AI pour la gestion des embeddings et des modèles.

2025-03-07
Blog
Vertex AI

Créer des applications d'IA générative partageables en moins de 60 secondes avec Vertex AI et Cloud Run

Cet article présente une fonctionnalité de Vertex AI qui permet de déployer des applications Web sur Cloud Run en un clic. Utilisez des requêtes d'IA générative pour simplifier le processus de transformation d'un concept d'IA générative en prototype partageable.

2025-02-20
Blog
GPU
Inférence
RAG
Vertex AI

Débloquer l'inférence en tant que service avec Cloud Run et Vertex AI

Cet article de blog explique comment les développeurs peuvent accélérer le développement d'applications d'IA générative en adoptant un modèle Inference-as-a-Service sur Cloud Run. Cela permet d'héberger et de mettre à l'échelle des LLM avec prise en charge des GPU, et de les intégrer à la génération augmentée par récupération (RAG) pour obtenir des réponses spécifiques au contexte.

2025-02-20
Communauté
LLM

De zéro à Deepseek sur Cloud Run pendant mon trajet du matin

Cet article explique comment déployer rapidement le modèle Deepseek R1 sur Cloud Run avec des GPU à l'aide d'Ollama pendant un trajet matinal. Cet article aborde des sujets avancés tels que l'intégration du modèle dans le conteneur, les tests A/B avec répartition du trafic et l'ajout d'une interface utilisateur Web avec un conteneur side-car.

2025-02-11
Appel de fonction
Gemini
Vidéo

Utiliser l'appel de fonction Gemini avec Cloud Run

Cette vidéo explore la puissance de l'appel de fonction Gemini et explique comment intégrer des API externes à vos applications d'IA. Créez une application météo qui exploite la compréhension du langage naturel de Gemini pour traiter les requêtes des utilisateurs et récupérer les données météorologiques à partir d'une API externe. Vous obtiendrez ainsi un exemple pratique d'appel de fonction en action.

2025-01-23
Communauté
LLM
Ollama

Exécuter n'importe quel LLM ouvert avec Ollama sur Google Cloud Run [Procédure détaillée]

Cet article explique comment héberger n'importe quel LLM ouvert, tel que Gemma 2, sur Google Cloud Run à l'aide d'Ollama. L'article inclut également des instructions pour créer un bucket Cloud Storage afin d'assurer la persistance du modèle et de tester le déploiement.

2025-01-20
Communauté
Modèles de ML

Déployer des modèles de machine learning sans serveur avec des GPU à l'aide de Google Cloud : Cloud Run

Cet article fournit un guide pas à pas pour déployer un modèle de machine learning (ML) compatible avec les GPU sur Cloud Run. Cet article aborde tous les aspects, de la configuration du projet et de la conteneurisation au déploiement automatisé avec Cloud Build et aux tests avec curl et JavaScript.

2025-01-17
Génération d'images
Vertex AI
Vidéo

Générer des images à partir de texte avec Vertex AI sur Cloud Run

Cette vidéo montre comment créer une application de génération d'images à l'aide de Vertex AI sur Google Cloud. Avec le modèle de génération d'images Vertex AI, les développeurs peuvent créer des visuels époustouflants sans avoir besoin d'une infrastructure complexe ni de gérer des modèles.

2025-01-16
Protection des données
Sécurité
Vidéo

Protéger les données sensibles dans les applications d'IA

Cette vidéo explique comment protéger les données sensibles dans les applications d'IA. Découvrez les concepts clés, les bonnes pratiques et les outils permettant de protéger les données tout au long du cycle de vie de l'IA.

2024-11-21
Grande fenêtre de requête
Réglage du modèle
RAG
Vidéo

RAG vs réglage du modèle vs grande fenêtre d'invite

Cette vidéo présente les trois principales méthodes d'intégration de vos données dans les applications d'IA : les prompts avec de longues fenêtres de contexte, la génération augmentée par récupération (RAG) et l'ajustement de modèle. Découvrez les points forts, les limites et les cas d'utilisation idéaux de chaque approche pour prendre des décisions éclairées concernant vos projets d'IA dans cet épisode de Serverless Expeditions.

2024-11-14
Ingénierie des requêtes
Vidéo

Prompt engineering pour les développeurs

Cette vidéo explique comment utiliser le prompt engineering pour améliorer la qualité des réponses de l'IA. Regardez la vidéo pour découvrir comment obtenir des réponses plus précises et pertinentes de l'IA générative grâce aux techniques de prompting en chaîne de pensée, few-shot et multi-shot.

2024-10-31