Cette page fournit une liste organisée de ressources pour vous aider à créer et à déployer des solutions d'IA sur Cloud Run.
Cloud Run est une plate-forme d'applications entièrement gérée qui vous permet d'exécuter votre code, votre fonction ou votre conteneur sur l'infrastructure hautement évolutive de Google. Vous pouvez utiliser Cloud Run pour exécuter diverses solutions d'IA, telles que des points de terminaison d'inférence d'IA, des API de modèles génératifs, des pipelines de génération augmentée par récupération (RAG) entiers, et plus encore.
Utilisez les catégories et les liens ci-dessous pour parcourir les guides officiels, les guides de démarrage rapide et les contenus utiles de la communauté. Pour obtenir de la documentation et des recommandations sur Cloud Run, consultez Explorer les solutions d'IA sur Cloud Run.
Remarque sur les ressources de la communauté
Le contenu portant le libellé "Communauté" est une sélection de ressources de la communauté des développeurs. Il n'est pas développé ni géré par Google. Tenez compte des avertissements suivants lorsque vous utilisez ces ressources :
- Audit de sécurité : examinez toujours attentivement tout code, en particulier la façon dont il gère les informations privées, les entrées utilisateur et l'accès au réseau.
- Obsolescence et mises à jour : le code de la communauté peut devenir obsolète ou cesser de fonctionner avec les nouvelles fonctionnalités Cloud Run ou les nouvelles versions de l'IA sans avertissement. Vérifiez sa date de dernière mise à jour et s'il est toujours activement géré.
- Rentabilité : bien que ces configurations visent souvent à réduire les coûts, elles ne suivent pas forcément les bonnes pratiques de Google pour économiser de l'argent dans les projets en direct. Surveillez attentivement votre facturation.
- Conformité des licences : assurez-vous de comprendre et de respecter la licence Open Source pour tout code ou toute bibliothèque de la communauté que vous ajoutez à votre application.
- Testez avant de déployer : vérifiez tous les paramètres importants et essayez les solutions de la communauté dans un environnement de test avant de les utiliser pour des projets en production.
Filtrer par catégorie ou par mot clé
Utilisez les filtres ou le champ de recherche pour trouver du contenu par catégorie ou par mot clé.
| Catégories | Titre et description | Date de publication |
|---|---|---|
|
Blog
Démarrages à froid
Déploiement
|
Guide sur les démarrages à froid de l'IA sur Cloud Run Cet article de blog aborde le problème des démarrages à froid pour les applications d'IA sur Cloud Run et décrit les optimisations des paramètres de configuration, d'architecture et d'exécution pour améliorer la latence lors du scaling à zéro. |
2026-05-28 |
|
ADK
Agents
Atelier de programmation
MCP
Sécurité
|
Gérer les charges de travail agentiques avec Agent Gateway sur Gemini Enterprise Agent Platform Cet atelier de programmation explique comment utiliser Agent Gateway pour régir et sécuriser un agent ADK s'exécutant dans Agent Runtime lorsqu'il se connecte à des outils externes hébergés en tant que serveurs MCP sur Cloud Run. |
2026-05-28 |
|
Agents
Communauté
MCP
Sécurité
|
Sécuriser les agents IA avec l'autorisation MCP Cet article explique comment configurer et appliquer l'autorisation MCP pour sécuriser les systèmes agentiques déployant des outils MCP à distance sur Cloud Run. |
2026-05-26 |
|
AI Studio
Blog
Cloud SQL
Firebase
Vibe coding
|
Cet article présente les nouveautés concernant le vibe coding full stack dans Google AI Studio. Il détaille les intégrations avec Firebase et Cloud SQL, ainsi qu'un parcours d'intégration sans carte de crédit pour déployer des applications sur Cloud Run. |
2026-05-21 |
|
ADK
Flutter
Go
Vidéo
|
Créer une application d'agent d'IA avec Go ADK, Cloud Run et Flutter Cette vidéo montre comment créer une application d'agent IA à l'aide du kit de développement d'agent Go (ADK), la déployer en tant que service de conteneur sur Cloud Run et y accéder à partir d'une interface utilisateur Flutter multiplate-forme. |
2026-05-21 |
|
AI Studio
Cloud SQL
Vidéo
|
Créer des applications Full Stack avec Google AI Studio, Cloud Run et Cloud SQL Cette vidéo explique comment créer des applications full stack dans le mode Créer de Google AI Studio et les déployer dans Cloud Run avec provisionnement automatique de la base de données. |
2026-05-21 |
|
AlloyDB
BigQuery
Atelier de programmation
MCP Toolbox
MongoDB
|
Créer un catalogue d'e-commerce intelligent avec persistance multidatabase Créez un catalogue e-commerce intelligent à l'aide d'AlloyDB, MongoDB, Cloud Storage, BigQuery et MCP Toolbox sur Cloud Run, puis déployez une application de chat multi-agents. |
2026-04-22 |
|
Agents
Atelier de programmation
Gemini Enterprise
|
Keynote Next '26 : le tissu de l'intelligence unifiée Déployez un système multi-agents sur Cloud Run et orchestrez-le à l'aide de Gemini Enterprise avec un contexte partagé pour illustrer la structure de l'intelligence unifiée. |
2026-04-22 |
|
ADK
Agents
Atelier de programmation
MCP
|
Créer et déployer un agent Passeport pour animaux de compagnie sur Cloud Run Cet atelier de programmation vous explique comment créer et déployer un agent Passeport pour animaux de compagnie utilisant des outils à l'aide de l'ADK et des serveurs Google MCP (Model Context Protocol) sur Cloud Run. |
2026-04-22 |
|
ADK
Agents
Atelier de programmation
Eventarc
|
Créer des agents d'IA événementielle avec Eventarc, Cloud Run et ADK Découvrez comment créer et déployer des agents d'IA asynchrones basés sur des événements sur Cloud Run à l'aide d'Eventarc et de l'Agent Development Kit (ADK). |
2026-04-22 |
|
Agents
Atelier de programmation
MCP
Sécurité
|
Déployer un agent d'entreprise compatible avec la gouvernance avec MCP et Cloud Run Dans la deuxième partie de cette série, découvrez comment déployer un serveur Model Context Protocol (MCP) sur Cloud Run pour qu'il serve de plan de contrôle des données et comment le connecter à un agent ADK compatible avec la gouvernance. |
2026-04-16 |
|
ADK
Agents
Atelier de programmation
Model Armor
Sécurité
|
Créer un agent sécurisé avec Model Armor et Identity Créez un agent d'IA sécurisé de qualité production à l'aide de l'Agent Development Kit (ADK) et déployez-le sur Google Cloud. Ce guide explique comment implémenter Model Armor pour le filtrage des entrées/sorties et l'identité de l'agent pour le contrôle des accès. |
2026-04-16 |
|
ADK
Agents
Atelier de programmation
MCP
|
Retour à la maison – Niveau 1 : Localiser l'emplacement Créer un système d'IA multi-agent à l'aide de l'Agent Development Kit (ADK) qui intègre des serveurs MCP personnalisés et l'intégration OneMCP BigQuery |
2026-04-16 |
|
AI Studio
Atelier de programmation
Déploiement
Vibe coding
|
Vibe coder avec Gemini dans Google AI Studio Cet atelier de programmation vous explique comment utiliser le mode Créer dans Google AI Studio pour prototyper rapidement une application React et la déployer sur Cloud Run en un clic. |
2026-04-15 |
|
Atelier de programmation
Gemma 4
GPU
LLM
|
Exécuter l'inférence du modèle Gemma 4 sur Cloud Run avec le GPU RTX 6000 Pro et vLLM Cet atelier de programmation explique comment déployer un modèle Gemma 4 sur un GPU Cloud Run NVIDIA RTX Pro 6000 à l'aide de vLLM pour une inférence sans serveur à haut débit. |
2026-04-13 |
|
ADK
Agents
Communauté
|
Comment j'ai créé et déployé de véritables agents IA à l'aide de Google ADK sur Cloud Run Créez un planificateur de voyage multi-agents à l'aide de Google Agent Development Kit (ADK) et déployez-le sur Google Cloud Run. |
2026-04-10 |
|
Agents
Automatisation
Communauté
SRE
Cas d'utilisation
|
De l'incident à la requête d'extraction : créer un agent SRE optimisé par l'IA sur GCP Créez un agent SRE qui automatise l'analyse des causes premières et les correctifs logiciels à l'aide de Gemini, Spring Boot et Cloud Run. |
2026-04-10 |
|
Agents
Atelier de programmation
Frameworks
LangChain
|
Déployer l'agent LangChain sur Cloud Run Créez un agent d'IA basé sur LangChain, empaquetez-le dans un conteneur et déployez-le sur Google Cloud Run pour le diffuser. |
2026-03-27 |
|
Agents
Communauté
Elasticsearch
Gemini
Multimodal
|
Snap, Plan, Go : créer un agent de voyage multimodal avec Google Cloud, Elasticsearch et Gemini Créez un agent de voyage multimodal qui identifie les points de repère à partir d'images et suggère des itinéraires à l'aide de Gemini sur Cloud Run. |
2026-02-22 |
|
AI Studio
Atelier de programmation
Déploiement
Vibe coding
|
Déployer depuis AI Studio vers Cloud Run Dans cet atelier de programmation, vous allez créer une application Web simple à l'aide de la programmation Vibe dans Google AI Studio et la déployer sur Cloud Run. |
2026-02-18 |
|
Frameworks
Gemini
LangChain
|
Guide de démarrage rapide : Créer et déployer une application Web Python (LangChain) sur Cloud Run Ce guide de démarrage rapide vous explique comment créer et déployer une application LangChain à l'aide de Cloud Run et de Gemini pour répondre aux requêtes sur les capitales de villes. |
2026-02-03 |
|
Agents
Frameworks
Gemini
|
Guide de démarrage rapide : Créer et déployer une application Web Python (smolagents) sur Cloud Run Ce guide de démarrage rapide explique comment compiler et déployer une application smolagents à l'aide de Cloud Run et de Gemini. |
28/01/2026 |
|
Agents
Antigravity
Vidéo
|
Arrêtez de coder, commencez à concevoir : Google Antigravity + Cloud Run Cette vidéo présente Antigravity, l'IDE agentique de Google. Utilisez-le pour créer et déployer une application Full Stack sur Cloud Run à partir de zéro. Regardez cette vidéo pour écrire une fiche technique pour l'IA, la forcer à utiliser Node.js moderne (sans étapes de compilation !), et la voir déboguer de manière autonome une incompatibilité de port lors du déploiement en modifiant un fichier de configuration. |
2025-12-08 |
|
Atelier de programmation
Outils
|
Déployer et exécuter n8n sur Google Cloud Run Cet atelier de programmation explique comment déployer une instance prête pour la production de l'outil d'automatisation de workflow n8n sur Cloud Run, avec une base de données Cloud SQL pour la persistance et Secret Manager pour les données sensibles. |
2025-11-20 |
|
Blog
Gemma 3
|
Exercice pratique avec Gemma 3 sur Google Cloud Cet article de blog annonce deux ateliers de programmation qui montrent aux développeurs comment déployer Gemma 3 sur Google Cloud en utilisant Cloud Run pour une approche sans serveur ou Google Kubernetes Engine (GKE) pour une approche de plate-forme. |
2025-11-17 |
|
Agents
GPU
Ollama
Vidéo
|
Cet agent d'IA s'exécute sur Cloud Run + GPU NVIDIA Cette vidéo montre comment créer une application d'agent d'IA réelle sur un GPU NVIDIA sans serveur. Découvrez une démonstration d'un agent de santé intelligent qui utilise des modèles Open Source tels que Gemma avec Ollama sur Cloud Run, et LangGraph pour créer un workflow multi-agents (RAG + outils). |
2025-11-13 |
|
Atelier de programmation
GPU
LLM
|
Exécuter l'inférence LLM sur les GPU Cloud Run avec vLLM et le SDK Python OpenAI Cet atelier de programmation explique comment déployer le modèle Gemma 2 2b ajusté aux instructions de Google sur Cloud Run avec des GPU, en utilisant vLLM comme moteur d'inférence et le SDK Python OpenAI pour effectuer la complétion de phrases. |
2025-11-13 |
|
ADK
Agents
Atelier de programmation
|
Déployer, gérer et observer un agent ADK sur Cloud Run Cet atelier de programmation vous explique comment déployer, gérer et surveiller un agent puissant créé avec l'Agent Development Kit (ADK) sur Cloud Run. |
2025-11-12 |
|
Blog
Outils
|
Automatisation simple des workflows d'IA : déployer n8n sur Cloud Run Cet article de blog explique comment déployer des agents à l'aide de l'outil d'automatisation de workflow n8n sur Cloud Run pour créer des workflows optimisés par l'IA et s'intégrer à des outils tels que Google Workspace. |
2025-11-07 |
|
MCP
Vidéo
|
Optimisez vos agents IA avec les outils MCP sur Google Cloud Run Cette vidéo présente le protocole MCP (Model Context Protocol) et explique comment il facilite la vie des développeurs d'agents d'IA. Découvrez comment créer un serveur MCP à l'aide de FastMCP et déployer un agent ADK sur Cloud Run. Découvrez comment le code gère l'authentification de service à service à l'aide des jetons OIDC intégrés de Cloud Run. |
2025-11-06 |
|
Model Armor
Sécurité
Vidéo
|
Nous avons essayé de jailbreaker notre IA (et Model Armor l'a empêché) Cette vidéo montre un exemple d'utilisation de Model Armor de Google pour bloquer les menaces avec un appel d'API. |
2025-10-30 |
|
Atelier de programmation
Gemini CLI
MCP
|
Déployer un serveur MCP sécurisé sur Cloud Run Cet atelier de programmation vous explique comment déployer un serveur MCP (Model Context Protocol) sécurisé sur Cloud Run et vous y connecter depuis la CLI Gemini. |
2025-10-28 |
|
ADK
Agents
Atelier de programmation
MCP
|
Créer et déployer un agent ADK qui utilise un serveur MCP sur Cloud Run Cet atelier de programmation vous guide dans la création et le déploiement d'un agent IA utilisant des outils avec l'Agent Development Kit (ADK). L'agent se connecte à un serveur MCP distant pour ses outils et est déployé en tant que conteneur sur Cloud Run. |
2025-10-27 |
|
Benchmarking
Vertex AI
Vidéo
|
Ne devinez pas : comment évaluer vos requêtes d'IA Cette vidéo montre comment utiliser Vertex AI pour créer des applications d'IA générative fiables à l'aide des outils Google Cloud. Les développeurs apprendront à utiliser les outils Google Cloud pour le prototypage rapide, à obtenir des chiffres précis grâce à des benchmarks basés sur les données et, enfin, à créer un pipeline CI/CD automatisé pour un véritable contrôle qualité, tout en évitant les pièges courants. |
2025-10-23 |
|
Modèles d'IA
Jobs Cloud Run
Atelier de programmation
Réglage du modèle
|
Affiner un LLM à l'aide de Cloud Run Jobs Cet atelier de programmation fournit un guide par étapes sur l'utilisation de Cloud Run Jobs avec des GPU pour affiner un modèle Gemma 3 sur l'ensemble de données Text2Emoji, puis diffuser le modèle obtenu sur un service Cloud Run avec vLLM. |
2025-10-21 |
|
Inférence par lot
Jobs Cloud Run
Atelier de programmation
|
Exécuter une inférence par lot sur des jobs Cloud Run Cet atelier de programmation explique comment utiliser un job Cloud Run avec GPU pour exécuter une inférence par lot sur un modèle Llama 3.2-1b et écrire les résultats directement dans un bucket Cloud Storage. |
2025-10-21 |
|
ADK
Multi-agent
Vidéo
|
Créer une application multi-agent avec ADK et Gemini Cette vidéo montre comment créer une application à l'aide de l'ADK (Agent Development Toolkit) de Google, qui vous aide à affiner du contenu et à collaborer dessus. Découvrez pourquoi les multi-agents avec état fonctionnent mieux qu'un seul agent. |
2025-10-16 |
|
Communauté
Sécurité
|
Appeler votre service Cloud Run de manière sécurisée, où que vous soyez Cet article fournit un exemple de code Python qui acquiert un jeton d'identité pour appeler de manière sécurisée un service Cloud Run authentifié depuis n'importe quel environnement. L'exemple utilise les identifiants par défaut de l'application (ADC) pour authentifier l'appel. |
2025-10-15 |
|
Gemini
Vidéo
|
Créer une application d'IA qui regarde des vidéos à l'aide de Gemini Cette vidéo montre comment créer une application qui regarde et comprend des vidéos YouTube à l'aide de Gemini 2.5 Pro. Utilisez des requêtes intelligentes pour personnaliser le résultat de votre application pour des articles de blog, des résumés, des quiz et plus encore. Cette vidéo explique comment intégrer Gemini pour générer du contenu textuel et des images d'en-tête à partir d'une entrée vidéo, aborde les considérations de coût et explique comment gérer les vidéos plus longues avec des requêtes par lot. |
2025-10-06 |
|
ADK
Agents
Atelier de programmation
GPU
LLM
MCP
|
Atelier 3 : Du prototype à la production : déployer votre agent ADK sur Cloud Run avec GPU Cet atelier de programmation explique comment déployer un agent Agent Development Kit (ADK) prêt pour la production avec un backend Gemma accéléré par GPU sur Cloud Run. Il aborde le déploiement, l'intégration et les tests de performances. |
2025-10-03 |
|
Agents
Atelier de programmation
|
Cet atelier de programmation explique comment déployer une application à deux niveaux sur Cloud Run, composée d'un frontend Gradio et d'un backend d'agent ADK, en mettant l'accent sur l'implémentation d'une communication sécurisée et authentifiée entre services. |
2025-09-29 |
|
Modèles d'IA
Communauté
RAG
|
IA sans serveur : EmbeddingGemma avec Cloud Run Cet article fournit un guide pas à pas sur la façon de conteneuriser et de déployer le modèle EmbeddingGemma sur Cloud Run avec des GPU, puis de l'utiliser pour créer une application RAG. |
2025-09-24 |
|
Blog
Extensions
Gemini
|
Cet article de blog annonce l'extension Cloud Run dans Gemini CLI pour simplifier le déploiement d'applications avec une seule commande /deploy. |
2025-09-10 |
|
Communauté
Sécurité
|
Chaîne de confiance pour l'IA : sécuriser l'architecture MCP Toolbox sur Cloud Run Cet article décompose une application de réservation d'hôtel simple conçue sur Google Cloud. Il présente un modèle de sécurité robuste et zéro confiance utilisant des identités de service, et montre comment une chaîne de confiance sécurisée est établie de l'utilisateur final à la base de données. |
03/09/2025 |
|
Modèles d'IA
Communauté
Conteneurisation
Docker
Ollama
RAG
|
IA sans serveur : embeddings Qwen3 avec Cloud Run Cet article fournit un tutoriel sur le déploiement du modèle d'embedding Qwen3 sur Cloud Run avec des GPU. L'article aborde également la conteneurisation avec Docker et Ollama, et fournit un exemple d'utilisation dans une application RAG. |
2025-08-20 |
|
Architecture
Communauté
LLM
|
Vous packagez encore des modèles d'IA dans des conteneurs ? Faites plutôt ceci sur Cloud Run Cet article préconise une architecture plus efficace et évolutive pour diffuser des grands modèles de langage (LLM) sur Cloud Run en dissociant les fichiers de modèle du conteneur d'application et en utilisant plutôt Cloud Storage FUSE. |
2025-08-11 |
|
Modèles d'IA
Communauté
|
Créer un générateur de podcasts optimisé par l'IA avec Gemini et Cloud Run Cet article explique en détail comment créer un générateur de podcasts sans serveur optimisé par l'IA qui utilise Gemini pour résumer le contenu et Cloud Run. L'exemple orchestre le pipeline automatisé pour générer et diffuser des briefings audio quotidiens à partir de flux RSS. |
2025-08-11 |
|
GenAI
Vidéo
|
Créons une application d'IA générative sur Cloud Run Cette vidéo vous présente l'architecture et le code, en utilisant l'IA pour vous aider à chaque étape. |
2025-07-17 |
|
Blog
Extensions
Gemini
|
Cet article de blog annonce une collaboration entre Google Cloud et Docker qui simplifie le déploiement d'applications d'IA complexes en permettant aux développeurs d'utiliser la commande gcloud run compose up pour déployer leurs fichiers compose.yaml directement sur Cloud Run. |
2025-07-10 |
|
Agents
Firebase
Vidéo
|
Créer des agents IA avec Cloud Run et Firebase Genkit Cette vidéo explique comment créer des agents d'IA avec Cloud Run et Firebase Genkit, un outil de création d'agents d'IA sans serveur. |
2025-07-10 |
|
Communauté
MCP
|
Alimenter vos serveurs MCP avec Google Cloud Run Cet article explique l'objectif du protocole MCP (Model Context Protocol) et fournit un tutoriel sur la création et le déploiement d'un serveur MCP sur Cloud Run pour exposer des ressources en tant qu'outils pour les applications d'IA. |
2025-07-09 |
|
AI Studio
Firebase
Gemini
LLM
Vidéo
|
Cette vidéo montre comment créer rapidement une application d'assistance technique à l'aide d'AI Studio, de Cloud Functions et de Firebase Hosting. Découvrez comment exploiter les grands modèles de langage (LLM) et consultez un exemple pratique d'intégration de l'IA dans une application Web traditionnelle. |
2025-06-19 |
|
Blog
MCP
|
Créer et déployer un serveur MCP distant sur Google Cloud Run en moins de 10 minutes Cet article de blog fournit un guide détaillé pour créer et déployer un serveur MCP (Model Context Protocol) distant et sécurisé sur Google Cloud Run en moins de 10 minutes à l'aide de FastMCP, puis le tester à partir d'un client local. |
2025-06-07 |
|
Communauté
Modèles de ML
Surveillance
|
Déployer et surveiller des modèles de ML avec Cloud Run : léger, évolutif et économique Cet article explique comment déployer, surveiller et mettre à l'échelle automatiquement un modèle de machine learning sur Cloud Run, en utilisant une pile de surveillance légère avec les services Google Cloud pour suivre les performances et contrôler les coûts. |
2025-05-29 |
|
Modèles d'IA
AI Studio
Communauté
LLM
|
Déployer Gemma directement depuis AI Studio vers Cloud Run Cet article fournit un tutoriel pas à pas sur la façon de prendre un modèle Gemma depuis AI Studio, d'adapter son code pour la production et de le déployer en tant qu'application Web conteneurisée sur Cloud Run. |
2025-05-29 |
|
ADK
Agents
Communauté
MCP
|
La triade de l'architecture d'agent : ADK, MCP et Cloud Run Cet article explique comment créer une architecture agentique d'IA en configurant un workflow ADK (Agent Development Kit) qui communique avec un serveur MCP (Model Context Protocol) hébergé sur Cloud Run pour gérer les réservations de vols. |
2025-05-27 |
|
ADK
Agents
Frameworks
LangGraph
Vertex AI
Vidéo
|
Créer des agents d'IA sur Google Cloud Cette vidéo montre comment créer et déployer des agents d'IA à l'aide de Cloud Run et Vertex AI. Découvrez des concepts clés tels que l'appel d'outils, l'agnosticisme des modèles et l'utilisation de frameworks tels que LangGraph et l'Agent Development Kit (ADK). |
2025-05-21 |
|
Agents
AI Studio
Blog
MCP
|
Cet article de blog présente des méthodes permettant de simplifier les déploiements d'IA grâce au déploiement en un clic d'AI Studio vers Cloud Run, au déploiement direct des modèles Gemma 3 et à un serveur MCP pour les déploiements basés sur des agents. |
2025-05-20 |
|
A2A
Agents
Communauté
Frameworks
Cas d'utilisation
|
Explorer le protocole Agent2Agent (A2A) avec le cas d'utilisation du concierge d'achat sur Cloud Run Cet article explique le protocole Agent2Agent (A2A) et montre comment l'utiliser avec une application de concierge d'achat. L'application Cloud Run contient plusieurs agents d'IA, conçus avec différents frameworks, qui collaborent entre eux pour traiter la commande d'un utilisateur. |
2025-05-15 |
|
Modèles d'IA
Automatisation
CI/CD
Communauté
GitHub
|
Automatiser le déploiement de modèles de ML avec GitHub Actions et Cloud Run Cet article fournit un guide complet sur la création d'un pipeline CI/CD avec GitHub Actions pour automatiser la compilation et le déploiement de modèles de machine learning en tant que services conteneurisés sur Cloud Run. |
2025-05-08 |
|
Modèles d'IA
GPU
Ollama
Vidéo
|
Découvrez comment héberger DeepSeek avec des GPU Cloud Run en trois étapes Cette vidéo montre comment simplifier l'hébergement du modèle DeepSeek AI avec les GPU Cloud Run. Découvrez comment déployer et gérer de grands modèles de langage (LLM) sur Google Cloud en trois commandes. Regardez la vidéo et découvrez les fonctionnalités de Cloud Run et de l'outil de ligne de commande Ollama, qui permettent aux développeurs d'exploiter rapidement les applications d'IA grâce à l'allocation et au scaling des ressources à la demande. |
2025-04-24 |
|
Agents
Blog
Cas d'utilisation
|
Cet article explique comment CodeRabbit, un outil d'examen de code basé sur l'IA, utilise Cloud Run pour créer une plate-forme évolutive et sécurisée permettant d'exécuter du code non fiable, ce qui permet de réduire de moitié le temps d'examen du code et le nombre de bugs. |
2025-04-22 |
|
Communauté
LLM
Sécurité
|
Créer des solutions d'IA souveraines avec Google Cloud – Cloud Run Cet article vous explique comment créer et déployer une solution d'IA souveraine sur Google Cloud à l'aide des contrôles de souveraineté par les partenaires. Les exemples exécutent un modèle Gemma sur Cloud Run, ce qui garantit la résidence des données et la conformité avec les réglementations européennes. |
2025-04-03 |
|
Atelier de programmation
Gemini
|
Déployer une application de chatbot FastAPI sur Cloud Run à l'aide de Gemini Cet atelier de programmation vous explique comment déployer une application de chatbot FastAPI sur Cloud Run. |
2025-04-02 |
|
Fonctions Cloud Run
Atelier de programmation
LLM
|
Héberger un LLM dans un side-car pour une fonction Cloud Run Cet atelier de programmation vous explique comment héberger un modèle gemma3:4b dans un side-car pour une fonction Cloud Run. |
2025-03-27 |
|
Blog
Déploiement
|
Déployer l'IA sans serveur avec Gemma 3 sur Cloud Run Cet article de blog annonce la sortie de Gemma 3, une famille de modèles d'IA ouverts et légers, et explique comment les déployer sur Cloud Run pour des applications d'IA sans serveur évolutives et économiques. |
2025-03-12 |
|
Architecture
RAG
Vertex AI
|
Infrastructure RAG pour l'IA générative à l'aide de Vertex AI et Vector Search Ce document présente une architecture de référence pour la création d'une application d'IA générative avec génération augmentée par récupération (RAG) sur Google Cloud, en utilisant la recherche vectorielle pour la mise en correspondance de similarités à grande échelle et Vertex AI pour la gestion des embeddings et des modèles. |
2025-03-07 |
|
Blog
Vertex AI
|
Cet article présente une fonctionnalité de Vertex AI qui permet de déployer des applications Web sur Cloud Run en un clic. Utilisez des requêtes d'IA générative pour simplifier le processus de transformation d'un concept d'IA générative en prototype partageable. |
2025-02-20 |
|
Blog
GPU
Inférence
RAG
Vertex AI
|
Débloquer l'inférence en tant que service avec Cloud Run et Vertex AI Cet article de blog explique comment les développeurs peuvent accélérer le développement d'applications d'IA générative en adoptant un modèle Inference-as-a-Service sur Cloud Run. Cela permet d'héberger et de mettre à l'échelle des LLM avec prise en charge des GPU, et de les intégrer à la génération augmentée par récupération (RAG) pour obtenir des réponses spécifiques au contexte. |
2025-02-20 |
|
Communauté
LLM
|
De zéro à Deepseek sur Cloud Run pendant mon trajet du matin Cet article explique comment déployer rapidement le modèle Deepseek R1 sur Cloud Run avec des GPU à l'aide d'Ollama pendant un trajet matinal. Cet article aborde des sujets avancés tels que l'intégration du modèle dans le conteneur, les tests A/B avec répartition du trafic et l'ajout d'une interface utilisateur Web avec un conteneur side-car. |
2025-02-11 |
|
Appel de fonction
Gemini
Vidéo
|
Utiliser l'appel de fonction Gemini avec Cloud Run Cette vidéo explore la puissance de l'appel de fonction Gemini et explique comment intégrer des API externes à vos applications d'IA. Créez une application météo qui exploite la compréhension du langage naturel de Gemini pour traiter les requêtes des utilisateurs et récupérer les données météorologiques à partir d'une API externe. Vous obtiendrez ainsi un exemple pratique d'appel de fonction en action. |
2025-01-23 |
|
Communauté
LLM
Ollama
|
Exécuter n'importe quel LLM ouvert avec Ollama sur Google Cloud Run [Procédure détaillée] Cet article explique comment héberger n'importe quel LLM ouvert, tel que Gemma 2, sur Google Cloud Run à l'aide d'Ollama. L'article inclut également des instructions pour créer un bucket Cloud Storage afin d'assurer la persistance du modèle et de tester le déploiement. |
2025-01-20 |
|
Communauté
Modèles de ML
|
Cet article fournit un guide pas à pas pour déployer un modèle de machine learning (ML) compatible avec les GPU sur Cloud Run. Cet article aborde tous les aspects, de la configuration du projet et de la conteneurisation au déploiement automatisé avec Cloud Build et aux tests avec curl et JavaScript. |
2025-01-17 |
|
Génération d'images
Vertex AI
Vidéo
|
Générer des images à partir de texte avec Vertex AI sur Cloud Run Cette vidéo montre comment créer une application de génération d'images à l'aide de Vertex AI sur Google Cloud. Avec le modèle de génération d'images Vertex AI, les développeurs peuvent créer des visuels époustouflants sans avoir besoin d'une infrastructure complexe ni de gérer des modèles. |
2025-01-16 |
|
Protection des données
Sécurité
Vidéo
|
Protéger les données sensibles dans les applications d'IA Cette vidéo explique comment protéger les données sensibles dans les applications d'IA. Découvrez les concepts clés, les bonnes pratiques et les outils permettant de protéger les données tout au long du cycle de vie de l'IA. |
2024-11-21 |
|
Grande fenêtre de requête
Réglage du modèle
RAG
Vidéo
|
RAG vs réglage du modèle vs grande fenêtre d'invite Cette vidéo présente les trois principales méthodes d'intégration de vos données dans les applications d'IA : les prompts avec de longues fenêtres de contexte, la génération augmentée par récupération (RAG) et l'ajustement de modèle. Découvrez les points forts, les limites et les cas d'utilisation idéaux de chaque approche pour prendre des décisions éclairées concernant vos projets d'IA dans cet épisode de Serverless Expeditions. |
2024-11-14 |
|
Ingénierie des requêtes
Vidéo
|
Prompt engineering pour les développeurs Cette vidéo explique comment utiliser le prompt engineering pour améliorer la qualité des réponses de l'IA. Regardez la vidéo pour découvrir comment obtenir des réponses plus précises et pertinentes de l'IA générative grâce aux techniques de prompting en chaîne de pensée, few-shot et multi-shot. |
2024-10-31 |