Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

Cloud Run – AI Cookbook

Auf dieser Seite finden Sie eine ausgewählte Liste von Ressourcen, die Ihnen beim Erstellen und Bereitstellen von KI-Lösungen in Cloud Run helfen.

Cloud Run ist eine vollständig verwaltete Anwendungsplattform, mit der Sie Ihren Code, Ihre Funktion oder Ihren Container auf der hoch skalierbaren Infrastruktur von Google ausführen können. Mit Cloud Run können Sie verschiedene KI-Lösungen ausführen, z. B. KI-Inferenzendpunkte, APIs für generative Modelle und vollständige RAG-Pipelines (Retrieval-Augmented Generation).

Über die Kategorien und Links unten können Sie auf offizielle Leitfäden, Schnellstarts und wertvolle Community-Inhalte zugreifen. Die Dokumentation und Empfehlungen für Cloud Run finden Sie unter KI-Lösungen in Cloud Run.

Hinweis zu Community-Ressourcen

Inhalte, die als „Community“ gekennzeichnet sind, sind ausgewählte Ressourcen aus der Entwickler-Community. Sie wurden nicht von Google entwickelt oder werden nicht von Google verwaltet. Beachten Sie die folgenden Hinweise, wenn Sie diese Ressourcen verwenden:

Sicherheitsüberprüfung:Überprüfen Sie den Code immer sorgfältig, insbesondere wie er mit vertraulichen Informationen, Nutzereingaben und Netzwerkzugriff umgeht.
Einstellung und Updates:Community-Code kann veraltet sein oder ohne Vorwarnung nicht mehr mit neuen Cloud Run-Funktionen oder KI-Versionen funktionieren. Prüfen Sie das Datum der letzten Aktualisierung und ob die App noch aktiv gewartet wird.
Kosteneffizienz:Diese Setups sind zwar oft auf niedrige Kosten ausgerichtet, folgen aber möglicherweise nicht den Best Practices von Google zum Sparen von Geld in Live-Projekten. Behalten Sie Ihre Abrechnung im Blick.
Lizenzkonformität:Sie müssen die Open-Source-Lizenz für Community-Code oder Bibliotheken, die Sie Ihrer Anwendung hinzufügen, verstehen und einhalten.
Vor der Bereitstellung testen:Prüfen Sie alle wichtigen Einstellungen und testen Sie Community-Lösungen in einer Testumgebung, bevor Sie sie für Live-Projekte verwenden.

Nach Kategorie oder Keyword filtern

Verwenden Sie die Filter oder das Suchfeld, um Inhalte nach Kategorie oder Suchbegriff zu finden.

Filtern nach:

Kategorien	Titel und Beschreibung	Veröffentlichungsdatum
Blog Kaltstarts Bereitstellung	Leitfaden zu KI-Kaltstarts in Cloud Run In diesem Blogpost wird die Herausforderung von Kaltstarts für KI-Anwendungen in Cloud Run behandelt. Außerdem werden Optimierungen für Konfiguration, Architektur und Laufzeiteinstellungen beschrieben, um die Latenz beim Herunterskalieren auf null zu verbessern.	2026-05-28
ADK Agents Codelab MCP Sicherheit	Agentische Arbeitslasten mit Agent Gateway auf der Gemini Enterprise Agent Platform verwalten In diesem Codelab wird gezeigt, wie Sie mit Agent Gateway einen ADK-Agenten, der in der Agent Runtime ausgeführt wird, verwalten und schützen, wenn er eine Verbindung zu externen Tools herstellt, die als MCP-Server in Cloud Run gehostet werden.	2026-05-28
Agents Community MCP Sicherheit	KI-Agents mit der MCP-Autorisierung schützen In diesem Artikel wird gezeigt, wie Sie die MCP-Autorisierung konfigurieren und erzwingen, um agentische Systeme zu schützen, die Remote-MCP-Tools in Cloud Run bereitstellen.	2026-05-26
AI Studio Blog Cloud SQL Firebase Vibe Coding	AI Studio ermöglicht Full-Stack-Vibe-Coding mit Cloud Run, Firebase und Cloud SQL – ohne Kreditkarte In diesem Artikel werden die Updates für das Vibe-Coding in Google AI Studio beschrieben, einschließlich der Integrationen mit Firebase und Cloud SQL sowie eines Onboarding-Ablaufs ohne Kreditkarte für die Bereitstellung von Apps in Cloud Run.	2026-05-21
ADK Flutter Go Video	KI-Agent-App mit Go ADK, Cloud Run und Flutter erstellen In diesem Video wird gezeigt, wie Sie mit dem Go Agent Development Kit (ADK) eine KI-Agentenanwendung erstellen, sie als Containerdienst in Cloud Run bereitstellen und über ein plattformübergreifendes Flutter-Frontend darauf zugreifen.	2026-05-21
AI Studio Cloud SQL Video	Full-Stack-Apps mit Google AI Studio, Cloud Run und Cloud SQL erstellen In diesem Video wird gezeigt, wie Sie im Build-Modus von Google AI Studio Full-Stack-Anwendungen erstellen und mit automatischer Datenbankbereitstellung in Cloud Run bereitstellen.	2026-05-21
AlloyDB BigQuery Codelab MCP Toolbox MongoDB	Intelligenten E-Commerce-Katalog mit Persistenz in mehreren Datenbanken erstellen Erstellen Sie einen intelligenten E-Commerce-Katalog mit AlloyDB, MongoDB, Cloud Storage, BigQuery und der MCP Toolbox in Cloud Run und stellen Sie dann eine Multi-Agenten-Chat-App bereit.	2026-04-22
Agents Codelab Gemini Enterprise	Nächste Keynote 2026: Fabric of Unified Intelligence Ein System mit mehreren KI-Agenten in Cloud Run bereitstellen und mit Gemini Enterprise mit gemeinsam genutztem Kontext orchestrieren, um die Struktur der einheitlichen KI zu demonstrieren.	2026-04-22
ADK Agents Codelab MCP	Pet Passport-Agenten in Cloud Run erstellen und bereitstellen In diesem Codelab erfahren Sie, wie Sie einen Tool-nutzenden Pet Passport-Agenten mit ADK und Google Model Context Protocol (MCP)-Servern in Cloud Run erstellen und bereitstellen.	2026-04-22
ADK Agents Codelab Eventarc	Ereignisgesteuerte KI-Agents mit Eventarc, Cloud Run und ADK erstellen In diesem Video erfahren Sie, wie Sie asynchrone, ereignisgesteuerte KI-Agents in Cloud Run mit Eventarc und dem Agent Development Kit (ADK) erstellen und bereitstellen.	2026-04-22
Agents Codelab MCP Sicherheit	Bereitstellung eines Governance-basierten Enterprise-Agenten mit MCP und Cloud Run Im zweiten Teil dieser Reihe erfahren Sie, wie Sie einen MCP-Server (Model Context Protocol) in Cloud Run bereitstellen, damit er als Datensteuerungsebene fungiert, und wie Sie ihn mit einem Governance-konformen ADK-Agenten verbinden.	2026-04-16
ADK Agents Codelab Model Armor Sicherheit	Sichere Agenten mit Model Armor und Identity erstellen Sie lernen, mit dem Agent Development Kit (ADK) einen sicheren KI-Agenten in Produktionsqualität zu erstellen und in Google Cloud bereitzustellen. In diesem Leitfaden wird die Implementierung von Model Armor für die Eingabe-/Ausgabefilterung und von Agent Identity für die Zugriffssteuerung beschrieben.	2026-04-16
ADK Agents Codelab MCP	Way Back Home – Level 1: Standort bestimmen Ein KI-System mit mehreren Agenten mit dem Agent Development Kit (ADK) erstellen, das benutzerdefinierte MCP-Server und die OneMCP BigQuery-Integration umfasst.	2026-04-16
AI Studio Codelab Bereitstellung Vibe Coding	Vibe Coding mit Gemini in Google AI Studio In diesem Codelab erfahren Sie, wie Sie mit dem Build-Modus in Google AI Studio schnell einen Prototyp einer React-Anwendung erstellen und mit einem Klick in Cloud Run bereitstellen.	2026-04-15
Codelab Gemma 4 GPUs LLMs	Inferenzen des Gemma 4-Modells in Cloud Run mit RTX 6000 Pro-GPU mit vLLM ausführen In diesem Codelab wird gezeigt, wie Sie ein Gemma 4-Modell auf einer Cloud Run NVIDIA RTX Pro 6000-GPU mit vLLM für serverlose Inferenz mit hohem Durchsatz bereitstellen.	2026-04-13
ADK Agents Community	How I Built and Deployed Real AI Agents Using Google ADK on Cloud Run In diesem Codelab wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) von Google einen Multi-Agenten-Reiseplaner erstellen und in Google Cloud Run bereitstellen.	2026-04-10
Agents Automatisierung Community SRE Anwendungsfälle	From Incident to Pull Request: Building an AI-Powered SRE Agent on GCP Erstellen Sie einen SRE-Agenten, der die Ursachenanalyse und Softwarekorrekturen mit Gemini, Spring Boot und Cloud Run automatisiert.	2026-04-10
Agents Codelab Frameworks LangChain	LangChain-Agent in Cloud Run bereitstellen Einen auf LangChain basierenden KI-Agenten erstellen, ihn in einen Container verpacken und in Google Cloud Run bereitstellen.	2026-03-27
Agents Community Elasticsearch Gemini Multimodal	Snap, Plan, Go: Building a Multimodal Travel Agent with Google Cloud, Elasticsearch, and Gemini Einen multimodalen Reise-Agenten erstellen, der Sehenswürdigkeiten anhand von Bildern erkennt und mit Gemini in Cloud Run Reiserouten vorschlägt	2026-02-22
AI Studio Codelab Bereitstellung Vibe Coding	Anwendungen aus AI Studio in Cloud Run bereitstellen In diesem Codelab erstellen Sie mit Vibe Coding in Google AI Studio eine einfache Webanwendung und stellen sie in Cloud Run bereit.	2026-02-18
Frameworks Gemini LangChain	Kurzanleitung: Python-Webanwendung (LangChain) erstellen und in Cloud Run bereitstellen In dieser Kurzanleitung erfahren Sie, wie Sie eine LangChain-Anwendung mit Cloud Run und Gemini erstellen und bereitstellen, um auf Anfragen zu Hauptstädten zu reagieren.	2026-02-03
Agents Frameworks Gemini	Kurzanleitung: Python-Webanwendung (smolagents) erstellen und in Cloud Run bereitstellen In dieser Kurzanleitung erfahren Sie, wie Sie eine smolagents-Anwendung mit Cloud Run und Gemini erstellen und bereitstellen.	2026-01-28
Agents Antigravity Video	Stop coding, start architecting: Google Antigravity + Cloud Run In diesem Video wird Antigravity, die agentische IDE von Google, vorgestellt. Damit können Sie eine Full-Stack-Anwendung von Grund auf neu erstellen und in Cloud Run bereitstellen. In diesem Video wird gezeigt, wie Sie ein Datenblatt für die KI schreiben, sie zwingen, modernes Node.js zu verwenden (keine Build-Schritte!), und wie sie während der Bereitstellung autonom einen Portkonflikt behebt, indem sie eine Konfigurationsdatei bearbeitet.	2025-12-08
Codelab Tools	n8n in Google Cloud Run bereitstellen und ausführen In diesem Codelab wird gezeigt, wie Sie eine produktionsreife Instanz des Workflow-Automatisierungstools n8n in Cloud Run bereitstellen. Dazu gehören eine Cloud SQL-Datenbank für die Persistenz und Secret Manager für vertrauliche Daten.	2025-11-20
Blog Gemma 3	Gemma 3 in Google Cloud ausprobieren In diesem Blogbeitrag werden zwei Codelabs angekündigt, in denen Entwickler erfahren, wie sie Gemma 3 in Google Cloud bereitstellen können. Dabei wird entweder Cloud Run für einen serverlosen Ansatz oder Google Kubernetes Engine (GKE) für einen Plattformansatz verwendet.	2025-11-17
Agents GPUs Ollama Video	Dieser KI-Agent wird auf Cloud Run mit NVIDIA-GPUs ausgeführt In diesem Video wird gezeigt, wie Sie eine echte KI-Agent-Anwendung auf einer serverlosen NVIDIA-GPU erstellen. Sehen Sie sich eine Demo eines intelligenten Gesundheits-Agents an, der Open-Source-Modelle wie Gemma mit Ollama in Cloud Run und LangGraph verwendet, um einen Multi-Agenten-Workflow (RAG + Tools) zu erstellen.	2025-11-13
Codelab GPUs LLMs	Ausführung von LLM-Inferenz auf Cloud Run-GPUs mit vLLM und dem OpenAI Python SDK In diesem Codelab wird gezeigt, wie Sie das auf Anweisungen abgestimmte Modell Gemma 2 2b von Google in Cloud Run mit GPUs bereitstellen. Dabei wird vLLM als Inferenz-Engine und das OpenAI Python SDK für die Vervollständigung von Sätzen verwendet.	2025-11-13
ADK Agents Codelab	ADK-Agenten in Cloud Run bereitstellen, verwalten und beobachten In diesem Codelab wird gezeigt, wie Sie einen leistungsstarken Agenten, der mit dem Agent Development Kit (ADK) erstellt wurde, in Cloud Run bereitstellen, verwalten und überwachen.	2025-11-12
Blog Tools	Einfache Automatisierung von KI-Workflows: n8n in Cloud Run bereitstellen In diesem Blogpost wird beschrieben, wie Sie Agenten mit dem n8n-Workflow-Automatisierungstool in Cloud Run bereitstellen, um KI-basierte Workflows zu erstellen und in Tools wie Google Workspace einzubinden.	2025-11-07
MCP Video	KI-Agenten mit MCP-Tools in Google Cloud Run unterstützen In diesem Video wird das Model Context Protocol (MCP) vorgestellt und es wird gezeigt, wie es die Arbeit von Entwicklern von KI-Agenten erleichtert. Sie erfahren, wie Sie einen MCP-Server mit FastMCP erstellen und einen ADK-Agenten in Cloud Run bereitstellen. Außerdem wird gezeigt, wie der Code die Dienst-zu-Dienst-Authentifizierung mit den integrierten OIDC-Tokens von Cloud Run verarbeitet.	2025-11-06
Model Armor Sicherheit Video	Wir haben versucht, unsere KI zu jailbreaken (und Model Armor hat es verhindert) In diesem Video wird gezeigt, wie Sie mit Google Model Armor Bedrohungen mit einem API-Aufruf blockieren können.	2025-10-30
Codelab Gemini CLI MCP	Sicheren MCP-Server in Cloud Run bereitstellen In diesem Codelab erfahren Sie, wie Sie einen sicheren MCP-Server (Model Context Protocol) in Cloud Run bereitstellen und über die Gemini CLI eine Verbindung zu ihm herstellen.	2025-10-28
ADK Agents Codelab MCP	Einen ADK-Agenten erstellen und bereitstellen, der einen MCP-Server in Cloud Run verwendet In diesem Codelab wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) einen KI-Agenten mit Tools erstellen und bereitstellen. Der Agent stellt eine Verbindung zu einem Remote-MCP-Server her, um die Tools zu verwenden, und wird als Container in Cloud Run bereitgestellt.	2025-10-27
Benchmarking Vertex AI Video	Nicht raten: Benchmarking von KI-Prompts In diesem Video wird gezeigt, wie Sie mit Vertex AI zuverlässige generative KI-Anwendungen mit den Tools von Google Cloud erstellen. Entwickler erfahren, wie sie Google Cloud-Tools für schnelles Prototyping einsetzen, mit datengestützten Benchmarks konkrete Zahlen erhalten und schließlich eine automatisierte CI/CD-Pipeline für eine echte Qualitätssicherung erstellen können. Dabei werden auch häufige Fallstricke vermieden.	2025-10-23
KI-Modelle Cloud Run-Jobs Codelab Modellabstimmung	LLM mit Cloud Run-Jobs abstimmen Dieses Codelab bietet eine detaillierte Anleitung zur Verwendung von Cloud Run-Jobs mit GPUs, um ein Gemma 3-Modell für das Text2Emoji-Dataset abzustimmen und das resultierende Modell dann mit vLLM in einem Cloud Run-Dienst bereitzustellen.	2025-10-21
Batch-Inferenz Cloud Run-Jobs Codelab	Batch-Inferenz für Cloud Run-Jobs ausführen In diesem Codelab wird gezeigt, wie Sie einen GPU-basierten Cloud Run-Job verwenden, um Batch-Inferenz für ein Llama 3.2-1b-Modell auszuführen und die Ergebnisse direkt in einen Cloud Storage-Bucket zu schreiben.	2025-10-21
ADK Multi-Agent Video	Multi-Agent-App mit dem ADK und Gemini erstellen In diesem Video wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) von Google eine App erstellen, mit der Sie Inhalte optimieren und gemeinsam bearbeiten können. Erfahren Sie, wie zustandsorientierte Multi-Agents besser funktionieren als ein einzelner Agent.	2025-10-16
Community Sicherheit	Cloud Run-Dienst von überall aus sicher aufrufen In diesem Artikel finden Sie ein Python-Codebeispiel, mit dem ein Identitätstoken abgerufen wird, um einen authentifizierten Cloud Run-Dienst sicher aus einer beliebigen Umgebung aufzurufen. Im Beispiel werden Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) verwendet, um den Aufruf zu authentifizieren.	2025-10-15
Gemini Video	KI-App mit Gemini erstellen, die Videos ansehen kann In diesem Video wird gezeigt, wie Sie mit Gemini 2.5 Pro eine App erstellen, die YouTube-Videos analysiert und versteht. Mit Smart-Prompts können Sie die Ausgabe Ihrer App für Blogposts, Zusammenfassungen, Quizze und mehr anpassen. In diesem Video wird erläutert, wie Sie Gemini integrieren, um sowohl Textinhalte als auch Kopfzeilenbilder aus Videoeingaben zu generieren. Außerdem werden Kostenaspekte behandelt und es wird erklärt, wie Sie längere Videos mit Batchanfragen verarbeiten.	2025-10-06
ADK Agents Codelab GPUs LLMs MCP	Lab 3:Vom Prototyp zur Produktion – ADK-Agenten in Cloud Run mit GPU bereitstellen In diesem Codelab wird gezeigt, wie Sie einen produktionsreifen ADK-Agenten (Agent Development Kit) mit einem GPU-beschleunigten Gemma-Backend in Cloud Run bereitstellen. Das Codelab umfasst die Bereitstellung, Integration und Leistungstests.	2025-10-03
Agents Codelab	Gradio-Frontend-App bereitstellen, die einen Backend-ADK-Agenten aufruft, wobei beide in Cloud Run ausgeführt werden In diesem Codelab wird gezeigt, wie Sie eine zweistufige Anwendung in Cloud Run bereitstellen, die aus einem Gradio-Frontend und einem ADK-Agent-Backend besteht. Der Schwerpunkt liegt dabei auf der Implementierung einer sicheren, authentifizierten Dienst-zu-Dienst-Kommunikation.	2025-09-29
KI-Modelle Community RAG	Serverless AI: EmbeddingGemma mit Cloud Run In diesem Artikel finden Sie eine Schritt-für-Schritt-Anleitung, wie Sie das EmbeddingGemma-Modell in einen Container packen und mit GPUs in Cloud Run bereitstellen und dann damit eine RAG-Anwendung erstellen.	2025-09-24
Blog Erweiterungen Gemini	App-Bereitstellung und Sicherheitsanalyse mit neuen Gemini CLI-Erweiterungen automatisieren In diesem Blogpost wird die Cloud Run-Erweiterung in der Gemini CLI angekündigt, mit der die Anwendungsbereitstellung mit einem einzigen /deploy-Befehl vereinfacht wird.	2025-09-10
Community Sicherheit	Chain of Trust for AI: Securing MCP Toolbox Architecture on Cloud Run In diesem Artikel wird eine einfache Hotelbuchungsanwendung, die in Google Cloud erstellt wurde, analysiert. Es wird ein robustes Zero-Trust-Sicherheitsmodell mit Dienstidentitäten demonstriert und gezeigt, wie eine sichere Vertrauenskette vom Endnutzer bis zur Datenbank aufgebaut wird.	2025-09-03
KI-Modelle Community Containerisierung Docker Ollama RAG	Serverless AI: Qwen3-Einbettungen mit Cloud Run In diesem Artikel finden Sie eine Anleitung zum Bereitstellen des Qwen3-Embedding-Modells in Cloud Run mit GPUs. Der Artikel behandelt auch die Containerisierung mit Docker und Ollama und enthält ein Beispiel für die Verwendung in einer RAG-Anwendung.	2025-08-20
Architektur Community LLMs	Verpacken Sie KI‑Modelle immer noch in Containern? So geht es in Cloud Run In diesem Artikel wird eine effizientere und skalierbare Architektur für die Bereitstellung von Large Language Models (LLMs) in Cloud Run vorgeschlagen, bei der Modelldateien vom Anwendungscontainer entkoppelt und stattdessen Cloud Storage FUSE verwendet wird.	2025-08-11
KI-Modelle Community	KI-gestützten Podcast-Generator mit Gemini und Cloud Run erstellen In diesem Artikel wird beschrieben, wie Sie einen serverlosen KI-basierten Podcast-Generator erstellen, der Gemini für die Zusammenfassung von Inhalten und Cloud Run verwendet. In diesem Beispiel wird die automatisierte Pipeline zum Generieren und Bereitstellen täglicher Audio-Briefings aus RSS-Feeds orchestriert.	2025-08-11
GenAI Video	GenAI-Anwendung auf Cloud Run erstellen In diesem Video werden die Architektur und der Code erläutert. KI wird dabei in jedem Schritt eingesetzt.	2025-07-17
Blog Erweiterungen Gemini	Von localhost bis zum Start: KI-App-Bereitstellung mit Cloud Run und Docker Compose vereinfachen In diesem Blogbeitrag wird eine Zusammenarbeit zwischen Google Cloud und Docker angekündigt, die die Bereitstellung komplexer KI-Anwendungen vereinfacht. Entwickler können ihre compose.yaml-Dateien mit dem Befehl „gcloud run compose up“ direkt in Cloud Run bereitstellen.	2025-07-10
Agents Firebase Video	KI-Agents mit Cloud Run und Firebase Genkit erstellen In diesem Video wird gezeigt, wie Sie KI-Agents mit Cloud Run und Firebase Genkit erstellen, einem serverlosen Tool zum Erstellen von KI-Agents.	2025-07-10
Community MCP	MCP-Server mit Google Cloud Run betreiben In diesem Artikel wird der Zweck des Model Context Protocol (MCP) erläutert. Außerdem finden Sie eine Anleitung zum Erstellen und Bereitstellen eines MCP-Servers in Cloud Run, um Ressourcen als Tools für KI-Anwendungen bereitzustellen.	2025-07-09
AI Studio Firebase Gemini LLMs Video	Cloud AI: Es ist nur eine API In diesem Video wird gezeigt, wie Sie mit AI Studio, Cloud Functions und Firebase Hosting schnell eine Anwendung für den technischen Support erstellen können. Hier erfahren Sie, wie Sie Large Language Models (LLMs) nutzen können, und sehen ein praktisches Beispiel für die Integration von KI in eine herkömmliche Webanwendung.	2025-06-19
Blog MCP	Remote-MCP-Server in weniger als 10 Minuten in Google Cloud Run erstellen und bereitstellen In diesem Blogbeitrag finden Sie eine Schritt-für-Schritt-Anleitung zum Erstellen und Bereitstellen eines sicheren Remote-MCP-Servers (Model Context Protocol) in Google Cloud Run in weniger als 10 Minuten mit FastMCP. Anschließend wird der Server von einem lokalen Client aus getestet.	2025-06-07
Community ML-Modelle Monitoring	ML-Modelle mit Cloud Run bereitstellen und überwachen – einfach, skalierbar und kosteneffizient In diesem Artikel wird beschrieben, wie Sie ein Machine-Learning-Modell in Cloud Run bereitstellen, überwachen und automatisch skalieren. Dabei wird ein schlanker Monitoring-Stack mit Google Cloud-Diensten verwendet, um die Leistung zu verfolgen und die Kosten zu kontrollieren.	2025-05-29
KI-Modelle AI Studio Community LLMs	Gemma direkt aus AI Studio in Cloud Run bereitstellen In diesem Artikel finden Sie eine detaillierte Anleitung dazu, wie Sie ein Gemma-Modell aus AI Studio übernehmen, den Code für die Produktion anpassen und es als containerisierte Webanwendung in Cloud Run bereitstellen.	2025-05-29
ADK Agents Community MCP	Die Triade der Agentenarchitektur: ADK, MCP und Cloud Run In diesem Artikel wird gezeigt, wie Sie eine KI-Agentenarchitektur erstellen, indem Sie einen ADK-Workflow (Agent Development Kit) einrichten, der mit einem MCP-Server (Model Context Protocol) kommuniziert, der in Cloud Run gehostet wird, um Flugbuchungen zu verwalten.	2025-05-27
ADK Agents Frameworks LangGraph Vertex AI Video	KI-Agenten in Google Cloud erstellen In diesem Video wird gezeigt, wie Sie mit Cloud Run und Vertex AI KI-Agenten erstellen und bereitstellen. Es werden wichtige Konzepte wie Tool-Aufrufe, Modellagnostizismus und die Verwendung von Frameworks wie LangGraph und dem Agent Development Kit (ADK) erläutert.	2025-05-21
Agents AI Studio Blog MCP	KI-Bereitstellung leicht gemacht: Apps aus AI Studio oder mit MCP-kompatiblen KI-Agenten in Cloud Run bereitstellen In diesem Blogbeitrag werden Möglichkeiten zur Vereinfachung von KI-Bereitstellungen vorgestellt, darunter die Bereitstellung mit einem Klick von AI Studio in Cloud Run, die direkte Bereitstellung von Gemma 3-Modellen und ein MCP-Server für agentenbasierte Bereitstellungen.	2025-05-20
A2A Agents Community Frameworks Anwendungsfälle	Agent2Agent-Protokoll (A2A) mit dem Anwendungsfall „Einkaufs-Concierge“ in Cloud Run In diesem Artikel wird das Agent2Agent-Protokoll (A2A) erläutert und seine Verwendung mit einer Einkaufs-Concierge-Anwendung demonstriert. Die Cloud Run-App enthält mehrere KI-Agents, die mit verschiedenen Frameworks erstellt wurden und zusammenarbeiten, um die Bestellung eines Nutzers auszuführen.	2025-05-15
KI-Modelle Automatisierung CI/CD Community GitHub	Bereitstellung von ML-Modellen mit GitHub Actions und Cloud Run automatisieren In diesem Artikel finden Sie eine umfassende Anleitung zum Erstellen einer CI/CD-Pipeline mit GitHub Actions, um das Erstellen und Bereitstellen von Modellen für maschinelles Lernen als containerisierte Dienste in Cloud Run zu automatisieren.	2025-05-08
KI-Modelle GPUs Ollama Video	DeepSeek mit Cloud Run-GPUs in drei Schritten hosten In diesem Video wird gezeigt, wie Sie das Hosting des DeepSeek AI-Modells mit Cloud Run-GPUs vereinfachen können. Hier erfahren Sie, wie Sie Large Language Models (LLMs) mit drei Befehlen in Google Cloud bereitstellen und verwalten. Sehen Sie sich das Video an und erfahren Sie mehr über die Funktionen von Cloud Run und dem Ollama-Befehlszeilentool, mit denen Entwickler KI-Anwendungen schnell mit On-Demand-Ressourcenzuweisung und ‑skalierung betreiben können.	2025-04-24
Agents Blog Anwendungsfälle	50% faster merge and 50% fewer bugs: How CodeRabbit built its AI code review agent with Google Cloud Run In diesem Artikel wird beschrieben, wie CodeRabbit, ein KI-Tool für die Codeüberprüfung, Cloud Run nutzt, um eine skalierbare und sichere Plattform für die Ausführung nicht vertrauenswürdigen Codes zu erstellen. Dadurch werden die Zeit für die Codeüberprüfung und die Anzahl der Fehler halbiert.	2025-04-22
Community LLMs Sicherheit	Souveräne KI-Lösungen mit Google Cloud erstellen – Cloud Run In diesem Artikel finden Sie eine detaillierte Anleitung zum Erstellen und Bereitstellen einer souveränen KI-Lösung in Google Cloud mit Kontrolle der Datenhoheit durch Partner. In den Beispielen wird ein Gemma-Modell in Cloud Run ausgeführt, um den Datenstandort und die Einhaltung europäischer Vorschriften zu gewährleisten.	2025-04-03
Codelab Gemini	FastAPI-Chatbot-App mit Gemini in Cloud Run bereitstellen In diesem Codelab erfahren Sie, wie Sie eine FastAPI-Chatbot-App in Cloud Run bereitstellen.	2025-04-02
Cloud Run Functions Codelab LLMs	LLM in einem Sidecar für eine Cloud Run-Funktion hosten In diesem Codelab erfahren Sie, wie Sie ein gemma3:4b-Modell in einem Sidecar für eine Cloud Run-Funktion hosten.	2025-03-27
Blog Bereitstellung	Serverlose KI mit Gemma 3 in Cloud Run bereitstellen In diesem Blogpost wird Gemma 3 angekündigt, eine Familie von leichtgewichtigen, offenen KI-Modellen. Außerdem wird erläutert, wie Sie sie in Cloud Run für skalierbare und kostengünstige serverlose KI-Anwendungen bereitstellen können.	2025-03-12
Architektur RAG Vertex AI	RAG-Infrastruktur für generative KI mit Vertex AI und der Vektorsuche In diesem Dokument wird eine Referenzarchitektur für die Entwicklung einer generativen KI-Anwendung mit Retrieval Augmented Generation (RAG) in Google Cloud vorgestellt, bei der die Vektorsuche für den Abgleich von Ähnlichkeiten im großen Maßstab und Vertex AI für die Verwaltung von Einbettungen und Modellen verwendet wird.	2025-03-07
Blog Vertex AI	Mit Vertex AI und Cloud Run in weniger als 60 Sekunden gemeinsam nutzbare generative KI-Apps erstellen In diesem Artikel wird ein Feature in Vertex AI vorgestellt, mit dem Webanwendungen mit nur einem Klick in Cloud Run bereitgestellt werden können. Mit generativen KI-Prompts können Sie den Prozess der Umwandlung eines generativen KI-Konzepts in einen teilbaren Prototyp optimieren.	2025-02-20
Blog GPUs Inferenz RAG Vertex AI	Inference-as-a-Service mit Cloud Run und Vertex AI nutzen In diesem Blogpost wird erläutert, wie Entwickler die Entwicklung generativer KI-Anwendungen beschleunigen können, indem sie ein Inference-as-a-Service-Modell in Cloud Run verwenden. So können LLMs mit GPU-Unterstützung gehostet und skaliert und mit Retrieval-Augmented Generation (RAG) für kontextbezogene Antworten integriert werden.	2025-02-20
Community LLMs	Auf dem Weg zur Arbeit von Null zu Deepseek auf Cloud Run In diesem Artikel wird gezeigt, wie Sie das Deepseek R1-Modell mit Ollama schnell auf Cloud Run mit GPUs bereitstellen können. In diesem Artikel werden erweiterte Themen wie das Einbetten des Modells in den Container, A/B-Tests mit Traffic-Aufteilung und das Hinzufügen einer Weboberfläche mit einem Sidecar-Container behandelt.	2025-02-11
Funktionsaufrufe Gemini Video	Gemini-Funktionsaufrufe mit Cloud Run verwenden In diesem Video wird die Leistungsfähigkeit von Gemini-Funktionsaufrufen untersucht und Sie erfahren, wie Sie externe APIs in Ihre KI-Anwendungen einbinden. Sie entwickeln eine Wetter-App, die die Verarbeitung von Nutzeranfragen durch Gemini in natürlicher Sprache nutzt, um Wetterdaten von einer externen API abzurufen. So erhalten Sie ein praktisches Beispiel für Funktionsaufrufe in Aktion.	2025-01-23
Community LLMs Ollama	Ausführen (beliebiger) offener LLMs mit Ollama in Google Cloud Run [Schritt-für-Schritt-Anleitung] In diesem Artikel wird beschrieben, wie Sie ein beliebiges offenes LLM wie Gemma 2 mit Ollama in Google Cloud Run hosten. Der Artikel enthält auch eine Anleitung zum Erstellen eines Cloud Storage-Bucket für die Modellpersistenz und zum Testen der Bereitstellung.	2025-01-20
Community ML-Modelle	Serverlose Machine-Learning-Modelle mit GPUs mit Google Cloud bereitstellen: Cloud Run In diesem Artikel wird Schritt für Schritt beschrieben, wie Sie ein Modell für maschinelles Lernen (ML) mit GPU-Unterstützung in Cloud Run bereitstellen. Der Artikel behandelt alles von der Projekteinrichtung und Containerisierung bis hin zur automatisierten Bereitstellung mit Cloud Build und Tests mit curl und JavaScript.	2025-01-17
Bildgenerierung Vertex AI Video	Text-zu-Bild-Funktion mit Vertex AI von Google Cloud auf Cloud Run In diesem Video wird gezeigt, wie Sie mit Vertex AI in Google Cloud eine Anwendung zur Bildgenerierung erstellen. Mit dem Vertex AI-Modell zur Bildgenerierung können Entwickler beeindruckende Bilder erstellen, ohne dass eine komplexe Infrastruktur oder Modellverwaltung erforderlich ist.	2025-01-16
Datenschutz Sicherheit Video	Sensible Daten in KI-Apps schützen In diesem Video erfahren Sie, wie Sie vertrauliche Daten in KI-Anwendungen schützen können. Hier finden Sie wichtige Konzepte, Best Practices und Tools zum Schutz von Daten während des gesamten KI-Lebenszyklus.	2024-11-21
Großes Prompt-Fenster Modellabstimmung RAG Video	RAG im Vergleich zu Modellabstimmung und großem Prompt-Fenster In diesem Video werden die drei wichtigsten Methoden zum Einbinden Ihrer Daten in KI-Anwendungen behandelt: Prompts mit langen Kontextfenstern, Retrieval-Augmented Generation (RAG) und Modelloptimierung. In dieser Folge von Serverless Expeditions erfahren Sie mehr über die Stärken, Einschränkungen und idealen Anwendungsfälle für die einzelnen Ansätze, damit Sie fundierte Entscheidungen für Ihre KI-Projekte treffen können.	2024-11-14
Prompt Engineering Video	Prompt Engineering für Entwickler In diesem Video erfahren Sie, wie Sie mit Prompt Engineering die Qualität von KI-Antworten verbessern können. In diesem Video erfahren Sie, wie Sie mit Chain-of-Thought-, Few-Shot- und Multi-Shot-Prompting-Techniken genauere und relevantere Antworten von generativer KI erhalten.	2024-10-31

Cloud Run – AI Cookbook Mit Sammlungen den Überblick behalten Sie können Inhalte basierend auf Ihren Einstellungen speichern und kategorisieren.

Hinweis zu Community-Ressourcen

Nach Kategorie oder Keyword filtern

Cloud Run – AI Cookbook