Cloud Run – AI Cookbook

Auf dieser Seite finden Sie eine ausgewählte Liste von Ressourcen, die Ihnen beim Erstellen und Bereitstellen von KI-Lösungen in Cloud Run helfen.

Cloud Run ist eine vollständig verwaltete Anwendungsplattform, mit der Sie Ihren Code, Ihre Funktion oder Ihren Container auf der hoch skalierbaren Infrastruktur von Google ausführen können. Mit Cloud Run können Sie verschiedene KI-Lösungen ausführen, z. B. KI-Inferenzendpunkte, APIs für generative Modelle und vollständige RAG-Pipelines (Retrieval-Augmented Generation).

Über die Kategorien und Links unten können Sie auf offizielle Leitfäden, Schnellstarts und wertvolle Community-Inhalte zugreifen. Die Dokumentation und Empfehlungen für Cloud Run finden Sie unter KI-Lösungen in Cloud Run.

Hinweis zu Community-Ressourcen

Inhalte, die als „Community“ gekennzeichnet sind, sind ausgewählte Ressourcen aus der Entwickler-Community. Sie wurden nicht von Google entwickelt oder werden nicht von Google verwaltet. Beachten Sie die folgenden Hinweise, wenn Sie diese Ressourcen verwenden:

  • Sicherheitsüberprüfung:Überprüfen Sie den Code immer sorgfältig, insbesondere wie er mit vertraulichen Informationen, Nutzereingaben und Netzwerkzugriff umgeht.
  • Einstellung und Updates:Community-Code kann veraltet sein oder ohne Vorwarnung nicht mehr mit neuen Cloud Run-Funktionen oder KI-Versionen funktionieren. Prüfen Sie das Datum der letzten Aktualisierung und ob die App noch aktiv gewartet wird.
  • Kosteneffizienz:Diese Setups sind zwar oft auf niedrige Kosten ausgerichtet, folgen aber möglicherweise nicht den Best Practices von Google zum Sparen von Geld in Live-Projekten. Behalten Sie Ihre Abrechnung im Blick.
  • Lizenzkonformität:Sie müssen die Open-Source-Lizenz für Community-Code oder Bibliotheken, die Sie Ihrer Anwendung hinzufügen, verstehen und einhalten.
  • Vor der Bereitstellung testen:Prüfen Sie alle wichtigen Einstellungen und testen Sie Community-Lösungen in einer Testumgebung, bevor Sie sie für Live-Projekte verwenden.

Nach Kategorie oder Keyword filtern

Verwenden Sie die Filter oder das Suchfeld, um Inhalte nach Kategorie oder Suchbegriff zu finden.


Filtern nach:
Kategorien Titel und Beschreibung Veröffentlichungsdatum
Blog
Kaltstarts
Bereitstellung

Leitfaden zu KI-Kaltstarts in Cloud Run

In diesem Blogpost wird die Herausforderung von Kaltstarts für KI-Anwendungen in Cloud Run behandelt. Außerdem werden Optimierungen für Konfiguration, Architektur und Laufzeiteinstellungen beschrieben, um die Latenz beim Herunterskalieren auf null zu verbessern.

2026-05-28
ADK
Agents
Codelab
MCP
Sicherheit

Agentische Arbeitslasten mit Agent Gateway auf der Gemini Enterprise Agent Platform verwalten

In diesem Codelab wird gezeigt, wie Sie mit Agent Gateway einen ADK-Agenten, der in der Agent Runtime ausgeführt wird, verwalten und schützen, wenn er eine Verbindung zu externen Tools herstellt, die als MCP-Server in Cloud Run gehostet werden.

2026-05-28
Agents
Community
MCP
Sicherheit

KI-Agents mit der MCP-Autorisierung schützen

In diesem Artikel wird gezeigt, wie Sie die MCP-Autorisierung konfigurieren und erzwingen, um agentische Systeme zu schützen, die Remote-MCP-Tools in Cloud Run bereitstellen.

2026-05-26
AI Studio
Blog
Cloud SQL
Firebase
Vibe Coding

AI Studio ermöglicht Full-Stack-Vibe-Coding mit Cloud Run, Firebase und Cloud SQL – ohne Kreditkarte

In diesem Artikel werden die Updates für das Vibe-Coding in Google AI Studio beschrieben, einschließlich der Integrationen mit Firebase und Cloud SQL sowie eines Onboarding-Ablaufs ohne Kreditkarte für die Bereitstellung von Apps in Cloud Run.

2026-05-21
ADK
Flutter
Go
Video

KI-Agent-App mit Go ADK, Cloud Run und Flutter erstellen

In diesem Video wird gezeigt, wie Sie mit dem Go Agent Development Kit (ADK) eine KI-Agentenanwendung erstellen, sie als Containerdienst in Cloud Run bereitstellen und über ein plattformübergreifendes Flutter-Frontend darauf zugreifen.

2026-05-21
AI Studio
Cloud SQL
Video

Full-Stack-Apps mit Google AI Studio, Cloud Run und Cloud SQL erstellen

In diesem Video wird gezeigt, wie Sie im Build-Modus von Google AI Studio Full-Stack-Anwendungen erstellen und mit automatischer Datenbankbereitstellung in Cloud Run bereitstellen.

2026-05-21
AlloyDB
BigQuery
Codelab
MCP Toolbox
MongoDB

Intelligenten E-Commerce-Katalog mit Persistenz in mehreren Datenbanken erstellen

Erstellen Sie einen intelligenten E-Commerce-Katalog mit AlloyDB, MongoDB, Cloud Storage, BigQuery und der MCP Toolbox in Cloud Run und stellen Sie dann eine Multi-Agenten-Chat-App bereit.

2026-04-22
Agents
Codelab
Gemini Enterprise

Nächste Keynote 2026: Fabric of Unified Intelligence

Ein System mit mehreren KI-Agenten in Cloud Run bereitstellen und mit Gemini Enterprise mit gemeinsam genutztem Kontext orchestrieren, um die Struktur der einheitlichen KI zu demonstrieren.

2026-04-22
ADK
Agents
Codelab
MCP

Pet Passport-Agenten in Cloud Run erstellen und bereitstellen

In diesem Codelab erfahren Sie, wie Sie einen Tool-nutzenden Pet Passport-Agenten mit ADK und Google Model Context Protocol (MCP)-Servern in Cloud Run erstellen und bereitstellen.

2026-04-22
ADK
Agents
Codelab
Eventarc

Ereignisgesteuerte KI-Agents mit Eventarc, Cloud Run und ADK erstellen

In diesem Video erfahren Sie, wie Sie asynchrone, ereignisgesteuerte KI-Agents in Cloud Run mit Eventarc und dem Agent Development Kit (ADK) erstellen und bereitstellen.

2026-04-22
Agents
Codelab
MCP
Sicherheit

Bereitstellung eines Governance-basierten Enterprise-Agenten mit MCP und Cloud Run

Im zweiten Teil dieser Reihe erfahren Sie, wie Sie einen MCP-Server (Model Context Protocol) in Cloud Run bereitstellen, damit er als Datensteuerungsebene fungiert, und wie Sie ihn mit einem Governance-konformen ADK-Agenten verbinden.

2026-04-16
ADK
Agents
Codelab
Model Armor
Sicherheit

Sichere Agenten mit Model Armor und Identity erstellen

Sie lernen, mit dem Agent Development Kit (ADK) einen sicheren KI-Agenten in Produktionsqualität zu erstellen und in Google Cloud bereitzustellen. In diesem Leitfaden wird die Implementierung von Model Armor für die Eingabe-/Ausgabefilterung und von Agent Identity für die Zugriffssteuerung beschrieben.

2026-04-16
ADK
Agents
Codelab
MCP

Way Back Home – Level 1: Standort bestimmen

Ein KI-System mit mehreren Agenten mit dem Agent Development Kit (ADK) erstellen, das benutzerdefinierte MCP-Server und die OneMCP BigQuery-Integration umfasst.

2026-04-16
AI Studio
Codelab
Bereitstellung
Vibe Coding

Vibe Coding mit Gemini in Google AI Studio

In diesem Codelab erfahren Sie, wie Sie mit dem Build-Modus in Google AI Studio schnell einen Prototyp einer React-Anwendung erstellen und mit einem Klick in Cloud Run bereitstellen.

2026-04-15
Codelab
Gemma 4
GPUs
LLMs

Inferenzen des Gemma 4-Modells in Cloud Run mit RTX 6000 Pro-GPU mit vLLM ausführen

In diesem Codelab wird gezeigt, wie Sie ein Gemma 4-Modell auf einer Cloud Run NVIDIA RTX Pro 6000-GPU mit vLLM für serverlose Inferenz mit hohem Durchsatz bereitstellen.

2026-04-13
ADK
Agents
Community

How I Built and Deployed Real AI Agents Using Google ADK on Cloud Run

In diesem Codelab wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) von Google einen Multi-Agenten-Reiseplaner erstellen und in Google Cloud Run bereitstellen.

2026-04-10
Agents
Automatisierung
Community
SRE
Anwendungsfälle

From Incident to Pull Request: Building an AI-Powered SRE Agent on GCP

Erstellen Sie einen SRE-Agenten, der die Ursachenanalyse und Softwarekorrekturen mit Gemini, Spring Boot und Cloud Run automatisiert.

2026-04-10
Agents
Codelab
Frameworks
LangChain

LangChain-Agent in Cloud Run bereitstellen

Einen auf LangChain basierenden KI-Agenten erstellen, ihn in einen Container verpacken und in Google Cloud Run bereitstellen.

2026-03-27
Agents
Community
Elasticsearch
Gemini
Multimodal

Snap, Plan, Go: Building a Multimodal Travel Agent with Google Cloud, Elasticsearch, and Gemini

Einen multimodalen Reise-Agenten erstellen, der Sehenswürdigkeiten anhand von Bildern erkennt und mit Gemini in Cloud Run Reiserouten vorschlägt

2026-02-22
AI Studio
Codelab
Bereitstellung
Vibe Coding

Anwendungen aus AI Studio in Cloud Run bereitstellen

In diesem Codelab erstellen Sie mit Vibe Coding in Google AI Studio eine einfache Webanwendung und stellen sie in Cloud Run bereit.

2026-02-18
Frameworks
Gemini
LangChain

Kurzanleitung: Python-Webanwendung (LangChain) erstellen und in Cloud Run bereitstellen

In dieser Kurzanleitung erfahren Sie, wie Sie eine LangChain-Anwendung mit Cloud Run und Gemini erstellen und bereitstellen, um auf Anfragen zu Hauptstädten zu reagieren.

2026-02-03
Agents
Frameworks
Gemini

Kurzanleitung: Python-Webanwendung (smolagents) erstellen und in Cloud Run bereitstellen

In dieser Kurzanleitung erfahren Sie, wie Sie eine smolagents-Anwendung mit Cloud Run und Gemini erstellen und bereitstellen.

2026-01-28
Agents
Antigravity
Video

Stop coding, start architecting: Google Antigravity + Cloud Run

In diesem Video wird Antigravity, die agentische IDE von Google, vorgestellt. Damit können Sie eine Full-Stack-Anwendung von Grund auf neu erstellen und in Cloud Run bereitstellen. In diesem Video wird gezeigt, wie Sie ein Datenblatt für die KI schreiben, sie zwingen, modernes Node.js zu verwenden (keine Build-Schritte!), und wie sie während der Bereitstellung autonom einen Portkonflikt behebt, indem sie eine Konfigurationsdatei bearbeitet.

2025-12-08
Codelab
Tools

n8n in Google Cloud Run bereitstellen und ausführen

In diesem Codelab wird gezeigt, wie Sie eine produktionsreife Instanz des Workflow-Automatisierungstools n8n in Cloud Run bereitstellen. Dazu gehören eine Cloud SQL-Datenbank für die Persistenz und Secret Manager für vertrauliche Daten.

2025-11-20
Blog
Gemma 3

Gemma 3 in Google Cloud ausprobieren

In diesem Blogbeitrag werden zwei Codelabs angekündigt, in denen Entwickler erfahren, wie sie Gemma 3 in Google Cloud bereitstellen können. Dabei wird entweder Cloud Run für einen serverlosen Ansatz oder Google Kubernetes Engine (GKE) für einen Plattformansatz verwendet.

2025-11-17
Agents
GPUs
Ollama
Video

Dieser KI-Agent wird auf Cloud Run mit NVIDIA-GPUs ausgeführt

In diesem Video wird gezeigt, wie Sie eine echte KI-Agent-Anwendung auf einer serverlosen NVIDIA-GPU erstellen. Sehen Sie sich eine Demo eines intelligenten Gesundheits-Agents an, der Open-Source-Modelle wie Gemma mit Ollama in Cloud Run und LangGraph verwendet, um einen Multi-Agenten-Workflow (RAG + Tools) zu erstellen.

2025-11-13
Codelab
GPUs
LLMs

Ausführung von LLM-Inferenz auf Cloud Run-GPUs mit vLLM und dem OpenAI Python SDK

In diesem Codelab wird gezeigt, wie Sie das auf Anweisungen abgestimmte Modell Gemma 2 2b von Google in Cloud Run mit GPUs bereitstellen. Dabei wird vLLM als Inferenz-Engine und das OpenAI Python SDK für die Vervollständigung von Sätzen verwendet.

2025-11-13
ADK
Agents
Codelab

ADK-Agenten in Cloud Run bereitstellen, verwalten und beobachten

In diesem Codelab wird gezeigt, wie Sie einen leistungsstarken Agenten, der mit dem Agent Development Kit (ADK) erstellt wurde, in Cloud Run bereitstellen, verwalten und überwachen.

2025-11-12
Blog
Tools

Einfache Automatisierung von KI-Workflows: n8n in Cloud Run bereitstellen

In diesem Blogpost wird beschrieben, wie Sie Agenten mit dem n8n-Workflow-Automatisierungstool in Cloud Run bereitstellen, um KI-basierte Workflows zu erstellen und in Tools wie Google Workspace einzubinden.

2025-11-07
MCP
Video

KI-Agenten mit MCP-Tools in Google Cloud Run unterstützen

In diesem Video wird das Model Context Protocol (MCP) vorgestellt und es wird gezeigt, wie es die Arbeit von Entwicklern von KI-Agenten erleichtert. Sie erfahren, wie Sie einen MCP-Server mit FastMCP erstellen und einen ADK-Agenten in Cloud Run bereitstellen. Außerdem wird gezeigt, wie der Code die Dienst-zu-Dienst-Authentifizierung mit den integrierten OIDC-Tokens von Cloud Run verarbeitet.

2025-11-06
Model Armor
Sicherheit
Video

Wir haben versucht, unsere KI zu jailbreaken (und Model Armor hat es verhindert)

In diesem Video wird gezeigt, wie Sie mit Google Model Armor Bedrohungen mit einem API-Aufruf blockieren können.

2025-10-30
Codelab
Gemini CLI
MCP

Sicheren MCP-Server in Cloud Run bereitstellen

In diesem Codelab erfahren Sie, wie Sie einen sicheren MCP-Server (Model Context Protocol) in Cloud Run bereitstellen und über die Gemini CLI eine Verbindung zu ihm herstellen.

2025-10-28
ADK
Agents
Codelab
MCP

Einen ADK-Agenten erstellen und bereitstellen, der einen MCP-Server in Cloud Run verwendet

In diesem Codelab wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) einen KI-Agenten mit Tools erstellen und bereitstellen. Der Agent stellt eine Verbindung zu einem Remote-MCP-Server her, um die Tools zu verwenden, und wird als Container in Cloud Run bereitgestellt.

2025-10-27
Benchmarking
Vertex AI
Video

Nicht raten: Benchmarking von KI-Prompts

In diesem Video wird gezeigt, wie Sie mit Vertex AI zuverlässige generative KI-Anwendungen mit den Tools von Google Cloud erstellen. Entwickler erfahren, wie sie Google Cloud-Tools für schnelles Prototyping einsetzen, mit datengestützten Benchmarks konkrete Zahlen erhalten und schließlich eine automatisierte CI/CD-Pipeline für eine echte Qualitätssicherung erstellen können. Dabei werden auch häufige Fallstricke vermieden.

2025-10-23
KI-Modelle
Cloud Run-Jobs
Codelab
Modellabstimmung

LLM mit Cloud Run-Jobs abstimmen

Dieses Codelab bietet eine detaillierte Anleitung zur Verwendung von Cloud Run-Jobs mit GPUs, um ein Gemma 3-Modell für das Text2Emoji-Dataset abzustimmen und das resultierende Modell dann mit vLLM in einem Cloud Run-Dienst bereitzustellen.

2025-10-21
Batch-Inferenz
Cloud Run-Jobs
Codelab

Batch-Inferenz für Cloud Run-Jobs ausführen

In diesem Codelab wird gezeigt, wie Sie einen GPU-basierten Cloud Run-Job verwenden, um Batch-Inferenz für ein Llama 3.2-1b-Modell auszuführen und die Ergebnisse direkt in einen Cloud Storage-Bucket zu schreiben.

2025-10-21
ADK
Multi-Agent
Video

Multi-Agent-App mit dem ADK und Gemini erstellen

In diesem Video wird gezeigt, wie Sie mit dem Agent Development Kit (ADK) von Google eine App erstellen, mit der Sie Inhalte optimieren und gemeinsam bearbeiten können. Erfahren Sie, wie zustandsorientierte Multi-Agents besser funktionieren als ein einzelner Agent.

2025-10-16
Community
Sicherheit

Cloud Run-Dienst von überall aus sicher aufrufen

In diesem Artikel finden Sie ein Python-Codebeispiel, mit dem ein Identitätstoken abgerufen wird, um einen authentifizierten Cloud Run-Dienst sicher aus einer beliebigen Umgebung aufzurufen. Im Beispiel werden Standardanmeldedaten für Anwendungen (Application Default Credentials, ADC) verwendet, um den Aufruf zu authentifizieren.

2025-10-15
Gemini
Video

KI-App mit Gemini erstellen, die Videos ansehen kann

In diesem Video wird gezeigt, wie Sie mit Gemini 2.5 Pro eine App erstellen, die YouTube-Videos analysiert und versteht. Mit Smart-Prompts können Sie die Ausgabe Ihrer App für Blogposts, Zusammenfassungen, Quizze und mehr anpassen. In diesem Video wird erläutert, wie Sie Gemini integrieren, um sowohl Textinhalte als auch Kopfzeilenbilder aus Videoeingaben zu generieren. Außerdem werden Kostenaspekte behandelt und es wird erklärt, wie Sie längere Videos mit Batchanfragen verarbeiten.

2025-10-06
ADK
Agents
Codelab
GPUs
LLMs
MCP

Lab 3:Vom Prototyp zur Produktion – ADK-Agenten in Cloud Run mit GPU bereitstellen

In diesem Codelab wird gezeigt, wie Sie einen produktionsreifen ADK-Agenten (Agent Development Kit) mit einem GPU-beschleunigten Gemma-Backend in Cloud Run bereitstellen. Das Codelab umfasst die Bereitstellung, Integration und Leistungstests.

2025-10-03
Agents
Codelab

Gradio-Frontend-App bereitstellen, die einen Backend-ADK-Agenten aufruft, wobei beide in Cloud Run ausgeführt werden

In diesem Codelab wird gezeigt, wie Sie eine zweistufige Anwendung in Cloud Run bereitstellen, die aus einem Gradio-Frontend und einem ADK-Agent-Backend besteht. Der Schwerpunkt liegt dabei auf der Implementierung einer sicheren, authentifizierten Dienst-zu-Dienst-Kommunikation.

2025-09-29
KI-Modelle
Community
RAG

Serverless AI: EmbeddingGemma mit Cloud Run

In diesem Artikel finden Sie eine Schritt-für-Schritt-Anleitung, wie Sie das EmbeddingGemma-Modell in einen Container packen und mit GPUs in Cloud Run bereitstellen und dann damit eine RAG-Anwendung erstellen.

2025-09-24
Blog
Erweiterungen
Gemini

App-Bereitstellung und Sicherheitsanalyse mit neuen Gemini CLI-Erweiterungen automatisieren

In diesem Blogpost wird die Cloud Run-Erweiterung in der Gemini CLI angekündigt, mit der die Anwendungsbereitstellung mit einem einzigen /deploy-Befehl vereinfacht wird.

2025-09-10
Community
Sicherheit

Chain of Trust for AI: Securing MCP Toolbox Architecture on Cloud Run

In diesem Artikel wird eine einfache Hotelbuchungsanwendung, die in Google Cloud erstellt wurde, analysiert. Es wird ein robustes Zero-Trust-Sicherheitsmodell mit Dienstidentitäten demonstriert und gezeigt, wie eine sichere Vertrauenskette vom Endnutzer bis zur Datenbank aufgebaut wird.

2025-09-03
KI-Modelle
Community
Containerisierung
Docker
Ollama
RAG

Serverless AI: Qwen3-Einbettungen mit Cloud Run

In diesem Artikel finden Sie eine Anleitung zum Bereitstellen des Qwen3-Embedding-Modells in Cloud Run mit GPUs. Der Artikel behandelt auch die Containerisierung mit Docker und Ollama und enthält ein Beispiel für die Verwendung in einer RAG-Anwendung.

2025-08-20
Architektur
Community
LLMs

Verpacken Sie KI‑Modelle immer noch in Containern? So geht es in Cloud Run

In diesem Artikel wird eine effizientere und skalierbare Architektur für die Bereitstellung von Large Language Models (LLMs) in Cloud Run vorgeschlagen, bei der Modelldateien vom Anwendungscontainer entkoppelt und stattdessen Cloud Storage FUSE verwendet wird.

2025-08-11
KI-Modelle
Community

KI-gestützten Podcast-Generator mit Gemini und Cloud Run erstellen

In diesem Artikel wird beschrieben, wie Sie einen serverlosen KI-basierten Podcast-Generator erstellen, der Gemini für die Zusammenfassung von Inhalten und Cloud Run verwendet. In diesem Beispiel wird die automatisierte Pipeline zum Generieren und Bereitstellen täglicher Audio-Briefings aus RSS-Feeds orchestriert.

2025-08-11
GenAI
Video

GenAI-Anwendung auf Cloud Run erstellen

In diesem Video werden die Architektur und der Code erläutert. KI wird dabei in jedem Schritt eingesetzt.

2025-07-17
Blog
Erweiterungen
Gemini

Von localhost bis zum Start: KI-App-Bereitstellung mit Cloud Run und Docker Compose vereinfachen

In diesem Blogbeitrag wird eine Zusammenarbeit zwischen Google Cloud und Docker angekündigt, die die Bereitstellung komplexer KI-Anwendungen vereinfacht. Entwickler können ihre compose.yaml-Dateien mit dem Befehl „gcloud run compose up“ direkt in Cloud Run bereitstellen.

2025-07-10
Agents
Firebase
Video

KI-Agents mit Cloud Run und Firebase Genkit erstellen

In diesem Video wird gezeigt, wie Sie KI-Agents mit Cloud Run und Firebase Genkit erstellen, einem serverlosen Tool zum Erstellen von KI-Agents.

2025-07-10
Community
MCP

MCP-Server mit Google Cloud Run betreiben

In diesem Artikel wird der Zweck des Model Context Protocol (MCP) erläutert. Außerdem finden Sie eine Anleitung zum Erstellen und Bereitstellen eines MCP-Servers in Cloud Run, um Ressourcen als Tools für KI-Anwendungen bereitzustellen.

2025-07-09
AI Studio
Firebase
Gemini
LLMs
Video

Cloud AI: Es ist nur eine API

In diesem Video wird gezeigt, wie Sie mit AI Studio, Cloud Functions und Firebase Hosting schnell eine Anwendung für den technischen Support erstellen können. Hier erfahren Sie, wie Sie Large Language Models (LLMs) nutzen können, und sehen ein praktisches Beispiel für die Integration von KI in eine herkömmliche Webanwendung.

2025-06-19
Blog
MCP

Remote-MCP-Server in weniger als 10 Minuten in Google Cloud Run erstellen und bereitstellen

In diesem Blogbeitrag finden Sie eine Schritt-für-Schritt-Anleitung zum Erstellen und Bereitstellen eines sicheren Remote-MCP-Servers (Model Context Protocol) in Google Cloud Run in weniger als 10 Minuten mit FastMCP. Anschließend wird der Server von einem lokalen Client aus getestet.

2025-06-07
Community
ML-Modelle
Monitoring

ML-Modelle mit Cloud Run bereitstellen und überwachen – einfach, skalierbar und kosteneffizient

In diesem Artikel wird beschrieben, wie Sie ein Machine-Learning-Modell in Cloud Run bereitstellen, überwachen und automatisch skalieren. Dabei wird ein schlanker Monitoring-Stack mit Google Cloud-Diensten verwendet, um die Leistung zu verfolgen und die Kosten zu kontrollieren.

2025-05-29
KI-Modelle
AI Studio
Community
LLMs

Gemma direkt aus AI Studio in Cloud Run bereitstellen

In diesem Artikel finden Sie eine detaillierte Anleitung dazu, wie Sie ein Gemma-Modell aus AI Studio übernehmen, den Code für die Produktion anpassen und es als containerisierte Webanwendung in Cloud Run bereitstellen.

2025-05-29
ADK
Agents
Community
MCP

Die Triade der Agentenarchitektur: ADK, MCP und Cloud Run

In diesem Artikel wird gezeigt, wie Sie eine KI-Agentenarchitektur erstellen, indem Sie einen ADK-Workflow (Agent Development Kit) einrichten, der mit einem MCP-Server (Model Context Protocol) kommuniziert, der in Cloud Run gehostet wird, um Flugbuchungen zu verwalten.

2025-05-27
ADK
Agents
Frameworks
LangGraph
Vertex AI
Video

KI-Agenten in Google Cloud erstellen

In diesem Video wird gezeigt, wie Sie mit Cloud Run und Vertex AI KI-Agenten erstellen und bereitstellen. Es werden wichtige Konzepte wie Tool-Aufrufe, Modellagnostizismus und die Verwendung von Frameworks wie LangGraph und dem Agent Development Kit (ADK) erläutert.

2025-05-21
Agents
AI Studio
Blog
MCP

KI-Bereitstellung leicht gemacht: Apps aus AI Studio oder mit MCP-kompatiblen KI-Agenten in Cloud Run bereitstellen

In diesem Blogbeitrag werden Möglichkeiten zur Vereinfachung von KI-Bereitstellungen vorgestellt, darunter die Bereitstellung mit einem Klick von AI Studio in Cloud Run, die direkte Bereitstellung von Gemma 3-Modellen und ein MCP-Server für agentenbasierte Bereitstellungen.

2025-05-20
A2A
Agents
Community
Frameworks
Anwendungsfälle

Agent2Agent-Protokoll (A2A) mit dem Anwendungsfall „Einkaufs-Concierge“ in Cloud Run

In diesem Artikel wird das Agent2Agent-Protokoll (A2A) erläutert und seine Verwendung mit einer Einkaufs-Concierge-Anwendung demonstriert. Die Cloud Run-App enthält mehrere KI-Agents, die mit verschiedenen Frameworks erstellt wurden und zusammenarbeiten, um die Bestellung eines Nutzers auszuführen.

2025-05-15
KI-Modelle
Automatisierung
CI/CD
Community
GitHub

Bereitstellung von ML-Modellen mit GitHub Actions und Cloud Run automatisieren

In diesem Artikel finden Sie eine umfassende Anleitung zum Erstellen einer CI/CD-Pipeline mit GitHub Actions, um das Erstellen und Bereitstellen von Modellen für maschinelles Lernen als containerisierte Dienste in Cloud Run zu automatisieren.

2025-05-08
KI-Modelle
GPUs
Ollama
Video

DeepSeek mit Cloud Run-GPUs in drei Schritten hosten

In diesem Video wird gezeigt, wie Sie das Hosting des DeepSeek AI-Modells mit Cloud Run-GPUs vereinfachen können. Hier erfahren Sie, wie Sie Large Language Models (LLMs) mit drei Befehlen in Google Cloud bereitstellen und verwalten. Sehen Sie sich das Video an und erfahren Sie mehr über die Funktionen von Cloud Run und dem Ollama-Befehlszeilentool, mit denen Entwickler KI-Anwendungen schnell mit On-Demand-Ressourcenzuweisung und ‑skalierung betreiben können.

2025-04-24
Agents
Blog
Anwendungsfälle

50% faster merge and 50% fewer bugs: How CodeRabbit built its AI code review agent with Google Cloud Run

In diesem Artikel wird beschrieben, wie CodeRabbit, ein KI-Tool für die Codeüberprüfung, Cloud Run nutzt, um eine skalierbare und sichere Plattform für die Ausführung nicht vertrauenswürdigen Codes zu erstellen. Dadurch werden die Zeit für die Codeüberprüfung und die Anzahl der Fehler halbiert.

2025-04-22
Community
LLMs
Sicherheit

Souveräne KI-Lösungen mit Google Cloud erstellen – Cloud Run

In diesem Artikel finden Sie eine detaillierte Anleitung zum Erstellen und Bereitstellen einer souveränen KI-Lösung in Google Cloud mit Kontrolle der Datenhoheit durch Partner. In den Beispielen wird ein Gemma-Modell in Cloud Run ausgeführt, um den Datenstandort und die Einhaltung europäischer Vorschriften zu gewährleisten.

2025-04-03
Codelab
Gemini

FastAPI-Chatbot-App mit Gemini in Cloud Run bereitstellen

In diesem Codelab erfahren Sie, wie Sie eine FastAPI-Chatbot-App in Cloud Run bereitstellen.

2025-04-02
Cloud Run Functions
Codelab
LLMs

LLM in einem Sidecar für eine Cloud Run-Funktion hosten

In diesem Codelab erfahren Sie, wie Sie ein gemma3:4b-Modell in einem Sidecar für eine Cloud Run-Funktion hosten.

2025-03-27
Blog
Bereitstellung

Serverlose KI mit Gemma 3 in Cloud Run bereitstellen

In diesem Blogpost wird Gemma 3 angekündigt, eine Familie von leichtgewichtigen, offenen KI-Modellen. Außerdem wird erläutert, wie Sie sie in Cloud Run für skalierbare und kostengünstige serverlose KI-Anwendungen bereitstellen können.

2025-03-12
Architektur
RAG
Vertex AI

RAG-Infrastruktur für generative KI mit Vertex AI und der Vektorsuche

In diesem Dokument wird eine Referenzarchitektur für die Entwicklung einer generativen KI-Anwendung mit Retrieval Augmented Generation (RAG) in Google Cloud vorgestellt, bei der die Vektorsuche für den Abgleich von Ähnlichkeiten im großen Maßstab und Vertex AI für die Verwaltung von Einbettungen und Modellen verwendet wird.

2025-03-07
Blog
Vertex AI

Mit Vertex AI und Cloud Run in weniger als 60 Sekunden gemeinsam nutzbare generative KI-Apps erstellen

In diesem Artikel wird ein Feature in Vertex AI vorgestellt, mit dem Webanwendungen mit nur einem Klick in Cloud Run bereitgestellt werden können. Mit generativen KI-Prompts können Sie den Prozess der Umwandlung eines generativen KI-Konzepts in einen teilbaren Prototyp optimieren.

2025-02-20
Blog
GPUs
Inferenz
RAG
Vertex AI

Inference-as-a-Service mit Cloud Run und Vertex AI nutzen

In diesem Blogpost wird erläutert, wie Entwickler die Entwicklung generativer KI-Anwendungen beschleunigen können, indem sie ein Inference-as-a-Service-Modell in Cloud Run verwenden. So können LLMs mit GPU-Unterstützung gehostet und skaliert und mit Retrieval-Augmented Generation (RAG) für kontextbezogene Antworten integriert werden.

2025-02-20
Community
LLMs

Auf dem Weg zur Arbeit von Null zu Deepseek auf Cloud Run

In diesem Artikel wird gezeigt, wie Sie das Deepseek R1-Modell mit Ollama schnell auf Cloud Run mit GPUs bereitstellen können. In diesem Artikel werden erweiterte Themen wie das Einbetten des Modells in den Container, A/B-Tests mit Traffic-Aufteilung und das Hinzufügen einer Weboberfläche mit einem Sidecar-Container behandelt.

2025-02-11
Funktionsaufrufe
Gemini
Video

Gemini-Funktionsaufrufe mit Cloud Run verwenden

In diesem Video wird die Leistungsfähigkeit von Gemini-Funktionsaufrufen untersucht und Sie erfahren, wie Sie externe APIs in Ihre KI-Anwendungen einbinden. Sie entwickeln eine Wetter-App, die die Verarbeitung von Nutzeranfragen durch Gemini in natürlicher Sprache nutzt, um Wetterdaten von einer externen API abzurufen. So erhalten Sie ein praktisches Beispiel für Funktionsaufrufe in Aktion.

2025-01-23
Community
LLMs
Ollama

Ausführen (beliebiger) offener LLMs mit Ollama in Google Cloud Run [Schritt-für-Schritt-Anleitung]

In diesem Artikel wird beschrieben, wie Sie ein beliebiges offenes LLM wie Gemma 2 mit Ollama in Google Cloud Run hosten. Der Artikel enthält auch eine Anleitung zum Erstellen eines Cloud Storage-Bucket für die Modellpersistenz und zum Testen der Bereitstellung.

2025-01-20
Community
ML-Modelle

Serverlose Machine-Learning-Modelle mit GPUs mit Google Cloud bereitstellen: Cloud Run

In diesem Artikel wird Schritt für Schritt beschrieben, wie Sie ein Modell für maschinelles Lernen (ML) mit GPU-Unterstützung in Cloud Run bereitstellen. Der Artikel behandelt alles von der Projekteinrichtung und Containerisierung bis hin zur automatisierten Bereitstellung mit Cloud Build und Tests mit curl und JavaScript.

2025-01-17
Bildgenerierung
Vertex AI
Video

Text-zu-Bild-Funktion mit Vertex AI von Google Cloud auf Cloud Run

In diesem Video wird gezeigt, wie Sie mit Vertex AI in Google Cloud eine Anwendung zur Bildgenerierung erstellen. Mit dem Vertex AI-Modell zur Bildgenerierung können Entwickler beeindruckende Bilder erstellen, ohne dass eine komplexe Infrastruktur oder Modellverwaltung erforderlich ist.

2025-01-16
Datenschutz
Sicherheit
Video

Sensible Daten in KI-Apps schützen

In diesem Video erfahren Sie, wie Sie vertrauliche Daten in KI-Anwendungen schützen können. Hier finden Sie wichtige Konzepte, Best Practices und Tools zum Schutz von Daten während des gesamten KI-Lebenszyklus.

2024-11-21
Großes Prompt-Fenster
Modellabstimmung
RAG
Video

RAG im Vergleich zu Modellabstimmung und großem Prompt-Fenster

In diesem Video werden die drei wichtigsten Methoden zum Einbinden Ihrer Daten in KI-Anwendungen behandelt: Prompts mit langen Kontextfenstern, Retrieval-Augmented Generation (RAG) und Modelloptimierung. In dieser Folge von Serverless Expeditions erfahren Sie mehr über die Stärken, Einschränkungen und idealen Anwendungsfälle für die einzelnen Ansätze, damit Sie fundierte Entscheidungen für Ihre KI-Projekte treffen können.

2024-11-14
Prompt Engineering
Video

Prompt Engineering für Entwickler

In diesem Video erfahren Sie, wie Sie mit Prompt Engineering die Qualität von KI-Antworten verbessern können. In diesem Video erfahren Sie, wie Sie mit Chain-of-Thought-, Few-Shot- und Multi-Shot-Prompting-Techniken genauere und relevantere Antworten von generativer KI erhalten.

2024-10-31