Durchsatzkontingent

Die Gemini Enterprise Agent Platform bietet verschiedene Möglichkeiten, den Durchsatz für generative KI-Modelle zu verwalten, damit Sie Kosten und Leistung in Einklang bringen können. In diesem Dokument werden die verfügbaren Optionen beschrieben: ein flexibles Pay-as-you-go-Modell und reservierte Kapazität für einen vorhersagbaren Durchsatz.

Kontingente für verwaltete Modelle

Die Agent Platform bietet zwei Möglichkeiten, den Durchsatz für die verwalteten generativen KI-Modelle auf der Gemini Enterprise Agent Platform zu verwalten. So können Sie Kosten, Flexibilität und Leistung in Einklang bringen. Sie können entweder ein Pay-as-you-go-Modell verwenden oder eine bestimmte Menge an Durchsatz zu einem festen Preis reservieren.

Pay as you go

Für das Standardmodell „Pay as you go“ verwendet die Agent Platform Standard PayGo. Mit PayGo zahlen Sie nur für die Ressourcen, die Sie nutzen, ohne dass finanzielle Vorabverpflichtungen erforderlich sind. Es gibt zusätzliche PayGo-Optionen, die sich in Kosten und Leistung unterscheiden. Weitere Informationen finden Sie unter Priority PayGo oder Flex PayGo.

Reservierte Kapazität

Für kritische Produktionsanwendungen, die eine konsistente Leistung und vorhersehbare Kosten erfordern, können Sie bereitgestellten Durchsatz verwenden. Bereitgestellter Durchsatz ist ein Abo mit festen Kosten, das eine bestimmte Menge an Durchsatz für Ihre Modelle an einem ausgewählten Standort reserviert.

Kontingente für Dienste mit generativer KI

Die Gemini Enterprise Agent Platform bietet eine Reihe von generativen KI-Diensten wie Modelloptimierung, Modellbewertung, Batch-Vorhersage, Einbettungen und Retrieval Augmented Generation. Weitere Informationen zu den Kontingenten für diese Dienste finden Sie unter Kontingente und Systemlimits für generative KI auf der Gemini Enterprise Agent Platform.

Nächste Schritte