Die Chat Completions API funktioniert als OpenAI-kompatibler Endpunkt, der die Interaktion mit Gemini auf der Gemini Enterprise Agent Platform mithilfe der OpenAI-Bibliotheken für Python und REST vereinfacht. Wenn Sie bereits die OpenAI-Bibliotheken verwenden, können Sie mit dieser API kostengünstig zwischen dem Aufrufen von OpenAI-Modellen und auf der Agent Platform gehosteten Modellen wechseln, um Ausgabe, Kosten und Skalierbarkeit zu vergleichen, ohne den vorhandenen Code ändern zu müssen. Wenn Sie die OpenAI-Bibliotheken noch nicht verwenden, empfehlen wir Ihnen, das Google Gen AI SDK zu verwenden. Informationen zum Migrieren von vorhandenem OpenAI SDK-Code zur Verwendung des Google Gen AI SDK finden Sie unter Von OpenAI SDK zu Google Gen AI SDK migrieren.
Unterstützte Modelle
Die Chat Completions API unterstützt sowohl Gemini-Modelle als auch ausgewählte selbst bereitgestellte Modelle aus Model Garden.
Gemini-Modelle
Die folgenden Modelle unterstützen die Chat Completions API:
Klicken Sie, um unterstützte Modelle zu maximieren.
Selbst bereitgestellte Modelle aus Model Garden
Die Hugging Face Text Generation Interface (HF TGI)- und vordefinierten vLLM-Container von Agent Platform Model Garden unterstützen die Chat Completions API. Allerdings wird die Chat Completions API nicht von allen Modellen unterstützt, die in diesen Containern bereitgestellt werden. Die folgende Tabelle enthält die beliebtesten unterstützten Modelle nach Container:
HF TGI |
vLLM |
|---|---|
Unterstützte Parameter
Für Google-Modelle unterstützt die Chat Completions API die folgenden OpenAI-Parameter. Eine Beschreibung der einzelnen Parameter finden Sie in der OpenAI-Dokumentation unter Creating chat completions. Die Parameterunterstützung für Drittanbietermodelle variiert je nach Modell. Welche Parameter unterstützt werden, können Sie in der Dokumentation des Modells nachlesen.
messages |
|
model |
|
detail |
Bei Modellen, die älter als Gemini 3 sind, muss das Feld detail für alle Nachrichten und Inhalte einheitlich sein (es gilt auf Anfrageebene). Bei Gemini 3 und höher entspricht dies der `media_resolution` auf Teilebene. Weitere Informationen finden Sie unter Media Resolution.
|
max_completion_tokens |
Alias für max_tokens. |
modalities |
Unterstützt audio, image und text. |
max_tokens |
|
n |
|
frequency_penalty |
|
presence_penalty |
|
reasoning_effort |
Konfiguriert, wie viel Zeit und wie viele Tokens für eine Antwort verwendet werden.
reasoning_effort oder extra_body.google.thinking_config angegeben werden.
|
response_format |
|
seed |
Entspricht GenerationConfig.seed. |
stop |
|
stream |
|
temperature |
|
top_p |
|
tools |
|
tool_choice |
|
web_search_options |
Entspricht dem GoogleSearch-Tool. Unteroptionen werden nicht unterstützt. |
function_call |
Dieses Feld ist veraltet, wird aber für Abwärtskompatibilität unterstützt. |
functions |
Dieses Feld ist veraltet, wird aber für Abwärtskompatibilität unterstützt. |
Wenn Sie einen nicht unterstützten Parameter übergeben, wird er ignoriert.
Multimodale Eingabeparameter
Die Chat Completions API unterstützt ausgewählte multimodale Eingaben.
input_audio |
|
image_url |
|
Im Allgemeinen kann der Parameter data ein URI oder eine Kombination aus MIME-Typ und Base64-codierten Bytes in der Form "data:<MIME-TYPE>;base64,<BASE64-ENCODED-BYTES>" sein. Eine vollständige Liste der MIME-Typen finden Sie unter GenerateContent. Weitere Informationen zur Base64-Codierung von OpenAI finden Sie in der Dokumentation.
Informationen zur Verwendung finden Sie in unseren Beispielen für multimodale Eingaben.
Gemini-spezifische Parameter
Gemini unterstützt mehrere Funktionen, die in OpenAI-Modellen nicht verfügbar sind.
Diese Funktionen können weiterhin als Parameter übergeben werden, müssen aber in einem extra_content oder extra_body enthalten sein, da sie sonst ignoriert werden.
extra_body Features
Fügen Sie ein google-Feld für alle Gemini-spezifischen extra_body-Funktionen ein.
{
...,
"extra_body": {
"google": {
...,
// Add extra_body features here.
}
}
}
safety_settings |
Das entspricht dem Gemini-Modell SafetySetting.
|
cached_content |
Dies entspricht dem Feld generateContent.cached_content von Gemini.
|
thinking_config |
Das entspricht dem Gemini-Modell GenerationConfig.ThinkingConfig.
|
thought_tag_marker |
Wird verwendet, um die Überlegungen eines Modells von seinen Antworten zu trennen, wenn die Funktion „Thinking“ für das Modell verfügbar ist. Wenn nicht angegeben, werden keine Tags um die Überlegungen des Modells zurückgegeben. Wenn sie vorhanden sind, werden bei nachfolgenden Anfragen die Thought-Tags entfernt und die Überlegungen entsprechend für den Kontext markiert. So wird der richtige Kontext für nachfolgende Anfragen beibehalten. |
stream_function_call_arguments |
Streams geben Funktionsaufrufargumente als JSON-Segmente zurück. Weitere Informationen finden Sie unter Streaming von Funktionsaufrufargumenten. |
tools |
Geben Sie Tools ähnlich wie „GenerateContent“ an. Weitere Informationen finden Sie unter Tool. |
media_resolution |
Geben Sie eine Media-Auflösung auf Anfrageebene an, die der von `GenerateContent` ähnelt. Weitere Informationen finden Sie unter
MediaResolution. |
extra_content Features
Mit extra_content können Sie Gemini-spezifische Inhalte angeben, die nicht ignoriert werden sollen.
Fügen Sie ein google-Feld für alle Gemini-spezifischen extra_content-Funktionen ein.
{
...,
"extra_content": {
"google": {
...,
// Add extra_content features here.
}
}
}
thought |
Dieses Feld gibt explizit an, ob es sich bei einem Feld um einen Gedanken handelt, und hat Vorrang vor thought_tag_marker. Es hilft, zwischen verschiedenen Schritten in einem Denkprozess zu unterscheiden, insbesondere in Szenarien mit Tool-Nutzung, in denen Zwischenschritte fälschlicherweise für endgültige Antworten gehalten werden könnten. Wenn Sie bestimmte Teile der Eingabe als Gedanken kennzeichnen, können Sie das Modell anweisen, sie als interne Überlegungen und nicht als Antworten für Nutzer zu behandeln. |
thought_signature |
Ein Bytefeld, das eine Gedanken-Signatur zur Validierung der vom Modell zurückgegebenen Gedanken enthält. Dieses Feld unterscheidet sich von thought, das ein boolesches Feld ist. Weitere Informationen finden Sie unter Gedankensignaturen. |
parts |
Spezifisch für eine Tool-Nachricht, um multimodale Funktionsantwortteile an das Modell zurückzugeben.
Weitere Informationen finden Sie unter
FunctionResponsePart und Multimodale Funktionsantwort. |
Nächste Schritte
- Weitere Informationen zur Authentifizierung und zu Anmeldedaten mit der OpenAI-kompatiblen Syntax
- Hier finden Sie Beispiele für das Aufrufen der Chat Completions API mit der OpenAI-kompatiblen Syntax.
- Hier finden Sie Beispiele für das Aufrufen der Inference API mit der OpenAI-kompatiblen Syntax.
- Hier finden Sie Beispiele für das Aufrufen der Function Calling API mit OpenAI-kompatibler Syntax.
- Weitere Informationen zur Gemini API
- Weitere Informationen zur Migration von Azure OpenAI zur Gemini API
- Informationen zum Migrieren von vorhandenem OpenAI SDK-Code zur Verwendung des Google Gen AI SDK finden Sie unter Von OpenAI SDK zu Google Gen AI SDK migrieren.