O Gemini 2.5 Flash com funcionalidades de áudio nativas da API Live oferece a nossa funcionalidade de áudio nativa de vanguarda para a API Live. Além das funcionalidades da API Live padrão, este modelo de pré-visualização inclui:
- Qualidade de áudio melhorada: desfrute de uma qualidade de áudio significativamente melhorada que lhe dá a sensação de estar a falar com uma pessoa.
- Qualidade de voz e adaptabilidade melhoradas: o áudio nativo da API Live oferece interações de voz mais ricas e naturais com 30 vozes HD em 24 idiomas.
- Apresentamos o Áudio proativo: Quando o Áudio proativo está ativado, o modelo só responde quando é relevante. O modelo gera transcrições de texto e respostas de áudio proativamente apenas para consultas dirigidas ao dispositivo e não responde a consultas não dirigidas ao dispositivo.
- Apresentamos o diálogo afetivo: os modelos que usam o áudio nativo da API Live podem compreender e responder adequadamente às expressões emocionais dos utilizadores para conversas mais detalhadas.
- Interrupção melhorada: interrompa o Gemini de forma mais natural e fiável, mesmo em ambientes ruidosos.
- Chamada de funções robusta: melhorámos a taxa de acionamento, o que permite ao Gemini executar com êxito as funções que define para suportar os seus exemplos de utilização.
- Transcrição precisa: a precisão da transcrição de áudio para texto foi significativamente melhorada.
- Suporte multilingue integrado: fale com o Gemini em vários idiomas, e este alterna facilmente entre eles sem qualquer pré-configuração. O idioma já não é uma barreira.
Para mais informações sobre a API Live, consulte:
- A nossa documentação da API Live autónoma.
- Os nossos formatos de áudio suportados pela API Live.
- Os nossos limites de sessões simultâneas da API Live.
ID do modelo | gemini-live-2.5-flash-preview-native-audio-09-2025 |
|
---|---|---|
Entradas e saídas suportadas |
|
|
Limites de tokens |
|
|
Capacidades |
|
|
Tipos de utilização |
|
|
Especificações técnicas | ||
Vídeo |
|
|
Áudio |
|
|
Predefinições de parâmetros |
|
|
Regiões suportadas | ||
Disponibilidade do modelo |
|
|
Consulte o artigo Residência de dados para mais informações. | ||
Data do limite de conhecimento | Janeiro de 2025 | |
Versões |
|
|
Controlos de segurança | ||
Consulte os Controlos de segurança para mais informações. | ||
Idiomas suportados | Consulte os idiomas suportados. | |
Preços | Consulte os preços. |