Proteggere le applicazioni AI con Model Armor

Model Armor è un servizio Google Cloud progettato per migliorare la sicurezza delle tue applicazioni di AI, in particolare quelle che utilizzano modelli linguistici di grandi dimensioni (LLM). Funziona ispezionando i prompt inviati ai modelli e le risposte generate, aiutandoti a mitigare i rischi e a rispettare le pratiche di AI responsabile.

Configura modelli

Definisci il modo in cui Model Armor deve filtrare i contenuti creando e utilizzando i modelli Model Armor. Un modello è un insieme di configurazioni riutilizzabili in cui specifichi i filtri da attivare, i livelli di confidenza per i filtri e il tipo di applicazione per ogni filtro. Per saperne di più, consulta la pagina Crea e gestisci modelli.

Configura impostazioni di base

Per garantire un livello di protezione di base, gli amministratori della sicurezza possono configurare le impostazioni di base a livello di organizzazione, cartella o progetto. Queste impostazioni impongono requisiti minimi per i filtri a cui devono attenersi tutti i modelli Model Armor creati in questo ambito, contribuendo a evitare configurazioni eccessivamente permissive. Per saperne di più, consulta Configurare le impostazioni del piano.

Sanificare prompt e risposte

Quando un utente invia un prompt alla tua applicazione, quest'ultima invia prima questo prompt a Model Armor. Model Armor elabora il prompt tramite i filtri abilitati nel modello e restituisce una risposta che indica se sono state rilevate violazioni delle norme e i risultati dettagliati di ogni filtro. La logica dell'applicazione decide quindi cosa fare.

Quando un LLM genera una risposta, prima di mostrarla all'utente, la tua applicazione la invia a Model Armor. Model Armor esamina l'output dell'LLM utilizzando le configurazioni dei filtri definite nel modello e restituisce i risultati dell'analisi. La tua applicazione decide quindi se mostrare la risposta all'utente, bloccandola potenzialmente se vengono rilevate violazioni.

Per saperne di più, consulta Sanificare prompt e risposte.

Passaggi successivi