Panoramica dell'inferenza del modello
Questo documento descrive i tipi di inferenza batch supportati da BigQuery ML, tra cui:
L'inferenza del machine learning è il processo di esecuzione di punti dati in un modello di machine learning per calcolare un output, ad esempio un singolo punteggio numerico. Questo processo è anche chiamato "operazionalizzazione di un modello di machine learning" o "inserimento di un modello di machine learning in produzione".
Previsione in batch
Le sezioni seguenti descrivono i modi disponibili per eseguire la previsione in BigQuery ML.
Inferenza utilizzando i modelli addestrati BigQuery ML
La previsione in BigQuery ML viene utilizzata non solo per i modelli di apprendimento supervisionato, ma anche per i modelli di apprendimento non supervisionato.
BigQuery ML supporta le funzionalità di previsione tramite la
funzione ML.PREDICT,
con i seguenti modelli:
| Categoria del modello | Tipi di modello | Cosa fa ML.PREDICT |
|---|---|---|
| Apprendimento supervisionato |
Regressione lineare e logistica Alberi potenziati Foresta casuale Reti neurali profonde Wide & Deep AutoML Tables |
Prevedi l'etichetta, un valore numerico per le attività di regressione o un valore categorico per le attività di classificazione. |
| Apprendimento non supervisionato | K-means | Assegna il cluster all'entità. |
| PCA | Applica la riduzione della dimensionalità all'entità trasformandola nello spazio generato dagli autovettori. | |
| Autoencoder | Trasforma l'entità nello spazio incorporato. |
Inferenza utilizzando modelli importati
Con questo approccio, crei e addestri un modello al di fuori di BigQuery, lo importi utilizzando l'istruzione CREATE MODEL e poi esegui l'inferenza utilizzando la funzione ML.PREDICT.
Tutta l'elaborazione delle inferenze avviene in BigQuery, utilizzando i dati di BigQuery. I modelli importati possono eseguire l'apprendimento supervisionato o non supervisionato.
BigQuery ML supporta i seguenti tipi di modelli importati:
- Open Neural Network Exchange (ONNX) per i modelli addestrati in PyTorch, scikit-learn e altri framework ML popolari.
- TensorFlow
- TensorFlow Lite
- XGBoost
Utilizza questo approccio per sfruttare i modelli personalizzati sviluppati con una gamma di framework ML, usufruendo al contempo della velocità di inferenza e della co-localizzazione con i dati di BigQuery ML.
Per saperne di più, prova uno dei seguenti tutorial:
- Elaborare previsioni con modelli TensorFlow importati
- Fare previsioni con i modelli scikit-learn in formato ONNX
- Fare previsioni con modelli PyTorch in formato ONNX
Inferenza utilizzando modelli remoti
Con questo approccio, puoi creare un riferimento a un modello ospitato in Vertex AI Inference utilizzando l'istruzione CREATE MODEL e poi eseguire l'inferenza utilizzando la funzione ML.PREDICT.
Tutta l'elaborazione delle inferenze avviene in Agent Platform, utilizzando i dati di
BigQuery. I modelli remoti possono eseguire l'apprendimento supervisionato o
non supervisionato.
Utilizza questo approccio per eseguire l'inferenza su modelli di grandi dimensioni che richiedono il supporto hardware della GPU fornito da Agent Platform. Se la maggior parte dei tuoi modelli è ospitata da Agent Platform, questa funzionalità ti consente anche di eseguire l'inferenza su questi modelli utilizzando SQL, senza dover creare manualmente pipeline di dati per trasferire i dati ad Agent Platform e riportare i risultati della previsione in BigQuery.
Per istruzioni passo passo, vedi Fare previsioni con modelli remoti su Agent Platform.
Inferenza batch con i modelli BigQuery in Agent Platform
BigQuery ML supporta le previsioni in batch integrate, senza la necessità di utilizzare Agent Platform. È anche possibile registrare un modello BigQuery ML in Model Registry per eseguire previsioni in batch in Agent Platform utilizzando una tabella BigQuery come input. Tuttavia, questa operazione può essere eseguita solo utilizzando l'API Agent Platform e impostando InstanceConfig.instanceType su object.
Previsione online
La funzionalità di inferenza integrata di BigQuery ML è ottimizzata per casi d'uso su larga scala, come le previsioni in batch. Sebbene BigQuery ML fornisca risultati di inferenza a bassa latenza quando gestisce piccoli dati di input, puoi ottenere una previsione online più rapida grazie all'integrazione perfetta con Gemini Enterprise Agent Platform.
Puoi gestire i modelli BigQuery ML all'interno dell'ambiente Gemini Enterprise Agent Platform, il che elimina la necessità di esportare i modelli da BigQuery ML prima di eseguirne il deployment come endpoint Gemini Enterprise Agent Platform. Gestendo i modelli all'interno di Gemini Enterprise Agent Platform, puoi accedere a tutte le funzionalità MLOps di Gemini Enterprise Agent Platform e anche a funzionalità come Vertex AI Feature Store.
Inoltre, hai la flessibilità di esportare i modelli BigQuery ML in Cloud Storage per la disponibilità su altre piattaforme di hosting di modelli.
Passaggi successivi
- Per saperne di più sull'utilizzo dei modelli di Agent Platform per generare testo ed embedding, consulta Panoramica dell'AI generativa.
- Per saperne di più sull'utilizzo delle API Cloud AI per eseguire attività di AI, consulta la panoramica dell'applicazione AI.
Per saperne di più sulle istruzioni e sulle funzioni SQL supportate per i diversi tipi di modelli, consulta i seguenti documenti: