Crea un modello di traduzione personalizzato
Addestra e utilizza un modello di traduzione personalizzato utilizzando la console Google Cloud . L'esempio seguente utilizza AutoML Translation per addestrare un modello di traduzione dall'inglese allo spagnolo utilizzando un set di dati che contiene coppie di segmenti di argomento tecnologico tratti dalla localizzazione di software.
Prima di iniziare
Prima di poter iniziare a utilizzare AutoML Translation, il tuo progetto deve avere l'API Cloud Translation abilitata e devi disporre delle autorizzazioni concesse dai seguenti ruoli:
- Ruolo Viewer per visualizzare le risorse esistenti nel progetto
- Ruolo Cloud Translation API Editor per creare e gestire set di dati e modelli
- Ruolo Storage Admin per caricare i dati di addestramento in un bucket Cloud Storage
Crea un set di dati di traduzione e importa coppie di segmenti
Scarica il file archivio contenente i dati di esempio per l'addestramento del modello ed estrai i file.
Per questo tutorial, utilizzerai il file TSV dall'inglese allo spagnolo.
Vai alla console AutoML Translation.
Nel riquadro di navigazione, fai clic su Set di dati per andare alla pagina Set di dati.
Fai clic su Crea set di dati.
Nella finestra di dialogo Crea set di dati, specifica i dettagli del set di dati:
- Inserisci
tutorial_datasetcome nome del set di dati. - Seleziona Inglese (EN) come lingua di origine dall'elenco a discesa.
- Seleziona Spagnolo (ES) come lingua di destinazione.
- Fai clic su Crea.
- Inserisci
Una volta creato il set di dati, fai clic sul suo nome per visualizzarne i dettagli.
Vai alla scheda Importa e carica il set di dati
en-es.tsvin Cloud Storage:- Seleziona Carica file dal tuo computer.
- Fai clic su Seleziona file e scegli il file
en-es.tsvche hai scaricato ed estratto in precedenza. - Fai clic su Sfoglia per selezionare o creare un nuovo bucket Cloud Storage in cui archiviare il file TSV. La regione del bucket deve essere
us-central1.
Fai clic su Continua.
AutoML Translation suddivide automaticamente i dati in set di addestramento, convalida e test. Puoi visualizzare queste suddivisioni e le coppie di frasi importate nella scheda Frasi del set di dati.
Addestra un modello
Vai alla console AutoML Translation.
Nel riquadro di navigazione, vai alla pagina Set di dati.
Fai clic sul set di dati tutorial_dataset.
Vai alla scheda Addestra.
Fai clic su Inizia addestramento per aprire il riquadro Addestra nuovo modello.
Inserisci
tutorial_modelcome nome del modello.Fai clic su Inizia addestramento.
L'addestramento di un modello può richiedere diverse ore.
Valuta il modello
Confronta il tuo modello con il modello NMT predefinito di Google utilizzando le coppie di segmenti del test set.
Vai alla console AutoML Translation.
Nel riquadro di navigazione, vai alla pagina Modelli.
Fai clic sul modello tutorial_model.
Fai clic sulla scheda Valuta.
Nella sezione Valutazioni precedenti, Cloud Translation mostra il punteggio BLEU del tuo modello rispetto al modello NMT di Google. Il punteggio BLEU (Bilingual Evaluation Understudy) indica la somiglianza tra il testo candidato e i testi di riferimento. Più il valore è vicino a 100, più i testi sono simili.
Utilizza il modello di traduzione
Dalla console Google Cloud , puoi utilizzare il modello personalizzato per tradurre del testo.
Vai alla console AutoML Translation.
Nel riquadro di navigazione, vai alla pagina Modelli.
Fai clic sul modello tutorial_model.
Fai clic sulla scheda Prevedi.
Nella casella di testo Inglese, inserisci il testo da tradurre e poi fai clic su Traduci.
Puoi confrontare i risultati del modello personalizzato con quelli del modello NMT di Google.
Esegui la pulizia
Per evitare addebiti di Google Cloud non necessari, elimina il modello, il set di dati e il file en-es.tsv. Puoi anche utilizzare laGoogle Cloud console per eliminare il progetto se non ti serve.
Passaggi successivi
- Per saperne di più sui modelli personalizzati, consulta la Guida per nuovi utenti.
- Per creare il tuo set di dati e il tuo modello personalizzato, consulta la sezione Prepara i dati di addestramento per istruzioni su come preparare i dati.