Ricevere snippet e contenuti estratti

La ricerca dell'agente può fornire snippet di ricerca, risposte estrattive e segmenti estrattivi con ogni risposta di ricerca per migliorare i risultati.

  • Snippet: uno snippet è un breve estratto di testo del documento dei risultati di ricerca che fornisce un'anteprima dei contenuti di un risultato di ricerca. Include l'evidenziazione delle corrispondenze che puoi visualizzare nella tua UI. In genere, gli snippet vengono visualizzati sotto ogni risultato di ricerca per aiutare gli utenti finali a valutare la pertinenza e l'utilità di quel risultato. Gli snippet sono disponibili per i datastore con dati non strutturati e dati del sito web (sia la ricerca di base del sito web sia l'indicizzazione avanzata dei siti web).

  • Risposte estrattive: una risposta estrattiva è un testo letterale che viene restituito con ogni risultato di ricerca. Viene estratto direttamente dal documento originale. In genere, le risposte estrattive vengono visualizzate nella parte superiore delle pagine web per fornire all'utente finale una breve risposta contestualmente pertinente alla sua query. Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con l'indicizzazione avanzata dei siti web.

  • Segmenti estrattivi: un segmento estrattivo è un testo letterale che viene restituito con ogni risultato di ricerca. Un segmento estrattivo è in genere più dettagliato di una risposta estrattiva. I segmenti estrattivi possono essere visualizzati come risposta a una query e possono essere utilizzati per eseguire attività di post-elaborazione e come input per i modelli linguistici di grandi dimensioni per generare risposte o nuovo testo. I segmenti estrattivi sono disponibili per i datastore con dati non strutturati e con l'indicizzazione avanzata dei siti web.

Esempi

Gli esempi riportati di seguito illustrano le differenze tra snippet, risposte estrattive e segmenti estrattivi.

Query: "che cos'è la ricerca dell'agente?"

  • Snippet:

    Per attivare questa funzionalità, annunciamo la nostra nuova ricerca dell'agente, il modo più rapido per gli sviluppatori di avviare la creazione di app generative come i bot, ...

  • Risposta estrattiva:

    La ricerca dell'agente consente agli sviluppatori di distribuire rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso tramite API ai modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare la creazione di app generative in pochi minuti o ore.

  • Segmento estrattivo:

    Anche le aziende e le amministrazioni pubbliche vogliono rendere più efficaci e utili le interazioni con clienti, partner e dipendenti grazie a questa nuova tecnologia di AI. Per attivare questa funzionalità, annunciamo la nostra nuova ricerca dell'agente.

    La ricerca dell'agente consente agli sviluppatori di distribuire rapidamente nuove esperienze, tra cui bot, interfacce di chat, motori di ricerca personalizzati, assistenti digitali e altro ancora. Gli sviluppatori hanno accesso tramite API ai modelli di base di Google e possono utilizzare modelli pronti all'uso per avviare la creazione di app generative in pochi minuti o ore. Con la ricerca dell'agente, gli sviluppatori potranno anche:

    • Combinare i dati dell'organizzazione e le tecniche di recupero delle informazioni per fornire risposte pertinenti.
    • Cercare e rispondere con più di un semplice testo.
    • Combinare conversazioni naturali e flussi strutturati.
    • Non limitarsi a informare, ma anche a effettuare transazioni.

Prima di iniziare

A seconda del tipo di app, completa i seguenti prerequisiti:

Snippet

Gli snippet sono brevi estratti di testo letterale di ogni documento dei risultati di ricerca. Includono l'evidenziazione delle corrispondenze nei tag HTML in grassetto per il rendering delle anteprime dei risultati di ricerca in un'interfaccia utente. In genere, gli snippet vengono visualizzati come testo di anteprima sotto un risultato di ricerca per aiutare gli utenti finali a decidere se fare clic su quel risultato di ricerca sarà utile.

Gli snippet sono disponibili per la ricerca di siti web e non strutturata.

Recuperare gli snippet

Per recuperare gli snippet:

  1. Invia una richiesta di ricerca che includa ContentSearchSpec.SnippetSpec e imposta returnSnippet su true.

    L'esempio seguente di SnippetSpec specifica che è possibile restituire uno snippet per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: se impostato su true, restituisce uno snippet.
  2. Recupera gli snippet dalla risposta di ricerca. Gli snippet vengono restituiti con ogni risultato di ricerca in derivedStructData.snippets.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è incluso uno snippet con l'evidenziazione delle corrispondenze in grassetto:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: contiene uno snippet generato per il risultato di ricerca del documento. L'evidenziazione delle corrispondenze è inclusa nei tag HTML in grassetto.
    • snippet_status: se viene generato uno snippet, questo campo viene restituito come SUCCESS. Se non viene generato alcuno snippet, questo campo viene restituito come NO_SNIPPET_AVAILABLE.

Risposte estrattive

Una risposta estrattiva è una sezione di testo derivata letteralmente da un documento. Quando un documento viene restituito come risultato di ricerca in una risposta di ricerca, con il risultato può essere restituita una risposta estrattiva pertinente.

Una risposta estrattiva può essere un testo come un paragrafo, una tabella o un elenco puntato estratto dal documento dei risultati di ricerca. Le risposte estrattive sono più brevi dei segmenti estrattivi.

Le risposte estrattive possono essere utilizzate come alternativa alle risposte riepilogate nei casi in cui le risposte precise e letterali sono preferibili ai riepiloghi riformulati.

Le risposte estrattive sono disponibili per i datastore con dati non strutturati e con l'indicizzazione avanzata dei siti web.

Recuperare le risposte estrattive

Per recuperare le risposte estrattive:

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveAnswerCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire una risposta per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: il numero di risposte estrattive da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 5.
  2. Recupera le risposte estrattive dalla risposta di ricerca. Le risposte estrattive vengono restituite con ogni risultato di ricerca in extractive_answers.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è stata inclusa una risposta estrattiva con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti della risposta estrattiva.

Segmenti estrattivi

Un segmento estrattivo è una sezione di testo estratta letteralmente da un documento dei risultati di ricerca. I segmenti estrattivi sono simili alle risposte estrattive, ma in genere sono più completi e dettagliati. In genere, i segmenti estrattivi vengono utilizzati come input per i tuoi LLM per generare risposte o nuovo testo.

I segmenti estrattivi possono essere costituiti da più paragrafi, incluso il testo formattato come tabelle ed elenchi puntati.

I segmenti estrattivi sono disponibili per i datastore con dati non strutturati e con l'indicizzazione avanzata dei siti web.

Opzioni dei segmenti estrattivi

Sono disponibili le seguenti opzioni per i segmenti estrattivi:

  • Numero di segmenti: puoi specificare fino a 10 segmenti estrattivi da restituire per ogni risultato di ricerca.

  • Punteggi di pertinenza: i punteggi di pertinenza si basano sulla somiglianza della query al segmento estratto. Puoi specificare che i segmenti estrattivi vengano restituiti con i punteggi di pertinenza. I punteggi vanno da -1,0 (meno pertinente) a 1,0 (più pertinente). L'attivazione dei punteggi di pertinenza può aumentare la latenza.

  • Segmenti adiacenti: puoi impostare numPreviousSegments e numNextSegments per ottenere fino a 3 segmenti immediatamente prima e dopo il segmento pertinente. I segmenti adiacenti possono aggiungere contesto e accuratezza al segmento pertinente.

    L'attivazione dei segmenti adiacenti può aumentare la latenza.

Recuperare i segmenti estrattivi

I passaggi seguenti mostrano come recuperare i segmenti estrattivi per i dati non strutturati. Puoi seguire passaggi simili per recuperare i segmenti estrattivi per i dati del sito web.

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveSegmentCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire un segmento per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: il numero di segmenti estrattivi da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 10.

    Opzioni aggiuntive:

    • returnExtractiveSegmentScore: imposta su true per restituire un punteggio di pertinenza con ogni segmento restituito.
    • numPreviousSegments: il numero di segmenti adiacenti da restituire prima del segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.
    • numNextSegments: il numero di segmenti adiacenti da restituire dopo il segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.

    Per ulteriori informazioni su queste opzioni, vedi Opzioni dei segmenti estrattivi.

  2. Recupera i segmenti dalla risposta di ricerca. I segmenti vengono restituiti con ogni risultato di ricerca in extractive_segments.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è stato incluso un segmento con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti del segmento estrattivo.

Passaggi successivi