Recuperare snippet e contenuti estratti (legacy)

Gemini Enterprise può fornire snippet di ricerca, risposte estrattive e segmenti estrattivi con ogni risposta di ricerca per migliorare i risultati.

  • Snippet: uno snippet è un breve estratto di testo dal documento dei risultati di ricerca che fornisce un'anteprima dei contenuti di un risultato di ricerca. Include l'evidenziazione delle corrispondenze che puoi visualizzare nella tua UI. In genere, gli snippet vengono visualizzati sotto ogni risultato di ricerca per aiutare gli utenti finali a valutare la pertinenza e l'utilità di quel risultato. Gli snippet sono disponibili per i data store con dati non strutturati.

  • Risposte estrattive: una risposta estrattiva è un testo letterale che viene restituito con ogni risultato di ricerca. Viene estratto direttamente dal documento originale. In genere, le risposte estrattive vengono visualizzate nella parte superiore delle pagine web per fornire all'utente finale una breve risposta contestualmente pertinente alla sua query. Le risposte estrattive sono disponibili per i datastore con dati non strutturati.

  • Segmenti estrattivi: un segmento estrattivo è un testo letterale che viene restituito con ogni risultato di ricerca. Un segmento estrattivo è in genere più dettagliato di una risposta estrattiva. I segmenti estrattivi possono essere visualizzati come risposta a una query e possono essere utilizzati per eseguire attività di post-elaborazione e come input per i modelli linguistici di grandi dimensioni per generare risposte o nuovo testo. I segmenti estrattivi sono disponibili per i datastore con dati non strutturati.

Esempi

Gli esempi riportati di seguito illustrano le differenze tra snippet, risposte estrattive e segmenti estrattivi.

Query: "what is example product?"

  • Snippet:

    To enable this, we are announcing our new Example Google Product, the fastest way for developers to jumpstart the creation of apps such as bots, ...

  • Risposta estrattiva:

    Example Google Product allows developers to quickly ship new experiences including bots, chat interfaces, custom search engines, digital assistants, and more. Developers have API access to Google's foundation models and can use out-of-the-box templates to jumpstart the creation of gen apps in minutes or hours.

  • Segmento estrattivo:

    Businesses and governments also want to make customer, partner, and employee interactions more effective and helpful with this new AI technology. To enable this, we are announcing our new Example Google Product.

    Example Google Product allows developers to quickly ship new experiences including bots, chat interfaces, custom search engines, digital assistants, and more. Developers have API access to Google's foundation models and can use out-of-the-box templates to jumpstart the creation of gen apps in minutes or hours. With Example Google Product, developers will also:

    • Combine organizational data and information retrieval techniques to provide relevant answers.
    • Search and respond with more than just text.
    • Combine natural conversations with structured flows.
    • Don't just inform — transact.

Snippet

Gli snippet sono brevi estratti di testo letterale da ogni documento dei risultati di ricerca. Includono l'evidenziazione delle corrispondenze nei tag HTML in grassetto per il rendering delle anteprime dei risultati di ricerca in un'interfaccia utente. In genere, gli snippet vengono visualizzati come testo di anteprima sotto un risultato di ricerca per aiutare gli utenti finali a decidere se fare clic su quel risultato di ricerca sarà utile.

Gli snippet sono disponibili per i dati non strutturati.

Ottenere gli snippet

Per ottenere gli snippet:

  1. Invia una richiesta di ricerca che includa ContentSearchSpec.SnippetSpec e imposta returnSnippet su true.

    L'esempio seguente di SnippetSpec specifica che è possibile restituire uno snippet per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "snippetSpec":
      {
        "returnSnippet": true
      }
    }
    • returnSnippet: se impostato su true, restituisce uno snippet.
  2. Ottieni gli snippet dalla risposta di ricerca. Gli snippet vengono restituiti con ogni risultato di ricerca in derivedStructData.snippets.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è incluso uno snippet con l'evidenziazione delle corrispondenze in grassetto:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2008_google_annual_report.pdf",
          "snippets": [
            {
              "snippet": "Google Chrome. Google Chrome is an open-source browser that combines a minimal design with technologies to make the web faster, safer, and easier to navigate.",
              "snippet_status": "SUCCESS"
            }
          ]
        }
      }
    }
    • snippet: contiene uno snippet generato per il risultato di ricerca del documento. L'evidenziazione delle corrispondenze è inclusa nei tag HTML in grassetto.
    • snippet_status: se viene generato uno snippet, questo campo viene restituito come SUCCESS. Se non viene generato alcuno snippet, questo campo viene restituito come NO_SNIPPET_AVAILABLE.

Risposte estrattive

Una risposta estrattiva è una sezione di testo derivata letteralmente da un documento. Quando un documento viene restituito come risultato di ricerca in una risposta di ricerca, con quel risultato può essere restituita una risposta estrattiva pertinente.

Una risposta estrattiva può essere un testo come un paragrafo, una tabella o un elenco puntato estratto dal documento dei risultati di ricerca. Le risposte estrattive sono più brevi dei segmenti estrattivi.

Le risposte estrattive possono essere utilizzate come alternativa alle risposte riassunte nei casi in cui le risposte precise e letterali sono preferibili ai riepiloghi riformulati.

Le risposte estrattive sono disponibili per i datastore con dati non strutturati.

Ottenere risposte estrattive

Per ottenere risposte estrattive:

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveAnswerCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire una risposta per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveAnswerCount": 1
      }
    }
    • maxExtractiveAnswerCount: il numero di risposte estrattive da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 5.
  2. Ottieni le risposte estrattive dalla risposta di ricerca. Le risposte estrattive vengono restituite con ogni risultato di ricerca in extractive_answers.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è stata inclusa una risposta estrattiva con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_answers": [
            {
              "pageNumber": "2",
              "content": "Google saw growth throughout the year both in our domestic business and internationally, both on Google owned sites and on the Google Network. Specifically, revenues from Google owned sites increased 101% on a year over year basis, from $792 million to $1.6 billion."
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti della risposta estrattiva.

Segmenti estrattivi

Un segmento estrattivo è una sezione di testo estratta letteralmente da un documento dei risultati di ricerca. I segmenti estrattivi sono simili alle risposte estrattive, ma in genere sono più completi e dettagliati. In genere, i segmenti estrattivi vengono utilizzati come input per i tuoi LLM per generare risposte o nuovo testo.

I segmenti estrattivi possono essere costituiti da più paragrafi, incluso testo formattato come tabelle ed elenchi puntati.

I segmenti estrattivi sono disponibili per i datastore con dati non strutturati.

Opzioni dei segmenti estrattivi

Sono disponibili le seguenti opzioni per i segmenti estrattivi:

  • Numero di segmenti: puoi specificare fino a 10 segmenti estrattivi da restituire per ogni risultato di ricerca.

  • Punteggi di pertinenza: i punteggi di pertinenza si basano sulla somiglianza della query al segmento estratto. Puoi specificare che i segmenti estrattivi vengano restituiti con i punteggi di pertinenza. I punteggi vanno da -1,0 (meno pertinente) a 1,0 (più pertinente). L'attivazione dei punteggi di pertinenza può aumentare la latenza.

  • Segmenti adiacenti: puoi impostare numPreviousSegments e numNextSegments per ottenere fino a 3 segmenti immediatamente prima e dopo il segmento pertinente. I segmenti adiacenti possono aggiungere contesto e accuratezza a il segmento pertinente.

    L'attivazione dei segmenti adiacenti può aumentare la latenza.

Ottenere segmenti estrattivi

I passaggi riportati di seguito mostrano come ottenere segmenti estrattivi per dati non strutturati.

  1. Invia una richiesta di ricerca che utilizzi ContentSearchSpec.extractiveContentSpec per specificare maxExtractiveSegmentCount.

    L'esempio seguente di extractiveContentSpec specifica che è possibile restituire un segmento per ogni risultato di ricerca.

    "contentSearchSpec":
    {
      "extractiveContentSpec": {
        "maxExtractiveSegmentCount": 1
      }
    }
    • maxExtractiveSegmentCount: il numero di segmenti estrattivi da restituire per ogni risultato di ricerca. Il valore predefinito è 0 e il valore massimo è 10.

    Opzioni aggiuntive:

    • returnExtractiveSegmentScore: imposta su true per restituire un punteggio di pertinenza con ogni segmento restituito.
    • numPreviousSegments: il numero di segmenti adiacenti da restituire prima del segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.
    • numNextSegments: il numero di segmenti adiacenti da restituire dopo il segmento pertinente. Il valore predefinito è 0 e il valore massimo è 3. L'utilizzo di segmenti adiacenti può aumentare la latenza.

    Per saperne di più su queste opzioni, consulta Opzioni dei segmenti estrattivi.

  2. Ottieni i segmenti dalla risposta di ricerca. I segmenti vengono restituiti con ogni risultato di ricerca in extractive_segments.

    In questo esempio di un documento restituito come uno dei risultati in una risposta di ricerca, è stato incluso un segmento con il risultato:

    {
      "id": "54321",
      "document": {
        "name": "projects/123/locations/global/collections/default_collection/dataStores/example-datastore/branches/0/documents/54321",
        "id": "54321",
        "derivedStructData": {
          "extractive_segments": [
            {
              "pageNumber": "2",
              "content": "Client\nGoogle Toolbar. Google Toolbar is a free application that adds a Google search box to web browsers (Internet\nExplorer and Firefox) and improves user web experience through features such as a pop-up blocker that blocks\npop-up advertising, an autofill feature that completes web forms with information saved on a user's computer, and\ncustomizable buttons that let users search their favorite web sites and stay updated on their favorite feeds.\n\nGoogle Chrome. Google Chrome is an open-source browser that combines a minimal design with\ntechnologies to make the web faster, safer, and easier to navigate.\nGoogle Pack. Google Pack is a free collection of safe, useful software programs from Google and other\ncompanies that improve the user experience online and on the desktop. It includes programs that help users\nbrowse the web faster, remove spyware and viruses.\n\nPicasa. Picasa is a free service that allows users to view, manage and share their photos. Picasa enables users\nto import, organize and edit their photos, and upload them to Picasa Web Albums where the photos can be shared\nwith others on the internet.\n\nGoogle Desktop. Google Desktop lets people perform a full-text search on the contents of their own\ncomputer, including email, files, instant messenger chats and web browser history. Users can view web pages they\nhave visited even when they are not online. Google Desktop also includes a customizable Sidebar that includes\nmodules for weather, stock tickers and news.\n\n5"
            }
          ],
          "link": "gs://cloud-samples-data/gen-app-builder/search/alphabet-investor-pdfs/2004Q4_earnings_google.pdf"
        }
    }
    }
    • pageNumber: se è possibile estrarre i numeri di pagina dal documento, questo campo indica da dove è stata estratta la risposta.
    • content: i contenuti del segmento estrattivo.

Passaggi successivi