產生回憶集錦

記憶庫可讓您從使用者與代理之間的對話建構長期記憶。本頁說明記憶集錦的生成方式、如何自訂記憶集錦的擷取方式,以及如何觸發記憶集錦生成作業。

如要完成本指南中示範的步驟,請先按照「設定 Memory Bank」中的步驟操作。

瞭解記憶生成

記憶體庫會從來源資料擷取記憶,並隨著時間新增、更新及移除記憶,自行為特定記憶集合 (由 scope 定義) 策劃記憶。

觸發記憶生成時,記憶庫會執行下列作業:

  • 擷取:從使用者與服務專員的對話中擷取使用者資訊。系統只會保留符合至少一個執行個體記憶體主題的資訊。

  • 合併:根據擷取的資訊,判斷是否應刪除或更新相同範圍的現有回憶集錦。記憶庫會先檢查新記憶是否重複或矛盾,再與現有記憶合併。如果現有記憶內容與新資訊不重疊,系統會建立新記憶內容。

回憶集錦主題

「記憶體主題」會識別記憶體銀行認為有意義的資訊,因此應保留為生成的回憶。記憶體庫支援兩種記憶主題:

  • 管理主題:標籤和操作說明由記憶體庫定義。您只需要提供受管理主題的名稱。例如:

    字典

    memory_topic = {
        "managed_memory_topic": {
            "managed_topic_enum": "USER_PERSONAL_INFO"
        }
    }
    

    以類別為準

    from vertexai.types import ManagedTopicEnum
    from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
    from vertexai.types import MemoryBankCustomizationConfigMemoryTopicManagedMemoryTopic as ManagedMemoryTopic
    
    memory_topic = MemoryTopic(
        managed_memory_topic=ManagedMemoryTopic(
            managed_topic_enum=ManagedTopicEnum.USER_PERSONAL_INFO
        )
    )
    
  • 自訂主題:設定記憶體庫執行個體時,您可以定義標籤和說明。這些資訊會用於記憶體庫擷取步驟的提示。例如:

    字典

    memory_topic = {
        "custom_memory_topic": {
            "label": "business_feedback",
            "description": """Specific user feedback about their experience at
    the coffee shop. This includes opinions on drinks, food, pastries, ambiance,
    staff friendliness, service speed, cleanliness, and any suggestions for
    improvement."""
        }
    }
    

    以類別為準

    from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
    from vertexai.types import MemoryBankCustomizationConfigMemoryTopicCustomMemoryTopic as CustomMemoryTopic
    
    memory_topic = MemoryTopic(
        custom_memory_topic=CustomMemoryTopic(
            label="business_feedback",
            description="""Specific user feedback about their experience at
    the coffee shop. This includes opinions on drinks, food, pastries, ambiance,
    staff friendliness, service speed, cleanliness, and any suggestions for
    improvement."""
        )
    )
    

    使用自訂主題時,建議一併提供少量樣本,說明如何從對話中擷取記憶內容。

根據預設,記憶體庫會保留下列所有受管理的主題:

  • 個人資訊 (USER_PERSONAL_INFO):使用者的重要個人資訊,例如姓名、關係、興趣和重要日期。例如「我在 Google 工作」或「我的結婚紀念日是 12 月 31 日」。
  • 使用者偏好設定 (USER_PREFERENCES):明確或隱含的喜好、不喜好、偏好的風格或模式。例如「我比較喜歡中間的座位」。
  • 重要對話事件和工作結果 (KEY_CONVERSATION_DETAILS):對話中的重要里程碑或結論。舉例來說,「我預訂了 JFK 和 SFO 之間的來回機票。我將於 2025 年 6 月 1 日出發,並於 2025 年 6 月 7 日返回。
  • 明確的記憶 / 忘記指令 (EXPLICIT_INSTRUCTIONS):使用者明確要求智慧助理記憶或忘記的資訊。舉例來說,如果使用者說「記住我主要使用 Python」,記憶庫就會產生「我主要使用 Python」這類記憶。

這相當於使用下列一組受管理記憶體主題:

字典

  memory_topics = [
      {"managed_memory_topic": {"managed_topic_enum": "USER_PERSONAL_INFO"}},
      {"managed_memory_topic": {"managed_topic_enum": "USER_PREFERENCES"}},
      {"managed_memory_topic": {"managed_topic_enum": "KEY_CONVERSATION_DETAILS"}},
      {"managed_memory_topic": {"managed_topic_enum": "EXPLICIT_INSTRUCTIONS"}},
  ]

以類別為準

from vertexai.types import ManagedTopicEnum
from vertexai.types import MemoryBankCustomizationConfigMemoryTopic as MemoryTopic
from vertexai.types import MemoryBankCustomizationConfigMemoryTopicManagedMemoryTopic as ManagedMemoryTopic

memory_topics = [
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.USER_PERSONAL_INFO)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.USER_PREFERENCES)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.KEY_CONVERSATION_DETAILS)),
  MemoryTopic(
      managed_memory_topic=ManagedMemoryTopic(
          managed_topic_enum=ManagedTopicEnum.EXPLICIT_INSTRUCTIONS)),
]

如要自訂記憶體庫保留的主題,請在設定記憶體庫時,於自訂設定中設定記憶體主題。

觸發記憶生成

您可以在工作階段結束時或工作階段期間,以固定間隔使用 GenerateMemories 觸發記憶體生成作業。記憶內容生成功能會從來源對話中擷取重要脈絡,並與相同範圍的現有記憶內容合併。舉例來說,您可以使用 {"user_id": "123", "session_id": "456"} 等範圍建立工作階段層級的記憶體。您可以合併相同範圍的記憶內容,並一起擷取

GenerateMemories長時間執行的作業。作業完成後,AgentEngineGenerateMemoriesOperation 會包含產生的回憶集錦清單 (如有):

AgentEngineGenerateMemoriesOperation(
  name="projects/.../locations/.../reasoningEngines/.../operations/...",
  done=True,
  response=GenerateMemoriesResponse(
    generatedMemories=[
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="CREATED",
      ),
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="UPDATED",
      ),
      GenerateMemoriesResponseGeneratedMemory(
        memory=Memory(
          "name": "projects/.../locations/.../reasoningEngines/.../memories/..."
        ),
        action="DELETED",
      ),
    ]
  )
)

每則生成的記憶內容都會顯示對該記憶內容執行的 action

  • CREATED:表示新增了記憶,代表現有記憶未擷取的新概念。
  • UPDATED:表示現有記憶內容已更新,這是因為記憶內容涵蓋的概念與新擷取的資訊類似。記憶內容的事實可能會更新為新資訊,也可能維持不變。
  • DELETED:表示系統已刪除現有記憶內容,因為該內容與從對話中擷取的新資訊有矛盾之處。

如果是 CREATEDUPDATED 記憶體,可以使用 GetMemories 擷取記憶體的完整內容。擷取 DELETED 記憶體會導致 404 錯誤。

在背景生成回憶集錦

GenerateMemories長時間執行的作業。根據預設,client.agent_engines.generate_memories 是封鎖函式,會輪詢作業,直到作業完成為止。以封鎖作業的形式執行記憶體生成作業,有助於手動檢查生成的記憶體,或通知使用者生成了哪些記憶體。

不過,對於正式版代理程式,您通常會希望在背景以非同步程序執行記憶體生成作業。在大多數情況下,用戶端不需要使用目前執行的輸出內容,因此不必等待回應而產生額外延遲。如要讓記憶體生成作業在背景執行,請將 wait_for_completion 設為 False

client.agent_engines.memories.generate(
    ...,
    config={
        "wait_for_completion": False
    }
)

資料來源

你可以透過多種方式提供記憶內容的來源資料:

直接在酬載中提供事件,或使用 Vertex AI Agent Engine 工作階段時,系統會從對話中擷取資訊,並與現有記憶內容合併。如果只想從這些資料來源擷取資訊,可以停用整併功能:

client.agent_engines.memories.generate(
    ...
    config={
        "disable_consolidation": True
    }
)

使用酬載中的事件做為資料來源

如要使用酬載中直接提供的事件生成回憶集錦,請使用 direct_contents_source。系統會從這些事件中擷取有意義的資訊,並與相同範圍的現有資訊合併。如果您使用的工作階段儲存空間與 Vertex AI Agent Engine 工作階段不同,可以採用這種做法。

字典

事件應包含 Content 字典。

events =  [
  {
    "content": {
      "role": "user",
      "parts": [
        {"text": "I work with LLM agents!"}
      ]
    }
  }
]

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_contents_source={
      "events": EVENTS
    },
    # For example, `scope={"user_id": "123"}`.
    scope=SCOPE,
    config={
        "wait_for_completion": True
    }
)

更改下列內容:

  • SCOPE:字典,代表生成回憶的範圍。例如,{"session_id": "MY_SESSION"}。只有相同範圍的記憶體才會合併。

以類別為準

事件應包含 Content 物件。

from google import genai
import vertexai

events = [
  vertexai.types.GenerateMemoriesRequestDirectContentsSourceEvent(
    content=genai.types.Content(
      role="user",
      parts=[
        genai.types.Part.from_text(text="I work with LLM agents!")
      ]
    )
  )
]

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_contents_source={
      "events": events
    },
    # For example, `scope={"user_id": "123"}`.
    scope=SCOPE,
    config={
        "wait_for_completion": True
    }
)

更改下列內容:

  • SCOPE:字典,代表生成回憶的範圍。例如,{"session_id": "MY_SESSION"}。只有相同範圍的記憶體才會合併。

使用 Vertex AI Agent Engine 工作階段做為資料來源

透過 Agent Engine 工作階段,Memory Bank 會使用工作階段事件做為記憶體生成的來源對話。

為限定生成的記憶內容範圍,記憶體庫預設會從工作階段中擷取並使用使用者 ID。舉例來說,如果工作階段的 user_id 是「123」,記憶體的範圍就會儲存為 {"user_id": "123"}。您也可以直接提供 scope,這會覆寫以工作階段的 user_id 做為範圍。

字典

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source={
      # For example, projects/.../locations/.../reasoningEngines/.../sessions/...
      "session": "SESSION_NAME"
  },
  # Optional when using Agent Engine Sessions. Defaults to {"user_id": session.user_id}.
  scope=SCOPE,
  config={
      "wait_for_completion": True
  }
)

更改下列內容:

  • SESSION_NAME:完整 工作階段名稱

  • (選用) SCOPE:字典,代表所產生回憶的範圍。例如,{"session_id": "MY_SESSION"}。系統只會合併範圍相同的記憶體。如果未提供,則使用 {"user_id": session.user_id}

以類別為準

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source=vertexai.types.GenerateMemoriesRequestVertexSessionSource(
      # For example, projects/.../locations/.../reasoningEngines/.../sessions/...
      session="SESSION_NAME"
  ),
  # Optional when using Agent Engine Sessions. Defaults to {"user_id": session.user_id}.
  scope=SCOPE,
  config={
      "wait_for_completion": True
  }
)

此外,您也可以視需要提供時間範圍,指出應納入工作階段的事件。如未提供,系統會納入工作階段中的所有事件。

字典

import datetime

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source={
      "session": "SESSION_NAME",
      # Extract memories from the last hour of events.
      "start_time": datetime.datetime.now(tz=datetime.timezone.utc) - datetime.timedelta(seconds=24 * 60),
      "end_time": datetime.datetime.now(tz=datetime.timezone.utc)
  },
  scope=SCOPE
)

以類別為準

import datetime

client.agent_engines.memories.generate(
  name=agent_engine.api_resource.name,
  vertex_session_source=vertexai.types.GenerateMemoriesRequestVertexSessionSource(
      session="SESSION_NAME",
      # Extract memories from the last hour of events.
      start_time=datetime.datetime.now(tz=datetime.timezone.utc) - datetime.timedelta(seconds=24 * 60),
      end_time=datetime.datetime.now(tz=datetime.timezone.utc)
  ),
  scope=SCOPE
)

整合預先擷取的記憶

除了使用記憶體庫的自動擷取程序,您也可以直接提供預先擷取的記憶內容。直接來源回憶集錦會與相同範圍的現有回憶集錦合併。這項功能非常實用,因為您可讓專員或參與迴圈的人員負責擷取記憶內容,同時利用記憶庫的整合功能,確保沒有重複或矛盾的記憶內容。

client.agent_engines.memories.generate(
    name=agent_engine.api_resource.name,
    direct_memories_source={"direct_memories": [{"fact": "FACT"}]},
    scope=SCOPE
)

更改下列內容:

  • FACT:應與現有記憶內容合併的預先擷取事實。您最多可以在清單中提供 5 個預先擷取的事實,如下所示:

    {"direct_memories": [{"fact": "fact 1"}, {"fact": "fact 2"}]}
    
  • SCOPE:字典,代表生成回憶的範圍。例如,{"session_id": "MY_SESSION"}。只有相同範圍的記憶體才會合併。

使用多模態輸入內容

你可以從多模態輸入內容中擷取記憶內容。不過,記憶內容只會從來源內容中的文字、內嵌檔案和檔案資料擷取。生成回憶集錦時,系統會忽略所有其他內容,包括函式呼叫和回應。

系統會從使用者提供的圖片影片音訊中擷取記憶。如果記憶庫判斷多模態輸入提供的脈絡對日後互動有意義,系統可能會建立文字記憶,當中包含從輸入內容擷取的資訊。舉例來說,如果使用者提供黃金獵犬的圖片,並附上「這是我的狗」的文字,記憶庫就會生成「我的狗是黃金獵犬」等記憶。

舉例來說,您可以在酬載中提供圖片和圖片情境:

字典

with open(file_name, "rb") as f:
    inline_data = f.read()

events =  [
  {
    "content": {
      "role": "user",
      "parts": [
        {"text": "This is my dog"},
        {
          "inline_data": {
            "mime_type": "image/jpeg",
            "data": inline_data
          }
        },
        {
          "file_data": {
            "file_uri": "gs://cloud-samples-data/generative-ai/image/dog.jpg",
            "mime_type": "image/jpeg"
          }
        },
      ]
    }
  }
]

以類別為準

from google import genai
import vertexai

with open(file_name, "rb") as f:
    inline_data = f.read()

events = [
  vertexai.types.GenerateMemoriesRequestDirectContentsSourceEvent(
    content=genai.types.Content(
      role="user",
      parts=[
        genai.types.Part.from_text(text="This is my dog"),
        genai.types.Part.from_bytes(
          data=inline_data,
          mime_type="image/jpeg",
        ),
        genai.types.Part.from_uri(
          file_uri="gs://cloud-samples-data/generative-ai/image/dog.jpg",
          mime_type="image/jpeg",
        )
      ]
    )
  )
]

使用 Vertex AI Agent Engine Sessions 做為資料來源時,多模態內容會直接在 Session 的事件中提供。

後續步驟