如需查看跟踪记录数据的汇总表示形式,或查找和探索包含特定标签的单个跟踪记录或跟踪记录,请使用 Trace 探索器页面。
以下屏幕截图展示了跟踪记录数据的显示方式:
此功能仅适用于 Google Cloud 项目。对于 App Hub 配置,请选择 App Hub 宿主项目或管理项目。
Trace 探索器页面简介
为了帮助您识别轨迹数据中的趋势和模式,系统会对延迟时间数据进行汇总并以图表形式显示。热图使用颜色来表示单元格中的跨度数。包含多个 span 的单元格的颜色比包含少量 span 的单元格的颜色深。每个单元格的工具提示都会显示延迟时间和其他信息。 您还可以查看延迟时间百分位和跨度比率信息。
在调查问题时,您可能希望查看特定轨迹或仅查看具有某些属性的 span:
如需限制显示哪些 span,请应用过滤条件。例如,您可以按服务、应用、错误状态和其他属性进行过滤。
如需显示特定轨迹,请使用工具栏的点击网页浏览 搜索轨迹选项。
如需识别离群值并查看各个时间段的详细信息,请使用表格部分:
您可以按“时长”标题对“区间”和“分组”标签页中的行进行排序。
如需了解不同服务生成的 span 数量,请使用分组标签页。每一行都对应一个服务和 span 名称,并且每个条目都会显示延迟统计信息。
如需详细了解某个 span 或分组,请从表格部分的某一行中选择相应条目。系统会打开一个弹出式窗口,其中显示了相应 span 在其跟踪记录中的上下文。在此视图中,您可以探索 span 及其属性,并查看事件和日志数据。您还可以在轨迹中搜索 span 和属性中的关键字。
Trace 探索器页面所依赖的跟踪记录数据取决于以下因素:
- 搜索跟踪数据的项目。默认情况下,系统仅在项目选择器中选定的项目中搜索轨迹数据。不过,您可以配置该页面,使其在跟踪记录范围内搜索项目列表。
- 您在搜索的项目中的 Identity and Access Management (IAM) 权限。 如果您没有查看项目跟踪数据的权限, Google Cloud 控制台会显示一条警告消息,并且不会显示相应项目的数据。
- 时间范围设置。
- 您应用的过滤条件。
本页面的其余部分详细介绍了如何查找和探索跟踪记录数据。
准备工作
如需获得使用 Google Cloud 控制台查看跟踪记录数据或选择跟踪记录范围所需的权限,请让您的管理员为您授予项目的 Cloud Trace User (roles/cloudtrace.user) IAM 角色。
如需详细了解如何授予角色,请参阅管理对项目、文件夹和组织的访问权限。
此预定义角色包含使用 Google Cloud 控制台查看轨迹数据以及选择轨迹范围所需的权限。如需查看所需的确切权限,请展开所需权限部分:
所需权限
如需使用 Google Cloud 控制台查看跟踪数据并选择跟踪范围,您需要拥有以下权限:
-
如需选择跟踪范围:
cloudtrace.traceScopes.[get, list] -
如需读取默认跟踪范围:
observability.scopes.get
如需详细了解角色,请参阅使用 Identity and Access Management 控制访问权限。
查看汇总的跟踪记录数据
如需查看有关跟踪记录数据的汇总信息,请执行以下操作:
-
在 Google Cloud 控制台中,前往 Trace 探索器页面:
您也可以使用搜索栏查找此页面。
首次将跟踪记录数据写入 Google Cloud 项目后,可能需要几分钟时间才能查看该数据。如果您在等待几分钟后未看到任何跟踪数据显示,则可能是您的项目没有任何数据可供显示,或者存在配置问题。如需了解如何解决这些问题,请参阅问题排查:跟踪记录界面中没有数据。
配置 Trace 探索器页面:
- 在 Google Cloud 控制台的工具栏中,选择您的 Google Cloud 项目。对于 App Hub 配置,请选择 App Hub 宿主项目或管理项目。
可选:使用 Scope 元素配置要搜索哪些项目的轨迹数据:
如需显示存储在项目中的轨迹数据,请将范围元素的第一个菜单设置为
项目或
_默认。
这两种设置是等效的。如需显示存储在多个项目中的跟踪数据,请展开范围元素的第一个菜单,选择跟踪范围,然后选择列出这些项目的跟踪范围。选择完成后,“范围”菜单会显示轨迹范围图标
和所选轨迹范围的名称。
返回的数据取决于您在搜索的项目中所拥有的 IAM 角色。例如,如果搜索的项目包含您无权访问的 Google Cloud 项目,则系统不会返回该项目的任何跟踪记录数据。
如需了解详情,请参阅创建和管理跟踪记录范围。
可选:使用时间范围选择器或使用指针突出显示 x 轴上的范围,以更新时间范围。
例如,如果您想了解延迟时间数据是否存在任何趋势,可以将此选择器设置为过去 2 周。 跨度数据的存储有效期为 30 天。
探索热图:
使用颜色来识别趋势和离群值。包含多个 span 的单元格的颜色比包含少量 span 的单元格深。
使用单元格的提示查看单元格的详细信息。提示会列出跨度数、日期和时间以及单元格的时间间隔。
探索延迟时间百分位数和错误率:
如需查看延迟时间趋势,请将图表视图菜单设置为跨度时长(百分位)。 时长图表会显示第 50、第 90、第 95 和第 99 百分位。
如需查看响应状态随时间变化的情况,请将图表视图菜单设置为跨度比率。该图表会显示发送到您项目的 span 的速率。
如需查找离群值,请选择 Span 标签页,然后按时长对表格进行排序。
如果您想详细了解某个 span,请选择该 span。系统会打开一个弹出式窗口,其中显示了相应 span 在其跟踪记录中的上下文。然后,您可以探索 span 和 trace。
如需探索为每个服务生成的 span 数量以及统计信息,请选择分组标签页:
- 每行对应于一项特定服务和 span 名称。
- 您可以按“时长”标题对行进行排序。
如果您想详细了解特定分组,请选择相应行的 span 名称。系统会打开一个弹出式窗口,其中显示了相应 span 在其跟踪记录中的上下文。然后,您可以探索 span 和轨迹。
如需限制显示哪些 span,请添加过滤条件。 如需详细了解如何过滤轨迹数据,请参阅下一部分。
过滤轨迹数据
如需仅显示您感兴趣的信息,请应用过滤条件。 过滤条件用于限制显示的数据。例如,您可以按服务名称和状态进行过滤。或者,如果您已将应用部署到 App Hub,则可能只想查看应用或应用中的特定服务或工作负载的跟踪记录数据。
添加或移除过滤条件后,Trace 探索器页面显示的数据会刷新,并且仅显示与所有已应用的过滤条件匹配的 span。
按 ID 过滤轨迹
在排查突发事件或故障时,您可能知道轨迹 ID。如需探索相应轨迹,请前往工具栏,依次点击网页浏览 搜索轨迹,然后输入轨迹 ID。
当您输入有效 ID 后,系统会打开详情弹出式菜单,其中显示了有关相应跟踪记录及其 span 的信息。您可以使用该窗格中的选项来探索轨迹。例如,您可以搜索跨度中的关键字。
应用跨度过滤条件
跨度过滤条件窗格列出了最常见的过滤条件。您可以从任何子类别中选择多个条目。添加或移除过滤条件时,过滤条件栏也会随之更新。
所有菜单的值均派生自您的轨迹数据。如果某个菜单包含不含任何文字的选项,则该选项是指不包含相应属性的 span。
以下是通常可用的跨度过滤条件:
- OpenTelemetry 服务:按
service.name属性过滤。 - Span 名称:span 的名称。
- span 状态:请求状态。如需了解这些值,请参阅 OpenTelemetry SpanStatus 文档。
- 时长:时间段的时长。
- Span kind:描述 span 之间的关系。如需了解这些值,请参阅 OpenTelemetry SpanKind 文档。
- App Hub 应用:按
gcp.apphub.application.id资源属性过滤。 - App Hub 服务:按
gcp.apphub.service.id资源属性过滤。 - App Hub 工作负载:按
gcp.apphub.workload.id资源属性进行过滤。
如果您想按时间段过滤条件窗格中未列出的属性进行过滤,请使用过滤条件栏。
使用过滤条件栏
借助过滤条件栏,您可以应用具有预定义过滤条件键和您所选值的过滤条件,也可以同时输入键和值。
如需添加过滤条件,请选择添加过滤条件,然后执行以下任一操作:
- 选择一个已定义的键,例如 Span name,然后从二级菜单中选择一个值。
选择添加属性过滤条件,然后添加自定义键和值。 如果您输入自己的过滤键,请使用与 span 上属性的键相同的语法。
例如,如需按主机标识符过滤,请将键设置为
host.id。同样,如需按状态代码过滤,请将键设置为/http/status_code。在这种情况下,您可能会将值设置为200,从而生成过滤条件/http/status_code: 200。如需让过滤条件匹配任何值,请选择任意值。
按应用过滤
您为应用添加的插桩生成的跟踪记录 span 可包含以下资源属性:
gcp.apphub.application.{container,id,location}gcp.apphub.{workload,service}.{criticality_type,environment_type,id}
Trace 探索器页面包含以下范围过滤条件,这些过滤条件的菜单会列出已向 App Hub 注册的应用、服务和工作负载:
- App Hub 应用:按
gcp.apphub.application.id资源属性过滤。 - App Hub 服务:按
gcp.apphub.service.id资源属性过滤。 - App Hub 工作负载:按
gcp.apphub.workload.id资源属性进行过滤。
如需了解如何对应用进行插桩,以便跟踪记录 span 包含特定于应用的属性,请参阅通过插桩监控应用。
探索轨迹
本部分介绍了如何在轨迹的上下文中探索 span:
打开并配置 Trace 探索器页面。如需了解这些步骤,请参阅查看汇总的轨迹数据。
如需查看 span 或轨迹的详细信息,请执行以下任一操作:
前往 Trace 探索器页面的表格部分,然后从表格部分中选择一个条目。您可以按任意表头对表格的行进行排序。您可以应用过滤条件来限制表格中显示的 span。
前往 Trace 探索器页面的工具栏,依次点击网页浏览 搜索轨迹,然后输入轨迹 ID。
系统会打开详情弹出式菜单,并显示轨迹及其 span。系统会显示所选 span 或轨迹的详细信息:
- 名称列显示调用层次结构,第一个条目包含轨迹 ID。此列可能还会包含注释,指明是否有生成式 AI 事件或日志数据可用。
- 如果设置了 OpenTelemetry 属性
service.name,系统会从中提取服务列。如果该属性未设置,并且服务正在 App Engine 上运行,系统会显示 App Engine 服务名称。否则,未指定任何服务。 - 延迟时间条的长度表示延迟时间值。
- 延迟时间条的颜色表示状态。蓝色延迟时间条表示成功完成,而红色延迟时间条表示发生了错误。
- 延迟时间条上的圆圈表示日志条目或事件与相应 span 相关联。如需更改此行为,请使用日志和事件菜单。
如需探索轨迹,请执行以下操作:
使用指针选择不同的时间段。选择 span 后,页面上的标签页会刷新,以显示该 span 的属性、日志条目和事件。
如需在轨迹中搜索跨度的关键字,请使用在轨迹中查找字段。
搜索仅适用于 span 名称、服务名称和属性字段。 您只能按纯文本进行搜索,无法搜索日志、事件或元数据。
例如,如果您输入
GET,则 span 名称、服务名称或属性窗格中显示的GET(忽略大小写)文本会突出显示。
查看属性、日志条目和事件
跨度的详细信息弹出式菜单包含以下各个标签页:
属性:此标签页列出了附加到 span 的标签。 如需了解标签,请参阅跟踪记录标签。
日志和事件:此标签页会列出
trace_id和span_id字段与所选 span 匹配的事件和日志条目。系统只会显示您有权查看的日志条目。如需探索此标签页上的条目,请点击 keyboard_arrow_down 显示更多。
如果您更喜欢使用“日志浏览器”页面查看日志数据,请点击查看日志。查询设置为过滤到特定轨迹、span 和时间范围。
堆栈轨迹:列出可用的堆栈轨迹。
元数据和链接:列出有关 span 的一般信息:
详细信息可能还包括一个名为输入/输出的标签页。此标签页会显示生成式 AI 事件。
查看生成式 AI 事件
如需查看与生成式 AI 代理相关的事件,请使用输入/输出标签页。此标签页会显示遵循 OpenTelemetry 生成式 AI 语义惯例的事件。
支持两种配置:
以属性形式附加到 span 的基于文本的提示和回答,这些属性是描述某些特征或事件的键值对。例如,键
gen_ai.system的值用于标识提供生成式 AI 功能的系统。生成式 AI 属性的键以gen_ai开头。存储在 Cloud Storage 存储桶中的多模态提示和回答。Cloud Trace 会通过关联您的轨迹和日志数据来识别这些事件。如需了解受支持的配置,请参阅收集和查看多模态提示和回答。
以下屏幕截图展示了 Trace 探索器页面如何呈现附加到 span 的基于文本的生成式 AI 事件:
如需了解生成上一个屏幕截图的示例应用,请参阅使用 OpenTelemetry 对 LangGraph ReAct 智能体进行插桩。