Cloud Network Insights 概览

Cloud Network Insights 由 Broadcom 与 AppNeta 合作提供,可让您了解多云和混合环境中的网络运行状况和应用性能。

借助 Cloud Network Insights,您的网络和运营团队可以监控网络,以确定应用性能下降是由于网络还是应用本身造成的。性能下降的来源可能是 Google Cloud、第三方云服务提供商、与 本地网络的最后一英里连接或互联网。

Cloud Network Insights 使用主动合成探测从用户或应用的角度监控这些路径,让您即使在没有用户流量的情况下也能监控网络路由。然后,您可以在潜在问题影响用户之前发现这些问题。

特性和优势

Cloud Network Insights 具有以下优势:

  • 主动检测:通过合成测试识别网络和应用性能 问题,通常在这些问题影响用户之前就能发现。
  • 端到端可见性:监控您不拥有的网络(例如 ISP 链接和第三方云服务)中的路径。
  • 快速根本原因分析:快速区分网络 问题、应用级问题或浏览器性能影响。
  • SLA 验证:获取指标以验证 ISP 和其他服务 提供商是否履行其性能承诺。
  • Web 应用洞见:衡量 Web 应用的用户体验指标,例如 DNS 解析时间或完整的浏览器网页加载时间。
  • 集成式监控:直接在 Google Cloud中访问指标和日志,利用 Cloud Monitoring 和 Cloud Logging 实现信息中心 和提醒功能。

Cloud Network Insights 的工作原理

Cloud Network Insights 执行主动合成探测,以从整个网络中收集实时性能遥测数据。监控点(轻量级 监控代理软件)通过互联网与中央 Cloud Network Insights 控制平面安全通信,发送其收集的数据并接收配置 更新。该控制平面托管在 AppNeta 上并由 AppNeta Google Cloud 管理。

Cloud Network Insights 会捕获数据包级计时、路径跃点和应用响应代码等元素,以直观呈现网络路由的运行状况。Cloud Network Insights 通过专用分析引擎处理这些数据后,会使用 Google Cloud Observability 导出结果,以提供网络运行状况的统一视图。

如需使用 Cloud Network Insights 监控网络,请执行以下操作:

  1. 部署监控点。 这些是合成探测的来源,也可以是探测的目标或目标。
  2. 配置监控政策。这些政策会告知监控点要探测的内容(网络路径或 Web 路径)以及运行测试的频率。
  3. 设置闹钟和日志记录。AppNeta 中的闹钟会识别持续的网络中断,并将日志和事件发送到 Google Cloud Observability 以进行提醒和通知。
  4. 设置提醒和通知。配置 Google Cloud 提醒 政策,以使用电子邮件、Slack、PagerDuty 或其他 通知渠道通知您的团队。
  5. 分析指标。Cloud Network Insights 提供网络路径的逐跃点可视化效果,并将遥测数据导出到 Google Cloud Observability 以进行提醒和信息中心显示。

监控点

监控点是执行合成探测的软件代理。您可以将它们部署到代表用户群或应用后端的关键网络分段,以监控网络或 Web 应用性能。例如,您可以将监控点部署到中央 VPC、远程分支机构或离客户最近的特定云区域。

您可以将监控点作为容器或虚拟设备部署到云端或本地网络。

监控政策

监控政策是一组用于控制监控行为的规则。它们将监控点(来源)链接到目标位置(目标)。监控政策决定哪些监控点运行测试、针对哪些目标以及运行测试的频率。

监控路径

监控政策会生成 路径( 探测数据包所采用路由的可视化效果)。Cloud Network Insights 支持两种类型的监控路径:网络路径Web 路径

  • 网络路径:网络路径提供来源和目标之间基础架构(第 3 层和第 4 层)的逐跃点可视化效果。这用于准确识别网络中出现问题的位置(例如特定 ISP 路由器或混合网关)。它会捕获往返时间 (RTT)、丢包丟包、抖动和路径更改等指标。这些路径以两种模式运行:
    • 单端路径:监控点探测未安装监控点的外部目标 (例如 google.com、SaaS VIP 或路由器)。这依赖于标准协议(ICMP、TCP、UDP 或 Echo),非常适合监控公共或第三方目标。
    • 双端路径:监控点探测不同的监控点或全局监控目标。由于您可以控制两端,因此这种模式提供更丰富的数据,包括精确的单向延迟时间、抖动,以及检测不对称路由(例如上传与下载的不同路径)的能力。
  • **Web 路径**:提供 Web 应用(第 7 层)的端到端体验监控。这些路径以两种模式运行:
    • 浏览器:监控点使用真实的浏览器引擎 (Selenium) 加载完整的网页、执行 JavaScript 并呈现 内容。这会衡量完整的网页加载时间并验证实际的用户体验。
    • HTTP:监控点向网址或 API 端点发送合成 HTTP 或 HTTPS 请求。这会创建一个轻量级检查,用于检查服务器可用性、响应时间和 TLS 或 DNS 性能,而无需加载完整网页的开销。

闹钟

闹钟是识别持续网络问题的智能层,代表网络运行状况的状态变化。它们由 AppNeta 中的闹钟规则 创建,这些规则定义了指标阈值以及指标在一段时间内必须 超出该阈值(违规)的次数,以触发事件。然后,这些事件会发送到 Cloud Logging。

指标和日志

所有收集的遥测数据都会导出到 Google Cloud Observability,以便在单一管理平台中直观呈现网络架构和性能。根据数据类型 ,遥测数据会发送到 Cloud MonitoringCloud Logging

  • Cloud Monitoring(指标):定量性能数据会 导出为标准 Google Cloud 指标。
    • **网络运行状况**:包括最低、平均和最高 往返时间、丟包率和抖动等指标。
    • **Web 体验**:包括总事务时间、DNS 查找时间、首字节时间 (TTFB) 和 HTTP 状态代码等指标。
  • Cloud Logging(事件):定性状态变化和闹钟会 导出为结构化日志。您可以在 Logs Explorer 中查询这些日志,以执行根本原因分析或创建基于日志的提醒以进行即时通知。
    • networkmanagement.googleapis.com/insights_alarm:当性能偏离您定义的基准时触发。
    • networkmanagement.googleapis.com/insights_event:由结构性更改触发,例如监控点离线并再次上线,或网络路由更改(路径更改)。

提醒和通知

提醒政策是 Google Cloud Observability 中 向您的团队发送通知的机制。

  • 基于日志的提醒: Cloud Network Insights 利用基于日志的提醒 政策。当闹钟触发时,它会将结构化日志条目 (networkmanagement.googleapis.com/insights_alarm) 写入 Cloud Logging。
  • 预定义模板: 为了简化配置,Cloud Network Insights 在 Google Cloud 控制台中提供了预定义的提醒政策模板。借助这些模板,您可以快速为常见场景(例如 Critical Network Alarm)创建政策。
  • 通知渠道:提醒政策会连接到您现有的 Google Cloud 通知渠道,让您能够使用电子邮件、Slack、PagerDuty、短信或 Pub/Sub 接收 Cloud Network Insights 提醒。

操作和平台

Cloud Network Insights 管理任务在 Google Cloud 和 AppNeta 之间拆分。下表将常见操作映射到您执行这些操作的正确平台。

操作 接口 说明
部署监控点 Google Cloud 控制台 在此处下载安装软件包(Docker、Helm、OVA)并查看监控点的连接状态(活跃或离线)。
查看监控点 Google Cloud 控制台 查看代理舰队、检查软件版本,并确定哪些监控点需要升级。
创建监控政策 AppNeta 定义测试规则,包括来源、目标和配置文件。这些政策会生成收集遥测数据的主动网络路径和 Web 路径。
查看高级指标 Google Cloud 控制台 直接在 Cloud Monitoring 信息中心内查看路径的标准性能指标(延迟时间、丢包率、抖动)。
深入排查问题 AppNeta 查看高级诊断信息,例如逐跃点路由可视化效果 (TruPath) 或 Web 事务的时间表图。
创建闹钟规则 AppNeta 定义触发事件和日志发送到 Google Cloud的阈值。
配置提醒政策和通知 Google Cloud 控制台 使用基于日志的提醒政策配置通知政策(电子邮件、Slack、PagerDuty 或 Pub/Sub)。

数据同步

虽然配置在两个位置进行,但数据会同步回 Google Cloud:

  • 指标:监控点收集的性能数据会导出到 Cloud Monitoring。
  • 日志:AppNeta 生成的闹钟和事件会导出到 Cloud Logging。