Cloud Network Insights 概览

Cloud Network Insights 是一种开箱即用的解决方案,由 Broadcom 旗下的 AppNeta 合作提供,可帮助您了解复杂的多云和混合环境中的网络运行状况和应用性能。

借助 Cloud Network Insights,您的网络和运维团队可以监控网络,以确定应用性能下降是由于网络还是应用本身造成的。性能下降的来源可能在Google Cloud、第三方云服务提供商、本地最后一公里连接或互联网中。

Cloud Network Insights 使用主动合成探测技术,从用户或应用的角度监控这些复杂的路径,即使没有用户流量,您也可以监控网络路由。这样,您就可以在潜在问题影响业务之前发现它们。

特性和优势

Cloud Network Insights 具有以下优势:

  • 主动检测:通过合成测试识别网络和应用性能问题,通常在这些问题影响用户之前就能发现。
  • 端到端的可视性:监控您不拥有的网络(例如 ISP 链接和第三方云服务)中的路径。
  • 快速进行根本原因分析:快速区分网络问题、应用级问题或浏览器性能影响。
  • SLA 验证:获取指标以验证 ISP 和其他服务提供商是否履行了其性能承诺。
  • Web 应用洞见:衡量 Web 应用的用户体验指标,例如 DNS 解析时间或全功能浏览器网页加载时间。
  • 集成式监控:直接在Google Cloud中访问指标和日志,利用 Cloud Monitoring 和 Cloud Logging 实现信息中心和提醒功能。

Cloud Network Insights 的工作原理

Cloud Network Insights 会执行主动的合成探测,以从整个网络中收集实时性能遥测数据。监控点(轻量级监控代理软件)通过互联网与中央 Cloud Network Insights 控制平面(托管在 Google Cloud 上并由 AppNeta 管理)安全地通信,从而发送其收集的数据并接收配置更新。

Cloud Network Insights 可捕获数据包级时间、路径跳数和应用响应代码等元素,以直观呈现网络路由的健康状况。通过专业分析引擎处理这些数据后,Cloud Network Insights 会将结果导出到 Google Cloud Observability,以便您统一查看网络健康状况。

如需使用 Cloud Network Insights 监控网络,请执行以下操作:

  1. 部署监控点。这些是合成探测的来源,也可以是探测的目标或目标。
  2. 配置监控政策。这些政策会告知监控点要探测的内容(网络路径或 Web 路径)以及运行测试的频率。
  3. 创建闹钟。AppNeta 中的警报可识别持续的网络中断,并将日志和事件发送到 Google Cloud Observability 以进行提醒和通知。
  4. 设置提醒和通知。配置 Google Cloud 提醒政策,以便通过电子邮件、Slack、PagerDuty 或其他通知渠道通知您的团队。
  5. 分析指标。Cloud Network Insights 提供网络路径的逐跳可视化视图,并将遥测数据导出到 Google Cloud Observability 以用于提醒和信息中心。

监控点

监控点是执行合成探测的软件代理。您可以将它们部署到代表用户群或应用后端的重要网段,以监控网络或 Web 应用性能。例如,您可以将监控点部署到中央 VPC、远程分支机构或离客户最近的特定云区域。

您可以将监控点部署为容器或虚拟设备,部署到云端或本地网络。

监控政策

监控政策是一组用于控制监控行为的规则。它们将监控点(来源)与目的地(目标)相关联。监控政策决定了哪些监控点运行测试、测试哪些目标以及测试频率。

监控路径

监控政策会生成路径,直观呈现探测数据包所采用的路由。Cloud Network Insights 支持两种类型的监控路径:网络路径网页路径

  • 网络路径:网络路径可直观呈现来源与目的地之间的基础设施(第 3 层和第 4 层),并显示每个跃点。此信息用于准确确定网络中出现问题的位置(例如特定 ISP 路由器或混合网关)。它会捕获往返时间 (RTT)、丟包、抖动和路径更改等指标。这些路径以两种模式运行:
    • 单端路径:监控点探测安装监控点的外部目标(例如 google.com、SaaS VIP 或路由器)。此方法依赖于标准协议(ICMP、TCP、UDP 或 Echo),非常适合监控公开目标或第三方目标。
    • 双端路径:监控点探测不同的监控点或全局监控目标。由于您控制着两端,因此该模式可提供更丰富的数据,包括精确的单向延迟时间、抖动,以及检测不对称路由(例如上传与下载采用不同的路径)的能力。
  • Web 路径:提供对 Web 应用(第 7 层)端到端体验的监控。这些路径以两种模式运行:
    • 浏览器:监控点使用真实的浏览器引擎 (Selenium) 加载完整的网页、执行 JavaScript 并呈现内容。此指标用于衡量完整的网页加载时间,并验证实际的用户体验。
    • HTTP:监控点向网址或 API 端点发送合成 HTTP 或 HTTPS 请求。这样一来,无需加载整个网页,即可对服务器可用性、响应时间和 TLS 或 DNS 性能进行轻量级检查。

闹钟

告警是可识别持续性网络问题的智能层,表示网络健康状况发生了变化。它们由 AppNeta 中的提醒规则创建,这些规则定义了指标阈值以及指标在一段时间内必须超出该阈值(违规)多少次才能触发事件。然后,这些事件会发送到 Cloud Logging。

指标和日志

所有收集的遥测数据都会导出到 Google Cloud Observability,以便您在单一管理平台上直观呈现网络架构和性能。遥测数据会发送到 Cloud Monitoring 或 Cloud Logging,具体取决于数据类型。

  • Cloud Monitoring(指标):定量性能数据会导出为标准 Google Cloud 指标。
    • 网络健康状况:包括往返时间(最短、平均和最长)、丟包百分比和抖动等指标。
    • Web 体验:包括总交易时间、DNS 查找时间、第一字节时间 (TTFB) 和 HTTP 状态代码等指标。
  • Cloud Logging(事件):定性状态变化和闹钟会导出为结构化日志。您可以在 Logs Explorer 中查询这些日志,以执行根本原因分析或创建基于日志的提醒,以便立即收到通知。
    • networkmanagement.googleapis.com/insights_alarm:当效果偏离您定义的基准时触发。
    • networkmanagement.googleapis.com/insights_event:由结构性变化触发,例如监控点离线并再次上线,或网络路由发生变化(路径变化)。

提醒和通知

提醒政策是 Google Cloud Observability 中向您的团队发送通知的机制。

  • 基于日志的提醒:Cloud Network Insights 利用基于日志的提醒政策。当闹钟触发时,它会将结构化日志条目 (networkmanagement.googleapis.com/insights_alarm) 写入 Cloud Logging。
  • 预定义模板:为简化配置,Cloud Network Insights 在 Google Cloud 控制台中提供了预定义的提醒政策模板。借助这些模板,您可以快速为常见场景(例如 Critical Network Alarm)创建政策。
  • 通知渠道:提醒政策会连接到您现有的Google Cloud 通知渠道,让您可以通过电子邮件、Slack、PagerDuty、短信或 Pub/Sub 接收 Cloud Network Insights 提醒。

操作和平台

Cloud Network Insights 管理任务在 Google Cloud 和 AppNeta 之间分配。下表将常见操作映射到执行这些操作的正确平台。

操作 接口 说明
部署监控点 Google Cloud 控制台 您可以在此处下载安装软件包(Docker、Helm、OVA)并查看监控点的连接状态(有效或离线)。
查看监控点 Google Cloud 控制台 查看代理群组、检查软件版本,并确定哪些监控点需要升级。
创建监控政策 AppNeta 定义测试规则,包括来源、目标和配置文件。这些政策会生成用于收集遥测数据的有效网络路径和 Web 路径。
查看概要指标 Google Cloud 控制台 直接在 Cloud Monitoring 信息中心内查看路径的标准性能指标(延迟时间、丢包率、抖动)。
深入问题排查 AppNeta 查看高级诊断信息,例如逐跳路由可视化图表 (TruPath) 或 Web 交易的时间表图。
创建闹钟规则 AppNeta 定义触发向Google Cloud发送事件和日志的阈值。
配置提醒政策和通知 Google Cloud 控制台 使用基于日志的提醒政策配置通知政策(电子邮件、Slack、PagerDuty 或 Pub/Sub)。

数据同步

虽然配置在两个位置进行,但数据会同步回Google Cloud:

  • 指标:由监控点收集的性能数据会导出到 Cloud Monitoring。
  • 日志:由 AppNeta 生成的警报和事件会导出到 Cloud Logging。