Cloud Network Insights 是一种开箱即用的解决方案,由 Broadcom 旗下的 AppNeta 合作提供,可帮助您了解复杂的多云和混合环境中的网络运行状况和应用性能。
借助 Cloud Network Insights,您的网络和运维团队可以监控网络,以确定应用性能下降是由于网络还是应用本身造成的。性能下降的来源可能在Google Cloud、第三方云服务提供商、本地最后一公里连接或互联网中。
Cloud Network Insights 使用主动合成探测技术,从用户或应用的角度监控这些复杂的路径,即使没有用户流量,您也可以监控网络路由。这样,您就可以在潜在问题影响业务之前发现它们。
特性和优势
Cloud Network Insights 具有以下优势:
- 主动检测:通过合成测试识别网络和应用性能问题,通常在这些问题影响用户之前就能发现。
- 端到端的可视性:监控您不拥有的网络(例如 ISP 链接和第三方云服务)中的路径。
- 快速进行根本原因分析:快速区分网络问题、应用级问题或浏览器性能影响。
- SLA 验证:获取指标以验证 ISP 和其他服务提供商是否履行了其性能承诺。
- Web 应用洞见:衡量 Web 应用的用户体验指标,例如 DNS 解析时间或全功能浏览器网页加载时间。
- 集成式监控:直接在Google Cloud中访问指标和日志,利用 Cloud Monitoring 和 Cloud Logging 实现信息中心和提醒功能。
Cloud Network Insights 的工作原理
Cloud Network Insights 会执行主动的合成探测,以从整个网络中收集实时性能遥测数据。监控点(轻量级监控代理软件)通过互联网与中央 Cloud Network Insights 控制平面(托管在 Google Cloud 上并由 AppNeta 管理)安全地通信,从而发送其收集的数据并接收配置更新。
Cloud Network Insights 可捕获数据包级时间、路径跳数和应用响应代码等元素,以直观呈现网络路由的健康状况。通过专业分析引擎处理这些数据后,Cloud Network Insights 会将结果导出到 Google Cloud Observability,以便您统一查看网络健康状况。
如需使用 Cloud Network Insights 监控网络,请执行以下操作:
- 部署监控点。这些是合成探测的来源,也可以是探测的目标或目标。
- 配置监控政策。这些政策会告知监控点要探测的内容(网络路径或 Web 路径)以及运行测试的频率。
- 创建闹钟。AppNeta 中的警报可识别持续的网络中断,并将日志和事件发送到 Google Cloud Observability 以进行提醒和通知。
- 设置提醒和通知。配置 Google Cloud 提醒政策,以便通过电子邮件、Slack、PagerDuty 或其他通知渠道通知您的团队。
- 分析指标。Cloud Network Insights 提供网络路径的逐跳可视化视图,并将遥测数据导出到 Google Cloud Observability 以用于提醒和信息中心。
监控点
监控点是执行合成探测的软件代理。您可以将它们部署到代表用户群或应用后端的重要网段,以监控网络或 Web 应用性能。例如,您可以将监控点部署到中央 VPC、远程分支机构或离客户最近的特定云区域。
您可以将监控点部署为容器或虚拟设备,部署到云端或本地网络。
监控政策
监控政策是一组用于控制监控行为的规则。它们将监控点(来源)与目的地(目标)相关联。监控政策决定了哪些监控点运行测试、测试哪些目标以及测试频率。
监控路径
监控政策会生成路径,直观呈现探测数据包所采用的路由。Cloud Network Insights 支持两种类型的监控路径:网络路径和网页路径。
- 网络路径:网络路径可直观呈现来源与目的地之间的基础设施(第 3 层和第 4 层),并显示每个跃点。此信息用于准确确定网络中出现问题的位置(例如特定 ISP 路由器或混合网关)。它会捕获往返时间 (RTT)、丟包、抖动和路径更改等指标。这些路径以两种模式运行:
- 单端路径:监控点探测未安装监控点的外部目标(例如
google.com、SaaS VIP 或路由器)。此方法依赖于标准协议(ICMP、TCP、UDP 或 Echo),非常适合监控公开目标或第三方目标。 - 双端路径:监控点探测不同的监控点或全局监控目标。由于您控制着两端,因此该模式可提供更丰富的数据,包括精确的单向延迟时间、抖动,以及检测不对称路由(例如上传与下载采用不同的路径)的能力。
- 单端路径:监控点探测未安装监控点的外部目标(例如
- Web 路径:提供对 Web 应用(第 7 层)端到端体验的监控。这些路径以两种模式运行:
- 浏览器:监控点使用真实的浏览器引擎 (Selenium) 加载完整的网页、执行 JavaScript 并呈现内容。此指标用于衡量完整的网页加载时间,并验证实际的用户体验。
- HTTP:监控点向网址或 API 端点发送合成 HTTP 或 HTTPS 请求。这样一来,无需加载整个网页,即可对服务器可用性、响应时间和 TLS 或 DNS 性能进行轻量级检查。
闹钟
告警是可识别持续性网络问题的智能层,表示网络健康状况发生了变化。它们由 AppNeta 中的提醒规则创建,这些规则定义了指标阈值以及指标在一段时间内必须超出该阈值(违规)多少次才能触发事件。然后,这些事件会发送到 Cloud Logging。
指标和日志
所有收集的遥测数据都会导出到 Google Cloud Observability,以便您在单一管理平台上直观呈现网络架构和性能。遥测数据会发送到 Cloud Monitoring 或 Cloud Logging,具体取决于数据类型。
- Cloud Monitoring(指标):定量性能数据会导出为标准 Google Cloud 指标。
- 网络健康状况:包括往返时间(最短、平均和最长)、丟包百分比和抖动等指标。
- Web 体验:包括总交易时间、DNS 查找时间、第一字节时间 (TTFB) 和 HTTP 状态代码等指标。
- Cloud Logging(事件):定性状态变化和闹钟会导出为结构化日志。您可以在 Logs Explorer 中查询这些日志,以执行根本原因分析或创建基于日志的提醒,以便立即收到通知。
networkmanagement.googleapis.com/insights_alarm:当效果偏离您定义的基准时触发。networkmanagement.googleapis.com/insights_event:由结构性变化触发,例如监控点离线并再次上线,或网络路由发生变化(路径变化)。
提醒和通知
提醒政策是 Google Cloud Observability 中向您的团队发送通知的机制。
- 基于日志的提醒:Cloud Network Insights 利用基于日志的提醒政策。当闹钟触发时,它会将结构化日志条目 (
networkmanagement.googleapis.com/insights_alarm) 写入 Cloud Logging。 - 预定义模板:为简化配置,Cloud Network Insights 在 Google Cloud 控制台中提供了预定义的提醒政策模板。借助这些模板,您可以快速为常见场景(例如
Critical Network Alarm)创建政策。 - 通知渠道:提醒政策会连接到您现有的Google Cloud 通知渠道,让您可以通过电子邮件、Slack、PagerDuty、短信或 Pub/Sub 接收 Cloud Network Insights 提醒。
操作和平台
Cloud Network Insights 管理任务在 Google Cloud 和 AppNeta 之间分配。下表将常见操作映射到执行这些操作的正确平台。
| 操作 | 接口 | 说明 |
|---|---|---|
| 部署监控点 | Google Cloud 控制台 | 您可以在此处下载安装软件包(Docker、Helm、OVA)并查看监控点的连接状态(有效或离线)。 |
| 查看监控点 | Google Cloud 控制台 | 查看代理群组、检查软件版本,并确定哪些监控点需要升级。 |
| 创建监控政策 | AppNeta | 定义测试规则,包括来源、目标和配置文件。这些政策会生成用于收集遥测数据的有效网络路径和 Web 路径。 |
| 查看概要指标 | Google Cloud 控制台 | 直接在 Cloud Monitoring 信息中心内查看路径的标准性能指标(延迟时间、丢包率、抖动)。 |
| 深入问题排查 | AppNeta | 查看高级诊断信息,例如逐跳路由可视化图表 (TruPath) 或 Web 交易的时间表图。 |
| 创建闹钟规则 | AppNeta | 定义触发向Google Cloud发送事件和日志的阈值。 |
| 配置提醒政策和通知 | Google Cloud 控制台 | 使用基于日志的提醒政策配置通知政策(电子邮件、Slack、PagerDuty 或 Pub/Sub)。 |
数据同步
虽然配置在两个位置进行,但数据会同步回Google Cloud:
- 指标:由监控点收集的性能数据会导出到 Cloud Monitoring。
- 日志:由 AppNeta 生成的警报和事件会导出到 Cloud Logging。