在设备管理控制台中监控作业

监控标签页中,您可以查看和管理由设备管理控制台管理的备份/恢复设备中的作业(取消有效作业或更改排队作业的作业优先级)。您还可以查看事件,这些事件是设备引发的信息、警告或错误通知。

您可以按名称、状态、开始或结束时间、类型、主机和应用过滤作业。

作业状态面板

设备管理控制台的作业面板提供有关过去 24 小时内(默认)运行的作业的信息。

  • 当前或过往工作经历。快速查看有多少作业正在运行、已成功完成、失败、已重试或已取消。
  • 服务类型或设备。链接到经过过滤的监控器,以显示过去 24 小时内按服务类型或按受管理的备份/恢复设备划分的作业状态。

在“过去作业”部分,您还可以根据需要查看上周或上个月的状态。此面板每两分钟提取一次最新数据。

监控作业

请按照以下说明监控作业:

  1. 点击监控标签页,然后从下拉菜单中选择作业,以打开作业页面,您可以在其中查看正在运行的所有作业的列表。 选择正在运行过滤条件,以显示所有正在监控的作业。
  2. 如需修改表格中字段的显示方式,您可以执行以下操作:

    • 按关键字搜索。作业视图中按作业名称、主机和应用过滤,或在事件视图中按事件消息过滤,现在会自动提交。当您输入查询时,系统会更新结果集。 按关键字搜索不区分大小写。
    • 已开始、已结束和已排队。这些过滤器的单选按钮可用于选择跨越一天、一周或一个月的日期范围。
    • 调整字段。您可以使用工具栏右上角的选项来设置列的显示或隐藏状态,以及设置要显示的行数。
    • 调整列宽。如需调整表格列的宽度以在表格中显示更多内容,请向左或向右拖动列标题中的列分隔线,以调整列宽。列分隔线以一对细灰色线条表示。
    • 自动刷新。每 15 秒更新一次监控网格视图。
    • 监控页面会显示上次刷新时间和下次刷新时间。您可以随时执行手动刷新。
  3. 如需将作业列表导出为 PDF,请点击导出图标。

  4. 如需修改表格页面中显示的行数,您可以从表格底部的下拉列表中进行选择。 您可以选择每页表格显示 10 行、25 行、50 行、100 行或 500 行。

  5. 如需过滤作业列表以仅查看部分作业,请点击打开过滤条件以打开过滤条件面板。选择过滤条件,然后点击更新过滤条件

  6. 如需查看特定作业的详细信息,请在作业列表中选择相应项,然后执行以下任一操作:

    • 点击状态列中关联作业的状态链接。
    • 点击页面右下角的查看详情
  7. 系统会打开作业详情页面。在此页面上,您可以查看以下内容:

    • 有关作业的详细信息
    • 流量信息
    • 作业重试次数
    • 作业统计信息

    如需详细了解这些方面,请参阅查看作业详情

  8. 查看完作业详情后,点击返回到作业以返回到作业页面。

作业状态

作业在任何时候都可能处于下表中所述的状态之一:

  • 已取消。作业被用户取消,或因目标资源池超出安全限值而被系统自动取消。
  • 失败。作业未能按备份方案中的时间段成功运行。如果作业失败,系统会创建一个包含作业失败信息的事件。如果备份方案周期内还有时间,系统会重试原始作业,并排队等待执行一个相同的新作业。
  • 未运行。作业因某些限制条件(例如调度程序已停用、目标池已满、源映像缺失或不合适、存在连接问题或没有可用的作业槽)而无法在备份方案周期内运行。
  • 已加入队列。如果某项政策要求运行作业,系统会创建一个状态为已加入队列的作业。如果没有限制,则进入 running 状态。如果存在限制条件导致其无法运行,则该作业会继续排队。如果限制在下一次运行同一政策实例之前仍然存在,则作业会被赋予 notrun 状态,并且系统会添加一个具有相同作业 ID 并在其后附加一个字母的新作业实例,该实例处于排队状态。
  • Queued_Readiness。作业状态仅适用于“转移到 OnVault”和“直接转移到 OnVault”作业。当执行检查以确定 OnVault 池是否已准备好处理排队的作业时,系统会显示此消息。如果没有可用的 OnVault 池,系统会显示 Queued_Readiness 状态。
  • 已重试。作业未完成。作业进入重试状态。 如果备份方案周期内还有时间,系统会重试原始作业,并排队等待具有相同作业 ID 且附加了字母的新作业实例。在每次作业失败后,系统会尝试重试 3 次,分别在 4 分钟、16 分钟和 64 分钟后进行。当备份计划时间用完或作业的另一个实例开始时,原始作业会失败,并以重试状态启动重试作业。重试作业的作业 ID 会附加字母。
  • 正在跑步。作业正在处理中。状态会显示作业的完成百分比。
  • 已成功,但存在警告。根据调用作业的备份方案,该作业已成功完成,但同时还打印了一条警告,您可以在监控 > 事件中查看该警告。一个典型示例是,Compute Engine 实例快照成功创建,但元数据上传到 OnVault 失败。
  • 成功。作业已根据调用它的备份方案成功完成。

查看作业详情

作业详情窗口中,您可以查看以下内容:

  • 有关作业的详细信息
  • 流量信息
  • 作业重试次数
  • 作业统计信息

查看完作业详情后,点击返回到作业以返回到作业页面。

以下列表提供了作业详情的说明。

  • 应用名称。应用名称,不一定具有唯一性。
  • 应用类型。应用类型,例如 SQL Server、Oracle、文件系统或整个虚拟机。
  • 容量。每个卷的容量。
  • 一致性模式。崩溃一致或应用一致,表示作业期间应用是否处于静止状态。
  • 时长。开始日期和结束日期之间的时间。
  • 结束日期。作业完成的日期和时间。
  • 错误代码。0 表示没有错误,非零值表示运行作业时遇到的错误。
  • 活动 ID。与作业关联的任何事件 ID。如果没有事件 ID,则值为 0。
  • 消息。一条消息,用于说明运行作业时遇到的错误。
  • 失效日期。相应图片即将失效的日期和时间。
  • 主机名。应用运行的主机的名称。
  • 图片类型。快照、云端,作业创建的图片类型。
  • isbootvmdk。如果映像中存在启动卷,则将该卷设置为 true。
  • Islvm。对于每个卷,是否为逻辑卷管理器卷。
  • 任务 ID。用于标识作业的唯一编号。
  • 最后约束日期。作业最近一次运行的日期。
  • 日志被截断。设置为 true 可表明日志已针对相应应用截断。
  • logicalname。主机系统识别的每个卷的名称。
  • 已装载的主机。对于装载故障切换作业,指装载映像的主机。
  • 政策名称。与作业关联的政策的名称。
  • 优先级。低、中或高,在政策中设置。
  • 受保护的数据。受保护的数据量。
  • 来源名称。作业的来源是图片的哪个特定副本。
  • 源装载点。原始主机上每个卷的装载点名称。
  • 开始日期。作业实际开始运行的日期和时间。
  • 模板名称。服务级别模板的名称。
  • 传输介质。作业期间数据传输的方式:通过 SAN 还是 LAN。
  • Uniqueid。唯一标识映像中每个卷的标识符。
  • Volumekey。一个字符串,在内部用于标识映像中的多个卷。
  • VolumeUID。映像中每个卷的唯一标识符。

卷信息

下表显示了提供的销量信息。

  • 容量。已备份的卷的大小。
  • 数据存储区。对于虚拟机,卷所在的数据存储区。
  • 文件名。VMware:VMDK 文件的路径。
  • HUID。主机唯一标识符,用于唯一标识卷的字符串。
  • 标签。卷的卷标。
  • 逻辑名称。卷的人类可读唯一名称。对于 VMware 虚拟机,这是文件名。
  • 源装载点。卷的装载点。
  • 目标。卷副本的 Backup and DR 虚拟磁盘名称。

重试

您可以在以下列表中查看重试元数据的说明。

  • 结束日期。作业完成的日期和时间,无论成功与否。
  • 错误代码。零,或作业返回的错误代码。
  • 错误消息。与错误代码对应的文本消息。
  • 作业名称。原始作业或重试尝试的作业名称。
  • 开始日期。作业开始运行的日期和时间。

统计信息

以下列表提供了统计信息的说明。

  • 应用冻结时间。在备份期间,应用处于冻结状态的总时长。在备份(快照)期间,应用被置于冻结状态,以便以一致的状态捕获所有数据。
  • 应用大小 (GB)。暂存磁盘上应用数据的大小。
  • 卷数。作业所针对的应用中的卷数。
  • 已复制的数据 (GB)。显示此作业发现的新应用数据量。

作业类型

Backup and DR 通过以下类型的作业来保护和访问数据:

作业类型 监控标签 说明
清理镜像 cleanupmirroring 当从应用中移除备份方案或将备份方案更改为不包含相同复制类型的方案时,从远程设备中移除 StreamSnap 映像。
克隆 clone 将源映像复制到目标位置,例如服务器、数据库或磁盘池。
克隆(迁移) 克隆(迁移) 将数据从已挂载的磁盘迁移到服务器磁盘。
克隆(装载) 克隆(装载) 将映像装载到服务器,以便准备执行克隆(迁移)作业。
删除 删除 删除已从主机卸载的映像。
删除测试 deletetest 执行由故障切换测试作业创建的映像的卸载和删除操作。
直接转到 OnVault DirectOnVault 在不先使用快照池的情况下,将 VMware 虚拟机的时间点映像创建到 OnVault 池中。
失效日期 到期 在图片达到保留期限结束时间时或在按需请求时,使其过期/删除图片。
故障恢复 故障恢复 执行故障切换作业创建的映像的卸载和删除,移除应用的所有同步返回映像,并在远程设备上触发故障切换删除作业。
故障切换 故障切换 从复制的 StreamSnap 映像执行应用的装载,停止源上的新快照作业,并跟踪反向复制(同步返回)的更改。
故障切换 - 删除 deletefailover 当本地设备执行故障恢复作业时,自动触发以在远程设备上运行。
故障切换 - 测试 failovertest 从复制的 StreamSnap 映像执行应用的装载,但保持前向复制处于活跃状态,并且不启用同步返回。
完成 完成 执行 SQL Server 装载和迁移流程中的最后一步,包括将迁移作业与卸载删除相结合。
忘记已激活的装载 ForgetActiveMount 移除对 Compute Engine 实例挂载的跟踪,但不会删除 Compute Engine 中的实例。
忘记导入的 OnVault 映像 忘记 OnVault 图片 撤消从一个设备导入 OnVault 池中 OnVault 元数据的操作。
LiveClone liveclone 根据快照映像创建 LiveClone 映像(完整副本)。
LogBackup LogBackup 创建用于捕获应用日志的映像。
日志复制 logreplicate 使用 StreamSnap 技术在本地设备和远程设备之间执行复制,这意味着日志复制直接从本地设备上的快照池到远程设备上的快照池。
迁移 迁移 将数据从装载点复制到服务器的存储空间。 对于某些应用类型,它将执行在线过渡并移除已挂载的 Backup and DR 磁盘。对于其他应用类型,迁移作业会重复运行,直到用户启动 Finalize 作业。
迁移(取消) 迁移(取消) 取消正在进行的迁移,针对已装载的映像停用未来的迁移作业,并清理任何部分迁移/复制的数据。
装载 mount 将映像装载到所选主机。
OnVault vault 将快照映像复制到 OnVault 池。
OnVault(Log) 将数据库日志复制到一个或多个 OnVault 池。
OnVault 复制 OnVaultReplicate 将一个 OnVault 池中的映像复制到另一个 OnVault 池中。
Oracle ASM 重新平衡 恢复(ASM 切换) 恢复(ASM 重新平衡) ASM Switch 会装载 Oracle 数据库,以取代其原始源数据库。ASM 重新平衡会启动从已挂载的磁盘到服务器磁盘的数据库迁移,然后在完成后移除已挂载的磁盘。
准备装载 prep-mount 以允许直接修改 LiveClone 的方式执行 LiveClone 映像的装载。
准备卸载 prep-unmount 卸载使用 prep-mount 安装的 LiveClone,并可选择将对装载所做的更改直接保存到 LiveClone 中。
刷新 LiveClone refreshliveclone 使用来自其他源快照映像的数据增量刷新 LiveClone 映像。
Remote-Mount remote-mount 将远程映像(来自其他设备)装载到本地主机。系统会执行反向增量复制(如果需要)来完成此任务。
重新配置 重新配置 获取数据库应用的现有装载,并通过执行以下操作将其刷新到不同的时间点:卸载删除和后续装载新映像,默认使用之前装载中使用的所有相同选项。
恢复 恢复 使用所选备份映像替换生产数据。
恢复(取消) 恢复(取消) 取消正在进行的装载并迁移恢复。所有迁移的数据都将被删除,并且装载数据将被移除。
恢复(迁移) 恢复(迁移) 将数据从恢复(装载)复制到服务器的存储空间。对于某些应用类型,它将执行在线过渡并移除已装载的 Backup and DR 磁盘。对于其他应用类型,迁移作业会重复运行,直到用户发起最终确定作业。
恢复(装载) 恢复(装载) 装载数据库映像以替换其原始源数据库,为后续的恢复(迁移)做好准备。
快照 快照 在快照池中创建应用或虚拟机的时间点映像。
StreamSnap streamsnap 在远程设备上创建或刷新可用于故障切换的 StreamSnap 映像。
注意:StreamSnap 复制作业也与特定的快照政策相关联。在执行复制时,它会使用快照政策的安排和频率设置。
Syncback syncback 在故障切换后执行增量反向复制,在本地或源设备上创建可供日后恢复使用的同步返回映像。
卸载 卸载 卸载之前已装载到主机的映像,但使该映像可供日后装载。
卸载删除 卸载删除 卸载之前已装载到主机的映像,并舍弃在该装载中进行的所有更改。

运行按需作业

如果您需要立即开始作业,请运行按需作业。 按需作业包括所有类型的恢复、克隆、装载作业,以及在按需应用政策时创建的作业。

每台备份/恢复设备都会为各种类别的作业预留一个槽池,包括数据访问、过期、日志复制、OnVault 日志、按需、OnVault、快照、streamsnap。此外,还有未预留的槽池。

在开始作业之前,每个备份/恢复设备都会检查是否有与作业类别对应的槽位可用于运行作业。当预留槽不可用(因为该类别的所有槽都在运行作业)时,备份/恢复设备会检查是否有未预留的槽可用。如果有未预留的空档可用,则会启动作业。 不过,您可以从未预留的池中预留特定类别的作业可以使用的最大槽数。此衡量指标限制了某个类别的作业可从未预留的池中使用的槽数。

从设备管理控制台运行按需备份作业

如需从管理备份方案页面运行受管应用的按需捕获,请执行以下操作:

  1. 点击应用管理器标签页,然后从下拉列表中选择应用选项。系统会打开应用页面。
  2. 选择应用或虚拟机,然后从下拉列表中点击管理备份方案。 系统随即会打开管理备份方案页面。
  3. 展开右侧政策列表中的模板政策。

    如果数据库是使用启用了日志保护功能的备份模板管理的,并且有可用的备份,那么您还可以选择其他日志选项来提交作业。在这种情况下,您可以选择是捕获数据库 (DB) 还是仅捕获日志 (Log)。

  4. 点击立即运行,系统会打开一条确认消息。

  5. 点击 Yes(是)进行确认。系统会根据备份政策创建时间点映像。

按需运行数据库日志复制

在某些情况下,您可能需要手动启动数据库映像的日志复制到远程备份/恢复设备。例如,如果数据库映像的日志未正确复制到备份/恢复设备,或者备份/恢复设备上没有数据库映像的日志,您可能需要手动执行日志复制。然后,您可以使用远程设备上的事务日志将数据库恢复到指定的时间点。

如需手动启动数据库日志复制到远程备份/恢复设备,请执行以下操作:

  1. 点击应用管理器标签页,然后从下拉列表中选择应用选项。系统会打开应用页面。
  2. 选择受管应用或虚拟机,然后从页面右下角的下拉列表中点击 Replicate Logs
  3. 在随即打开的确认对话框中,点击确认。数据库事务日志会复制到模板中由复制政策定义的远程设备。

监控容器的装载作业

如需监控向容器装载的作业,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业,以打开作业页面,您可以在该页面中看到正在运行的所有作业的列表。
  2. 安装作业进行过滤。
  3. 通过作业的标签或其他详细信息找到要监控的作业。
  4. 如果作业正在运行,您可以监控其进度。完成后,选择相应作业,然后点击查看详情以查看以下内容:

    • 有关作业的详细信息
    • 流量信息
    • 作业重试次数
    • 作业统计信息

    如需详细了解这些方面,请参阅查看作业详情

访问容器 YAML 代码

容器 YAML 部分列出了已添加到容器或 pod 的 YAML 配置文件中的 YAML 代码段。您可以回头参考此代码,并在日后根据需要使用它。

  1. 查看完作业详情后,点击返回到作业以返回到“作业”页面。

取消正在运行的作业

您可以取消正在运行或已排队等待运行的作业。

如需取消有效作业,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业。 系统会打开作业页面,其中列出了所有正在运行的作业。您可以清除此默认过滤条件,以显示所有正在监控的作业。
  2. 选择要取消的作业,然后点击窗口右下角的取消作业

  3. 取消作业对话框中,点击确认

更改作业优先级

您可以根据希望备份/恢复设备如何分配必要资源来更改正在处理的作业的优先级。

如需更改排队作业的优先级,请执行以下操作:

  1. 点击监控标签页,然后从下拉菜单中选择作业。 系统会打开作业页面,其中列出了所有正在运行的作业。您可以清除此默认过滤条件,以显示所有正在监控的作业。
  2. 作业页面中选择要更改优先级的作业,然后依次点击窗口右下角的查看详情更改优先级

  3. 设置作业优先级对话框中,选择作业优先级。

  4. 点击确认以更改优先级选择。

未完成的作业在失败前会重试多少次

如果预定作业失败,调度器会自动重试该作业,最多重试三次。如果作业首次失败,第一次尝试的状态将被标记为“已重试”,并且调度程序将等待 4 分钟,然后再次将作业加入队列。如果第二次失败,下一次重试将在 16 分钟后排队。如果第三次失败,系统会在 64 分钟的搁置期后将最终重试排入队列。在三次重试失败后(总共尝试四次),最终重试作业将被标记为“失败”(而不是重试),并且在该调度周期内不会再尝试执行该应用的任何作业。

调度程序会将作业重试视为任何其他可用作业。如果排队的作业数量多于可容纳的槽数,则排队的重试作业需要等待槽。如果政策窗口在重试作业开始之前关闭,则任何已排队的重试作业都不会运行,并且不会尝试进一步重试。

作业重试会在监控 > 作业中报告。为了标识作业重试,所有这四个作业都将具有相同的作业编号,格式如下(按顺序):

  • Job_xxxxx(状态:已重试)
  • Job_xxxxxa(状态:已重试;在 4 分钟的延迟后已排队)
  • Job_xxxxxb(状态:已重试;在 16 分钟的延迟后已排队)
  • Job_xxxxxc(状态:失败;在 64 分钟的延迟后排队)

下次尝试备份相应应用的时间取决于相应政策的安排。因此,如果时间表要求在从 01:00 开始的窗口中每天拍摄一张快照,则下一次尝试将在第二天 01:00 进行。

时区

默认情况下,在设备管理控制台中,“作业”和“事件”菜单中显示的所有时间戳均采用 Web 浏览器检测到的用户本地时区。如果您想确认当前使用的是哪个时区,请在信息中心菜单栏中选择右上角的用户图标。它会显示自动检测到的时区,如果检测到的时区不合适,还会设置时区。

按照以下说明更改时区。

  1. 在信息中心内,点击右上角的用户图标。
  2. 选择更改时区
  3. 时区下拉菜单中,选择在显示作业和活动时要使用的时区。
  4. 点击保存

预定作业简介

作业会根据备份模板政策中分配的时间表运行。 如果您尝试同时运行许多资源密集型作业,那么有些作业必须等待资源可用。如果等待时间过长,窗口会关闭,并发生备份方案违规。

最好错开资源密集型作业(例如初始快照作业)的运行时间,而不是让它们同时竞争资源。例如,不要在工作日 18:00 拍摄所有虚拟机、文件系统和数据库的快照,而是考虑在整点拍摄一种类型的应用的快照,在整点后 10 分钟拍摄另一种类型的应用的快照,在整点后 20 分钟拍摄另一种类型的应用的快照。

应用或虚拟机的初始快照是最大且最耗时的快照,因为每个数据位都是新的。 当您添加新的大型应用或虚拟机时,请在非高峰时段执行首次按需快照,然后为所有未来的快照安排备份模板政策。

按需作业简介

大多数作业都根据其备份计划按计划运行,但在即将到来的维护窗口、软件升级以及新应用的第一个快照中,您需要确保在开始计划的维护任务之前成功创建数据副本。这些情况需要按需作业。

作业槽简介

Backup and DR Service 通过分配作业槽来管理作业。设备会为每类作业预留一个槽池,此外还会预留一个未预留的槽池。

在开始作业之前,Backup and DR 会检查是否有与作业类别对应的可用 slot 来运行作业。当预留槽不可用(因为该类别的所有槽都在运行作业)时,设备会检查是否有未预留的槽可用。如果有未预留的空闲时间段,则开始执行作业。

按需备份作业的队列

Backup and DR Service 支持按需作业排队,让您可以灵活地创建映像,而无需担心可用于启动作业的按需作业槽数量。排队的按需作业会一直处于排队状态,直到有按需作业槽可用。

当按需槽位空闲时,作业会进入运行状态。此序列按作业提交顺序进行。如果按需作业失败,设备将尝试运行队列中的下一个作业。按需作业使用的作业槽与调度作业不同,因此调度作业可能会在排队的作业之前运行。

当按需作业处于排队状态时,您可以更改作业优先级、取消作业或取消应用的保护。您可以点击监控,然后点击作业,查看已加入队列的作业。

已取消的按需作业在作业历史记录表中显示为已取消的作业。 作业的开始时间和结束时间将是系统确认取消请求或取消应用保护的时间。

在添加新应用时保持性能

如果您的系统之前一直运行良好,但在添加新应用后,性能可能会暂时下降。这是因为更改块跟踪功能可以识别新数据并对其进行保护,即使新数据只是大型应用的一小部分。这意味着,系统经过优化,每天可以处理许多更改的块。

新应用在初始捕获时需要更多资源,因为对于系统而言,所有数据都是全新的。

添加新应用时,请参考以下信息以获得最佳效果:

  • 添加新应用时,请在低负载期间使用按需作业首次保护该应用。这样可以防止资源密集型初始注入作业干扰其他作业。

  • 添加多个新应用或虚拟机时,请尝试错开每个新应用的初始保护作业,以防止同时提取所有新数据。为此,您可以分配在不同时间运行的备份方案。您还可以使用初始作业槽功能来最大限度地减少中断。

  • 在时间上将初始保护作业与镜像作业分开。拍摄应用快照后,镜像作业可以在系统负载较轻的几个小时后运行。

  • 一致性组可以成为一种高效的方式,用于保护具有类似需求的多个应用;请参阅在 Backup and DR 一致性组中捕获应用数据

  • 请注意您现有的备份计划,并尽量不要同时安排快照作业和超大型或动态应用的快照作业。

    您可以在管理标签页中从保留的快照映像列表中进行选择,然后执行以下操作:

    • 从保留的映像列表中进行选择,然后在 App Manager 中前往相应映像。

    • 使所选的一张或多张快照图片过期。