下表介绍了重要的 Backup and DR Service 事件 ID、事件消息以及解决步骤:
| 事件 ID | 事件消息 | 您需要采取的措施 |
|---|---|---|
| 5022 | Actifio 连接器:准备 VSS 快照集时失败 | 如果 Windows 无法创建 VSS 快照,就会出现此问题。如需解决此问题,请执行以下操作:
这些错误通常伴有日志中报告的 VSS 错误,例如: VSS_E_VOLUME_NOT_SUPPORTED_BY_PROVIDER、VSS_E_UNEXPECTED_PROVIDER_ERROR。首先,前往命令行并运行以下命令,检查所有 VSS 写入器是否处于稳定状态: # vssadmin list writers。检查输出,确认所有写入器都处于稳定状态。重启 VSS 服务,并检查写入器是否稳定。如果不是,您可能需要重启机器。 |
| 5024 | Actifio 连接器:未能创建 VSS 快照以进行备份。可用存储空间不足,无法创建卷影复制存储文件或其他卷影复制数据 | 如果磁盘空间不足以处理快照,则会出现此问题。
有时,当发生内部 VSS 错误时,系统会显示此消息。检查 Windows 事件日志中是否存在与 VSS 相关的错误。对于与 VSS 相关的错误,请搜索相关的 Microsoft 补丁。有关 VSS 故障排除的更多详细信息,请访问 Microsoft TechNet。 Microsoft 建议在指定用于保存所创建 VSS 快照的设备上,至少预留 320 MB 的空间,外加存储在该空间中的更改数据。 Actifio 建议使用以下命令将影子存储空间设置为无限制: vssadmin list shadowstorage、vssadmin Resize ShadowStorage /On=[drive]: /For=[drive]: / Maxsize=[size]。如需在 Windows 界面中更改存储区大小,请参阅在 Windows Server 2008 上配置卷影复制。在 VSS 状态稳定且影子存储空间设置为无限制后,重新运行备份。 |
| 5046 | 备份暂存 LUN 对 Actifio 连接器不可见 | 如果暂存 LUN 对应用宿主机上的 UDSAgent 不可见,并且宿主机无法从备份/恢复设备检测到暂存 LUN,则会出现此问题。 |
| 5049 | Actifio 连接器:无法识别备份暂存 LUN 上的逻辑卷 | Actifio 连接器无法看到过渡 LUN。这可能是由于连接不良或 LUN 出现问题所致。 请验证 FC/iSCSI 连接是否良好,然后通过映射 VDisk、对其进行分区、格式化并向其复制文件来确保其正常运行。分区和格式化步骤因操作系统而异。 |
| 5078 | Actifio 连接器:临时磁盘已满 | 如果源磁盘中修改过的文件被复制到暂存磁盘,但该文件大于暂存磁盘中的可用空间,作业就会失败。如需解决临时磁盘空间已满的问题,请增加临时磁盘空间。在应用的高级设置中指定暂存磁盘的大小。将暂存磁盘大小的值设置为大于源磁盘大小与最大文件大小之和。 注意:在高级设置中更改暂存磁盘会导致进行完整备份。 |
| 5087 | Actifio 连接器:备份期间写入文件失败(源文件) | 杀毒程序或第三方驱动程序可能已应用无法覆盖的文件锁定。 检查 UDSAgent.log 以查看无法访问的文件。尝试在 Unix/ Linux 上使用 lsof 或在 Windows 上使用 fltmc 查找哪个进程锁定了文件。从杀毒或捕获作业中排除相应文件,然后重试捕获。 Microsoft 目前已知的进程列于:分配的过滤高度。 这些错误很少出现在 Unix 或 Linux 上,但数据库维护或补丁安装 / 更新等进程可能会对文件创建独占锁定。安装最新的 Actifio 连接器。 主机操作系统检测到文件系统限制或不一致。在过渡磁盘上运行 Windows 磁盘碎片整理程序。 主机磁盘或传输介质(iSCSI 或 FC)的 I/O 吞吐量较低。确保主机磁盘或传输介质中没有 I/O 问题。传输介质将是 iSCSI 或光纤通道,具体取决于带外配置。根据需要咨询存储和网络管理员。 |
| 5131 - SQL 日志报告错误 3041 | 实例上的 SQL 日志备份失败,并显示错误 5131 | 如需解决此问题,请启用“不要在用户注销时强制卸载用户注册表”,请参阅用户配置文件服务功能。 |
| 5131 - SQL 日志显示备份/ 恢复设备错误 43901 | 快照作业失败,并显示错误 5131,SQL 日志显示备份/ 恢复“快照作业失败”设备错误 43901 | 这是因为数据库的 ODBC 登录失败。修复 ODBC 登录问题即可解决此问题。 |
| 5136 | Actifio 连接器:临时卷不可读 | 请查看 /act/logs/UDSAgent.log 了解详情,并与 Google 支持团队联系以解决此问题。 |
| 5241 | Actifio 连接器:无法从映射的映像(源文件)装载/克隆应用 | 从控制文件中解析出的用户名和密码无效。在源上,查看 UDSAgent.log,了解源是否已在连接器属性的“高级设置”下配置了正确的用户名/密码。 |
| 5547 | Oracle:未能备份归档日志(源文件) | Actifio 连接器未能使用 RMAN 归档备份命令备份归档日志。此故障的可能原因如下:
在 RMAN 日志中搜索 ORA- 或 RMAN- 错误。这是从 Oracle 收到的错误。请使用首选的 Oracle 资源,因为这些不是 Backup and DR Service 的条件,因此无法在 Backup and DR Service 中解决。
|
| 10032 | 快照池超出警告级别 | 如需减少快照池的消耗,请执行以下操作:
|
| 10038 | 即将超出虚拟磁盘警告限值 | 如需立即减少虚拟磁盘消耗量,请执行以下操作:
如果此提醒每天重复出现,但设备未达到最大虚拟磁盘数,请修改政策以减少使用的虚拟磁盘数,或提高提醒阈值。在每日快照窗口期间,VDisk 数量可能会波动,因为在旧 VDisk 因快照过期而被移除之前,系统会为快照创建新的 VDisk。每日波动幅度因受保护的应用数量而异。 |
| 10039 | 访问存储设备时出现网络错误 | 由于硬件故障或网络问题,对受监控存储设备的检测信号 ping 失败。检查网络以解决问题。 |
| 10043 | 检测到备份方案违规行为 | 查看备份方案最佳实践,并优化您的政策。以下是违反备份计划的常见原因。
|
| 10046 | 性能池已超过安全阈值 | 如需减少快照池的消耗,请执行以下操作:
|
| 10055 | 无法检查远程保护状态 | 每个备份/恢复设备每小时都会检查远程设备,以确定是否存在远程保护问题。由于以下问题,设备通信失败:
|
| 10070 | Udppm 调度程序已关闭超过 30 分钟。 | 调度程序已关闭。这可能是因为系统正在进行维护。如果维护已完成,您可以重新启用调度程序,请参阅启用调度程序。 |
| 10084 | 应用(应用名称)和政策(政策名称)作业的提醒因未知原因而未运行 | 查看备份方案最佳实践,并优化您的政策。以下是违反备份计划的常见原因。
|
| 10085 | 主机(主机名)上应用(应用名称)的备份方案违反了政策(政策名称)。作业未运行,原因未知。 | 查看备份方案最佳实践,并优化您的政策。以下是违反备份计划的常见原因。
|
| 10120 | Psrv 已成功启动 | 这是一个内部事件,可以忽略。 |
| 10220 | NTP 服务未运行或未同步。 | 备份设备上的 NTP 服务未运行。需要 NTP 服务来确保备份设备使用正确的时间戳。Compute Engine 设备应使用 metadata.google.internal。按照 DNS 和 NTP 方法设置 NTP 服务器。 |
| 10225 | 找到了 UDP 核心文件,文件名为 udpengine.(文件名) | 内部进程意外记录错误文件。请与 Google 支持团队联系,以获取此问题的解决方案。 |
| 10229 | 存储空间不足,系统名称:(设备名称) | 这是一个内部事件,通常可以忽略。 |
| 10237 | X 作业已运行超过 3 小时。 | 作业运行时间超过 3 小时的原因有很多。 |
| 11001 | 备份设备证书将在 X 天后过期。开机 24 小时即可续订,或与支持团队联系。 | 备份/恢复设备的证书上次更新时间已超过 15 天。如果备份/恢复设备处于停机状态,请将其启动。 |
| 11004 | 系统组件出现故障。如果备份受到影响,请与支持团队联系。 | 请与支持团队联系。 |
| 11006 | 无法与主机 X 同步,需要与主机定期同步,以避免备份设备与主机之间永久失去通信。 | 主机上的证书已超过 7 天未更新。尝试重启并重新连接到主机。 |
| 20019 | CPU / 内存不足。所需的核心数量下限:(核心)实际核心数量:(核心)。所需内存大小下限(以 GB 为单位):(内存)实际内存:(内存) | 备份/恢复设备已更改,但尺寸不符合建议的尺寸。请与 Google 支持团队联系,以获取此问题的解决方案。 |
| 20025 | 交换空间使用量超出上限 | 当交换区使用量超出为备份/恢复设备设置的配置阈限时,就会出现此问题。请与 Google 支持团队联系,以获取此问题的解决方案。 |
| 20030 | tomcat 已成功停止 | 这是一个内部事件,可以忽略。 |
| 20031 | tomcat 已成功启动 | 这是一个内部事件,可以忽略。 |
| 22001 | OMD 已成功启动,sltname:,slpname:。 | 这是一个内部事件,可以忽略。 |
| 42356 | 检测到文件更改,但未检测到已删除的文件,检测到新文件。 | 这是一个内部事件,可以忽略。 |
| 43151 | 无法向虚拟机 (VM) 添加原始设备映射。错误:虚拟机任务失败。发生了常规系统错误:系统返回了错误。 | 向虚拟机添加原始设备映射会使虚拟机“停顿”,直到 ESX 有机会添加新资源。如需了解无法添加裸设备映射的原因,请查看相关虚拟机的 ESX 日志 (vmware.log)。 如需有关查看日志以了解错误消息的帮助,请参阅 VMware 文档和知识库。此外,您还可以查看 VMware 文章,详细了解如何收集 VMware 日志。 |
| 43155 | 错误:虚拟机任务失败。保存快照时出错:未能使虚拟机进入静默状态。 | 这是一个 VMware 问题;如需了解详情,请参阅 VMware 知识库文章 - 1015180。虚拟机静默问题取决于操作系统类型。如需解决此问题,请进行进一步调查、搜索更多 VMware KBA 或与 VMware 支持团队联系。 |
| 43155 - a | 错误:虚拟机任务失败。设备 scsi3 无法热添加。 | 这通常意味着您尝试添加到虚拟机的 SCSI 设备已被另一个虚拟机使用。 |
| 43155 - b | 错误:虚拟机任务失败。虚拟磁盘已损坏或采用了不受支持的格式。 | 如果虚拟机的 CTK 文件处于锁定、无法读取或正在提交状态,就会出现此问题。如需解决此问题,请移除并重新创建这些 CTK 文件。如需了解详情,请参阅知识库文章 2013520。 |
| 43155 - c | 错误:虚拟机任务失败。在数据存储区的当前状态下不允许执行此操作。progress ="11" status="running" | 您可以通过以下两种方式格式化 VMware 数据存储区:NFS 和 VMFS。使用 NFS 时,存在一些限制,例如无法执行 RDM(原始磁盘映射)。这意味着,您无法从备份/恢复设备装载到 NFS 数据存储区。如需了解详情,请参阅以下知识库文章 - 1001856。 |
| 43175 | UDSAgent 套接字连接在等待代理的响应时异常终止 | Actifio 连接器停止响应设备与安装了 Backup and DR 代理的主机之间的通信。
|
| 43604 | 未能验证指纹 | 当源数据和目标数据之间存在不一致时,就会发生这种情况。请与 Google 支持团队联系,以获取此问题的解决方案。 |
| 43690 | 主机未定义任何 SAN 或 iSCSI 端口。 | 如果备份/恢复设备未配置与目标主机的 iSCSI 连接,则会发生此问题。确保网络端口已为 iSCSI 打开,并且目标主机已发现备份/恢复设备。 |
| 43698 | ESX 主机无法访问,无法进行 NBD 模式数据迁移 | 备份/恢复设备无法通过网络访问 ESX 主机,也无法使用 DNS 解析 ESX 主机名。请与 Google 支持团队联系,以获取此问题的解决方案。 |
| 43702 | 由于虚拟机主目录中的额外文件过多,备份已中止 | 这是由备份和灾难恢复服务生成的提醒情况,由虚拟机数据存储区中的剩余增量文件引起。通常,在合并 Backup and DR 快照后,系统会移除增量文件。在某些情况下,这些文件可能会因 VMware 合并而遗留下来,而 Backup and DR 会开始使作业失败,以防止问题加剧。此问题是由 VMware 引起的,请参阅知识库文章 1002310。 |
| 43755 | 无法打开 VMDK 卷;请检查与 ESX 服务器的连接。 | 当控制器无法访问 ESX 服务器时(通常是由于物理连接或 DNS 问题),会发生这种情况。如需解决此问题,请执行以下操作:
|
| 43844 | 检测到虚拟机的 vmdk 大小无效 | 针对这种情况,有两种可能的解决方案:
|
| 43873 | 数据存储区的磁盘空间使用量已超出严重阈值 | 当数据存储区中的剩余空间低于临界阈值时,就会出现此问题。如果存储空间很快没有更多可用空间,当剩余空间不足以存储作业时,作业就会开始失败。 此提醒旨在帮助您采取措施,防止 ESX 数据存储区被快照数据填满。通过扩展数据存储区、迁移部分虚拟机或删除数据存储区中的旧数据来增加可用空间。随着添加的更改数据越来越多,快照也会越来越大。如果数据存储区因快照不断增长而填满,VMware 可能会自动将虚拟机置于离线状态,以保护数据。 |
| 43900 | 重试主机 (hostname) 上应用 (appname) 的待处理 OnVault (log) (jobname) 错误:(errorID)(错误说明) | 许多错误都可能导致作业重试。每条 43900 事件消息都包含错误代码和错误消息。 |
| 43901 | 作业失败 | 作业失败可能由多种错误导致。每条 43901 事件消息都包含错误代码和错误消息。 |
| 43903 | 过期作业失败 | 如果映像在过期时正在使用,则会发生此问题。这可能是因为映像正被其他进程或操作(例如装载、克隆、恢复)使用。过期作业很可能在第二次尝试时成功完成。Backup and DR 不会报告第二次尝试的成功完成情况。如果您只收到一条与映像相关的错误消息,则可以放心地得出结论:第二次尝试使相应映像过期成功了。如果此图片因正当理由而无法过期,您会收到与此图片相关的多条错误消息。如果您收到多个错误,请与 Google 支持团队联系。 |
| 43905 | 失败的装载作业 | 挂载作业可能会因多种原因而失败。事件随附的错误代码有助于确定根本原因。 |
| 43908 | 恢复作业失败 | 作业失败可能由多种错误导致。每条 43908 事件消息都包含错误代码和错误消息。 |
| 43915 | 无法连接到备份主机。确保 Backup and DR 代理正在(主机)上运行,并且网络端口(端口)已开放 | 如需启动备份,备份/恢复设备必须能够访问 Actifio 连接器服务。如果未打开所需端口、配置了错误的主机 IP、Backup and DR 代理服务未运行或主机物理资源不足,则会发生此问题。如需解决此问题,请执行以下操作:
|
| 43941 | 数据存储区的磁盘空间使用量已超出严重阈值 | 当数据存储区中的剩余空间低于临界阈值时,就会出现此问题。如果很快没有更多存储空间可用,那么当剩余空间不足以存储作业时,作业就会开始失败。此提醒旨在帮助您采取措施,防止 ESX 数据存储区被快照数据填满。通过扩展数据存储区、迁移部分虚拟机或删除数据存储区中的旧数据来增加可用空间。随着添加的更改数据越来越多,快照也会越来越大。如果数据存储区因快照不断增长而填满,VMware 可能会自动将虚拟机置于离线状态,以保护数据。 |
| 43954 | 失败的 OnVault 作业 | 在装载作业期间,备份/恢复设备无法连接到 OnVault 池。此问题可能是由以下任何原因造成的。
|
| 43929 | 虚拟机快照创建失败。错误:虚拟机任务失败保存快照时出错:未能使虚拟机进入静默状态。 | 如果 ESX 服务器无法使虚拟机静默,则虚拟机快照会失败。这可能是因为 I/O 过多,也可能是因为 VMware Tools 无法及时使用 VSS 使应用静默。检查主机上的事件日志,并检查虚拟机的 ESX 日志 (vmware.log)。崩溃一致性快照和基于连接器的备份不太会出现此行为。如需了解详情,请参阅 VMware 知识库文章 1018194 和 1007696。 |
| 43933 | 未能找到具有匹配 BIOS UUID 的虚拟机 | 如果虚拟机的 UUID 被修改,则会出现此问题。如需解决此问题,请重新发现虚拟机,并检查该虚拟机是否以新的 UUID 被发现。您可以在管理控制台中通过比较新发现的虚拟机和之前发现的虚拟机的 UUID 来确认这一点。如果 UUID 不匹配,则虚拟机可能已被克隆。如果从 vCenter 中移除了大量 Backup and DR 托管虚拟机,您也可能会看到此错误。 |
| 43948 | 有 (x) 张未过期的图片正等待进一步处理,这些图片来自 (x) 个不同的应用,包括 (x) 张快照和 (x) 张保险柜图片。在过去 (x) 秒内((x) 小时 (x) 分钟)添加了 (x) 个快照和 (x) 个 OnVault。, sltname: No specific slt, slpname: No specific slp. | 当应用开始停止过期(作为映像保留的一部分)时,系统会生成事件 ID 43948。“图片保留”功能可将快照和 OnVault 图片保留到其过期日期之后,以确保备份/恢复设备能够正确处理这些图片。当新应用进入保留模式时,系统会生成警告提醒。最常见的原因是违反备份计划(如事件 ID 10085 下所述)。 |
| 43954 | Retry OnVault | 需要重试 OnVault 作业。可能存在的问题包括:所使用的服务账号具有错误的角色。相应服务账号无权写入存储桶。Cloud Storage 存储桶已不存在。 |
| 43960 | 跳过了 SqlServerWriter 应用的 6 个离线应用的备份。 | SQL Server 实例的备份发现某些数据库处于离线状态,无法备份。这种情况通常发生在服务器端已删除数据库,但备份/灾难恢复端仍包含该数据库时。错误消息包含应调查的离线数据库的名称。 |
| 43972 | 向存储桶上传元数据失败。 | 向 OnVault 存储桶写入元数据失败。可能存在的问题包括:所使用的服务账号具有错误的角色。相应服务账号无权写入存储桶。Cloud Storage 存储桶已不存在。 |
| 43973 | udppm 已成功启动 | 这是一个内部事件,可以忽略。 |
| 43999 | 警告:虚拟机运行在运行过时 ESXi 版本的宿主机上,Google 不支持该版本。请将其升级到受支持的版本 (>=),以确保获得最佳效果。 | 将虚拟机升级到受支持的版本(>=),以确保获得最佳效果。 |
| 44003 | 在主机 host 上为应用 application ID 成功执行了 Job_xx-xx-xx,sltname:template,slpname:profile。 |
这是一个成功状态事件,可以忽略。 |
| 62001 | Streamsnapd 守护程序已成功启动 | 这是一个内部事件,可以忽略。 |
| 90003 | 备份设备有新更新(版本 X)可用 | 有新的更新。请尽快更新备份/恢复设备。 |
后续步骤
- 如需查看在备份/恢复设备上创建的事件日志,请参阅 Backup and DR 事件日志
- 如需根据示例查询为 Backup and DR Service 配置基于日志的提醒,请参阅创建基于日志的提醒。