图片实用程序

一组实用程序操作,可在调查期间帮助分析、提取和转换图片和文件内容。主要功能包括用于提取文本的光学字符识别 (OCR)、栅格化(将网页内容转换为静态图片)和文件格式转换。所有操作都需要远程代理。

操作

如需详细了解操作,请参阅 在工作台页面中处理待处理的操作执行手动操作

转换文件

使用转换文件操作可更改指定文件的格式。

操作输入

转换文件操作需要以下参数:

参数 说明
Input File Format

必填。

相应操作所转换的文件的原始格式。

可能的值如下:

  • PNG
  • PDF

默认值为 PNG

Input File Path

必填。

相应操作转换的文件的路径。

Output File Format

必填。

转换过程完成后文件的最终格式。

可能的值如下:

  • PNG
  • PDF

默认值为 PDF

操作输出

转换文件操作可提供以下输出:

操作输出类型 可用性
案例墙附件 不可用
案例墙链接 不可用
“支持请求墙”表格 不可用
丰富化表 不可用
JSON 结果 可用
输出消息 可用
脚本结果 可用
JSON 结果

以下示例展示了使用转换文件操作时收到的 JSON 结果输出:

[
   {
       "output_format": ""  
       "file_path": ""
   }
]
输出消息

转换文件操作可能会返回以下输出消息:

输出消息 消息说明

Successfully converted file.

操作成功。
Error executing action "Convert File". Reason: ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用转换文件操作时脚本结果输出的值:

脚本结果名称
is_success truefalse

OCR 图像

使用 OCR 图像操作执行 OCR 并从图像文件中提取文本。

操作输入

OCR 图像操作需要以下参数:

参数 说明
Base64 Encoded Image

可选。

图片文件的 base64 编码字符串。

File Path

必填。

图片文件的路径。

操作输出

OCR 图片操作提供以下输出:

操作输出类型 可用性
案例墙附件 不可用
案例墙链接 不可用
“支持请求墙”表格 不可用
丰富化表 不可用
JSON 结果 可用
输出消息 可用
脚本结果 可用
JSON 结果

以下示例展示了使用 OCR 图片操作时收到的 JSON 结果输出:

{ 
  "extracted_text": "",
}
输出消息

OCR Image 操作可以返回以下输出消息:

输出消息 消息说明

Successfully performed OCR on the provided image.

操作成功。
Error executing action "OCR Image". Reason: ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用 OCR 图像操作时脚本结果输出的值:

脚本结果名称
is_success truefalse

栅格化内容

使用光栅化内容操作将矢量或复杂内容转换为固定的位图图像格式。

远程代理前提条件 (Debian)

为确保 Rasterize Content 操作在基于 Debian 的远程代理上成功运行,您必须安装以下软件包和依赖项:

Playwright Python 库

使用以下命令安装 Playwright Python 库:

python3.11 -m pip install playwright
浏览器依赖项

安装必要的 Chromium 浏览器依赖项,以便 Playwright 正常运行:

playwright install --with-deps chromium

操作输入

参数 说明
Input Type

必填。

相应操作用作主要输入的内容类型。

可能的值如下:

  • URL
  • Email
  • HTML

默认值为 URL

URLs or Body

必填。

要根据所选 Input Type 进行栅格化的输入内容。

如果选择了 URL,请提供以英文逗号分隔的网址列表。

如果选择 EmailHTML,请提供相应输入类型的完整内容正文。

Output Type

可选。

栅格化内容的最终输出格式。

可能的值如下:

  • PNG
  • PDF
  • Both

默认值为 PNG

Export Method

可选。

用于输出生成的内容的方法。

可能的值如下:

  • Case Attachment
  • File Path
  • Both

默认值为 Case Attachment

Width

必填。

用于生成的栅格内容的宽度(以像素为单位)。

默认值为 1920

Height

必填。

用于生成的栅格内容的高度(以像素为单位)。

默认值为 1080

Full Screen

可选。

如果选中此选项,内容会在栅格化之前在整个浏览器窗口中呈现。

默认情况下,该环境处于停用状态。

Timeout

可选。

浏览器在开始栅格化之前用于渲染内容的最长时间(以秒为单位)。

最大值为 60

默认值为 120

Wait For

可选。

浏览器在继续执行光栅化或内容提取操作之前必须达到的特定状态。

NETWORK_IDLE 状态通常最可靠。

可能的值如下:

  • LOAD
  • DOM_CONTENT_LOADED
  • NETWORK_IDLE COMMIT

默认值为 NETWORK_IDLE

Wait for Selector

可选。

一种 CSS 选择器,用于指定操作在捕获屏幕截图之前等待其出现在页面上。

操作输出

栅格化内容操作提供以下输出:

操作输出类型 可用性
案例墙附件 不可用
案例墙链接 不可用
“支持请求墙”表格 不可用
丰富化表 不可用
JSON 结果 可用
输出消息 可用
脚本结果 可用
JSON 结果

以下示例展示了使用栅格化内容操作时收到的 JSON 结果输出:

[
   {
       "attachment_name": "",
       "file_path": ""
   }
]
输出消息

栅格化内容操作可以返回以下输出消息:

输出消息 消息说明

Successfully rasterized content based on the provided input.

Successfully rasterized content based on the following URLs: URLS

Action wasn't able to rasterize content for the following URLs: URLS

Action wasn't able to rasterize content for the provided URLs.

操作成功。
Error executing action "Rasterize Content". Reason: ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用 栅格化内容操作时脚本结果输出的值:

脚本结果名称
is_success truefalse

需要更多帮助?获得社区成员和 Google SecOps 专业人士的解答。