图片实用程序

一组实用程序操作，可在调查期间帮助分析、提取和转换图片和文件内容。主要功能包括用于提取文本的光学字符识别 (OCR)、栅格化（将网页内容转换为静态图片）和文件格式转换。所有操作都需要远程代理。

操作

如需详细了解操作，请参阅在工作台页面中处理待处理的操作和执行手动操作。

转换文件

使用转换文件操作可更改指定文件的格式。

操作输入

转换文件操作需要以下参数：

参数说明

参数	说明
`Input File Format`	必填。相应操作所转换的文件的原始格式。可能的值如下： `PNG` `PDF` 默认值为 `PNG`。
`Input File Path`	必填。相应操作转换的文件的路径。
`Output File Format`	必填。转换过程完成后文件的最终格式。可能的值如下： `PNG` `PDF` 默认值为 `PDF`。

Input File Format

必填。

相应操作所转换的文件的原始格式。

可能的值如下：

PNG
PDF

默认值为 PNG。

Input File Path

必填。

相应操作转换的文件的路径。

Output File Format

必填。

转换过程完成后文件的最终格式。

可能的值如下：

PNG
PDF

默认值为 PDF。

操作输出

转换文件操作可提供以下输出：

操作输出类型	可用性
案例墙附件	不可用
案例墙链接	不可用
“支持请求墙”表格	不可用
丰富化表	不可用
JSON 结果	可用
输出消息	可用
脚本结果	可用

JSON 结果

以下示例展示了使用转换文件操作时收到的 JSON 结果输出：

[
   {
       "output_format": ""  
       "file_path": ""
   }
]

输出消息

转换文件操作可能会返回以下输出消息：

输出消息消息说明

输出消息	消息说明
`Successfully converted file.`	操作成功。
`Error executing action "Convert File". Reason: ERROR_REASON`	操作失败。检查与服务器的连接、输入参数或凭据。

Successfully converted file.

操作成功。

Error executing action "Convert File". Reason:
     ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用转换文件操作时脚本结果输出的值：

脚本结果名称	值
`is_success`	`true` 或 `false`

OCR 图像

使用 OCR 图像操作执行 OCR 并从图像文件中提取文本。

操作输入

OCR 图像操作需要以下参数：

参数说明

参数	说明
`Base64 Encoded Image`	可选。图片文件的 base64 编码字符串。
`File Path`	必填。图片文件的路径。注意：如果同时提供了 `Base64 Encoded Image` 和 `File Path`，则系统会处理 `Base64 Encoded Image`。

Base64 Encoded Image

可选。

图片文件的 base64 编码字符串。

File Path

必填。

图片文件的路径。

注意：如果同时提供了 Base64 Encoded Image 和 File Path，则系统会处理 Base64 Encoded Image。

操作输出

OCR 图片操作提供以下输出：

操作输出类型	可用性
案例墙附件	不可用
案例墙链接	不可用
“支持请求墙”表格	不可用
丰富化表	不可用
JSON 结果	可用
输出消息	可用
脚本结果	可用

JSON 结果

以下示例展示了使用 OCR 图片操作时收到的 JSON 结果输出：

{ 
  "extracted_text": "",
}

输出消息

OCR Image 操作可以返回以下输出消息：

输出消息消息说明

输出消息	消息说明
`Successfully performed OCR on the provided image.`	操作成功。
`Error executing action "OCR Image". Reason: ERROR_REASON`	操作失败。检查与服务器的连接、输入参数或凭据。

Successfully performed OCR on the provided image.

操作成功。

Error executing action "OCR Image". Reason:
     ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用 OCR 图像操作时脚本结果输出的值：

脚本结果名称	值
`is_success`	`true` 或 `false`

栅格化内容

使用光栅化内容操作将矢量或复杂内容转换为固定的位图图像格式。

远程代理前提条件 (Debian)

为确保 Rasterize Content 操作在基于 Debian 的远程代理上成功运行，您必须安装以下软件包和依赖项：

Playwright Python 库

使用以下命令安装 Playwright Python 库：

python3.11 -m pip install playwright

浏览器依赖项

安装必要的 Chromium 浏览器依赖项，以便 Playwright 正常运行：

playwright install --with-deps chromium

操作输入

参数	说明
`Input Type`	必填。相应操作用作主要输入的内容类型。可能的值如下： `URL` `Email` `HTML` 默认值为 `URL`。
`URLs or Body`	必填。要根据所选 `Input Type` 进行栅格化的输入内容。如果选择了 `URL`，请提供以英文逗号分隔的网址列表。如果选择 `Email` 或 `HTML`，请提供相应输入类型的完整内容正文。
`Output Type`	可选。栅格化内容的最终输出格式。可能的值如下： `PNG` `PDF` `Both` 默认值为 `PNG`。
`Export Method`	可选。用于输出生成的内容的方法。可能的值如下： `Case Attachment` `File Path` `Both` 默认值为 `Case Attachment`。
`Width`	必填。用于生成的栅格内容的宽度（以像素为单位）。默认值为 `1920`。
`Height`	必填。用于生成的栅格内容的高度（以像素为单位）。默认值为 `1080`。
`Full Screen`	可选。如果选中此选项，内容会在栅格化之前在整个浏览器窗口中呈现。默认情况下，该环境处于停用状态。
`Timeout`	可选。浏览器在开始栅格化之前用于渲染内容的最长时间（以秒为单位）。最大值为 `60`。默认值为 `120`。
`Wait For`	可选。浏览器在继续执行光栅化或内容提取操作之前必须达到的特定状态。 `NETWORK_IDLE` 状态通常最可靠。可能的值如下： `LOAD` `DOM_CONTENT_LOADED` `NETWORK_IDLE COMMIT` 默认值为 `NETWORK_IDLE`。
`Wait for Selector`	可选。一种 CSS 选择器，用于指定操作在捕获屏幕截图之前等待其出现在页面上。注意：对于内容动态加载的网页，强烈建议使用此设置，因为此设置可在操作执行之前确认所有元素都已存在。

操作输出

栅格化内容操作提供以下输出：

操作输出类型	可用性
案例墙附件	不可用
案例墙链接	不可用
“支持请求墙”表格	不可用
丰富化表	不可用
JSON 结果	可用
输出消息	可用
脚本结果	可用

JSON 结果

以下示例展示了使用栅格化内容操作时收到的 JSON 结果输出：

[
   {
       "attachment_name": "",
       "file_path": ""
   }
]

输出消息

栅格化内容操作可以返回以下输出消息：

输出消息消息说明

输出消息	消息说明
`Successfully rasterized content based on the provided input.` `Successfully rasterized content based on the following URLs: URLS` `Action wasn't able to rasterize content for the following URLs: URLS` `Action wasn't able to rasterize content for the provided URLs.`	操作成功。
`Error executing action "Rasterize Content". Reason: ERROR_REASON`	操作失败。检查与服务器的连接、输入参数或凭据。

Successfully rasterized content based on the provided input.

Successfully rasterized content based on the following URLs: URLS

Action wasn't able to rasterize content for the following URLs: URLS

Action wasn't able to rasterize content for the provided URLs.

操作成功。

Error executing action "Rasterize Content". Reason:
     ERROR_REASON

操作失败。

检查与服务器的连接、输入参数或凭据。

脚本结果

下表列出了使用 栅格化内容操作时脚本结果输出的值：

脚本结果名称	值
`is_success`	`true` 或 `false`