图片实用程序
一组实用程序操作,可在调查期间帮助分析、提取和转换图片和文件内容。主要功能包括用于提取文本的光学字符识别 (OCR)、栅格化(将网页内容转换为静态图片)和文件格式转换。所有操作都需要远程代理。
操作
如需详细了解操作,请参阅 在工作台页面中处理待处理的操作和执行手动操作。
转换文件
使用转换文件操作可更改指定文件的格式。
操作输入
转换文件操作需要以下参数:
| 参数 | 说明 |
|---|---|
Input File Format |
必填。 相应操作所转换的文件的原始格式。 可能的值如下:
默认值为 |
Input File Path |
必填。 相应操作转换的文件的路径。 |
Output File Format |
必填。 转换过程完成后文件的最终格式。 可能的值如下:
默认值为 |
操作输出
转换文件操作可提供以下输出:
| 操作输出类型 | 可用性 |
|---|---|
| 案例墙附件 | 不可用 |
| 案例墙链接 | 不可用 |
| “支持请求墙”表格 | 不可用 |
| 丰富化表 | 不可用 |
| JSON 结果 | 可用 |
| 输出消息 | 可用 |
| 脚本结果 | 可用 |
JSON 结果
以下示例展示了使用转换文件操作时收到的 JSON 结果输出:
[
{
"output_format": ""
"file_path": ""
}
]
输出消息
转换文件操作可能会返回以下输出消息:
| 输出消息 | 消息说明 |
|---|---|
|
操作成功。 |
Error executing action "Convert File". Reason:
ERROR_REASON |
操作失败。 检查与服务器的连接、输入参数或凭据。 |
脚本结果
下表列出了使用转换文件操作时脚本结果输出的值:
| 脚本结果名称 | 值 |
|---|---|
is_success |
true 或 false |
OCR 图像
使用 OCR 图像操作执行 OCR 并从图像文件中提取文本。
操作输入
OCR 图像操作需要以下参数:
| 参数 | 说明 |
|---|---|
Base64 Encoded Image |
可选。 图片文件的 base64 编码字符串。 |
File Path |
必填。 图片文件的路径。 |
操作输出
OCR 图片操作提供以下输出:
| 操作输出类型 | 可用性 |
|---|---|
| 案例墙附件 | 不可用 |
| 案例墙链接 | 不可用 |
| “支持请求墙”表格 | 不可用 |
| 丰富化表 | 不可用 |
| JSON 结果 | 可用 |
| 输出消息 | 可用 |
| 脚本结果 | 可用 |
JSON 结果
以下示例展示了使用 OCR 图片操作时收到的 JSON 结果输出:
{
"extracted_text": "",
}
输出消息
OCR Image 操作可以返回以下输出消息:
| 输出消息 | 消息说明 |
|---|---|
|
操作成功。 |
Error executing action "OCR Image". Reason:
ERROR_REASON |
操作失败。 检查与服务器的连接、输入参数或凭据。 |
脚本结果
下表列出了使用 OCR 图像操作时脚本结果输出的值:
| 脚本结果名称 | 值 |
|---|---|
is_success |
true 或 false |
栅格化内容
使用光栅化内容操作将矢量或复杂内容转换为固定的位图图像格式。
远程代理前提条件 (Debian)
为确保 Rasterize Content 操作在基于 Debian 的远程代理上成功运行,您必须安装以下软件包和依赖项:
Playwright Python 库
使用以下命令安装 Playwright Python 库:
python3.11 -m pip install playwright
浏览器依赖项
安装必要的 Chromium 浏览器依赖项,以便 Playwright 正常运行:
playwright install --with-deps chromium
操作输入
| 参数 | 说明 |
|---|---|
Input Type |
必填。 相应操作用作主要输入的内容类型。 可能的值如下:
默认值为 |
URLs or Body |
必填。 要根据所选 如果选择了 如果选择 |
Output Type |
可选。 栅格化内容的最终输出格式。 可能的值如下:
默认值为 |
Export Method |
可选。 用于输出生成的内容的方法。 可能的值如下:
默认值为 |
Width |
必填。 用于生成的栅格内容的宽度(以像素为单位)。 默认值为 |
Height |
必填。 用于生成的栅格内容的高度(以像素为单位)。 默认值为 |
Full Screen |
可选。 如果选中此选项,内容会在栅格化之前在整个浏览器窗口中呈现。 默认情况下,该环境处于停用状态。 |
Timeout |
可选。 浏览器在开始栅格化之前用于渲染内容的最长时间(以秒为单位)。 最大值为 默认值为 |
Wait For |
可选。 浏览器在继续执行光栅化或内容提取操作之前必须达到的特定状态。
可能的值如下:
默认值为 |
Wait for Selector |
可选。 一种 CSS 选择器,用于指定操作在捕获屏幕截图之前等待其出现在页面上。 |
操作输出
栅格化内容操作提供以下输出:
| 操作输出类型 | 可用性 |
|---|---|
| 案例墙附件 | 不可用 |
| 案例墙链接 | 不可用 |
| “支持请求墙”表格 | 不可用 |
| 丰富化表 | 不可用 |
| JSON 结果 | 可用 |
| 输出消息 | 可用 |
| 脚本结果 | 可用 |
JSON 结果
以下示例展示了使用栅格化内容操作时收到的 JSON 结果输出:
[
{
"attachment_name": "",
"file_path": ""
}
]
输出消息
栅格化内容操作可以返回以下输出消息:
| 输出消息 | 消息说明 |
|---|---|
|
操作成功。 |
Error executing action "Rasterize Content". Reason:
ERROR_REASON |
操作失败。 检查与服务器的连接、输入参数或凭据。 |
脚本结果
下表列出了使用 栅格化内容操作时脚本结果输出的值:
| 脚本结果名称 | 值 |
|---|---|
is_success |
true 或 false |
需要更多帮助?获得社区成员和 Google SecOps 专业人士的解答。