Pulse

Pulse 工具利用最先进的 OCR（光学字符识别）技术，实现从各种文档（包括 PDF、图片和 Office 文件）中无缝提取文本和结构化内容。Pulse Parser 专为自动化智能代理工作流设计，帮助您轻松解锁隐藏在非结构化文档中的有价值信息，并将提取的内容直接集成到您的工作流中。

使用 Pulse，您可以：

Pulse Parser 非常适合自动化繁琐的文档审查、内容摘要、科研等场景，让真实世界的文档无缝融入数字化工作流时代。

如果您需要跨格式、跨语言、跨版式的高精度、可扩展、开发者友好的文档解析能力，Pulse 能让您的智能代理“读懂世界”。

使用说明

将 Pulse 集成到工作流程中。通过上传或文件引用，从 PDF 文档、图片和 Office 文件中提取文本。

参数	类型	必填	说明
`filePath`	string	否	要处理的文档 URL
`file`	file	否	要处理的文档文件
`fileUpload`	object	否	来自文件上传组件的文件上传数据
`pages`	string	否	要处理的页码范围（从 1 开始，例如 "1-2, 5"）
`extractFigure`	boolean	否	启用文档中的图像提取
`figureDescription`	boolean	否	为提取的图像生成描述/标题
`returnHtml`	boolean	否	在响应中包含 HTML
`chunking`	string	否	分块策略（用逗号分隔：semantic、header、page、recursive）
`chunkSize`	number	否	启用分块时每块的最大字符数
`apiKey`	string	是	Pulse API key

此工具不产生任何输出。