Sim

Mistral Parser

从 PDF 文档中提取文本

Mistral Parse 工具提供了一种强大的方式,通过 Mistral 的 OCR API 从 PDF 文档中提取和处理内容。该工具利用先进的光学字符识别技术,能够准确提取 PDF 文件中的文本和结构,使文档数据轻松融入您的代理工作流程。

使用 Mistral Parse 工具,您可以:

  • 从 PDF 中提取文本:将 PDF 内容准确转换为文本、Markdown 或 JSON 格式
  • 处理来自 URL 的 PDF:通过提供在线托管的 PDF 的 URL,直接提取内容
  • 保留文档结构:保留原始 PDF 的格式、表格和布局
  • 提取图像:可选地包含 PDF 中嵌入的图像
  • 选择特定页面:仅处理多页文档中您需要的页面

Mistral Parse 工具在需要处理 PDF 内容的场景中特别有用,例如分析报告、从表单中提取数据或处理扫描文档中的文本。它简化了将 PDF 内容提供给代理的过程,使他们能够像处理直接文本输入一样轻松地处理存储在 PDF 中的信息。

使用说明

使用 Mistral 的 OCR API 从 PDF 文档中提取文本和结构。您可以输入 PDF 文档的 URL 或直接上传 PDF 文件。配置处理选项,并以您首选的格式获取内容。对于 URL,必须是公开可访问的并指向有效的 PDF 文件。注意:不支持 Google Drive、Dropbox 和其他云存储链接;请使用来自 Web 服务器的直接下载 URL。

工具

mistral_parser

使用 Mistral OCR API 解析 PDF 文档

输入

参数类型必需描述
filePath字符串要处理的 PDF 文档的 URL
fileUpload对象来自文件上传组件的文件上传数据
resultType字符串解析结果的类型(markdown、text 或 json)。默认为 markdown。
includeImageBase64布尔值在响应中包含 base64 编码的图像
pages数组要处理的特定页面(页面编号数组,从 0 开始)
imageLimit数字从 PDF 中提取的最大图像数量
imageMinSize数字从 PDF 中提取的图像的最小高度和宽度
apiKey字符串Mistral API 密钥(MISTRAL_API_KEY)

输出

参数类型描述
successbooleanPDF 是否成功解析
contentstring按请求格式提取的内容(markdown、text 或 JSON)
metadataobject包括 jobId、fileType、pageCount 和使用信息的处理元数据

注意事项

  • 类别:tools
  • 类型:mistral_parse
Mistral Parser