Sim

Jina

将网站内容转换为文本

Jina AI 是一款强大的内容提取工具,可与 Sim 无缝集成,将网页内容转换为简洁、可读的文本。此集成使开发者能够轻松将网页内容处理功能融入其代理工作流中。

Jina AI Reader 专注于从网页中提取最相关的内容,去除杂乱、广告和格式问题,生成简洁、结构化的文本,优化语言模型和其他文本处理任务。

通过在 Sim 中集成 Jina AI,您可以:

  • 从任何网页提取简洁内容,只需提供一个 URL
  • 将复杂的网页布局 转换为结构化、可读的文本
  • 保留重要的上下文,同时去除不必要的元素
  • 为您的代理工作流 准备网页内容以供进一步处理
  • 简化研究任务,快速将网页信息转换为可用数据

此集成对于构建需要从网页收集和处理信息、进行研究或分析在线内容的代理特别有价值。

使用说明

利用 Jina AI 的高级提取功能,将网页内容转换为简洁、可读的文本。从网站中提取有意义的内容,同时保留重要信息,并可选择性地收集链接。

工具

jina_read_url

使用 Jina AI Reader 提取和处理网页内容,生成简洁、适合 LLM 的文本。支持高级内容解析、链接收集和多种输出格式,并提供可配置的处理选项。

输入

参数类型必需描述
url字符串要读取并转换为 markdown 的 URL
useReaderLMv2布尔值是否使用 ReaderLM-v2 以获得更高质量
gatherLinks布尔值是否在末尾收集所有链接
jsonResponse布尔值是否以 JSON 格式返回响应
apiKey字符串您的 Jina AI API 密钥

输出

参数类型描述
contentstring从 URL 中提取的内容,经过处理后成为简洁、适合 LLM 的文本

注意事项

  • 类别:tools
  • 类型:jina
Jina