Jina
将网站内容转换为文本
Jina AI 是一款强大的内容提取工具,可与 Sim 无缝集成,将网页内容转换为简洁、可读的文本。此集成使开发者能够轻松将网页内容处理功能融入其代理工作流中。
Jina AI Reader 专注于从网页中提取最相关的内容,去除杂乱、广告和格式问题,生成简洁、结构化的文本,优化语言模型和其他文本处理任务。
通过在 Sim 中集成 Jina AI,您可以:
- 从任何网页提取简洁内容,只需提供一个 URL
- 将复杂的网页布局 转换为结构化、可读的文本
- 保留重要的上下文,同时去除不必要的元素
- 为您的代理工作流 准备网页内容以供进一步处理
- 简化研究任务,快速将网页信息转换为可用数据
此集成对于构建需要从网页收集和处理信息、进行研究或分析在线内容的代理特别有价值。
使用说明
利用 Jina AI 的高级提取功能,将网页内容转换为简洁、可读的文本。从网站中提取有意义的内容,同时保留重要信息,并可选择性地收集链接。
工具
jina_read_url
使用 Jina AI Reader 提取和处理网页内容,生成简洁、适合 LLM 的文本。支持高级内容解析、链接收集和多种输出格式,并提供可配置的处理选项。
输入
参数 | 类型 | 必需 | 描述 |
---|---|---|---|
url | 字符串 | 是 | 要读取并转换为 markdown 的 URL |
useReaderLMv2 | 布尔值 | 否 | 是否使用 ReaderLM-v2 以获得更高质量 |
gatherLinks | 布尔值 | 否 | 是否在末尾收集所有链接 |
jsonResponse | 布尔值 | 否 | 是否以 JSON 格式返回响应 |
apiKey | 字符串 | 是 | 您的 Jina AI API 密钥 |
输出
参数 | 类型 | 描述 |
---|---|---|
content | string | 从 URL 中提取的内容,经过处理后成为简洁、适合 LLM 的文本 |
注意事项
- 类别:
tools
- 类型:
jina