Sim

Tavily

搜索和提取信息

Tavily 是一款专为 LLM 应用设计的 AI 驱动搜索 API。它提供可靠的实时信息检索功能,并针对 AI 使用场景优化了功能,包括语义搜索、内容提取和结构化数据检索。

使用 Tavily,您可以:

  • 执行上下文搜索:基于语义理解获取相关结果,而不仅仅是关键词匹配
  • 提取结构化内容:以干净、可用的格式从网页中提取特定信息
  • 访问实时信息:从整个网络中检索最新数据
  • 同时处理多个 URL:在单次请求中从多个网页提取内容
  • 接收 AI 优化结果:获取专为 AI 系统使用而格式化的搜索结果

在 Sim 中,Tavily 集成使您的代理能够在其工作流程中搜索网络并提取信息。这支持需要从互联网获取最新信息的复杂自动化场景。您的代理可以制定搜索查询,检索相关结果,并从特定网页中提取内容,以支持其决策过程。此集成弥合了您的工作流程自动化与网络上广泛知识之间的差距,使您的代理无需人工干预即可访问实时信息。通过将 Sim 与 Tavily 连接,您可以创建能够跟上最新信息的代理,提供更准确的响应,并为用户带来更多价值。

使用说明

将 Tavily 集成到工作流程中。可以搜索网页并从特定 URL 提取内容。需要 API 密钥。

工具

使用 Tavily 执行由 AI 驱动的网页搜索

输入

参数类型必需描述
query字符串要执行的搜索查询
max_results数字最大结果数量 (1-20)
topic字符串类别类型:general、news 或 finance (默认:general)
search_depth字符串搜索范围:basic (1 积分) 或 advanced (2 积分) (默认:basic)
include_answer字符串LLM 生成的响应:true/basic 表示快速回答,advanced 表示详细回答
include_raw_content字符串解析的 HTML 内容:true/markdown 或文本格式
include_images布尔值包括图片搜索结果
include_image_descriptions布尔值为图片添加描述性文本
include_favicon布尔值包括 favicon URL
chunks_per_source数字每个来源的最大相关块数 (1-3,默认:3)
time_range字符串按最新时间筛选:day/d、week/w、month/m、year/y
start_date字符串最早发布日期 (YYYY-MM-DD 格式)
end_date字符串最晚发布日期 (YYYY-MM-DD 格式)
include_domains字符串逗号分隔的白名单域名列表 (最多 300 个)
exclude_domains字符串逗号分隔的黑名单域名列表 (最多 150 个)
country字符串提升指定国家的结果 (仅限 general 主题)
auto_parameters布尔值根据查询意图自动配置参数
apiKey字符串Tavily API 密钥

输出

参数类型描述
query字符串已执行的搜索查询
results数组工具输出的结果

tavily_extract

使用 Tavily 同时从多个网页提取原始内容

输入

参数类型必需描述
urls字符串要提取内容的 URL 或 URL 数组
extract_depth字符串提取深度 (basic=1 积分/5 个 URL,advanced=2 积分/5 个 URL)
format字符串输出格式:markdown 或 text (默认:markdown)
include_images布尔值在提取输出中包含图像
include_favicon布尔值为每个结果添加 favicon URL
apiKey字符串Tavily API 密钥

输出

参数类型描述
results数组已提取的 URL

tavily_crawl

使用 Tavily 系统化地爬取并提取网站内容

输入

参数类型必需描述
url字符串开始爬取的根 URL
instructions字符串爬取器的自然语言指令 (每 10 页消耗 2 积分)
max_depth数字从基础 URL 探索的深度 (1-5,默认:1)
max_breadth数字每个页面级别跟随的链接数量 (≥1,默认:20)
limit数字停止前处理的总链接数量 (≥1,默认:50)
select_paths字符串用逗号分隔的正则表达式模式,用于包含特定的 URL 路径 (例如,/docs/.*)
select_domains字符串用逗号分隔的正则表达式模式,用于限制爬取特定域名
exclude_paths字符串用逗号分隔的正则表达式模式,用于跳过特定的 URL 路径
exclude_domains字符串用逗号分隔的正则表达式模式,用于屏蔽特定域名
allow_external布尔值在结果中包含外部域名链接 (默认:true)
include_images布尔值在爬取输出中包含图像
extract_depth字符串提取深度:basic (1 积分/5 页) 或 advanced (2 积分/5 页)
format字符串输出格式:markdown 或 text (默认:markdown)
include_favicon布尔值为每个结果添加 favicon URL
apiKey字符串Tavily API 密钥

输出

参数类型描述
base_url字符串被爬取的基础 URL
results数组被爬取的页面 URL

tavily_map

使用 Tavily 探索并可视化网站结构

输入

参数类型必需描述
url字符串开始映射的根 URL
instructions字符串用于映射行为的自然语言指导 (每 10 页消耗 2 积分)
max_depth数字从基础 URL 探索的深度 (1-5,默认值:1)
max_breadth数字每级要跟随的链接数量 (默认值:20)
limit数字要处理的总链接数量 (默认值:50)
select_paths字符串用于 URL 路径过滤的逗号分隔正则表达式模式 (例如:/docs/.*)
select_domains字符串限制映射到特定域的逗号分隔正则表达式模式
exclude_paths字符串排除特定 URL 路径的逗号分隔正则表达式模式
exclude_domains字符串排除域的逗号分隔正则表达式模式
allow_external布尔值在结果中包含外部域链接 (默认值:true)
apiKey字符串Tavily API 密钥

输出

参数类型描述
base_url字符串被映射的基础 URL
results数组发现的 URL

注意事项

  • 类别:tools
  • 类型:tavily
On this page

On this page

Start building today
Trusted by over 60,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started