Tavily

Tavily 是一款专为 LLM 应用设计的 AI 驱动搜索 API。它提供可靠的实时信息检索功能，并针对 AI 使用场景优化了功能，包括语义搜索、内容提取和结构化数据检索。

使用 Tavily，您可以：

执行上下文搜索：基于语义理解获取相关结果，而不仅仅是关键词匹配
提取结构化内容：以干净、可用的格式从网页中提取特定信息
访问实时信息：从整个网络中检索最新数据
同时处理多个 URL：在单次请求中从多个网页提取内容
接收 AI 优化结果：获取专为 AI 系统使用而格式化的搜索结果

在 Sim 中，Tavily 集成使您的代理能够在其工作流程中搜索网络并提取信息。这支持需要从互联网获取最新信息的复杂自动化场景。您的代理可以制定搜索查询，检索相关结果，并从特定网页中提取内容，以支持其决策过程。此集成弥合了您的工作流程自动化与网络上广泛知识之间的差距，使您的代理无需人工干预即可访问实时信息。通过将 Sim 与 Tavily 连接，您可以创建能够跟上最新信息的代理，提供更准确的响应，并为用户带来更多价值。

参数	类型	必需	描述
`query`	字符串	是	要执行的搜索查询
`max_results`	数字	否	最大结果数量 (1-20)
`topic`	字符串	否	类别类型：general、news 或 finance (默认：general)
`search_depth`	字符串	否	搜索范围：basic (1 积分) 或 advanced (2 积分) (默认：basic)
`include_answer`	字符串	否	LLM 生成的响应：true/basic 表示快速回答，advanced 表示详细回答
`include_raw_content`	字符串	否	解析的 HTML 内容：true/markdown 或文本格式
`include_images`	布尔值	否	包括图片搜索结果
`include_image_descriptions`	布尔值	否	为图片添加描述性文本
`include_favicon`	布尔值	否	包括 favicon URL
`chunks_per_source`	数字	否	每个来源的最大相关块数 (1-3，默认：3)
`time_range`	字符串	否	按最新时间筛选：day/d、week/w、month/m、year/y
`start_date`	字符串	否	最早发布日期 (YYYY-MM-DD 格式)
`end_date`	字符串	否	最晚发布日期 (YYYY-MM-DD 格式)
`include_domains`	字符串	否	逗号分隔的白名单域名列表 (最多 300 个)
`exclude_domains`	字符串	否	逗号分隔的黑名单域名列表 (最多 150 个)
`country`	字符串	否	提升指定国家的结果 (仅限 general 主题)
`auto_parameters`	布尔值	否	根据查询意图自动配置参数
`apiKey`	字符串	是	Tavily API 密钥

输出

参数	类型	描述
`query`	字符串	已执行的搜索查询
`results`	数组	工具输出的结果

`tavily_extract`

使用 Tavily 同时从多个网页提取原始内容

输入

参数	类型	必需	描述
`urls`	字符串	是	要提取内容的 URL 或 URL 数组
`extract_depth`	字符串	否	提取深度 (basic=1 积分/5 个 URL，advanced=2 积分/5 个 URL)
`format`	字符串	否	输出格式：markdown 或 text (默认：markdown)
`include_images`	布尔值	否	在提取输出中包含图像
`include_favicon`	布尔值	否	为每个结果添加 favicon URL
`apiKey`	字符串	是	Tavily API 密钥

输出

参数	类型	描述
`results`	数组	已提取的 URL

`tavily_crawl`

使用 Tavily 系统化地爬取并提取网站内容

输入

参数	类型	必需	描述
`url`	字符串	是	开始爬取的根 URL
`instructions`	字符串	否	爬取器的自然语言指令 (每 10 页消耗 2 积分)
`max_depth`	数字	否	从基础 URL 探索的深度 (1-5，默认：1)
`max_breadth`	数字	否	每个页面级别跟随的链接数量 (≥1，默认：20)
`limit`	数字	否	停止前处理的总链接数量 (≥1，默认：50)
`select_paths`	字符串	否	用逗号分隔的正则表达式模式，用于包含特定的 URL 路径 (例如，/docs/.*)
`select_domains`	字符串	否	用逗号分隔的正则表达式模式，用于限制爬取特定域名
`exclude_paths`	字符串	否	用逗号分隔的正则表达式模式，用于跳过特定的 URL 路径
`exclude_domains`	字符串	否	用逗号分隔的正则表达式模式，用于屏蔽特定域名
`allow_external`	布尔值	否	在结果中包含外部域名链接 (默认：true)
`include_images`	布尔值	否	在爬取输出中包含图像
`extract_depth`	字符串	否	提取深度：basic (1 积分/5 页) 或 advanced (2 积分/5 页)
`format`	字符串	否	输出格式：markdown 或 text (默认：markdown)
`include_favicon`	布尔值	否	为每个结果添加 favicon URL
`apiKey`	字符串	是	Tavily API 密钥

输出

参数	类型	描述
`base_url`	字符串	被爬取的基础 URL
`results`	数组	被爬取的页面 URL

`tavily_map`

使用 Tavily 探索并可视化网站结构

输入

参数	类型	必需	描述
`url`	字符串	是	开始映射的根 URL
`instructions`	字符串	否	用于映射行为的自然语言指导 (每 10 页消耗 2 积分)
`max_depth`	数字	否	从基础 URL 探索的深度 (1-5，默认值：1)
`max_breadth`	数字	否	每级要跟随的链接数量 (默认值：20)
`limit`	数字	否	要处理的总链接数量 (默认值：50)
`select_paths`	字符串	否	用于 URL 路径过滤的逗号分隔正则表达式模式 (例如：/docs/.*)
`select_domains`	字符串	否	限制映射到特定域的逗号分隔正则表达式模式
`exclude_paths`	字符串	否	排除特定 URL 路径的逗号分隔正则表达式模式
`exclude_domains`	字符串	否	排除域的逗号分隔正则表达式模式
`allow_external`	布尔值	否	在结果中包含外部域链接 (默认值：true)
`apiKey`	字符串	是	Tavily API 密钥

输出

参数	类型	描述
`base_url`	字符串	被映射的基础 URL
`results`	数组	发现的 URL

Tavily

使用说明

工具

`tavily_search`

输入

输出

`tavily_extract`

输入

输出

`tavily_crawl`

输入

输出

`tavily_map`

输入

输出

On this page