Sim

Stagehand

网页自动化和数据提取

Stagehand 是一款工具,可以通过 Browserbase 和现代 LLMs(如 OpenAI 或 Anthropic)实现从网页中提取结构化数据以及自主网页自动化。

Stagehand 在 Sim 中提供了两项主要功能:

  • stagehand_extract:从单个网页中提取结构化数据。您可以指定所需内容(一个模式),AI 会从页面中以该格式检索并解析数据。这非常适合在您明确知道需要什么信息以及从哪里获取时,用于提取列表、字段或对象。

  • stagehand_agent:运行一个自主的网页代理,能够完成多步骤任务,与元素交互,在页面之间导航,并返回结构化结果。这更加灵活:代理可以执行登录、搜索、填写表单、从多个地方收集数据,并根据请求的模式输出最终结果。

关键区别:

  • stagehand_extract 是一个快速的“从这个页面提取这些数据”的操作。它最适合直接的、一步完成的提取任务。
  • stagehand_agent 执行复杂的、多步骤的自主网页任务,例如导航、搜索,甚至交易,并可以根据您的指示和可选的模式动态提取数据。

在实际应用中,当您知道需要什么以及在哪里时,请使用 stagehand_extract;当您需要一个机器人思考并执行交互式工作流程时,请使用 stagehand_agent

通过集成 Stagehand,Sim 代理可以在网页上自动化数据收集、分析和工作流程执行:更新数据库、组织信息以及生成自定义报告——无缝且自主地完成。

使用说明

将 Stagehand 集成到工作流程中。可以从网页中提取结构化数据,或运行自主代理执行任务。

工具

stagehand_extract

使用 Stagehand 从网页中提取结构化数据

输入

参数类型必需描述
urlstring要提取数据的网页 URL
instructionstring提取的指令
providerstring要使用的 AI 提供商:openai 或 anthropic
apiKeystring所选提供商的 API 密钥
schemajson定义要提取数据结构的 JSON 架构

输出

参数类型描述
dataobject符合提供架构的提取结构化数据

stagehand_agent

运行自主网页代理以完成任务并提取结构化数据

输入

参数类型必需描述
startUrlstring启动代理的网页 URL
taskstring在网站上完成的任务或目标
variablesjson任务中可替换的可选变量(格式:{key: value})。在任务中使用 %key% 引用
formatstring无描述
providerstring要使用的 AI 提供商:openai 或 anthropic
apiKeystring所选提供商的 API 密钥
outputSchemajson定义代理应返回数据结构的可选 JSON 架构

输出

参数类型描述
agentResultobjectStagehand 代理执行的结果

注意事项

  • 类别:tools
  • 类型:stagehand
On this page

On this page

Start building today
Trusted by over 60,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started