Sim

浏览器使用

运行浏览器自动化任务

BrowserUse 是一个强大的浏览器自动化平台,能够以编程方式创建和运行浏览器任务。它通过自然语言指令提供了一种自动化网页交互的方式,使您能够浏览网站、填写表单、提取数据以及执行复杂的操作序列,而无需编写代码。

使用 BrowserUse,您可以:

  • 自动化网页交互:浏览网站、点击按钮、填写表单以及执行其他浏览器操作
  • 提取数据:从网站抓取内容,包括文本、图片和结构化数据
  • 执行复杂工作流:将多个操作串联在一起,完成复杂的网页任务
  • 监控任务执行:通过可视化反馈实时观看浏览器任务的运行
  • 以编程方式处理结果:从网页自动化任务中接收结构化输出

在 Sim 中,BrowserUse 集成允许您的代理像人类用户一样与网页交互。这使得研究、数据收集、表单提交和网页测试等场景成为可能——所有这些都通过简单的自然语言指令实现。您的代理可以从网站收集信息,与网页应用交互,并执行通常需要手动浏览的操作,从而扩展其能力,将整个网络作为资源。

使用说明

使用 BrowserUse 执行浏览器自动化任务,浏览网页、抓取数据,并执行操作,就像真实用户在与浏览器交互一样。任务是异步运行的,模块会在返回结果之前轮询任务的完成状态。

工具

browser_use_run_task

使用 BrowserUse 运行浏览器自动化任务

输入

参数类型必需描述
taskstring浏览器代理应该执行的操作
variablesjson可选变量,用作密钥(格式:{key: value})
formatstring无描述
save_browser_databoolean是否保存浏览器数据
modelstring使用的 LLM 模型(默认:gpt-4o)
apiKeystringBrowserUse API 的 API 密钥

输出

参数类型描述
idstring任务执行标识符
successboolean任务完成状态
outputjson任务输出数据
stepsjson执行步骤

注意事项

  • 类别:tools
  • 类型:browser_use
浏览器使用