Stagehand es una herramienta que permite tanto la extracción de datos estructurados de páginas web como la automatización web autónoma utilizando Browserbase y LLMs modernos (OpenAI o Anthropic).
Stagehand ofrece dos capacidades principales en Sim:
-
stagehand_extract: Extrae datos estructurados de una sola página web. Especificas lo que quieres (un esquema), y la IA recupera y analiza los datos en esa forma desde la página. Esto es mejor para extraer listas, campos u objetos cuando sabes exactamente qué información necesitas y dónde obtenerla.
-
stagehand_agent: Ejecuta un agente web autónomo capaz de completar tareas de múltiples pasos, interactuar con elementos, navegar entre páginas y devolver resultados estructurados. Esto es mucho más flexible: el agente puede hacer cosas como iniciar sesión, buscar, completar formularios, recopilar datos de múltiples lugares y generar un resultado final según un esquema solicitado.
Diferencias clave:
- stagehand_extract es una operación rápida de “extraer estos datos de esta página”. Funciona mejor para tareas de extracción directas, de un solo paso.
- stagehand_agent realiza tareas autónomas complejas de múltiples pasos en la web — como navegación, búsqueda o incluso transacciones — y puede extraer datos dinámicamente según tus instrucciones y un esquema opcional.
En la práctica, usa stagehand_extract cuando sabes qué quieres y dónde, y usa stagehand_agent cuando necesitas que un bot piense y ejecute flujos de trabajo interactivos.
Al integrar Stagehand, los agentes de Sim pueden automatizar la recopilación de datos, el análisis y la ejecución de flujos de trabajo en la web: actualizando bases de datos, organizando información y generando informes personalizados, de manera fluida y autónoma.
Instrucciones de uso
Integra Stagehand en el flujo de trabajo. Puede extraer datos estructurados de páginas web o ejecutar un agente autónomo para realizar tareas.
Herramientas
stagehand_extract
Extraer datos estructurados de una página web usando Stagehand
Entrada
| Parámetro | Tipo | Obligatorio | Descripción |
|---|---|---|---|
url | string | Sí | URL de la página web de la que extraer datos |
instruction | string | Sí | Instrucciones para la extracción |
provider | string | No | Proveedor de IA a utilizar: openai o anthropic |
apiKey | string | Sí | Clave API para el proveedor seleccionado |
schema | json | Sí | Esquema JSON que define la estructura de los datos a extraer |
Salida
| Parámetro | Tipo | Descripción |
|---|---|---|
data | object | Datos estructurados extraídos que coinciden con el esquema proporcionado |
stagehand_agent
Ejecutar un agente web autónomo para completar tareas y extraer datos estructurados
Entrada
| Parámetro | Tipo | Obligatorio | Descripción |
|---|---|---|---|
startUrl | string | Sí | URL de la página web donde iniciar el agente |
task | string | Sí | La tarea a completar o el objetivo a lograr en el sitio web |
variables | json | No | Variables opcionales para sustituir en la tarea (formato: {key: value}). Referencia en la tarea usando %key% |
format | string | No | Sin descripción |
provider | string | No | Proveedor de IA a utilizar: openai o anthropic |
apiKey | string | Sí | Clave API para el proveedor seleccionado |
outputSchema | json | No | Esquema JSON opcional que define la estructura de los datos que el agente debe devolver |
Salida
| Parámetro | Tipo | Descripción |
|---|---|---|
agentResult | objeto | Resultado de la ejecución del agente Stagehand |
Notas
- Categoría:
tools - Tipo:
stagehand