Jina
Convertir contenido de sitios web en texto
Jina AI es una potente herramienta de extracción de contenido que se integra perfectamente con Sim para transformar el contenido web en texto limpio y legible. Esta integración permite a los desarrolladores incorporar fácilmente capacidades de procesamiento de contenido web en sus flujos de trabajo basados en agentes.
Jina AI Reader se especializa en extraer el contenido más relevante de las páginas web, eliminando el desorden, la publicidad y los problemas de formato para producir texto limpio y estructurado que está optimizado para modelos de lenguaje y otras tareas de procesamiento de texto.
Con la integración de Jina AI en Sim, puedes:
- Extraer contenido limpio de cualquier página web simplemente proporcionando una URL
- Procesar diseños web complejos en texto estructurado y legible
- Mantener el contexto importante mientras eliminas elementos innecesarios
- Preparar contenido web para su posterior procesamiento en tus flujos de trabajo con agentes
- Agilizar tareas de investigación convirtiendo rápidamente la información web en datos utilizables
Esta integración es particularmente valiosa para crear agentes que necesitan recopilar y procesar información de la web, realizar investigaciones o analizar contenido en lÃnea como parte de su flujo de trabajo.
Instrucciones de uso
Transforma el contenido web en texto limpio y legible utilizando las capacidades avanzadas de extracción de Jina AI. Extrae contenido significativo de sitios web mientras preservas información importante y opcionalmente recopilas enlaces.
Herramientas
jina_read_url
Extrae y procesa contenido web en texto limpio y compatible con LLM usando Jina AI Reader. Admite análisis avanzado de contenido, recopilación de enlaces y múltiples formatos de salida con opciones de procesamiento configurables.
Entrada
Parámetro | Tipo | Obligatorio | Descripción |
---|---|---|---|
url | string | SÃ | La URL para leer y convertir a markdown |
useReaderLMv2 | boolean | No | Si se debe usar ReaderLM-v2 para mejor calidad |
gatherLinks | boolean | No | Si se deben recopilar todos los enlaces al final |
jsonResponse | boolean | No | Si se debe devolver la respuesta en formato JSON |
apiKey | string | SÃ | Tu clave API de Jina AI |
Salida
Parámetro | Tipo | Descripción |
---|---|---|
content | string | El contenido extraÃdo de la URL, procesado en texto limpio y compatible con LLM |
Notas
- CategorÃa:
tools
- Tipo:
jina