Sim

Jina

Convertir contenido de sitios web en texto

Jina AI es una potente herramienta de extracción de contenido que se integra perfectamente con Sim para transformar el contenido web en texto limpio y legible. Esta integración permite a los desarrolladores incorporar fácilmente capacidades de procesamiento de contenido web en sus flujos de trabajo basados en agentes.

Jina AI Reader se especializa en extraer el contenido más relevante de las páginas web, eliminando el desorden, la publicidad y los problemas de formato para producir texto limpio y estructurado que está optimizado para modelos de lenguaje y otras tareas de procesamiento de texto.

Con la integración de Jina AI en Sim, puedes:

  • Extraer contenido limpio de cualquier página web simplemente proporcionando una URL
  • Procesar diseños web complejos en texto estructurado y legible
  • Mantener el contexto importante mientras eliminas elementos innecesarios
  • Preparar contenido web para su posterior procesamiento en tus flujos de trabajo con agentes
  • Agilizar tareas de investigación convirtiendo rápidamente la información web en datos utilizables

Esta integración es particularmente valiosa para crear agentes que necesitan recopilar y procesar información de la web, realizar investigaciones o analizar contenido en línea como parte de su flujo de trabajo.

Instrucciones de uso

Transforma el contenido web en texto limpio y legible utilizando las capacidades avanzadas de extracción de Jina AI. Extrae contenido significativo de sitios web mientras preservas información importante y opcionalmente recopilas enlaces.

Herramientas

jina_read_url

Extrae y procesa contenido web en texto limpio y compatible con LLM usando Jina AI Reader. Admite análisis avanzado de contenido, recopilación de enlaces y múltiples formatos de salida con opciones de procesamiento configurables.

Entrada

ParámetroTipoObligatorioDescripción
urlstringSíLa URL para leer y convertir a markdown
useReaderLMv2booleanNoSi se debe usar ReaderLM-v2 para mejor calidad
gatherLinksbooleanNoSi se deben recopilar todos los enlaces al final
jsonResponsebooleanNoSi se debe devolver la respuesta en formato JSON
apiKeystringSíTu clave API de Jina AI

Salida

ParámetroTipoDescripción
contentstringEl contenido extraído de la URL, procesado en texto limpio y compatible con LLM

Notas

  • Categoría: tools
  • Tipo: jina
Jina