Jina
Convertir le contenu d'un site web en texte
Jina AI est un puissant outil d'extraction de contenu qui s'intÚgre parfaitement à Sim pour transformer le contenu web en texte propre et lisible. Cette intégration permet aux développeurs d'incorporer facilement des capacités de traitement de contenu web dans leurs flux de travail d'agents.
Jina AI Reader se spécialise dans l'extraction du contenu le plus pertinent des pages web, en supprimant les éléments superflus, les publicités et les problÚmes de formatage pour produire un texte propre et structuré, optimisé pour les modÚles de langage et autres tùches de traitement de texte.
Avec l'intégration de Jina AI dans Sim, vous pouvez :
- Extraire du contenu propre de n'importe quelle page web en fournissant simplement une URL
- Traiter des mises en page web complexes en texte structuré et lisible
- Maintenir le contexte important tout en supprimant les éléments inutiles
- Préparer le contenu web pour un traitement ultérieur dans vos flux de travail d'agents
- Simplifier les tùches de recherche en convertissant rapidement les informations web en données utilisables
Cette intégration est particuliÚrement précieuse pour créer des agents qui doivent recueillir et traiter des informations du web, mener des recherches ou analyser du contenu en ligne dans le cadre de leur flux de travail.
Instructions d'utilisation
Transformez le contenu web en texte propre et lisible grùce aux capacités d'extraction avancées de Jina AI. Extrayez du contenu significatif des sites web tout en préservant les informations importantes et en recueillant éventuellement des liens.
Outils
jina_read_url
Extrayez et traitez le contenu web en texte propre et adapté aux LLM avec Jina AI Reader. Prend en charge l'analyse avancée du contenu, la collecte de liens et plusieurs formats de sortie avec des options de traitement configurables.
Entrée
ParamĂštre | Type | Obligatoire | Description |
---|---|---|---|
url | string | Oui | L'URL Ă lire et Ă convertir en markdown |
useReaderLMv2 | boolean | Non | Indique s'il faut utiliser ReaderLM-v2 pour une meilleure qualité |
gatherLinks | boolean | Non | Indique s'il faut rassembler tous les liens Ă la fin |
jsonResponse | boolean | Non | Indique s'il faut renvoyer la réponse au format JSON |
apiKey | string | Oui | Votre clé API Jina AI |
Sortie
ParamĂštre | Type | Description |
---|---|---|
content | string | Le contenu extrait de l'URL, traité en texte propre et adapté aux LLM |
Notes
- Catégorie :
tools
- Type :
jina