Jina
Konvertiere Website-Inhalte in Text
Jina AI ist ein leistungsstarkes Content-Extraktionstool, das sich nahtlos in Sim integriert, um Webinhalte in sauberen, lesbaren Text umzuwandeln. Diese Integration ermöglicht es Entwicklern, Webinhaltsverarbeitungsfunktionen einfach in ihre agentischen Workflows einzubinden.
Jina AI Reader ist darauf spezialisiert, die relevantesten Inhalte von Webseiten zu extrahieren, indem Unordnung, Werbung und Formatierungsprobleme entfernt werden, um sauberen, strukturierten Text zu erzeugen, der für Sprachmodelle und andere Textverarbeitungsaufgaben optimiert ist.
Mit der Jina AI-Integration in Sim können Sie:
- Saubere Inhalte extrahieren von jeder Webseite, indem Sie einfach eine URL angeben
- Komplexe Web-Layouts in strukturierten, lesbaren Text verarbeiten
- Wichtigen Kontext beibehalten, während unnötige Elemente entfernt werden
- Webinhalte vorbereiten für die weitere Verarbeitung in Ihren Agenten-Workflows
- Rechercheaufgaben optimieren, indem Webinformationen schnell in nutzbare Daten umgewandelt werden
Diese Integration ist besonders wertvoll für die Erstellung von Agenten, die Informationen aus dem Web sammeln und verarbeiten, Recherchen durchführen oder Online-Inhalte als Teil ihres Workflows analysieren müssen.
Gebrauchsanweisung
Integrieren Sie Jina in den Workflow. Extrahiert Inhalte von Websites. Erfordert API-Schlüssel.
Tools
jina_read_url
Extrahieren und verarbeiten Sie Webinhalte in sauberen, LLM-freundlichen Text mit Jina AI Reader. Unterstützt fortschrittliches Content-Parsing, Link-Sammlung und mehrere Ausgabeformate mit konfigurierbaren Verarbeitungsoptionen.
Eingabe
Parameter | Typ | Erforderlich | Beschreibung |
---|---|---|---|
url | string | Ja | Die URL, die gelesen und in Markdown konvertiert werden soll |
useReaderLMv2 | boolean | Nein | Ob ReaderLM-v2 für bessere Qualität verwendet werden soll |
gatherLinks | boolean | Nein | Ob alle Links am Ende gesammelt werden sollen |
jsonResponse | boolean | Nein | Ob die Antwort im JSON-Format zurückgegeben werden soll |
apiKey | string | Ja | Ihr Jina AI API-Schlüssel |
Ausgabe
Parameter | Typ | Beschreibung |
---|---|---|
content | string | Der extrahierte Inhalt von der URL, verarbeitet in sauberen, LLM-freundlichen Text |
Hinweise
- Kategorie:
tools
- Typ:
jina