Sim

Jina

Konvertiere Website-Inhalte in Text

Jina AI ist ein leistungsstarkes Content-Extraktionstool, das sich nahtlos in Sim integriert, um Webinhalte in sauberen, lesbaren Text umzuwandeln. Diese Integration ermöglicht es Entwicklern, Webinhaltsverarbeitungsfunktionen einfach in ihre agentischen Workflows einzubinden.

Jina AI Reader ist darauf spezialisiert, die relevantesten Inhalte von Webseiten zu extrahieren, indem Unordnung, Werbung und Formatierungsprobleme entfernt werden, um sauberen, strukturierten Text zu erzeugen, der für Sprachmodelle und andere Textverarbeitungsaufgaben optimiert ist.

Mit der Jina AI-Integration in Sim können Sie:

  • Saubere Inhalte extrahieren von jeder Webseite, indem Sie einfach eine URL angeben
  • Komplexe Web-Layouts in strukturierten, lesbaren Text verarbeiten
  • Wichtigen Kontext beibehalten, während unnötige Elemente entfernt werden
  • Webinhalte vorbereiten für die weitere Verarbeitung in Ihren Agenten-Workflows
  • Rechercheaufgaben optimieren, indem Webinformationen schnell in nutzbare Daten umgewandelt werden

Diese Integration ist besonders wertvoll für die Erstellung von Agenten, die Informationen aus dem Web sammeln und verarbeiten, Recherchen durchführen oder Online-Inhalte als Teil ihres Workflows analysieren müssen.

Gebrauchsanweisung

Integrieren Sie Jina in den Workflow. Extrahiert Inhalte von Websites. Erfordert API-Schlüssel.

Tools

jina_read_url

Extrahieren und verarbeiten Sie Webinhalte in sauberen, LLM-freundlichen Text mit Jina AI Reader. Unterstützt fortschrittliches Content-Parsing, Link-Sammlung und mehrere Ausgabeformate mit konfigurierbaren Verarbeitungsoptionen.

Eingabe

ParameterTypErforderlichBeschreibung
urlstringJaDie URL, die gelesen und in Markdown konvertiert werden soll
useReaderLMv2booleanNeinOb ReaderLM-v2 für bessere Qualität verwendet werden soll
gatherLinksbooleanNeinOb alle Links am Ende gesammelt werden sollen
jsonResponsebooleanNeinOb die Antwort im JSON-Format zurückgegeben werden soll
apiKeystringJaIhr Jina AI API-Schlüssel

Ausgabe

ParameterTypBeschreibung
contentstringDer extrahierte Inhalt von der URL, verarbeitet in sauberen, LLM-freundlichen Text

Hinweise

  • Kategorie: tools
  • Typ: jina
Jina