Sim

Jina

Durchsuche das Web oder extrahiere Inhalte aus URLs

Jina AI ist ein leistungsstarkes Content-Extraktionstool, das sich nahtlos in Sim integriert, um Webinhalte in sauberen, lesbaren Text umzuwandeln. Diese Integration ermöglicht es Entwicklern, Webinhaltsverarbeitungsfunktionen einfach in ihre agentischen Workflows einzubinden.

Jina AI Reader ist darauf spezialisiert, die relevantesten Inhalte von Webseiten zu extrahieren, indem Unordnung, Werbung und Formatierungsprobleme entfernt werden, um sauberen, strukturierten Text zu erzeugen, der für Sprachmodelle und andere Textverarbeitungsaufgaben optimiert ist.

Mit der Jina AI-Integration in Sim können Sie:

  • Saubere Inhalte extrahieren von jeder Webseite, indem Sie einfach eine URL angeben
  • Komplexe Web-Layouts in strukturierten, lesbaren Text verarbeiten
  • Wichtigen Kontext beibehalten, während unnötige Elemente entfernt werden
  • Webinhalte vorbereiten für die weitere Verarbeitung in Ihren Agenten-Workflows
  • Rechercheaufgaben optimieren, indem Webinformationen schnell in nutzbare Daten umgewandelt werden

Diese Integration ist besonders wertvoll für die Erstellung von Agenten, die Informationen aus dem Web sammeln und verarbeiten, Recherchen durchführen oder Online-Inhalte als Teil ihres Workflows analysieren müssen.

Gebrauchsanweisung

Integriere Jina AI in den Workflow. Durchsuche das Web und erhalte LLM-freundliche Ergebnisse oder extrahiere saubere Inhalte aus bestimmten URLs mit erweiterten Parsing-Optionen.

Tools

jina_read_url

Extrahieren und verarbeiten Sie Webinhalte in sauberen, LLM-freundlichen Text mit Jina AI Reader. Unterstützt fortschrittliches Content-Parsing, Link-Sammlung und mehrere Ausgabeformate mit konfigurierbaren Verarbeitungsoptionen.

Eingabe

ParameterTypeRequiredDescription
urlstringYesDie URL, die gelesen und in Markdown konvertiert werden soll
useReaderLMv2booleanNoOb ReaderLM-v2 für bessere Qualität verwendet werden soll (3-fache Token-Kosten)
gatherLinksbooleanNoOb alle Links am Ende gesammelt werden sollen
jsonResponsebooleanNoOb die Antwort im JSON-Format zurückgegeben werden soll
apiKeystringYesIhr Jina AI API-Schlüssel
withImagesummarybooleanNoAlle Bilder von der Seite mit Metadaten sammeln
retainImagesstringNoSteuerung der Bildeinbindung: "none" entfernt alle, "all" behält alle bei
returnFormatstringNoAusgabeformat: markdown, html, text, screenshot oder pageshot
withIframebooleanNoIframe-Inhalte in die Extraktion einbeziehen
withShadowDombooleanNoShadow-DOM-Inhalte extrahieren
noCachebooleanNoZwischengespeicherte Inhalte umgehen für Echtzeit-Abruf
withGeneratedAltbooleanNoAlt-Text für Bilder mit VLM generieren
robotsTxtstringNoBot User-Agent für robots.txt-Prüfung
dntbooleanNoDo Not Track - verhindert Caching/Tracking
noGfmbooleanNoGitHub Flavored Markdown deaktivieren

Ausgabe

ParameterTypBeschreibung
contentstringDer extrahierte Inhalt von der URL, verarbeitet zu sauberem, LLM-freundlichem Text
linksarrayListe der auf der Seite gefundenen Links (wenn gatherLinks oder withLinksummary aktiviert ist)
imagesarrayListe der auf der Seite gefundenen Bilder (wenn withImagesummary aktiviert ist)

Durchsucht das Web und gibt die Top 5 Ergebnisse mit LLM-freundlichem Inhalt zurück. Jedes Ergebnis wird automatisch über die Jina Reader API verarbeitet. Unterstützt geografische Filterung, Website-Einschränkungen und Paginierung.

Eingabe

ParameterTypeRequiredDescription
qstringYesSuchanfrage-String
apiKeystringYesIhr Jina AI API-Schlüssel
numnumberNoMaximale Anzahl von Ergebnissen pro Seite (Standard: 5)
sitestringNoErgebnisse auf bestimmte Domain(s) beschränken. Kann durch Kommas getrennt für mehrere Seiten sein (z.B. "jina.ai,github.com")
withFaviconbooleanNoWebsite-Favicons in Ergebnissen einbeziehen
withImagesummarybooleanNoAlle Bilder von Ergebnisseiten mit Metadaten sammeln
withLinksummarybooleanNoAlle Links von Ergebnisseiten sammeln
retainImagesstringNoSteuerung der Bildeinbindung: "none" entfernt alle, "all" behält alle bei
noCachebooleanNoZwischengespeicherte Inhalte umgehen für Echtzeit-Abruf
withGeneratedAltbooleanNoAlt-Text für Bilder mit VLM generieren
respondWithstringNoAuf "no-content" setzen, um nur Metadaten ohne Seiteninhalt zu erhalten
returnFormatstringNoAusgabeformat: markdown, html, text, screenshot oder pageshot

Ausgabe

ParameterTypBeschreibung
resultsarrayArray von Suchergebnissen, die jeweils Titel, Beschreibung, URL und LLM-freundlichen Inhalt enthalten

Hinweise

  • Kategorie: tools
  • Typ: jina
On this page

On this page

Start building today
Trusted by over 60,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started