Pulse

Das Pulse-Tool ermöglicht die nahtlose Extraktion von Text und strukturierten Inhalten aus einer Vielzahl von Dokumenten – einschließlich PDFs, Bildern und Office-Dateien – mithilfe modernster OCR (Optical Character Recognition) von Pulse. Pulse Parser wurde für automatisierte agentische Workflows entwickelt und macht es einfach, wertvolle Informationen aus unstrukturierten Dokumenten freizusetzen und die extrahierten Inhalte direkt in Ihren Workflow zu integrieren.

Mit Pulse können Sie:

Text aus Dokumenten extrahieren: Konvertieren Sie gescannte PDFs, Bilder und Office-Dokumente schnell in verwendbaren Text, Markdown oder JSON.
Dokumente per URL oder Upload verarbeiten: Geben Sie einfach eine Datei-URL an oder nutzen Sie den Upload, um Text aus lokalen Dokumenten oder Remote-Ressourcen zu extrahieren.
Flexible Ausgabeformate: Wählen Sie zwischen Markdown, reinem Text oder JSON-Darstellungen des extrahierten Inhalts für die Weiterverarbeitung.
Selektive Seitenverarbeitung: Geben Sie einen Seitenbereich an, um Verarbeitungszeit und Kosten zu reduzieren, wenn Sie nur einen Teil eines Dokuments benötigen.
Abbildungs- und Tabellenextraktion: Extrahieren Sie optional Abbildungen und Tabellen mit automatischer Generierung von Bildunterschriften und Beschreibungen für angereicherten Kontext.
Verarbeitungseinblicke erhalten: Erhalten Sie detaillierte Metadaten zu jedem Auftrag, einschließlich Dateityp, Seitenanzahl, Verarbeitungszeit und mehr.
Integrationsfertige Antworten: Integrieren Sie extrahierte Inhalte in Recherche-, Workflow-Automatisierungs- oder Datenanalyse-Pipelines.

Ideal zur Automatisierung mühsamer Dokumentenprüfung, zur Ermöglichung von Inhaltszusammenfassungen, Recherche und mehr – Pulse Parser bringt reale Dokumente in die Ära des digitalen Workflows.

Wenn Sie präzise, skalierbare und entwicklerfreundliche Dokumenten-Parsing-Funktionen benötigen – über Formate, Sprachen und Layouts hinweg – befähigt Pulse Ihre Agenten, die Welt zu lesen.

Parameter	Typ	Erforderlich	Beschreibung
`filePath`	string	Nein	URL zu einem zu verarbeitenden Dokument
`file`	file	Nein	Zu verarbeitende Dokumentdatei
`fileUpload`	object	Nein	Datei-Upload-Daten aus der Datei-Upload-Komponente
`pages`	string	Nein	Zu verarbeitender Seitenbereich (1-indiziert, z. B. "1-2,5")
`extractFigure`	boolean	Nein	Aktiviert die Extraktion von Abbildungen aus dem Dokument
`figureDescription`	boolean	Nein	Generiert Beschreibungen/Bildunterschriften für extrahierte Abbildungen
`returnHtml`	boolean	Nein	HTML in der Antwort einschließen
`chunking`	string	Nein	Chunking-Strategien (kommagetrennt: semantic, header, page, recursive)
`chunkSize`	number	Nein	Maximale Zeichen pro Chunk, wenn Chunking aktiviert ist
`apiKey`	string	Ja	Pulse-API-Schlüssel

Ausgabe

Dieses Tool erzeugt keine Ausgaben.

Pulse

Nutzungsanweisungen

Tools

`pulse_parser`

Eingabe

Ausgabe

On this page