Pulse

Extrahieren Sie Text aus Dokumenten mit Pulse OCR

Das Pulse-Tool ermöglicht die nahtlose Extraktion von Text und strukturierten Inhalten aus einer Vielzahl von Dokumenten – einschließlich PDFs, Bildern und Office-Dateien – mithilfe modernster OCR (Optical Character Recognition) von Pulse. Pulse Parser wurde für automatisierte agentische Workflows entwickelt und macht es einfach, wertvolle Informationen aus unstrukturierten Dokumenten freizusetzen und die extrahierten Inhalte direkt in Ihren Workflow zu integrieren.

Mit Pulse können Sie:

  • Text aus Dokumenten extrahieren: Konvertieren Sie gescannte PDFs, Bilder und Office-Dokumente schnell in verwendbaren Text, Markdown oder JSON.
  • Dokumente per URL oder Upload verarbeiten: Geben Sie einfach eine Datei-URL an oder nutzen Sie den Upload, um Text aus lokalen Dokumenten oder Remote-Ressourcen zu extrahieren.
  • Flexible Ausgabeformate: Wählen Sie zwischen Markdown, reinem Text oder JSON-Darstellungen des extrahierten Inhalts für die Weiterverarbeitung.
  • Selektive Seitenverarbeitung: Geben Sie einen Seitenbereich an, um Verarbeitungszeit und Kosten zu reduzieren, wenn Sie nur einen Teil eines Dokuments benötigen.
  • Abbildungs- und Tabellenextraktion: Extrahieren Sie optional Abbildungen und Tabellen mit automatischer Generierung von Bildunterschriften und Beschreibungen für angereicherten Kontext.
  • Verarbeitungseinblicke erhalten: Erhalten Sie detaillierte Metadaten zu jedem Auftrag, einschließlich Dateityp, Seitenanzahl, Verarbeitungszeit und mehr.
  • Integrationsfertige Antworten: Integrieren Sie extrahierte Inhalte in Recherche-, Workflow-Automatisierungs- oder Datenanalyse-Pipelines.

Ideal zur Automatisierung mühsamer Dokumentenprüfung, zur Ermöglichung von Inhaltszusammenfassungen, Recherche und mehr – Pulse Parser bringt reale Dokumente in die Ära des digitalen Workflows.

Wenn Sie präzise, skalierbare und entwicklerfreundliche Dokumenten-Parsing-Funktionen benötigen – über Formate, Sprachen und Layouts hinweg – befähigt Pulse Ihre Agenten, die Welt zu lesen.

Nutzungsanweisungen

Integrieren Sie Pulse in den Workflow. Extrahieren Sie Text aus PDF-Dokumenten, Bildern und Office-Dateien per Upload oder Dateireferenzen.

Tools

pulse_parser

Eingabe

ParameterTypErforderlichBeschreibung
filePathstringNeinURL zu einem zu verarbeitenden Dokument
filefileNeinZu verarbeitende Dokumentdatei
fileUploadobjectNeinDatei-Upload-Daten aus der Datei-Upload-Komponente
pagesstringNeinZu verarbeitender Seitenbereich (1-indiziert, z. B. "1-2,5")
extractFigurebooleanNeinAktiviert die Extraktion von Abbildungen aus dem Dokument
figureDescriptionbooleanNeinGeneriert Beschreibungen/Bildunterschriften für extrahierte Abbildungen
returnHtmlbooleanNeinHTML in der Antwort einschließen
chunkingstringNeinChunking-Strategien (kommagetrennt: semantic, header, page, recursive)
chunkSizenumberNeinMaximale Zeichen pro Chunk, wenn Chunking aktiviert ist
apiKeystringJaPulse-API-Schlüssel

Ausgabe

Dieses Tool erzeugt keine Ausgaben.

On this page

Start building today
Trusted by over 70,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started