Reducto

Text aus PDF-Dokumenten extrahieren

Das Reducto-Tool ermöglicht eine schnelle und präzise Extraktion von Text und Daten aus PDF-Dokumenten mittels OCR (Optical Character Recognition). Reducto ist für Agenten-Workflows konzipiert und erleichtert die Verarbeitung hochgeladener oder verlinkter PDFs sowie die Umwandlung ihrer Inhalte in sofort nutzbare Informationen.

Mit dem Reducto-Tool können Sie:

  • Text und Tabellen aus PDFs extrahieren: Konvertieren Sie gescannte oder digitale PDFs schnell in Text, Markdown oder strukturiertes JSON.
  • PDFs aus Uploads oder URLs verarbeiten: Verarbeiten Sie Dokumente entweder durch Hochladen einer PDF oder durch Angabe einer direkten URL.
  • Ausgabeformatierung anpassen: Wählen Sie Ihr bevorzugtes Ausgabeformat – Markdown, Klartext oder JSON – und legen Sie Tabellenformate als Markdown oder HTML fest.
  • Bestimmte Seiten auswählen: Extrahieren Sie optional Inhalte von bestimmten Seiten, um die Verarbeitung zu optimieren und sich auf das Wesentliche zu konzentrieren.
  • Detaillierte Verarbeitungsmetadaten erhalten: Erhalten Sie neben den extrahierten Inhalten auch Auftragsdetails, Verarbeitungszeiten, Quelldatei-Informationen, Seitenzahlen und OCR-Nutzungsstatistiken für Audit und Automatisierung.

Ob Sie Workflow-Schritte automatisieren, geschäftskritische Informationen extrahieren oder Archivdokumente für Suche und Analyse erschließen – Reductos OCR-Parser liefert Ihnen strukturierte, verwertbare Daten selbst aus den komplexesten PDFs.

Suchen Sie nach zuverlässigem und skalierbarem PDF-Parsing? Reducto ist für Entwickler und Agenten optimiert – und bietet Genauigkeit, Geschwindigkeit und Flexibilität für modernes Dokumentenverständnis.

Nutzungsanleitung

Integrieren Sie Reducto Parse in den Workflow. Kann Text aus hochgeladenen PDF-Dokumenten oder Dateireferenzen extrahieren.

Tools

reducto_parser

Eingabe

ParameterTypErforderlichBeschreibung
filePathstringNeinURL zu einem zu verarbeitenden PDF-Dokument
filefileNeinZu verarbeitende Dokumentdatei
fileUploadobjectNeinDatei-Upload-Daten aus der Datei-Upload-Komponente
pagesarrayNeinBestimmte zu verarbeitende Seiten (1-indizierte Seitenzahlen)
tableOutputFormatstringNeinTabellen-Ausgabeformat (html oder markdown). Standard ist markdown.
apiKeystringJaReducto-API-Schlüssel (REDUCTO_API_KEY)

Ausgabe

Dieses Tool erzeugt keine Ausgaben.

On this page

Start building today
Trusted by over 70,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started