AWS Textract

Extrahieren Sie Text, Tabellen und Formulare aus Dokumenten

AWS Textract ist ein leistungsstarker KI-Service von Amazon Web Services, der entwickelt wurde, um automatisch gedruckten Text, Handschrift, Tabellen, Formulare, Schlüssel-Wert-Paare und andere strukturierte Daten aus gescannten Dokumenten und Bildern zu extrahieren. Textract nutzt fortschrittliche optische Zeichenerkennung (OCR) und Dokumentenanalyse, um Dokumente in verwertbare Daten zu verwandeln und so Automatisierung, Analysen, Compliance und mehr zu ermöglichen.

Mit AWS Textract können Sie:

  • Text aus Bildern und Dokumenten extrahieren: Gedruckten Text und Handschrift in Formaten wie PDF, JPEG, PNG oder TIFF erkennen
  • Tabellen erkennen und extrahieren: Tabellen automatisch finden und deren strukturierte Inhalte ausgeben
  • Formulare und Schlüssel-Wert-Paare auslesen: Strukturierte Daten aus Formularen extrahieren, einschließlich Feldern und zugehörigen Werten
  • Unterschriften und Layout-Merkmale identifizieren: Unterschriften, geometrisches Layout und Beziehungen zwischen Dokumentelementen erkennen
  • Extraktion mit Abfragen anpassen: Bestimmte Felder und Antworten mithilfe abfragebasierter Extraktion extrahieren (z. B. "Wie lautet die Rechnungsnummer?")

In Sim ermöglicht die AWS Textract-Integration Ihren Agent:innen, Dokumente intelligent im Rahmen ihrer Workflows zu verarbeiten. Dadurch werden Automatisierungsszenarien wie die Datenerfassung aus Rechnungen, Onboarding-Dokumenten, Verträgen, Quittungen und mehr möglich. Ihre Agent:innen können relevante Daten extrahieren, strukturierte Formulare analysieren und direkt aus Dokument-Uploads oder URLs Zusammenfassungen oder Berichte erstellen. Durch die Verbindung von Sim mit AWS Textract können Sie manuellen Aufwand reduzieren, die Datenqualität verbessern und Ihre Geschäftsprozesse mit robuster Dokumentenverarbeitung optimieren.

Anleitung zur Nutzung

Integrieren Sie AWS Textract in Ihren Workflow, um Text, Tabellen, Formulare und Schlüssel-Wert-Paare aus Dokumenten zu extrahieren. Der Einzelseiten-Modus unterstützt JPEG, PNG und einseitige PDF. Der Mehrseiten-Modus unterstützt mehrseitige PDF und TIFF.

Tools

textract_parser

Eingabe

ParameterTypErforderlichBeschreibung
accessKeyIdstringJaAWS Access Key ID
secretAccessKeystringJaAWS Secret Access Key
regionstringJaAWS-Region für Textract-Service (z. B. us-east-1)
processingModestringNeinDokumenttyp: single-page oder multi-page. Standard ist single-page.
filePathstringNeinURL zu einem zu verarbeitenden Dokument (JPEG, PNG oder einseitige PDF).
filefileNeinZu verarbeitende Dokumentdatei (JPEG, PNG oder einseitige PDF).
s3UristringNeinS3-URI für Mehrseitenverarbeitung (s3://bucket/key).
featureTypesarrayNeinZu erkennende Feature-Typen: TABLES, FORMS, QUERIES, SIGNATURES, LAYOUT. Wenn nicht angegeben, wird nur Texterkennung durchgeführt.
itemsstringNeinFeature-Typ
queriesarrayNeinBenutzerdefinierte Abfragen zur Extraktion spezifischer Informationen. Wird nur verwendet, wenn featureTypes QUERIES enthält.
itemsobjectNeinAbfragekonfiguration
propertiesstringNeinDer Abfragetext
TextstringNeinKeine Beschreibung
AliasstringNeinKeine Beschreibung

Ausgabe

Dieses Tool erzeugt keine Ausgaben.

On this page

Start building today
Trusted by over 70,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started