Reducto

Extrae texto de documentos PDF

La herramienta Reducto permite la extracción rápida y precisa de texto y datos de documentos PDF mediante OCR (reconocimiento óptico de caracteres). Reducto está diseñado para flujos de trabajo de agentes, facilitando el procesamiento de PDF cargados o enlazados y transformando su contenido en información lista para usar.

Con la herramienta Reducto, puedes:

  • Extraer texto y tablas de PDF: convierte rápidamente PDF escaneados o digitales a texto, markdown o JSON estructurado.
  • Analizar PDF desde cargas o URL: procesa documentos cargando un PDF o especificando una URL directa.
  • Personalizar el formato de salida: elige tu formato de salida preferido (markdown, texto plano o JSON) y especifica formatos de tabla como markdown o HTML.
  • Seleccionar páginas específicas: opcionalmente extrae contenido de páginas particulares para optimizar el procesamiento y enfocarte en lo que importa.
  • Recibir metadatos detallados de procesamiento: junto con el contenido extraído, obtén detalles del trabajo, tiempos de procesamiento, información del archivo fuente, recuentos de páginas y estadísticas de uso de OCR para auditoría y automatización.

Ya sea que estés automatizando pasos de flujo de trabajo, extrayendo información crítica para el negocio o desbloqueando documentos de archivo para búsqueda y análisis, el analizador OCR de Reducto te proporciona datos estructurados y accionables incluso de los PDF más complejos.

¿Buscas análisis de PDF confiable y escalable? Reducto está optimizado para uso de desarrolladores y agentes, proporcionando precisión, velocidad y flexibilidad para la comprensión moderna de documentos.

Instrucciones de uso

Integra Reducto Parse en el flujo de trabajo. Puede extraer texto de documentos PDF cargados o referencias de archivos.

Herramientas

reducto_parser

Entrada

ParámetroTipoRequeridoDescripción
filePathstringNoURL a un documento PDF para ser procesado
filefileNoArchivo de documento para ser procesado
fileUploadobjectNoDatos de carga de archivo del componente file-upload
pagesarrayNoPáginas específicas para procesar (números de página indexados desde 1)
tableOutputFormatstringNoFormato de salida de tabla (html o markdown). Por defecto es markdown.
apiKeystringClave API de Reducto (REDUCTO_API_KEY)

Salida

Esta herramienta no produce ninguna salida.

On this page

Start building today
Trusted by over 70,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started