Pulse

Extrae texto de documentos usando Pulse OCR

La herramienta Pulse permite la extracción fluida de texto y contenido estructurado de una amplia variedad de documentos—incluyendo PDFs, imágenes y archivos de Office—utilizando OCR (reconocimiento óptico de caracteres) de última generación impulsado por Pulse. Diseñado para flujos de trabajo agénticos automatizados, Pulse Parser facilita desbloquear información valiosa atrapada en documentos no estructurados e integrar el contenido extraído directamente en tu flujo de trabajo.

Con Pulse, puedes:

  • Extraer texto de documentos: Convierte rápidamente PDFs escaneados, imágenes y documentos de Office en texto utilizable, markdown o JSON.
  • Procesar documentos por URL o carga: Simplemente proporciona una URL de archivo o usa la carga para extraer texto de documentos locales o recursos remotos.
  • Formatos de salida flexibles: Elige entre markdown, texto plano o representaciones JSON del contenido extraído para procesamiento posterior.
  • Procesamiento selectivo de páginas: Especifica un rango de páginas a procesar, reduciendo el tiempo de procesamiento y el costo cuando solo necesitas parte de un documento.
  • Extracción de figuras y tablas: Opcionalmente extrae figuras y tablas, con generación automática de títulos y descripciones para contexto poblado.
  • Obtén información del procesamiento: Recibe metadatos detallados de cada trabajo, incluyendo tipo de archivo, número de páginas, tiempo de procesamiento y más.
  • Respuestas listas para integración: Incorpora contenido extraído en investigación, automatización de flujos de trabajo o pipelines de análisis de datos.

Ideal para automatizar la revisión tediosa de documentos, permitiendo la resumición de contenido, investigación y más, Pulse Parser lleva documentos del mundo real a la era del flujo de trabajo digital.

Si necesitas capacidades de análisis de documentos precisas, escalables y amigables para desarrolladores—a través de formatos, idiomas y diseños—Pulse empodera a tus agentes para leer el mundo.

Instrucciones de uso

Integra Pulse en el flujo de trabajo. Extrae texto de documentos PDF, imágenes y archivos de Office mediante carga o referencias de archivo.

Herramientas

pulse_parser

Entrada

ParámetroTipoRequeridoDescripción
filePathstringNoURL a un documento a procesar
filefileNoArchivo de documento a procesar
fileUploadobjectNoDatos de carga de archivo del componente file-upload
pagesstringNoRango de páginas a procesar (indexado desde 1, ej., "1-2,5")
extractFigurebooleanNoHabilitar extracción de figuras del documento
figureDescriptionbooleanNoGenerar descripciones/leyendas para las figuras extraídas
returnHtmlbooleanNoIncluir HTML en la respuesta
chunkingstringNoEstrategias de fragmentación (separadas por comas: semantic, header, page, recursive)
chunkSizenumberNoMáximo de caracteres por fragmento cuando la fragmentación está habilitada
apiKeystringClave API de Pulse

Salida

Esta herramienta no produce ninguna salida.

On this page

Start building today
Trusted by over 70,000 builders.
Build Agentic workflows visually on a drag-and-drop canvas or with natural language.
Get started