Mistral Parser

L'outil Mistral Parse offre un moyen puissant d'extraire et de traiter le contenu des documents PDF en utilisant l'API OCR de Mistral. Cet outil exploite la reconnaissance optique de caractères avancée pour extraire avec précision le texte et la structure des fichiers PDF, facilitant ainsi l'intégration des données documentaires dans vos flux de travail d'agents.

Avec l'outil Mistral Parse, vous pouvez :

Extraire du texte des PDF : convertir avec précision le contenu PDF en formats texte, markdown ou JSON
Traiter les PDF à partir d'URL : extraire directement le contenu des PDF hébergés en ligne en fournissant leurs URL
Conserver la structure du document : préserver la mise en forme, les tableaux et la disposition des PDF originaux
Extraire des images : inclure optionnellement les images intégrées dans les PDF
Sélectionner des pages spécifiques : traiter uniquement les pages dont vous avez besoin dans les documents multi-pages

L'outil Mistral Parse est particulièrement utile dans les scénarios où vos agents doivent travailler avec du contenu PDF, comme l'analyse de rapports, l'extraction de données de formulaires ou le traitement de texte à partir de documents numérisés. Il simplifie le processus de mise à disposition du contenu PDF pour vos agents, leur permettant de travailler avec les informations stockées dans les PDF aussi facilement qu'avec une saisie de texte directe.

Paramètre	Type	Obligatoire	Description
`filePath`	chaîne	Oui	URL vers un document PDF à traiter
`fileUpload`	objet	Non	Données de téléchargement de fichier provenant du composant de téléchargement de fichier
`resultType`	chaîne	Non	Type de résultat analysé (markdown, texte ou json). Par défaut : markdown.
`includeImageBase64`	booléen	Non	Inclure les images encodées en base64 dans la réponse
`pages`	tableau	Non	Pages spécifiques à traiter (tableau de numéros de page, commençant par 0)
`imageLimit`	nombre	Non	Nombre maximum d'images à extraire du PDF
`imageMinSize`	nombre	Non	Hauteur et largeur minimales des images à extraire du PDF
`apiKey`	chaîne	Oui	Clé API Mistral (MISTRAL_API_KEY)

Mistral Parser

Instructions d'utilisation

Outils

`mistral_parser`

Entrée

Sortie

On this page