Visión

Visión es una herramienta que te permite analizar imágenes con modelos de visión.

Con Vision, puedes:

Analizar imágenes: Analizar imágenes con modelos de visión
Extraer texto: Extraer texto de imágenes
Identificar objetos: Identificar objetos en imágenes
Describir imágenes: Describir imágenes en detalle
Generar imágenes: Generar imágenes a partir de texto

En Sim, la integración de Vision permite a tus agentes analizar imágenes con modelos de visión como parte de sus flujos de trabajo. Esto permite potentes escenarios de automatización que requieren analizar imágenes con modelos de visión. Tus agentes pueden analizar imágenes con modelos de visión, extraer texto de imágenes, identificar objetos en imágenes, describir imágenes en detalle y generar imágenes a partir de texto. Esta integración cierra la brecha entre tus flujos de trabajo de IA y tus necesidades de análisis de imágenes, permitiendo automatizaciones más sofisticadas y centradas en imágenes. Al conectar Sim con Vision, puedes crear agentes que se mantengan actualizados con la información más reciente, proporcionen respuestas más precisas y entreguen más valor a los usuarios - todo sin requerir intervención manual o código personalizado.

Parámetro	Tipo	Obligatorio	Descripción
`apiKey`	string	Sí	Clave API para el proveedor de modelo seleccionado
`imageUrl`	string	No	URL de imagen accesible públicamente
`imageFile`	file	No	Archivo de imagen para analizar
`model`	string	No	Modelo de visión a utilizar (gpt-4o, claude-3-opus-20240229, etc)
`prompt`	string	No	Prompt personalizado para análisis de imagen

Visión

Instrucciones de uso

Herramientas

`vision_tool`

Entrada

Salida

On this page