Visión
Analiza imágenes con modelos de visión
Visión es una herramienta que te permite analizar imágenes con modelos de visión.
Con Vision, puedes:
- Analizar imágenes: Analizar imágenes con modelos de visión
- Extraer texto: Extraer texto de imágenes
- Identificar objetos: Identificar objetos en imágenes
- Describir imágenes: Describir imágenes en detalle
- Generar imágenes: Generar imágenes a partir de texto
En Sim, la integración de Vision permite a tus agentes analizar imágenes con modelos de visión como parte de sus flujos de trabajo. Esto permite potentes escenarios de automatización que requieren analizar imágenes con modelos de visión. Tus agentes pueden analizar imágenes con modelos de visión, extraer texto de imágenes, identificar objetos en imágenes, describir imágenes en detalle y generar imágenes a partir de texto. Esta integración cierra la brecha entre tus flujos de trabajo de IA y tus necesidades de análisis de imágenes, permitiendo automatizaciones más sofisticadas y centradas en imágenes. Al conectar Sim con Vision, puedes crear agentes que se mantengan actualizados con la información más reciente, proporcionen respuestas más precisas y entreguen más valor a los usuarios - todo sin requerir intervención manual o código personalizado.
Instrucciones de uso
Procesa contenido visual con indicaciones personalizables para extraer información y conocimientos de las imágenes.
Herramientas
vision_tool
Procesa y analiza imágenes utilizando modelos avanzados de visión. Capaz de comprender el contenido de imágenes, extraer texto, identificar objetos y proporcionar descripciones visuales detalladas.
Entrada
Parámetro | Tipo | Obligatorio | Descripción |
---|---|---|---|
apiKey | string | SÃ | Clave API para el proveedor de modelo seleccionado |
imageUrl | string | Sà | URL de imagen de acceso público |
model | string | No | Modelo de visión a utilizar (gpt-4o, claude-3-opus-20240229, etc) |
prompt | string | No | Indicación personalizada para análisis de imágenes |
Salida
Parámetro | Tipo | Descripción |
---|---|---|
content | string | El contenido analizado y la descripción de la imagen |
model | string | El modelo de visión que se utilizó para el análisis |
tokens | number | Total de tokens utilizados para el análisis |
usage | object | Desglose detallado del uso de tokens |
Notas
- CategorÃa:
tools
- Tipo:
vision