Hola, encontré un tema https://meta.discourse.org/t/managing-images-in-ai-context/380828. Me gustaría saber más sobre este contexto.
¿Alguien podría aclarar la lógica actual para entender las imágenes?
-
Uso Qwen3-VL-8b con LM Studio con una API compatible con OpenAI. La pista a continuación dice que las imágenes son compatibles con los modelos de Anthropic, Google y OpenAI. ¿No hay oportunidad para Qwen, verdad?
-
Qwen3-VL-8b Nuevo mensaje confuso cuando el modelo no puede reconocer una imagen/documento.
En 3.6.0.beta2:

Tanto en el caso de vision enabled = true como vision enabled = false, el bot de IA maneja la solicitud de reconocimiento de imágenes correctamente, sin ninguna excepción.
En v2025.12.0-latest: nueva opción allowed attachments (archivos adjuntos permitidos)

Ahora, con vision enabled = true, devuelve un error en el diálogo:
{“error”:“Invalid ‘content’: ‘content’ objects must have a ‘type’ field that is either ‘text’ or ‘image_url’.”}
- Gemma3-27b. Algunas reflexiones sobre el reconocimiento de contenido mixto de texto + imagen. La respuesta actualmente solo admite texto. Cuando le pido al modelo que proporcione un texto de la capa OCR de un PDF con imágenes separadas, devuelve

No hay nada en esta URL, el modelo ha creado un enlace falso.
¡Gracias!