Problemas de reconocimiento de imágenes de Qwen3-VL-8b y contenido de texto e imagen mixto de Gemma3-27b

Ivan_Rapekas · 11 Diciembre, 2025 10:55

Hola, encontré un tema https://meta.discourse.org/t/managing-images-in-ai-context/380828. Me gustaría saber más sobre este contexto.

¿Alguien podría aclarar la lógica actual para entender las imágenes?

Uso Qwen3-VL-8b con LM Studio con una API compatible con OpenAI. La pista a continuación dice que las imágenes son compatibles con los modelos de Anthropic, Google y OpenAI. ¿No hay oportunidad para Qwen, verdad?
Qwen3-VL-8b Nuevo mensaje confuso cuando el modelo no puede reconocer una imagen/documento.

En 3.6.0.beta2:

Tanto en el caso de vision enabled = true como vision enabled = false, el bot de IA maneja la solicitud de reconocimiento de imágenes correctamente, sin ninguna excepción.

En v2025.12.0-latest: nueva opción allowed attachments (archivos adjuntos permitidos)

Ahora, con vision enabled = true, devuelve un error en el diálogo:

{“error”:“Invalid ‘content’: ‘content’ objects must have a ‘type’ field that is either ‘text’ or ‘image_url’.”}

Gemma3-27b. Algunas reflexiones sobre el reconocimiento de contenido mixto de texto + imagen. La respuesta actualmente solo admite texto. Cuando le pido al modelo que proporcione un texto de la capa OCR de un PDF con imágenes separadas, devuelve

No hay nada en esta URL, el modelo ha creado un enlace falso.

¡Gracias!

sam · 11 Diciembre, 2025 11:07

lmstudio no tiene soporte para PDF en la API de finalización o respuestas.

Solo admite imagen/texto por lo que puedo ver.

Ivan_Rapekas · 12 Diciembre, 2025 07:33

¡Gracias por la respuesta! Lo marcaré como resuelto y dejaré un comentario aquí de que fue correcto para LM Studio 0.3.x. El equipo de Studio está trabajando actualmente en la versión 0.4.0 con una nueva REST. Espero que añadan soporte para PDF en sus respuestas.

Tema		Respuestas	Vistas
Ai plugin ocr support Feature ai	11	972	2 Abril 2024
Gemini ai bot to draw picture in chat Support ai	3	208	14 Marzo 2025
Exploring blocking file upload while interacting with AI bot Feature ai , ai-bot	0	87	11 Enero 2026
Introduce alt-text for images on chat Feature chat	0	370	22 Febrero 2023
How to solve discourse ai : No endpoints found that support tool use. To learn more about provider routing, Support ai	1	637	20 Octubre 2025

Problemas de reconocimiento de imágenes de Qwen3-VL-8b y contenido de texto e imagen mixto de Gemma3-27b

Temas relacionados