Problemi di riconoscimento immagini con Qwen3-VL-8b e contenuto misto testo-immagine di Gemma3-27b

Ivan_Rapekas · 11 Dicembre 2025, 10:55am

Ciao, ho trovato un argomento https://meta.discourse.org/t/managing-images-in-ai-context/380828. Vorrei saperne di più su questo contesto.

Qualcuno potrebbe chiarire la logica attuale di comprensione delle immagini?

Uso Qwen3-VL-8b con LM Studio con API compatibile con OpenAI. L’indizio seguente afferma che le immagini sono supportate dai modelli Anthropic, Google e OpenAI. Nessuna possibilità per Qwen, giusto?
Qwen3-VL-8b Nuovo messaggio confuso quando il modello non riesce a riconoscere un’immagine/documento.

In 3.6.0.beta2:

Sia nel caso in cui vision enabled = true sia vision enabled = false, l’AI-bot gestisce correttamente la richiesta di riconoscimento dell’immagine, senza alcuna eccezione.

In v2025.12.0-latest: nuova opzione allowed attachments

Ora con vision enabled = true in restituisce un errore nella finestra di dialogo:

{“error”:“Invalid ‘content’: ‘content’ objects must have a ‘type’ field that is either ‘text’ or ‘image_url’.”}

Gemma3-27b. Alcune considerazioni sul riconoscimento di contenuti misti testo+immagine. La risposta attualmente supporta solo testo. Quando chiedo al modello di fornire un testo dallo strato OCR di un PDF con immagini separate, restituisce

Non c’è nulla a questo URL, il modello ha creato un link falso.

Grazie!

sam · 11 Dicembre 2025, 11:07am

lmstudio non ha supporto PDF nella completamento o nelle API di risposta.

Supporta solo immagini/testo da quanto posso capire.

Ivan_Rapekas · 12 Dicembre 2025, 7:33am

Grazie per la risposta! La contrassegnerò come risolta e lascerò un commento qui che era corretto per LM Studio 0.3.x. Il team di Studio sta attualmente lavorando alla versione 0.4.0 con la nuova REST. Spero che aggiungano il supporto PDF nelle loro risposte.

system · 11 Gennaio 2026, 7:33am

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.

Argomento		Risposte	Visualizzazioni
Ai plugin ocr support Feature ai	11	871	Aprile 2, 2024
Gemini ai bot to draw picture in chat Support ai	4	150	Aprile 13, 2025
Exploring blocking file upload while interacting with AI bot Feature ai , ai-bot	0	50	Gennaio 11, 2026
Managing Images in AI context Dev	0	74	Agosto 28, 2025
Introduce alt-text for images on chat Feature chat	0	351	Febbraio 22, 2023

Problemi di riconoscimento immagini con Qwen3-VL-8b e contenuto misto testo-immagine di Gemma3-27b

Argomenti correlati