sam
(Sam Saffron)
29 Agosto 2025, 6:22am
1
Google ha appena rilasciato un nuovo entusiasmante LLM multimodale.
Questo modello è veloce ed estremamente potente.
Questa modifica è stata introdotta nel seguente commit:
committed 04:39AM - 29 Aug 25 UTC
Adds support for:
https://blog.google/products/gemini/updated-image-editing-mode… l/
This mode generates images natively, we updated the Gemini endpoint to
support handling image output.
Additionally, there is a refinement to how we provide image context to
models, we avoid very short descriptions and simply
inline images in the context, prior to this fix image generating models
could get confused and start generating markdown blobs.
This takes care to properly omit images from context in model responses
for anthropic and open ai in responses api.
Ho realizzato un breve video che dimostra la funzionalità:
Vedi precedentemente: OpenAI image generation and editing now supported in Discourse AI
Le persone AI sono documentate su: AI bot - Personas
Configurazione in breve
Aggiungi Gemini Flash 2.5 Image
Abilita visione e bot
Abilita visione sulla tua persona creativa
Crea immagini!
29 Mi Piace
Tutte le nostre foto di gruppo in Google Cloud Storage vengono utilizzate a dovere, chiaramente!
Il piedistallo è stato un bel tocco!
5 Mi Piace
sam
(Sam Saffron)
22 Novembre 2025, 10:04pm
3
Nano Banana 3 è disponibile e supportato in Discourse.
Incredibile come ci abbia trasportato in Toscana, Robin e Jeff sembrano fuori luogo, ma l’illuminazione, la definizione e lo sfondo sono tutti piuttosto spettacolari.
4 Mi Piace
Ora… questo è incredibile . Trovo davvero bello che ci siano meno inesattezze/incongruenze nelle immagini adesso.
1 Mi Piace