sam
(Sam Saffron)
29 Agosto, 2025 06:22
1
Google acaba de lanzar un nuevo y emocionante LLM multimodal.
Este modelo es rápido y extremadamente potente.
Este cambio se introdujo en el siguiente commit:
committed 04:39AM - 29 Aug 25 UTC
Adds support for:
https://blog.google/products/gemini/updated-image-editing-mode… l/
This mode generates images natively, we updated the Gemini endpoint to
support handling image output.
Additionally, there is a refinement to how we provide image context to
models, we avoid very short descriptions and simply
inline images in the context, prior to this fix image generating models
could get confused and start generating markdown blobs.
This takes care to properly omit images from context in model responses
for anthropic and open ai in responses api.
Hice un video rápido demostrando la función:
Ver anteriormente: OpenAI image generation and editing now supported in Discourse AI
Las Personas de IA se documentan en: AI bot - Personas
Configuración en pocas palabras
Añadir Gemini Flash 2.5 Image
Habilitar visión y bot
Habilitar visión en tu persona creativa
¡Crea imágenes!
29 Me gusta
¡Todas nuestras fotos grupales en Google Cloud Storage están siendo bien aprovechadas, claramente!
¡El pedestal fue un buen detalle!
5 Me gusta
sam
(Sam Saffron)
22 Noviembre, 2025 22:04
3
Nano Banana 3 ya está disponible y es compatible con Discourse.
Es increíble cómo nos transportó a la Toscana, Robin y Jeff se ven muy fuera de lugar, pero la iluminación, la definición y el fondo son bastante espectaculares.
4 Me gusta
Ahora… eso es increíble . Me parece realmente bueno que haya menos imprecisiones/inconsistencias en las imágenes ahora.
1 me gusta