Ayudante - subtitulando imágenes

:bookmark: Esta guía explica cómo habilitar y configurar leyendas de imágenes impulsadas por IA, que forman parte de la función Asistente del complemento Discourse AI.

:person_raising_hand: Nivel de usuario requerido: Administrador

La subtitulación de imágenes permite a los usuarios aprovechar la IA para subtitular cualquier imagen cargada, proporcionando descripciones detalladas. Los usuarios pueden activar manualmente la subtitulación haciendo clic en el botón Subtitular con IA que aparece en las imágenes en el compositor.

Características

  • Botón manual Subtitular con IA en las imágenes del compositor
  • Subtítulo editable con atribución “(Subtitulado por IA)”

Habilitar la subtitulación de imágenes

Requisitos previos

Debe configurar al menos un Modelo de Lenguaje Grande (LLM) con capacidad de visión de un proveedor.

Para comenzar, puede configurarlos a través de la página de configuración del Modelo de Lenguaje Grande (LLM) de Discourse AI.

Configuración

  1. Vaya a Administrador → Complementos
  2. Busque discourse-ai y asegúrese de que esté habilitado
  3. Asegúrese de que la función Asistente esté habilitada marcando ai helper enabled
  4. En ai helper enabled features, asegúrese de que se agregue image_caption — tenga en cuenta que no se incluye por defecto
  5. Seleccione el agente en ai helper image caption agent
  6. Asegúrese de que los grupos de usuarios deseados estén incluidos en composer ai helper allowed groups para que puedan usar el botón de subtítulos

Preguntas frecuentes técnicas

¿Por qué la descripción del subtítulo no coincide con la imagen?

  • Esto depende del LLM con capacidad de visión y de la imagen en sí. Los LLM más potentes podrían ser capaces de describir mejor la imagen, pero eso depende del modelo. La fidelidad de la imagen y el sujeto de la imagen también son factores importantes a considerar en la salida del subtítulo.
1 me gusta

Cuando se carga una imagen, se proporciona un breve resumen (aproximadamente 1 oración). Supongo que eso lo genera la IA y generará costos.

1 me gusta

Sí, incurrirías en un costo y eso dependería del proveedor.

1 me gusta

@NateDhaliwal, esto debería ayudarte a tener algunas estimaciones aproximadas.

1 me gusta

¡De acuerdo, gracias!

Falta una instrucción muy importante aquí, me tomó mucho tiempo descifrarla:

La lista de AI helper enabled features no incluye por defecto “Image caption”, así que tuve que añadir esa específicamente:

1 me gusta

Se encontró (y se corrigió) un problema más: si configuras “Grupos permitidos para subtítulos automáticos de imágenes de IA” en el grupo “todos”, no subtitulará automáticamente nada para nadie (independientemente de la configuración del usuario). Tuve que configurarlo explícitamente para incluir todos los niveles de confianza.

La imagen muestra una pantalla que muestra opciones para habilitar la subtitulación automática de imágenes de IA, lo que permite a los usuarios alternar los niveles de confianza para esta función. (Subtitulado por IA)

Everyone es un poco problemático, porque no es un grupo real, e incluye a los anónimos, que no pueden escribir ni subir nada.

Pero en mi foro trust_level_0 funciona perfectamente e incluye a todos los que han iniciado sesión.

2 Me gusta

Creo que el op necesita una actualización

1 me gusta

Me gustó mucho :frowning:
Me confundió por qué dejó de funcionar, pero ahora al menos sé por qué.