¿Se podría agregar una lista de temas recomendados al menú superior?

Me encanta el Discourse AI - Related Topics: Enhancing Content Exploration, pero lamentablemente su alcance parece estar definido por el tema que estoy leyendo actualmente.

Me pregunto si, con los avances recientes en los LLM, sería posible hojear las publicaciones y el historial de lectura de un usuario para ofrecerle un feed de recomendaciones.

Esta sería una gran característica para nuestro caso de uso centrado en preguntas y respuestas. Tenemos muchas categorías distintas, usuarios (colegas) muy activos y mucha información extremadamente útil que simplemente no verán. Una buena lista de recomendaciones ayudaría a algunos de nuestros usuarios a anticiparse a los problemas que intentan resolver.

Supongo que nuestro ideal sería una lista compuesta por errores comunes, significativos y candentes de los que la gente habla, relacionados con las herramientas y conversaciones en las que el usuario ya está demostrando interés.

7 Me gusta

¿Te importaría compartir un enlace al sitio si es público?

Como alguien que ha estado utilizando las funciones de IA de Discourse, muchas antes de que se hicieran públicas, estoy ansioso por aprender más sobre tu sitio. Comprender los detalles específicos que has señalado me permitirá hacer recomendaciones más informadas para la IA de Discourse, teniendo en cuenta los aspectos únicos de tu plataforma.

Me encantaría, pero lamentablemente es una gran instancia interna corporativa :frowning:
Quizás pueda darte una idea de lo que estamos haciendo.

Antecedentes

Esencialmente, es como un Stackoverflow interno donde compartimos problemas específicos de la empresa y la industria como “¿cómo diablos configuro el proxy para esto?” o “¿no encuentro ningún resultado para Bug123 en Google, alguien más lo ha resuelto?”.

Nuestras categorías son específicas de la herramienta, como:

  • Kubernetes
  • Gitlab
  • Cosas defectuosas de IBM con la peor interfaz de usuario que jamás hayas visto

¿Cómo podría ser útil una lista de recomendaciones?

Actualmente, si leo/respondo a un tema en la Categoría Gitlab que habla sobre la integración con otras herramientas, como Kubernetes, no recibo notificaciones sobre temas relacionados. Por lo tanto, si hay una publicación muy útil en la Categoría Kubernetes, es posible que no la vea hasta muy tarde. Tengo que encontrarla yo mismo o suscribirme a las notificaciones correctas.

La mayoría de nuestros usuarios no tendrán una buena configuración de notificaciones:

  1. Están bajo presión para obtener resultados.
  2. No pasan suficiente tiempo en la plataforma para sacar el máximo provecho de su configuración de notificaciones.

Una lista de recomendaciones proporcionaría información potencialmente útil, bajo demanda, con un solo clic. Esencialmente, “basado en tus intereses recientes, aquí tienes algunos temas que podrían ser útiles”. Podría basarse en el historial de búsqueda del usuario, temas populares, palabras clave comunes en los temas en los que participa, etc. Por lo tanto, si nunca visitan la Categoría de Cosas defectuosas de IBM, nada de esa Categoría se recomendará, a menos que toque algo en lo que ya tengan un gran interés, por ejemplo, Gitlab.

4 Me gusta

Obviamente, nunca has usado una máquina keypunch.


Imagen de: Definition of keypunch machine | PCMag


¿Has visto este tema? Deberías leerlo todo, ya que hay mucha información útil en la mayoría de las publicaciones.

1 me gusta

Proporciono un resumen de IA “daily buzz” en la parte superior de este sitio que se actualiza cada 12 horas y se basa en 2 días de publicaciones.

La solución es propietaria y no está en un plugin público, pero demuestra el concepto.

¡Y sí, es propenso a errores! :sweat_smile:

He estado queriendo que vincule contenido … ACTUALIZACIÓN: hecho, solo necesitaba GPT 4 Turbo y algo de ingeniería de prompts. GPT 3.5 no puede manejar ese nivel de dirección.

3 Me gusta

Veo tu hermosa máquina de teletipo y te ofrezco un sistema de tickets basado en web que no admite markdown :laughing:


Tema recomendado

Gracias, no lo había visto. Podría resultar fructífero si las cosas cambian para nosotros, pero desafortunadamente no parece cumplir con nuestras restricciones actuales (¡que olvidé mencionar antes! :facepalm:).

Restricciones

  • No se puede usar chat
  • No se pueden usar mensajes privados
  • No se puede depender de la IA para generar respuestas y proporcionarlas silenciosamente a nuestros desarrolladores: fabricamos software de seguridad crítica

Estas restricciones son esencialmente la razón por la que una lista de temas recomendados sería una buena solución para nosotros: no se genera contenido, no se usa el chat, no se usan los mensajes privados.

Esta sería una forma interesante de proporcionar un resumen diario. Como dices, los hipervínculos serían sin duda una gran característica. ¿Estás pensando en personalizarlo para el conjunto de intereses distinto del usuario? ¿Qué hizo que este enfoque fuera atractivo en lugar de depender del resumen diario existente?

2 Me gusta

esa es una idea muy buena si pudieras hacerlo de manera eficiente …

2 Me gusta

Sospecho que esta es la parte verdaderamente desafiante de esta solicitud, pero también donde reside una gran cantidad de valor.

La mayoría de las plataformas de alojamiento de contenido tienen alguna forma de sistema de recomendación personalizado, me sorprendería que Discourse no se dirigiera hacia allí en algún momento. Es discutiblemente más factible que para plataformas como Spotify/Youtube, ya que todo está basado en texto, eliminando una capa de error entre la traducción de imagen/sonido a objeto/texto/concepto.

2 Me gusta

En resumen.

Piensa más allá de lo convencional con la solicitud en la primera publicación. Si bien tienes muchas restricciones válidas que deben cumplirse, eso no significa que no existan también soluciones potencialmente mejores.


Nota al margen sobre Temas Relacionados, de los cuales honestamente puedo decir que he visto unos miles en los últimos días y he notado esto

Algo a tener en cuenta.

Al revisar muchas publicaciones en Temas Relacionados para un sitio en inglés (OpenAI), empiezo a notar que los temas en español tienden a agruparse y sospecho que si se tradujeran primero al inglés, cada publicación tendría un vector diferente y, por lo tanto, se agruparía con otras publicaciones. :slightly_smiling_face:

1 me gusta

pesadilla :sweat_smile:

Aún estamos perfeccionando la función (prevemos anunciarla la próxima semana), pero nuestro nuevo Informe periódico con IA se ajusta perfectamente a tu visión:

instrucciones personalizadas proporcionadas

Genera un resumen diario de meta.discourse.org

  • Enumera estadísticas clave, como los principales usuarios y el número de publicaciones y temas.

  • Enumera unas 10 nuevas temas interesantes con un breve resumen de la actividad ocurrida durante el día.

  • Enumera unos 10 temas antiguos interesantes que hayan tenido actividad significativa durante el día.

  • Incluye un resumen de la actividad del grupo @team, enlazando a los temas en los que participaron.

  • Fuentes: SIEMPRE respalda las afirmaciones con enlaces a discusiones del foro.

  • Uso de Markdown: Mejora la legibilidad con negrita, cursiva, y > citas y enlaces.

  • Enlaces: Utiliza https://meta.discourse.org/t/-/TOPIC_ID/POST_NUMBER para referencias directas.

  • Menciones de usuarios: Referencia a los usuarios con @USUARIO

  • Añade muchos enlaces a temas: intenta enlazar al menos 30 temas en el informe. El ID del tema no tiene sentido para los usuarios finales; si necesitas incluir un enlace, usa ref o, mejor aún, incrusta directamente en la oración.

  • Categorías y etiquetas: utiliza el formato #ETIQUETA y #CATEGORÍA para indicar etiquetas y categorías.

  • Los temas bug son súper importantes para mí; asegúrate de priorizarlos y siéntete libre de resaltar cualquier bug mal categorizado que encuentres. NO menciones si los temas están correctamente categorizados.

  • Al proporcionar un resumen de un tema, hazlo en forma de párrafo, por ejemplo:

    @usuario descubrió que había un problema con XYZ y @usuario2 sugirió una solución

informe crudo generado por IA - AVISO: contiene 4 o más alucinaciones

Resumen diario de Meta.Discourse.org (2023-12-21)

Estadísticas clave

  • Nuevas publicaciones: 131
  • Nuevos temas: 25
  • Principales usuarios por likes y publicaciones:

Nuevos temas interesantes

  1. Navegación experimental de la barra lateral de administración - @martin presentó una navegación experimental de la barra lateral de administración, lo que generó discusiones sobre su diseño y funcionalidad. Usuarios como @packman y @Don ofrecieron comentarios sobre entradas faltantes y problemas de visualización en móviles, que @martin reconoció y está considerando para futuras actualizaciones. Leer más.

  2. Lista de temas recomendados - @Tris20 sugirió añadir una lista de temas recomendados al menú superior, aprovechando los avances en los modelos de lenguaje grandes (LLM) para adaptar el contenido a los intereses de los usuarios. La conversación evolucionó con contribuciones de @EricGT, @merefield y otros, discutiendo el potencial y los desafíos de las recomendaciones de contenido personalizadas. Leer más.

  3. Diez años de Discourse - Usuarios como @Judy_Hawkins y @Quercus compartieron su gratitud por varias comunidades de Discourse que han impactado sus vidas, celebrando el décimo aniversario de la plataforma. Leer más.

  4. Plugin de ubicaciones - @Don reportó un problema con el plugin de ubicaciones, al que @merefield respondió rápidamente, indicando su disposición a investigar el problema. Leer más.

  5. Restringir a los usuarios de editar la barra de navegación - @Yola pidió ayuda para restringir a los usuarios de editar la barra de navegación, y @JammyDodger aclaró que la función está diseñada para la personalización individual. @pfaffman y @LOCOSP proporcionaron soluciones CSS para ocultar el botón de edición. Leer más.

  6. Errores al subir archivos - @Vladimir_P encontró errores al subir archivos, los cuales @JammyDodger y @blake abordaron, lo que llevó a la implementación de una corrección. Leer más.

  7. Crear e instalar plugins - @Gaurav_Kumar_Sandan preguntó sobre cómo crear e instalar plugins en la página de inicio, y @JammyDodger y @pfaffman brindaron orientación sobre componentes de temas e instalación de plugins. Leer más.

  8. DiscoTOC - Tabla de contenidos automática - Usuarios como @digitaldominica y @Arkshine discutieron problemas con el componente DiscoTOC, los cuales se resolvieron tras las actualizaciones de Discourse. Leer más.

  9. Configuración de usuario personalizada en un plugin - @pirhoo pidió consejo sobre cómo crear campos de usuario personalizados desde un plugin, y @merefield proporcionó recursos para ayudar en el proceso. Leer más.

  10. Ubicación de los detalles de facturación - @Teresations necesitaba ayuda para localizar los detalles de facturación de su Discourse alojado con Communiteq, y @awesomerobot y @RGJ le ayudaron, señalando el panel de control. Leer más.

Temas antiguos interesantes con actividad significativa

  1. Comentarios sobre el ajuste del interlineado de emojis - @sam y @tynaut discutieron el impacto de los ajustes del interlineado de emojis en el estilo del estado del usuario, y @tynaut confirmó una corrección para el chat y está investigando una solución para publicaciones/mensajes. Leer más.

  2. Usar FILTER para resumir datos - @JammyDodger compartió una consulta SQL que utiliza la función FILTER para segmentar datos de usuarios según las preferencias de resumen de actividad, proporcionando una explicación detallada de los componentes de la consulta. Leer más.

  3. Estilo de comunicación como parte del perfil de un usuario - @Saif y @simon discutieron el potencial y las preocupaciones de implementar el análisis de sentimientos en los perfiles de usuario para evaluar el estilo de comunicación. Leer más.

  4. Enter para nueva línea, Shift+Enter para enviar mensaje en el chat - @meglio propuso un cambio de configuración para el comportamiento de entrada en el chat, apoyado por usuarios como @Jagster y @Moin, para hacer más amigable el envío de mensajes de varios párrafos. Leer más.

  5. No se puede aprobar la primera publicación de un usuario si tiene una encuesta - @Firepup650 reportó un problema donde la primera publicación de un usuario que contenía una encuesta no podía ser aprobada debido a un error de permisos. Leer más.

Actividad del grupo @team

Temas bug mal categorizados

  • Mensaje de error al subir un logotipo - @spicerunner reportó un mensaje de error al subir un logotipo, el cual se resolvió tras una actualización. Este tema estaba correctamente categorizado como bug. Leer más.

Temas bug correctamente categorizados

  • Fallo en los correos electrónicos de notificación salientes - @managenet tuvo problemas con los correos electrónicos de notificación salientes después de intentar cambiar el límite de tamaño de adjunto. Leer más.

  • No se puede reconstruir la aplicación, atascado extrayendo una capa - @LOCOSP encontró un problema con la extracción de una capa de Docker durante una reconstrucción, buscando consejo sobre cómo forzar la re-descarga de los archivos. Leer más.

  • ¿Usa Discourse Launcher / Docker los servidores locales de Postgresql y Redis? - @dalu74 preguntó si Discourse utiliza las instalaciones locales de Postgresql y Redis del host, lo cual fue aclarado por @hello-smile6. Leer más.

Para más detalles y discusiones, visita meta.discourse.org.

Específicamente, podrías liberar algunos de estos informes automatizados para intentar resaltar contenido interesante.

El hecho de que controles el tamaño del contexto, la cantidad de días que abarca el informe y más, te permite tener un control extremo aquí.

Advertencia: esto necesita GPT-4 turbo para funcionar bien; Anthropic Claude es un modelo de lenguaje con una ventana de contexto grande, pero los resultados que ha producido no me han impresionado.

13 Me gusta

Puede que ya lo sepas, pero también lo digo para otros, ya que puede que no sea tan obvio.

Si tienes acceso al bot Discourse AI que se encuentra en la esquina superior derecha
image
entonces, usando la personalidad de Forum Helper, también puedes probar diferentes instrucciones que podrían usarse con las custom instructions del Periodic report using AI. En otras palabras, puedes usar Forum Helper para prototipar rápidamente el informe.

Como alguien que tuvo el privilegio de ayudar con comentarios durante el desarrollo, puedo decirte que las custom instructions son importantes para obtener los resultados deseados. En el ejemplo dado anteriormente, puedo ver claramente que Sam añadió esto para tu variación de un informe basado en tu solicitud inicial.

Espero que te sirva.

1 me gusta

Lamentablemente, esta instrucción personalizada es demasiado difícil incluso para GPT 4, aunque por otro lado el resto funciona bastante bien.

1 me gusta

Me encanta el aspecto, aunque no estoy seguro de entender completamente la funcionalidad. Parece que esto produce algo similar al Digest. Me gusta mucho este nuevo formato para esa información.

Lo que no pude ver en la respuesta es si esto puede proporcionar un resumen personalizado. ¿Me perdí algo? ¿Es posible generar esto por usuario, basándose en los intereses individuales del usuario?

Para concretar estas ideas, esto es aproximadamente lo que tenía en mente:

  1. Identificar los intereses principales del usuario: (Ejecutar una vez) Escanear todos los temas y respuestas con los que el usuario ha interactuado (me gusta, responder, crear) en busca de palabras clave.
  2. Identificar los intereses recientes del usuario: Escanear los temas y respuestas que el usuario ha leído este mes en busca de palabras clave.
  3. Identificar los conceptos clave de los temas recientes: escanear todos los temas nuevos de esta semana.

pseudocódigo

user_interests = main_interests + recent_interests
Recommended_list = Match(recent_topics with user_interests)
Recommended_list = Recommended_list.sort_by_match_strength()
3 Me gusta

Una conclusión interesante a la que estoy llegando con nuestros informes diarios (que ahora están configurados para TL3 en meta)

La parte que más le gusta a la gente y que está impulsada por LLM es el simple resumen de 1 párrafo de los cambios en un tema de la fecha X a la Y.

En lugar de hacer que el LLM lea todo el corpus y cree un informe como este, podríamos simplemente mantener una “caché de fragmentos” donde, por ejemplo, almacenamos párrafos por tema:

ID del tema Rango de fechas para el resumen Resumen muy corto
2343 12-1 → 12-9

Con eso, podemos construir resúmenes personalizados por usuario. Básicamente, estamos dividiendo esto en múltiples problemas:

  • Identificar temas interesantes → programación tradicional (etiquetas / categorías observadas o quizás observación “de fondo” basada en la actividad - excluir lo ya leído)

  • Resumir temas → función impulsada por LLM

Esto tiene múltiples ventajas. Escala muy bien, los resúmenes pueden ser mucho más precisos porque la cantidad de contexto es mucho más limitada y hay menos riesgo de fuga de contexto y alucinación.

4 Me gusta

He estado reflexionando sobre una variación de esta idea. En lugar de pensar en temas relacionados por etiquetas o categorías, considérelos en función de su similitud semántica. Si bien no todos los temas semánticamente relacionados formarán una esfera de manera ordenada, es útil pensar en ellos de esa manera. Imagina una esfera que comienza como un solo tema; a medida que se agregan más temas, la esfera se expande, pero tiene un tamaño limitado después de un tiempo. Sin embargo, se pueden agregar más temas dentro de la esfera a medida que crece e incluso con el tiempo después de alcanzar su tamaño completo. Piensa en esto como un espectáculo de fuegos artificiales en el cielo, con explosiones rápidas que representan temas con diferentes similitudes semánticas que se agregan con el tiempo. Esta analogía me ayuda a comprender mejor el concepto. Estoy particularmente interesado en esas explosiones rápidas y aquellas que perduran y brillan durante mucho tiempo. Si uno también tuviera una representación visual de esto, sería bueno elegir centros semánticos y adaptar un párrafo sobre eso.

Este tema, al usar Mostrar publicación completa, muestra una imagen real de temas semánticamente relacionados.


EDITAR

Aquí hay una imagen visual que se acerca más a lo que estoy pensando.

La imagen es de aquí

https://marvl.infotech.monash.edu/webcola/

1 me gusta

En muchos sentidos, esto es pedir "el algoritmo" pero para Discourse.

Muchas cosas pueden influir en “el algoritmo” para seleccionar contenido interesante:

  • ¿Quién es? Por ejemplo: “Suelo prestar mucha atención a las publicaciones de Jane”.
  • ¿Qué es? Por ejemplo: “Suelo prestar mucha atención a las publicaciones muy bien escritas”.
  • ¿Qué es? Por ejemplo: “Suelo prestar mucha atención a los temas en este espacio vectorial meta”.
  • ¿Qué tan popular es? Por ejemplo: “Suelo leer cosas que a mucha otra gente le gustan/leen”.
  • Y mucho, mucho más.
2 Me gusta

Tengo que ser honesto y señalar que es la primera vez que oigo hablar de “el algoritmo”, pero sí, se alinea bastante con lo que estoy pensando. Tendré que investigarlo más a fondo, pero no espero discrepar con lo que señalas. :slightly_smiling_face:


21 de noviembre de 2023
ChatGPT 3.5

¿Qué es “el algoritmo” de Twitter?

ChatGPT

El algoritmo de Twitter se refiere al complejo conjunto de reglas y procesos matemáticos que la plataforma de redes sociales utiliza para determinar qué contenido se muestra a los usuarios en sus líneas de tiempo y feeds. Este algoritmo está diseñado para curar y personalizar el contenido que los usuarios ven en función de sus intereses, historial de interacciones y otros factores. El algoritmo de Twitter ha evolucionado a lo largo de los años, pero generalmente tiene como objetivo mostrar a los usuarios los tuits más relevantes y atractivos, al tiempo que promueve la interacción y la retención de usuarios en la plataforma.

Los componentes y factores clave que pueden influir en el algoritmo de Twitter incluyen:

  1. Relevancia: El algoritmo considera la relevancia de un tuit para los intereses y preferencias de un usuario. Tiene en cuenta las cuentas que sigue un usuario, el contenido con el que interactúa (me gusta, retuits, respuestas) y las palabras clave y hashtags que utiliza en sus tuits.
  2. Interacción: Los tuits que reciben más me gusta, retuits, respuestas y compartidos tienen más probabilidades de ser promocionados por el algoritmo. Una mayor interacción indica que un tuit resuena con los usuarios y se considera más valioso.
  3. Recencia: Twitter a menudo prioriza los tuits recientes para mantener a los usuarios actualizados con la información y las tendencias más recientes. Sin embargo, también puede mostrar tuits más antiguos que siguen siendo relevantes y atractivos.
  4. Personalización: El algoritmo crea una experiencia personalizada para cada usuario adaptando su feed a sus intereses y comportamientos específicos. Se adapta con el tiempo a medida que los usuarios interactúan con la plataforma.
  5. Número de seguidores: El número de seguidores que tiene una cuenta también puede influir en la visibilidad de sus tuits. Las cuentas con más seguidores generalmente tienen más probabilidades de que sus tuits se muestren a una audiencia más amplia.
  6. Tipo de medio: Los tuits con imágenes, videos u otros medios tienden a recibir una mayor interacción y pueden ser promocionados por el algoritmo.
  7. Calidad y seguridad: El algoritmo de Twitter también tiene como objetivo promover contenido de alta calidad y seguro, al tiempo que reduce la visibilidad de spam, noticias falsas y contenido perjudicial.

Es importante tener en cuenta que Twitter actualiza y refina periódicamente su algoritmo para mejorar la experiencia del usuario y abordar las preocupaciones relacionadas con la propagación de desinformación y contenido perjudicial. Los usuarios también pueden tener cierto control sobre su línea de tiempo ajustando su configuración, silenciando cuentas o utilizando funciones de Twitter como Listas y la opción “Mostrar primero los mejores tuits” para personalizar aún más su feed.

Me encanta absolutamente esto. Se siente como una versión sin alertas de Observando, que es exactamente el tipo de cosa que estamos buscando. ¡Algo que realmente me impresiona es el poco esfuerzo cognitivo que siento al leer este formato! ¡Sinceramente, no puedo esperar a leer más de ellos!

¿Estoy en lo cierto al pensar que esto solo se ha probado en Meta hasta ahora? Tengo mucha curiosidad sobre cómo manejaría un foro técnico con información potencialmente más obtusa.

2 Me gusta

Lo probé en un foro muy técnico también y funcionó bien, está listo para jugar, añadiré documentación adecuada la próxima semana.

5 Me gusta