Pourrait-on ajouter une liste de sujets recommandés au menu principal?

J’adore le Discourse AI - Related Topics: Enhancing Content Exploration, mais malheureusement sa portée semble être définie par le sujet que je lis actuellement.

Je me demande si, avec les récents progrès des LLM, il serait possible de parcourir les publications et l’historique de lecture d’un utilisateur pour lui proposer un flux de recommandations ?

Ce serait une excellente fonctionnalité pour notre cas d’utilisation axé sur les questions-réponses. Nous avons de nombreuses catégories distinctes, des utilisateurs (collègues) très actifs et beaucoup d’informations extrêmement utiles qu’ils ne verront tout simplement pas. Une bonne liste de recommandations aiderait certains de nos utilisateurs à anticiper les problèmes qu’ils essaient de résoudre.

Je suppose que notre idéal serait une liste composée de bugs courants, significatifs et populaires dont les gens parlent, liés aux outils et aux conversations auxquels l’utilisateur manifeste déjà de l’intérêt.

7 « J'aime »

Pourriez-vous partager un lien vers le site s’il est public ?

En tant qu’utilisateur des fonctionnalités d’IA de Discourse, dont beaucoup avant qu’elles ne soient rendues publiques, je suis impatient d’en savoir plus sur votre site. Comprendre les détails spécifiques que vous avez notés me permettra de faire des recommandations plus éclairées pour l’IA de Discourse, en tenant compte des aspects uniques de votre plateforme.

J’aimerais beaucoup, mais malheureusement, il s’agit d’une grande instance interne d’entreprise :frowning:
Je peux peut-être vous donner une idée de ce que nous faisons.

Contexte

Essentiellement, c’est comme un Stackoverflow interne où nous partageons des problèmes spécifiques à l’entreprise et à l’industrie, comme « comment diable configurer le proxy pour cela ? » ou « Je ne trouve aucun résultat pour Bug123 sur Google, quelqu’un d’autre a-t-il résolu cela ? »

Nos catégories sont spécifiques aux outils, telles que :

  • Kubernetes
  • Gitlab
  • Des trucs IBM buggés avec la pire interface utilisateur que vous ayez jamais vue

Comment une liste recommandée pourrait-elle être utile ?

Actuellement, si je lis/réponds à un sujet dans la catégorie Gitlab qui parle de l’intégration avec d’autres outils, tels que Kubernetes, je ne reçois aucune notification sur les sujets connexes. Donc, s’il y a un article très utile dans la catégorie Kubernetes, je pourrais ne le voir que très tardivement. Je dois le trouver moi-même, ou m’abonner aux bonnes notifications.

La plupart de nos utilisateurs n’auront pas de bons paramètres de notification :

  1. Ils sont sous pression pour obtenir des résultats
  2. Ils ne passent pas assez de temps sur la plateforme pour tirer le meilleur parti de leurs paramètres de notification.

Une liste recommandée fournirait des informations potentiellement utiles, à la demande, en un seul clic. Essentiellement, « en fonction de vos intérêts récents, voici quelques sujets qui pourraient vous être utiles ». Elle pourrait être construite à partir de l’historique de recherche de l’utilisateur, des sujets populaires, des mots-clés courants dans les sujets auxquels il participe, etc. Ainsi, s’il ne visite jamais la catégorie IBM buggée, rien de cette catégorie ne sera recommandé, sauf si cela touche par hasard à quelque chose qui l’intéresse déjà fortement, par exemple, Gitlab.

4 « J'aime »

Vous n’avez manifestement jamais utilisé de perforatrice machine.


Image de : Definition of keypunch machine | PCMag


Avez-vous vu ce sujet, vous devriez tout lire car il y a beaucoup d’informations utiles dans la plupart des messages.

1 « J'aime »

Je fournis un résumé IA « daily buzz » en haut de ce site, mis à jour toutes les 12 heures et basé sur 2 jours de publications.

La solution est propriétaire et n’est pas dans un plugin public, mais elle démontre le concept.

Et oui, elle est sujette aux erreurs ! :sweat_smile:

J’avais l’intention de la faire lier du contenu… MISE À JOUR : c’est fait, il suffisait de GPT 4 Turbo et d’un peu d’ingénierie de prompt. GPT 3.5 ne peut pas gérer ce niveau d’instruction.

3 « J'aime »

Je vois votre belle machine à cartes perforées, et je vous propose un système de billetterie basé sur le web qui ne prend pas en charge le markdown :rire :


Sujet recommandé

Merci, je ne l’avais pas vu. Il pourrait s’avérer fructueux si les choses changent pour nous, mais malheureusement, il ne semble pas répondre à nos restrictions actuelles (que j’ai omis de mentionner plus tôt :facepalm:) .

Restrictions

  • Impossible d’utiliser le chat
  • Impossible d’utiliser les messages privés
  • Impossible de s’appuyer sur l’IA pour générer des réponses et les fournir silencieusement à nos développeurs – nous fabriquons des logiciels critiques pour la sécurité

Ces restrictions sont essentiellement la raison pour laquelle une liste de sujets recommandés serait une bonne solution pour nous : aucun contenu n’est généré, le chat n’est pas utilisé, les messages privés ne sont pas utilisés.

Ce serait une façon intéressante de fournir un résumé quotidien. Comme vous le dites, les hyperliens seraient certainement une excellente fonctionnalité. Envisagez-vous de la personnaliser en fonction de l’ensemble distinct d’intérêts de l’utilisateur ? Qu’est-ce qui a rendu cette approche attrayante au lieu de s’appuyer sur le bulletin d’information quotidien existant ?

2 « J'aime »

c’est une très bonne idée si vous pouviez le faire efficacement…

2 « J'aime »

Je soupçonne que c’est la partie vraiment difficile de cette demande, mais aussi celle où réside une tonne de valeur.

La plupart des plateformes d’hébergement de contenu ont une forme de système de recommandation personnalisé, je serais surpris que Discourse ne s’oriente pas aussi dans cette direction à un moment donné. C’est sans doute plus réalisable que pour des plateformes comme Spotify/Youtube car tout est basé sur du texte, supprimant une couche d’erreur entre la traduction d’image/son en objet/texte/concept.

2 « J'aime »

Pour faire court.

Pensez davantage hors des sentiers battus avec la demande du premier message. Bien que vous ayez de nombreuses contraintes valides qui doivent être respectées, cela ne signifie pas qu’il n’existe pas de solutions potentiellement meilleures.


Note annexe sur les sujets connexes, dont je peux honnêtement dire que j’en ai vu quelques milliers ces derniers jours et j’ai remarqué ceci

Quelque chose à surveiller.

En examinant de nombreux messages dans les sujets connexes pour un site en anglais (OpenAI), je commence à remarquer que les sujets en espagnol ont tendance à être regroupés et je soupçonne que s’ils étaient d’abord traduits en anglais, chaque message aurait un vecteur différent et serait donc regroupé avec d’autres messages. :slightly_smiling_face:

1 « J'aime »

cauchemar :sweat_smile:

We are still refining the feature (will look at announcing next week), but our new Periodic report using AI totally fits with your vision:

custom instructions provided

Generate a Daily summary of meta.discourse.org

  • List key stats like top users and counts of posts / topics

  • List 10 or so interesting new topics with a brief summary of activity that happened during the day

  • List 10 or so interesting older topics that got significant activity during the day

  • List a summary of activity by the @team group linking to topics they made inline.

  • Sourcing: ALWAYS Back statements with links to forum discussions.

  • Markdown Usage: Enhance readability with bold, italic, and > quotes and links.

  • Linking: Use https://meta.discourse.org/t/-/TOPIC_ID/POST_NUMBER for direct references.

  • User Mentions: Reference users with @USERNAME

  • Add many topic links: strive to link to at least 30 topics in the report. Topic Id is meaningless to end users if you need to throw in a link use ref or better still just embed it into the sentence

  • Categories and tags: use the format #TAG and #CATEGORY to denote tags and categories

  • bug topics are super important to me, make sure to prioritize them and also feel free to try to highlight any miscategorized bugs if you find any. DO NOT mention if stuff is correctly categorized.

  • When providing a topic summary, do so in paragraph form eg:

    @user discovered there was an issue with XYZ and @user2 suggested suggestion

raw report generated via AI - DISCLAIMER - contains 4 or so hallucinations

Daily Summary of Meta.Discourse.org (2023-12-21)

Key Stats

Interesting New Topics

  1. Experimental Admin Sidebar Navigation - @martin introduced an experimental admin sidebar navigation, sparking discussions about its design and functionality. Users like @packman and @Don provided feedback on missing entries and mobile display issues, which @martin acknowledged and is considering for future updates. Read more.

  2. Recommended Topics List - @Tris20 suggested adding a list of recommended topics to the top menu, leveraging advancements in LLMs to tailor content to users’ interests. The conversation evolved with contributions from @EricGT, @merefield, and others, discussing the potential and challenges of personalized content recommendations. Read more.

  3. Ten Years of Discourse - Users like @Judy_Hawkins and @Quercus shared their gratitude for various Discourse communities that have impacted their lives, celebrating the platform’s ten-year anniversary. Read more.

  4. Locations Plugin - @Don reported an issue with the Locations plugin, which @merefield promptly responded to, indicating a willingness to investigate the problem. Read more.

  5. Restricting Users from Editing Navigation Bar - @Yola sought help to restrict users from editing the navigation bar, and @JammyDodger clarified that the feature is designed for individual customization. @pfaffman and @LOCOSP provided CSS solutions to hide the edit button. Read more.

  6. Upload File Bugs - @Vladimir_P encountered bugs when uploading files, which @JammyDodger and @blake addressed, leading to a fix being implemented. Read more.

  7. Creating and Installing Plugins - @Gaurav_Kumar_Sandan inquired about creating and installing plugins on the home page, with @JammyDodger and @pfaffman providing guidance on theme components and plugin installation. Read more.

  8. DiscoTOC - Automatic Table of Contents - Users like @digitaldominica and @Arkshine discussed issues with the DiscoTOC component, which were resolved following updates to Discourse. Read more.

  9. Custom User Setting in a Plugin - @pirhoo sought advice on creating custom user fields from a plugin, with @merefield providing resources to assist in the process. Read more.

  10. Billing Details Location - @Teresations needed help locating billing details for their Discourse hosted with Communiteq, which @awesomerobot and @RGJ assisted with, pointing to the control panel. Read more.

Interesting Older Topics with Significant Activity

  1. Emoji Line-Height Adjustment Feedback - @sam and @tynaut discussed the impact of emoji line-height adjustments on user status styling, with @tynaut confirming a fix for chat and looking into a solution for posts/messages. Read more.

  2. Using FILTER to Summarize Data - @JammyDodger shared a SQL query using the FILTER function to segment user data based on activity summary preferences, providing a detailed explanation of the query’s components. Read more.

  3. Communication Style as Part of a User’s Profile - @Saif and @simon discussed the potential and concerns of implementing sentiment analysis on user profiles to assess communication style. Read more.

  4. Enter to Newline, Shift+Enter to Submit Message in Chat - @meglio proposed a configuration change for chat input behavior, supported by users like @Jagster and @Moin, to make multi-paragraph messaging more user-friendly. Read more.

  5. Can’t Approve a User’s First Post if It Has a Poll - @Firepup650 reported an issue where a user’s first post containing a poll could not be approved due to a permissions error. Read more.

Activity by the @team Group

Miscategorized bug Topics

  • Error Message When Uploading Logo - @spicerunner reported an error message when uploading a logo, which was resolved after an update. This topic was correctly categorized as a bug. Read more.

Correctly Categorized bug Topics

  • Outbound Notification E-mails Failing - @managenet faced issues with outbound notification emails after attempting to change the attachment size limit. Read more.

  • Can’t Rebuild App Stuck Extracting One Layer - @LOCOSP encountered a problem with a Docker layer extraction during a rebuild, seeking advice on how to force a re-pull of the files. Read more.

  • Does Discourse Launcher / Docker Use the Local Postgresql and Redis Servers? - @dalu74 inquired about whether Discourse uses the host’s Postgresql and Redis installations, which was clarified by @hello-smile6. Read more.

For more details and discussions, visit meta.discourse.org.

Specifically you could unleash some of these automation reports to try to surface interesting content.

The fact you control the context size, amount of days the report spans and more lets you have extreme control here.

Warning though, this needs GPT-4 turbo to work well, Anthropic Claude is a large context window llm but the results it has produced failed to impress me.

13 « J'aime »

Vous le savez peut-être déjà, mais je le précise pour les autres car ce n’est pas si évident.

Si vous avez accès au bot Discourse AI, que vous pouvez trouver dans le coin supérieur droit
image
alors en utilisant le persona Forum Helper, vous pouvez également essayer différentes instructions qui pourraient être utilisées avec les instructions personnalisées du Rapport périodique utilisant l'IA. En d’autres termes, vous pouvez utiliser Forum Helper pour prototyper rapidement le rapport.

En tant que personne privilégiée d’avoir pu fournir des commentaires pendant le développement, je peux vous dire que les instructions personnalisées sont importantes pour obtenir les résultats souhaités. Dans l’exemple donné ci-dessus, je peux clairement voir que Sam a ajouté ceci pour votre variation d’un rapport basé sur votre demande initiale

J’espère que cela vous aide.

1 « J'aime »

Malheureusement, cette instruction personnalisée est trop difficile même pour GPT 4, mais par contre le reste fonctionne assez bien.

1 « J'aime »

J’adore l’apparence, bien que je ne sois pas sûr de bien comprendre la fonctionnalité. Il semble que cela produise quelque chose de similaire au Digest. J’aime beaucoup ce nouveau format pour ces informations.

Ce que je n’ai pas pu voir dans la réponse, c’est si cela peut fournir un résumé personnalisé. Ai-je manqué quelque chose ? Est-il possible de générer cela par utilisateur, en fonction des intérêts individuels de l’utilisateur ?

Pour concrétiser ces idées, voici à peu près ce que j’avais en tête :

  1. Identifier les principaux centres d’intérêt de l’utilisateur : (Exécuter une fois) Analyser tous les sujets et réponses avec lesquels l’utilisateur a interagi (aimé, répondu, créé) pour trouver des mots-clés
  2. Identifier les centres d’intérêt récents de l’utilisateur : Analyser les sujets et réponses que l’utilisateur a lus ce mois-ci pour trouver des mots-clés
  3. Identifier les concepts clés des sujets récents : analyser tous les nouveaux sujets cette semaine
user_interests = main_interests + recent_interests
Recommended_list = Match(recent_topics with user_interests)
Recommended_list = Recommended_list.sort_by_match_strength()
3 « J'aime »

Une conclusion intéressante à laquelle j’arrive avec nos rapports quotidiens (qui sont maintenant configurés pour TL3 sur meta)

La partie que les gens aiment le plus et qui est pilotée par LLM est le simple résumé en 1 paragraphe des changements dans un sujet de la date X à Y.

Au lieu de demander au LLM de lire l’intégralité du corpus et de créer un rapport comme celui-ci, nous pourrions simplement conserver un « cache de fragments » où nous stockons, par exemple, des paragraphes par sujet :

id du sujet plage de dates pour le résumé résumé très court
2343 12-1 → 12-9

Avec cela, nous pouvons construire des résumés personnalisés par utilisateur. Nous divisons donc cela en plusieurs problèmes :

  • Identifier les sujets intéressants → programmation traditionnelle (tags / catégories suivis ou peut-être suivi « en arrière-plan » basé sur l’activité - exclure ce qui a déjà été lu)

  • Résumer les sujets → fonctionnalité alimentée par LLM

Cela présente plusieurs avantages. Cela évolue très bien, les résumés peuvent être beaucoup plus précis car la quantité de contexte est beaucoup plus limitée et il y a moins de risque de fuite de contexte et d’hallucination.

4 « J'aime »

J’ai réfléchi à une variation de cette idée. Au lieu de penser aux sujets liés par des tags ou des catégories, considérez-les en fonction de leur similarité sémantique. Bien que tous les sujets sémantiquement liés ne forment pas une sphère, il est utile de les considérer de cette façon. Imaginez une sphère commençant comme un seul sujet ; à mesure que d’autres sujets sont ajoutés, la sphère s’agrandit, mais elle a une taille limitée après un certain temps. Pourtant, d’autres sujets peuvent être ajoutés à l’intérieur de la sphère à mesure qu’elle grandit et, au fil du temps, même après avoir atteint sa taille maximale. Pensez-y comme à un feu d’artifice dans le ciel, avec des explosions rapides représentant des sujets de différentes similarités sémantiques ajoutés au fil du temps. Cette analogie m’aide à mieux comprendre le concept. Je suis particulièrement intéressé par ces explosions rapides et celles qui persistent et scintillent pendant une longue période. Si l’on pouvait également avoir une représentation visuelle de cela, il serait agréable de choisir des centres sémantiques et de personnaliser un paragraphe à ce sujet.

Ce sujet, lorsque vous utilisez Afficher le message complet, montre une véritable image de sujets sémantiquement liés.


EDIT

Voici une visualisation qui se rapproche de ce que je pense.

L’image provient d’ici

https://marvl.infotech.monash.edu/webcola/

1 « J'aime »

D’une certaine manière, cela demande « l’algorithme » mais pour Discourse.

Tant de choses peuvent entrer dans « l’algorithme » pour choisir des choses intéressantes :

  • Qui est-ce ? Par exemple : « J’ai tendance à beaucoup m’intéresser aux publications de Jane »
  • Qu’est-ce que c’est ? Par exemple : « J’ai tendance à beaucoup m’intéresser aux publications très bien écrites »
  • Qu’est-ce que c’est ? Par exemple : « J’ai tendance à beaucoup m’intéresser aux sujets dans cet espace vectoriel méta »
  • Quelle est sa popularité ? Par exemple : « J’ai tendance à lire des choses que beaucoup d’autres personnes aiment/lisent »
  • Et bien plus encore.
2 « J'aime »

Je dois être honnête et noter que c’est la première fois que j’entends parler de « l’algorithme », mais oui, cela correspond tout à fait à ce que je pense. Je devrai y regarder de plus près, mais je ne m’attends pas à être en désaccord avec ce que vous notez. :slightly_smiling_face:


21 novembre 2023
ChatGPT 3.5

Vous

Qu’est-ce que « l’algorithme » de Twitter ?

ChatGPT

L’algorithme de Twitter fait référence à l’ensemble complexe de règles et de processus mathématiques que la plateforme de médias sociaux utilise pour déterminer quel contenu est montré aux utilisateurs dans leurs chronologies et leurs flux. Cet algorithme est conçu pour organiser et personnaliser le contenu que les utilisateurs voient en fonction de leurs intérêts, de leur historique d’engagement et d’autres facteurs. L’algorithme de Twitter a évolué au fil des ans, mais il vise généralement à montrer aux utilisateurs les tweets les plus pertinents et les plus engageants tout en favorisant l’engagement et la rétention des utilisateurs sur la plateforme.

Les principaux éléments et facteurs qui peuvent influencer l’algorithme de Twitter comprennent :

  1. Pertinence : L’algorithme prend en compte la pertinence d’un tweet par rapport aux intérêts et préférences d’un utilisateur. Il prend en compte les comptes que l’utilisateur suit, le contenu avec lequel il interagit (likes, retweets, réponses) et les mots-clés et hashtags qu’il utilise dans ses tweets.
  2. Engagement : Les tweets qui reçoivent plus de likes, de retweets, de réponses et de partages sont plus susceptibles d’être promus par l’algorithme. Un engagement plus élevé indique qu’un tweet résonne auprès des utilisateurs et est considéré comme plus précieux.
  3. Récence : Twitter privilégie souvent les tweets récents pour tenir les utilisateurs informés des dernières informations et tendances. Cependant, il peut également montrer des tweets plus anciens qui sont toujours pertinents et engageants.
  4. Personnalisation : L’algorithme crée une expérience personnalisée pour chaque utilisateur en adaptant son flux à ses intérêts et comportements spécifiques. Il s’adapte au fil du temps à mesure que les utilisateurs interagissent avec la plateforme.
  5. Nombre d’abonnés : Le nombre d’abonnés d’un compte peut également influencer la visibilité de ses tweets. Les comptes ayant plus d’abonnés sont généralement plus susceptibles de voir leurs tweets diffusés à un public plus large.
  6. Type de média : Les tweets contenant des images, des vidéos ou d’autres médias ont tendance à recevoir un engagement plus élevé et peuvent être promus par l’algorithme.
  7. Qualité et sécurité : L’algorithme de Twitter vise également à promouvoir un contenu de haute qualité et sûr tout en réduisant la visibilité du spam, des fausses nouvelles et du contenu préjudiciable.

Il est important de noter que Twitter met à jour et affine périodiquement son algorithme pour améliorer l’expérience utilisateur et répondre aux préoccupations concernant la propagation de la désinformation et du contenu préjudiciable. Les utilisateurs peuvent également avoir un certain contrôle sur leur chronologie en ajustant leurs paramètres, en masquant des comptes ou en utilisant des fonctionnalités de Twitter comme les Listes et l’option « Afficher d’abord les meilleurs Tweets » pour personnaliser davantage leur flux.

J’adore absolument ça. Cela ressemble à une version de Watching sans alertes, ce qui est exactement le genre de chose que nous recherchons. Ce qui m’impressionne vraiment, c’est le peu d’effort cognitif que je ressens en lisant ce format ! J’ai vraiment hâte d’en lire d’autres !

Ai-je raison de penser que cela n’a été essayé que sur Meta jusqu’à présent ? Je suis extrêmement curieux de savoir comment cela gérerait un forum technique avec des informations potentiellement plus obscures.

2 « J'aime »

Je l’ai essayé sur un forum très technique également et cela a bien fonctionné, il est prêt à être utilisé, j’ajouterai une documentation appropriée la semaine prochaine.

5 « J'aime »