Je me demande si, avec les récents progrès des LLM, il serait possible de parcourir les publications et l’historique de lecture d’un utilisateur pour lui proposer un flux de recommandations ?
Ce serait une excellente fonctionnalité pour notre cas d’utilisation axé sur les questions-réponses. Nous avons de nombreuses catégories distinctes, des utilisateurs (collègues) très actifs et beaucoup d’informations extrêmement utiles qu’ils ne verront tout simplement pas. Une bonne liste de recommandations aiderait certains de nos utilisateurs à anticiper les problèmes qu’ils essaient de résoudre.
Je suppose que notre idéal serait une liste composée de bugs courants, significatifs et populaires dont les gens parlent, liés aux outils et aux conversations auxquels l’utilisateur manifeste déjà de l’intérêt.
Pourriez-vous partager un lien vers le site s’il est public ?
En tant qu’utilisateur des fonctionnalités d’IA de Discourse, dont beaucoup avant qu’elles ne soient rendues publiques, je suis impatient d’en savoir plus sur votre site. Comprendre les détails spécifiques que vous avez notés me permettra de faire des recommandations plus éclairées pour l’IA de Discourse, en tenant compte des aspects uniques de votre plateforme.
J’aimerais beaucoup, mais malheureusement, il s’agit d’une grande instance interne d’entreprise
Je peux peut-être vous donner une idée de ce que nous faisons.
Contexte
Essentiellement, c’est comme un Stackoverflow interne où nous partageons des problèmes spécifiques à l’entreprise et à l’industrie, comme « comment diable configurer le proxy pour cela ? » ou « Je ne trouve aucun résultat pour Bug123 sur Google, quelqu’un d’autre a-t-il résolu cela ? »
Nos catégories sont spécifiques aux outils, telles que :
Kubernetes
Gitlab
Des trucs IBM buggés avec la pire interface utilisateur que vous ayez jamais vue
Comment une liste recommandée pourrait-elle être utile ?
Actuellement, si je lis/réponds à un sujet dans la catégorie Gitlab qui parle de l’intégration avec d’autres outils, tels que Kubernetes, je ne reçois aucune notification sur les sujets connexes. Donc, s’il y a un article très utile dans la catégorie Kubernetes, je pourrais ne le voir que très tardivement. Je dois le trouver moi-même, ou m’abonner aux bonnes notifications.
La plupart de nos utilisateurs n’auront pas de bons paramètres de notification :
Ils sont sous pression pour obtenir des résultats
Ils ne passent pas assez de temps sur la plateforme pour tirer le meilleur parti de leurs paramètres de notification.
Une liste recommandée fournirait des informations potentiellement utiles, à la demande, en un seul clic. Essentiellement, « en fonction de vos intérêts récents, voici quelques sujets qui pourraient vous être utiles ». Elle pourrait être construite à partir de l’historique de recherche de l’utilisateur, des sujets populaires, des mots-clés courants dans les sujets auxquels il participe, etc. Ainsi, s’il ne visite jamais la catégorie IBM buggée, rien de cette catégorie ne sera recommandé, sauf si cela touche par hasard à quelque chose qui l’intéresse déjà fortement, par exemple, Gitlab.
Je fournis un résumé IA « daily buzz » en haut de ce site, mis à jour toutes les 12 heures et basé sur 2 jours de publications.
La solution est propriétaire et n’est pas dans un plugin public, mais elle démontre le concept.
Et oui, elle est sujette aux erreurs !
J’avais l’intention de la faire lier du contenu… MISE À JOUR : c’est fait, il suffisait de GPT 4 Turbo et d’un peu d’ingénierie de prompt. GPT 3.5 ne peut pas gérer ce niveau d’instruction.
Je vois votre belle machine à cartes perforées, et je vous propose un système de billetterie basé sur le web qui ne prend pas en charge le markdown :rire :
Merci, je ne l’avais pas vu. Il pourrait s’avérer fructueux si les choses changent pour nous, mais malheureusement, il ne semble pas répondre à nos restrictions actuelles (que j’ai omis de mentionner plus tôt ) .
Restrictions
Impossible d’utiliser le chat
Impossible d’utiliser les messages privés
Impossible de s’appuyer sur l’IA pour générer des réponses et les fournir silencieusement à nos développeurs – nous fabriquons des logiciels critiques pour la sécurité
Ces restrictions sont essentiellement la raison pour laquelle une liste de sujets recommandés serait une bonne solution pour nous : aucun contenu n’est généré, le chat n’est pas utilisé, les messages privés ne sont pas utilisés.
Ce serait une façon intéressante de fournir un résumé quotidien. Comme vous le dites, les hyperliens seraient certainement une excellente fonctionnalité. Envisagez-vous de la personnaliser en fonction de l’ensemble distinct d’intérêts de l’utilisateur ? Qu’est-ce qui a rendu cette approche attrayante au lieu de s’appuyer sur le bulletin d’information quotidien existant ?
Je soupçonne que c’est la partie vraiment difficile de cette demande, mais aussi celle où réside une tonne de valeur.
La plupart des plateformes d’hébergement de contenu ont une forme de système de recommandation personnalisé, je serais surpris que Discourse ne s’oriente pas aussi dans cette direction à un moment donné. C’est sans doute plus réalisable que pour des plateformes comme Spotify/Youtube car tout est basé sur du texte, supprimant une couche d’erreur entre la traduction d’image/son en objet/texte/concept.
Pensez davantage hors des sentiers battus avec la demande du premier message. Bien que vous ayez de nombreuses contraintes valides qui doivent être respectées, cela ne signifie pas qu’il n’existe pas de solutions potentiellement meilleures.
Note annexe sur les sujets connexes, dont je peux honnêtement dire que j’en ai vu quelques milliers ces derniers jours et j’ai remarqué ceci
Quelque chose à surveiller.
En examinant de nombreux messages dans les sujets connexes pour un site en anglais (OpenAI), je commence à remarquer que les sujets en espagnol ont tendance à être regroupés et je soupçonne que s’ils étaient d’abord traduits en anglais, chaque message aurait un vecteur différent et serait donc regroupé avec d’autres messages.
Nous affinez encore la fonctionnalité (nous envisageons de l’annoncer la semaine prochaine), mais notre nouveau Rapport périodique utilisant l'IA correspond parfaitement à votre vision :
Lister les statistiques clés comme les meilleurs utilisateurs et les nombres de messages / sujets
Lister une dizaine de nouveaux sujets intéressants avec un bref résumé de l’activité survenue dans la journée
Lister une dizaine de sujets plus anciens intéressants ayant généré une activité significative durant la journée
Lister un résumé de l’activité du groupe @team en liant les sujets qu’ils ont créés en ligne
Sources : TOUJOURS étayer les affirmations par des liens vers des discussions du forum
Utilisation du Markdown : Améliorer la lisibilité avec gras, italique, et > citations et liens
Liens : Utiliser https://meta.discourse.org/t/-/TOPIC_ID/POST_NUMBER pour les références directes
Mentions d’utilisateurs : Référencer les utilisateurs avec @NOM_UTILISATEUR
Ajouter de nombreux liens vers des sujets : viser à lier au moins 30 sujets dans le rapport. L’ID du sujet n’a aucun sens pour les utilisateurs finaux ; si vous devez insérer un lien, utilisez ref ou, mieux encore, intégrez-le directement dans la phrase
Catégories et balises : utiliser le format #BALISE et #CATÉGORIE pour désigner les balises et les catégories
Les sujets bug sont extrêmement importants pour moi ; assurez-vous de les prioriser et n’hésitez pas à souligner tout bug mal catégorisé que vous pourriez trouver. NE mentionnez PAS si les éléments sont correctement catégorisés.
Lors de la rédaction d’un résumé de sujet, faites-le sous forme de paragraphe, par exemple :
Navigation expérimentale de la barre latérale d’administration - @martin a présenté une navigation expérimentale de la barre latérale d’administration, déclenchant des discussions sur sa conception et son fonctionnement. Des utilisateurs comme @packman et @Don ont donné leur avis sur les entrées manquantes et les problèmes d’affichage sur mobile, que @martin a reconnus et envisage pour les futures mises à jour. Lire la suite.
Liste de sujets recommandés - @Tris20 a suggéré d’ajouter une liste de sujets recommandés dans le menu supérieur, en tirant parti des avancées des LLM pour adapter le contenu aux intérêts des utilisateurs. La conversation a évolué avec des contributions de @EricGT, @merefield et d’autres, discutant du potentiel et des défis des recommandations de contenu personnalisées. Lire la suite.
Dix ans de Discourse - Des utilisateurs comme @Judy_Hawkins et @Quercus ont partagé leur gratitude envers diverses communautés Discourse qui ont marqué leur vie, célébrant le dixième anniversaire de la plateforme. Lire la suite.
Plugin Locations - @Don a signalé un problème avec le plugin Locations, auquel @merefield a rapidement répondu, indiquant sa volonté d’enquêter sur le problème. Lire la suite.
Restreindre les utilisateurs de modifier la barre de navigation - @Yola a demandé de l’aide pour empêcher les utilisateurs de modifier la barre de navigation, et @JammyDodger a précisé que cette fonctionnalité est conçue pour une personnalisation individuelle. @pfaffman et @LOCOSP ont fourni des solutions CSS pour masquer le bouton de modification. Lire la suite.
Bugs liés au téléchargement de fichiers - @Vladimir_P a rencontré des bugs lors du téléchargement de fichiers, que @JammyDodger et @blake ont résolus, conduisant à une correction mise en œuvre. Lire la suite.
Création et installation de plugins - @Gaurav_Kumar_Sandan a demandé des informations sur la création et l’installation de plugins sur la page d’accueil, @JammyDodger et @pfaffman ayant fourni des conseils sur les composants de thème et l’installation de plugins. Lire la suite.
DiscoTOC - Table des matières automatique - Des utilisateurs comme @digitaldominica et @Arkshine ont discuté de problèmes liés au composant DiscoTOC, qui ont été résolus suite aux mises à jour de Discourse. Lire la suite.
Paramètre utilisateur personnalisé dans un plugin - @pirhoo a demandé des conseils sur la création de champs utilisateur personnalisés via un plugin, @merefield fournissant des ressources pour aider à ce processus. Lire la suite.
Emplacement des détails de facturation - @Teresations avait besoin d’aide pour localiser les détails de facturation de son Discourse hébergé par Communiteq, @awesomerobot et @RGJ l’ayant aidé en indiquant le panneau de contrôle. Lire la suite.
Sujets plus anciens intéressants avec une activité significative
Retour sur l’ajustement de la hauteur de ligne des emojis - @sam et @tynaut ont discuté de l’impact des ajustements de la hauteur de ligne des emojis sur le style du statut utilisateur, @tynaut confirmant une correction pour le chat et explorant une solution pour les messages. Lire la suite.
Utilisation de FILTER pour résumer les données - @JammyDodger a partagé une requête SQL utilisant la fonction FILTER pour segmenter les données utilisateur en fonction des préférences de résumé d’activité, fournissant une explication détaillée des composants de la requête. Lire la suite.
Style de communication comme partie du profil d’un utilisateur - @Saif et @simon ont discuté du potentiel et des préoccupations liés à la mise en œuvre de l’analyse des sentiments sur les profils utilisateurs pour évaluer le style de communication. Lire la suite.
Entrée pour saut de ligne, Shift+Entrée pour envoyer un message dans le chat - @meglio a proposé un changement de configuration pour le comportement de saisie du chat, soutenu par des utilisateurs comme @Jagster et @Moin, afin de rendre la messagerie multi-paragraphe plus conviviale. Lire la suite.
Impossible d’approuver le premier message d’un utilisateur s’il contient un sondage - @Firepup650 a signalé un problème où le premier message d’un utilisateur contenant un sondage ne pouvait pas être approuvé en raison d’une erreur de permissions. Lire la suite.
Message d’erreur lors du téléchargement d’un logo - @spicerunner a signalé un message d’erreur lors du téléchargement d’un logo, qui a été résolu après une mise à jour. Ce sujet était correctement catégorisé comme bug. Lire la suite.
Échec des e-mails de notification sortants - @managenet a rencontré des problèmes avec les e-mails de notification sortants après avoir tenté de modifier la limite de taille des pièces jointes. Lire la suite.
Impossible de reconstruire l’application, bloqué à l’extraction d’une couche - @LOCOSP a rencontré un problème d’extraction d’une couche Docker lors d’une reconstruction, demandant des conseils sur la façon de forcer le re-téléchargement des fichiers. Lire la suite.
Discourse Launcher / Docker utilise-t-il les serveurs Postgresql et Redis locaux ? - @dalu74 a demandé si Discourse utilise les installations Postgresql et Redis de l’hôte, ce qui a été clarifié par @hello-smile6. Lire la suite.
Vous pourriez spécifiquement déployer certains de ces rapports automatisés pour tenter de mettre en avant du contenu intéressant.
Le fait que vous contrôliez la taille du contexte, le nombre de jours couverts par le rapport, et bien plus encore, vous offre un contrôle extrême ici.
Attention toutefois, cela nécessite GPT-4 turbo pour fonctionner correctement ; Anthropic Claude dispose d’une grande fenêtre de contexte, mais les résultats qu’il a produits ne m’ont pas impressionné.
Vous le savez peut-être déjà, mais je le précise pour les autres car ce n’est pas si évident.
Si vous avez accès au bot Discourse AI, que vous pouvez trouver dans le coin supérieur droit
alors en utilisant le persona Forum Helper, vous pouvez également essayer différentes instructions qui pourraient être utilisées avec les instructions personnalisées du Rapport périodique utilisant l'IA. En d’autres termes, vous pouvez utiliser Forum Helper pour prototyper rapidement le rapport.
En tant que personne privilégiée d’avoir pu fournir des commentaires pendant le développement, je peux vous dire que les instructions personnalisées sont importantes pour obtenir les résultats souhaités. Dans l’exemple donné ci-dessus, je peux clairement voir que Sam a ajouté ceci pour votre variation d’un rapport basé sur votre demande initiale
J’adore l’apparence, bien que je ne sois pas sûr de bien comprendre la fonctionnalité. Il semble que cela produise quelque chose de similaire au Digest. J’aime beaucoup ce nouveau format pour ces informations.
Ce que je n’ai pas pu voir dans la réponse, c’est si cela peut fournir un résumé personnalisé. Ai-je manqué quelque chose ? Est-il possible de générer cela par utilisateur, en fonction des intérêts individuels de l’utilisateur ?
Pour concrétiser ces idées, voici à peu près ce que j’avais en tête :
Identifier les principaux centres d’intérêt de l’utilisateur : (Exécuter une fois) Analyser tous les sujets et réponses avec lesquels l’utilisateur a interagi (aimé, répondu, créé) pour trouver des mots-clés
Identifier les centres d’intérêt récents de l’utilisateur : Analyser les sujets et réponses que l’utilisateur a lus ce mois-ci pour trouver des mots-clés
Identifier les concepts clés des sujets récents : analyser tous les nouveaux sujets cette semaine
La partie que les gens aiment le plus et qui est pilotée par LLM est le simple résumé en 1 paragraphe des changements dans un sujet de la date X à Y.
Au lieu de demander au LLM de lire l’intégralité du corpus et de créer un rapport comme celui-ci, nous pourrions simplement conserver un « cache de fragments » où nous stockons, par exemple, des paragraphes par sujet :
id du sujet
plage de dates pour le résumé
résumé très court
2343
12-1 → 12-9
…
Avec cela, nous pouvons construire des résumés personnalisés par utilisateur. Nous divisons donc cela en plusieurs problèmes :
Identifier les sujets intéressants → programmation traditionnelle (tags / catégories suivis ou peut-être suivi « en arrière-plan » basé sur l’activité - exclure ce qui a déjà été lu)
Résumer les sujets → fonctionnalité alimentée par LLM
Cela présente plusieurs avantages. Cela évolue très bien, les résumés peuvent être beaucoup plus précis car la quantité de contexte est beaucoup plus limitée et il y a moins de risque de fuite de contexte et d’hallucination.
J’ai réfléchi à une variation de cette idée. Au lieu de penser aux sujets liés par des tags ou des catégories, considérez-les en fonction de leur similarité sémantique. Bien que tous les sujets sémantiquement liés ne forment pas une sphère, il est utile de les considérer de cette façon. Imaginez une sphère commençant comme un seul sujet ; à mesure que d’autres sujets sont ajoutés, la sphère s’agrandit, mais elle a une taille limitée après un certain temps. Pourtant, d’autres sujets peuvent être ajoutés à l’intérieur de la sphère à mesure qu’elle grandit et, au fil du temps, même après avoir atteint sa taille maximale. Pensez-y comme à un feu d’artifice dans le ciel, avec des explosions rapides représentant des sujets de différentes similarités sémantiques ajoutés au fil du temps. Cette analogie m’aide à mieux comprendre le concept. Je suis particulièrement intéressé par ces explosions rapides et celles qui persistent et scintillent pendant une longue période. Si l’on pouvait également avoir une représentation visuelle de cela, il serait agréable de choisir des centres sémantiques et de personnaliser un paragraphe à ce sujet.
Ce sujet, lorsque vous utilisez Afficher le message complet, montre une véritable image de sujets sémantiquement liés.
EDIT
Voici une visualisation qui se rapproche de ce que je pense.
Je dois être honnête et noter que c’est la première fois que j’entends parler de « l’algorithme », mais oui, cela correspond tout à fait à ce que je pense. Je devrai y regarder de plus près, mais je ne m’attends pas à être en désaccord avec ce que vous notez.
L’algorithme de Twitter fait référence à l’ensemble complexe de règles et de processus mathématiques que la plateforme de médias sociaux utilise pour déterminer quel contenu est montré aux utilisateurs dans leurs chronologies et leurs flux. Cet algorithme est conçu pour organiser et personnaliser le contenu que les utilisateurs voient en fonction de leurs intérêts, de leur historique d’engagement et d’autres facteurs. L’algorithme de Twitter a évolué au fil des ans, mais il vise généralement à montrer aux utilisateurs les tweets les plus pertinents et les plus engageants tout en favorisant l’engagement et la rétention des utilisateurs sur la plateforme.
Les principaux éléments et facteurs qui peuvent influencer l’algorithme de Twitter comprennent :
Pertinence : L’algorithme prend en compte la pertinence d’un tweet par rapport aux intérêts et préférences d’un utilisateur. Il prend en compte les comptes que l’utilisateur suit, le contenu avec lequel il interagit (likes, retweets, réponses) et les mots-clés et hashtags qu’il utilise dans ses tweets.
Engagement : Les tweets qui reçoivent plus de likes, de retweets, de réponses et de partages sont plus susceptibles d’être promus par l’algorithme. Un engagement plus élevé indique qu’un tweet résonne auprès des utilisateurs et est considéré comme plus précieux.
Récence : Twitter privilégie souvent les tweets récents pour tenir les utilisateurs informés des dernières informations et tendances. Cependant, il peut également montrer des tweets plus anciens qui sont toujours pertinents et engageants.
Personnalisation : L’algorithme crée une expérience personnalisée pour chaque utilisateur en adaptant son flux à ses intérêts et comportements spécifiques. Il s’adapte au fil du temps à mesure que les utilisateurs interagissent avec la plateforme.
Nombre d’abonnés : Le nombre d’abonnés d’un compte peut également influencer la visibilité de ses tweets. Les comptes ayant plus d’abonnés sont généralement plus susceptibles de voir leurs tweets diffusés à un public plus large.
Type de média : Les tweets contenant des images, des vidéos ou d’autres médias ont tendance à recevoir un engagement plus élevé et peuvent être promus par l’algorithme.
Qualité et sécurité : L’algorithme de Twitter vise également à promouvoir un contenu de haute qualité et sûr tout en réduisant la visibilité du spam, des fausses nouvelles et du contenu préjudiciable.
Il est important de noter que Twitter met à jour et affine périodiquement son algorithme pour améliorer l’expérience utilisateur et répondre aux préoccupations concernant la propagation de la désinformation et du contenu préjudiciable. Les utilisateurs peuvent également avoir un certain contrôle sur leur chronologie en ajustant leurs paramètres, en masquant des comptes ou en utilisant des fonctionnalités de Twitter comme les Listes et l’option « Afficher d’abord les meilleurs Tweets » pour personnaliser davantage leur flux.
J’adore absolument ça. Cela ressemble à une version de Watching sans alertes, ce qui est exactement le genre de chose que nous recherchons. Ce qui m’impressionne vraiment, c’est le peu d’effort cognitif que je ressens en lisant ce format ! J’ai vraiment hâte d’en lire d’autres !
Ai-je raison de penser que cela n’a été essayé que sur Meta jusqu’à présent ? Je suis extrêmement curieux de savoir comment cela gérerait un forum technique avec des informations potentiellement plus obscures.
Je l’ai essayé sur un forum très technique également et cela a bien fonctionné, il est prêt à être utilisé, j’ajouterai une documentation appropriée la semaine prochaine.