Mi chiedo se, con i recenti progressi nei LLM, sarebbe possibile esaminare i post di un utente e la sua cronologia di lettura per fornire un feed Consigliato?
Questa sarebbe un’ottima funzionalità per il nostro caso d’uso incentrato su Domande e Risposte. Abbiamo molte categorie distinte, utenti (colleghi) molto attivi e molte informazioni estremamente utili che semplicemente non vedranno. Un buon elenco Consigliato aiuterebbe alcuni dei nostri utenti ad essere un passo avanti rispetto ai problemi che stanno cercando di risolvere.
Suppongo che il nostro ideale sarebbe un elenco composto da bug comuni, significativi e caldi di cui le persone parlano, relativi agli strumenti e alle conversazioni a cui l’utente sta già dimostrando interesse.
Ti dispiace condividere un link al sito se è pubblico.
Come utente che ha utilizzato le funzionalità di Discourse AI, molte prima che diventassero pubbliche, sono ansioso di saperne di più sul tuo sito. Comprendere i dettagli specifici che hai notato mi consentirà di fornire raccomandazioni più informate per Discourse AI, tenendo conto degli aspetti unici della tua piattaforma.
Mi piacerebbe ma purtroppo è una grande istanza aziendale interna
Posso forse darti un’idea di cosa stiamo facendo.
Contesto
Essenzialmente è come uno Stackoverflow interno dove condividiamo problemi specifici dell’azienda e del settore come “come diavolo configuro il proxy per questo?” o “non trovo risultati per Bug123 su Google, qualcun altro l’ha risolto?”.
Le nostre categorie sono specifiche per strumento, come:
Kubernetes
Gitlab
Cose difettose di IBM con la peggiore interfaccia utente che tu abbia mai visto
Come potrebbe essere utile un elenco di raccomandazioni?
Attualmente, se leggo/rispondo a un argomento nella categoria Gitlab che parla dell’integrazione con altri strumenti, come Kubernetes, non ricevo notifiche su argomenti correlati. Quindi, se c’è un post molto utile nella categoria Kubernetes, potrei non vederlo fino a molto tardi. Devo trovarlo da solo o sottoscrivere le giuste notifiche.
La maggior parte dei nostri utenti non avrà buone impostazioni di notifica:
Sono sotto pressione per ottenere risultati
Non passano abbastanza tempo sulla piattaforma per ottenere il massimo dalle loro impostazioni di notifica.
Un elenco di raccomandazioni fornirebbe informazioni potenzialmente utili, su richiesta, con un singolo clic. Essenzialmente, “sulla base dei tuoi recenti interessi, ecco alcuni argomenti che potrebbero esserti utili”. Potrebbe essere costruito dalla cronologia di ricerca dell’utente, dagli argomenti più popolari, dalle parole chiave comuni negli argomenti a cui partecipa, ecc. Quindi, se non visitano mai la categoria Buggy IBM, nulla da quella categoria verrà consigliato, a meno che non tocchi qualcosa in cui hanno già un forte interesse, ad esempio, Gitlab.
Fornisco un riassunto AI “daily buzz” in cima a questo sito che viene aggiornato ogni 12 ore e attinge a 2 giorni di post.
La soluzione è proprietaria e non è in un plugin pubblico, tuttavia, dimostra il concetto.
E sì, è incline agli errori!
Avevo intenzione di farlo collegare i contenuti… AGGIORNAMENTO: fatto, bastava GPT 4 Turbo e un po’ di prompt engineering. GPT 3.5 non può gestire quel livello di direttive.
Grazie, non l’avevo visto. Potrebbe rivelarsi fruttuoso se le cose cambiassero per noi, ma sfortunatamente non sembra soddisfare le nostre attuali restrizioni (che ho dimenticato di menzionare in precedenza ).
Restrizioni
Non posso usare la chat
Non posso usare i PM
Non posso fare affidamento sull’IA per generare risposte e fornirle silenziosamente ai nostri sviluppatori – creiamo software critico per la sicurezza
Queste restrizioni sono essenzialmente il motivo per cui un elenco di argomenti consigliati sarebbe una buona soluzione per noi: nessun contenuto viene generato, la chat non viene utilizzata, i PM non vengono utilizzati.
Questo sarebbe un modo interessante per fornire un riassunto giornaliero. Come dici tu, gli hyperlink sarebbero sicuramente una grande funzionalità. Stai pensando di personalizzarlo per il set di interessi distinti dell’utente? Cosa ha reso questo approccio interessante invece di fare affidamento sul digest giornaliero esistente?
Sospetto che questa sia la parte veramente impegnativa di questa richiesta, ma anche dove risiede una tonnellata di valore.
La maggior parte delle piattaforme di hosting di contenuti ha una qualche forma di sistema di raccomandazione personalizzato, sarei sorpreso se Discourse non si dirigesse anche in quella direzione ad un certo punto. È discutibilmente più realizzabile rispetto a piattaforme come Spotify/Youtube poiché tutto è basato sul testo, rimuovendo un livello di errore tra la traduzione di immagini/suoni in oggetti/testo/concetti.
Pensa fuori dagli schemi con la richiesta nel primo post. Sebbene tu abbia molti vincoli validi che devono essere soddisfatti, ciò non significa che non ci siano anche soluzioni potenzialmente migliori.
Nota a margine su Argomenti Correlati, che onestamente posso dire di aver visto qualche migliaio negli ultimi giorni e ho notato questo
Qualcosa da tenere d’occhio.
Rivedendo molti post in Argomenti Correlati per un sito in inglese (OpenAI), sto iniziando a notare che gli argomenti in spagnolo tendono ad essere raggruppati insieme e sospetto che se fossero prima tradotti in inglese ogni post avrebbe un vettore diverso e quindi sarebbe raggruppato con altri post.
List key stats like top users and counts of posts / topics
List 10 or so interesting new topics with a brief summary of activity that happened during the day
List 10 or so interesting older topics that got significant activity during the day
List a summary of activity by the @team group linking to topics they made inline.
Sourcing: ALWAYS Back statements with links to forum discussions.
Markdown Usage: Enhance readability with bold, italic, and > quotes and links.
Linking: Use https://meta.discourse.org/t/-/TOPIC_ID/POST_NUMBER for direct references.
User Mentions: Reference users with @USERNAME
Add many topic links: strive to link to at least 30 topics in the report. Topic Id is meaningless to end users if you need to throw in a link use ref or better still just embed it into the sentence
Categories and tags: use the format #TAG and #CATEGORY to denote tags and categories
Bug topics are super important to me, make sure to prioritize them and also feel free to try to highlight any miscategorized bugs if you find any. DO NOT mention if stuff is correctly categorized.
When providing a topic summary, do so in paragraph form eg:
Experimental Admin Sidebar Navigation - @martin introduced an experimental admin sidebar navigation, sparking discussions about its design and functionality. Users like @packman and @Don provided feedback on missing entries and mobile display issues, which @martin acknowledged and is considering for future updates. Read more.
Recommended Topics List - @Tris20 suggested adding a list of recommended topics to the top menu, leveraging advancements in LLMs to tailor content to users’ interests. The conversation evolved with contributions from @EricGT, @merefield, and others, discussing the potential and challenges of personalized content recommendations. Read more.
Ten Years of Discourse - Users like @Judy_Hawkins and @Quercus shared their gratitude for various Discourse communities that have impacted their lives, celebrating the platform’s ten-year anniversary. Read more.
Locations Plugin - @Don reported an issue with the Locations plugin, which @merefield promptly responded to, indicating a willingness to investigate the problem. Read more.
Restricting Users from Editing Navigation Bar - @Yola sought help to restrict users from editing the navigation bar, and @JammyDodger clarified that the feature is designed for individual customization. @pfaffman and @LOCOSP provided CSS solutions to hide the edit button. Read more.
Upload File Bugs - @Vladimir_P encountered bugs when uploading files, which @JammyDodger and @blake addressed, leading to a fix being implemented. Read more.
Creating and Installing Plugins - @Gaurav_Kumar_Sandan inquired about creating and installing plugins on the home page, with @JammyDodger and @pfaffman providing guidance on theme components and plugin installation. Read more.
DiscoTOC - Automatic Table of Contents - Users like @digitaldominica and @Arkshine discussed issues with the DiscoTOC component, which were resolved following updates to Discourse. Read more.
Custom User Setting in a Plugin - @pirhoo sought advice on creating custom user fields from a plugin, with @merefield providing resources to assist in the process. Read more.
Billing Details Location - @Teresations needed help locating billing details for their Discourse hosted with Communiteq, which @awesomerobot and @RGJ assisted with, pointing to the control panel. Read more.
Interesting Older Topics with Significant Activity
Emoji Line-Height Adjustment Feedback - @sam and @tynaut discussed the impact of emoji line-height adjustments on user status styling, with @tynaut confirming a fix for chat and looking into a solution for posts/messages. Read more.
Using FILTER to Summarize Data - @JammyDodger shared a SQL query using the FILTER function to segment user data based on activity summary preferences, providing a detailed explanation of the query’s components. Read more.
Communication Style as Part of a User’s Profile - @Saif and @simon discussed the potential and concerns of implementing sentiment analysis on user profiles to assess communication style. Read more.
Enter to Newline, Shift+Enter to Submit Message in Chat - @meglio proposed a configuration change for chat input behavior, supported by users like @Jagster and @Moin, to make multi-paragraph messaging more user-friendly. Read more.
Can’t Approve a User’s First Post if It Has a Poll - @Firepup650 reported an issue where a user’s first post containing a poll could not be approved due to a permissions error. Read more.
Error Message When Uploading Logo - @spicerunner reported an error message when uploading a logo, which was resolved after an update. This topic was correctly categorized as a Bug. Read more.
Outbound Notification E-mails Failing - @managenet faced issues with outbound notification emails after attempting to change the attachment size limit. Read more.
Can’t Rebuild App Stuck Extracting One Layer - @LOCOSP encountered a problem with a Docker layer extraction during a rebuild, seeking advice on how to force a re-pull of the files. Read more.
Does Discourse Launcher / Docker Use the Local Postgresql and Redis Servers? - @dalu74 inquired about whether Discourse uses the host’s Postgresql and Redis installations, which was clarified by @hello-smile6. Read more.
Specifically you could unleash some of these automation reports to try to surface interesting content.
The fact you control the context size, amount of days the report spans and more lets you have extreme control here.
Warning though, this needs GPT-4 turbo to work well, Anthropic Claude is a large context window llm but the results it has produced failed to impress me.
Potresti già saperlo, ma lo dico anche per gli altri poiché potrebbe non essere così ovvio.
Se hai accesso al bot Discourse AI che si trova nell’angolo in alto a destra
quindi, utilizzando la persona Forum Helper, puoi anche provare diverse istruzioni che potrebbero essere utilizzate con le istruzioni personalizzate del Report periodico tramite AI. In altre parole, puoi usare Forum Helper per prototipare rapidamente il report.
Come uno che ha avuto il privilegio di assistere con il feedback durante lo sviluppo, posso dirti che le istruzioni personalizzate sono importanti per ottenere i risultati desiderati. Nell’esempio fornito sopra, posso vedere chiaramente che Sam ha aggiunto questo per la tua variazione di un report basato sulla tua richiesta iniziale
Mi piace molto l’aspetto di questo, anche se non sono sicuro di seguirne appieno la funzionalità. Sembra che questo produca qualcosa di simile al Digest. Mi piace molto questo nuovo formato per quelle informazioni.
Ciò che non ho potuto vedere dalla risposta è se questo possa fornire un riepilogo personalizzato. Mi è sfuggito qualcosa? È possibile generarlo per utente, in base agli interessi individuali dell’utente?
Per rendere questi pensieri più concreti, ecco approssimativamente cosa avevo in mente:
Identificare i principali interessi dell’utente: (Esegui una volta) Scansiona tutti gli argomenti e le risposte con cui l’utente ha interagito (mi piace, rispondi, crea) per parole chiave
Identificare i recenti interessi dell’utente: Scansiona gli argomenti e le risposte che l’utente ha letto questo mese per parole chiave
Identificare i concetti chiave degli argomenti recenti: scansiona tutti i nuovi argomenti questa settimana
La parte che le persone amano di più, guidata dall’LLM, è il semplice riassunto di 1 paragrafo delle modifiche in un argomento dalla data X alla Y.
Invece di far leggere all’LLM l’intero corpus e creare un report come questo, potremmo semplicemente mantenere una “cache di frammenti” in cui, ad esempio, memorizziamo paragrafi per argomento:
ID argomento
Intervallo di date per il riassunto
Riassunto molto breve
2343
12-1 → 12-9
…
Con ciò possiamo costruire riassunti personalizzati per utente. Quindi, stiamo essenzialmente dividendo questo in più problemi:
Identificare argomenti interessanti → programmazione tradizionale (tag/categorie monitorati o forse monitoraggio “in background” basato sull’attività - escludi già letti)
Riassumere argomenti → funzionalità basata su LLM
Questo presenta molteplici vantaggi. Scala molto bene, i riassunti possono essere molto più accurati perché la quantità di contesto è molto più limitata e c’è meno rischio di “context bleed” e allucinazioni.
Ho riflettuto su una variazione di questa idea. Invece di pensare ad argomenti correlati per tag o categorie, considerali in base alla loro somiglianza semantica. Sebbene non tutti gli argomenti semanticamente correlati formeranno una sfera ordinata, è utile pensarci in questo modo. Immagina una sfera che inizia come un singolo argomento; man mano che vengono aggiunti altri argomenti, la sfera si espande, ma ha una dimensione limitata dopo un po’. Tuttavia, è possibile aggiungere altri argomenti all’interno della sfera man mano che cresce e nel tempo, anche dopo aver raggiunto la sua dimensione massima. Pensa a questo come a uno spettacolo pirotecnico nel cielo, con rapide esplosioni che rappresentano argomenti con diverse somiglianze semantiche aggiunte nel tempo. Questa analogia mi aiuta a capire meglio il concetto. Sono particolarmente interessato a quelle rapide esplosioni e a quelle che persistono e scintillano per un lungo periodo. Se si avesse anche una rappresentazione visiva di ciò, sarebbe bello scegliere centri semantici e adattare un paragrafo su di essi.
Questo argomento, quando si utilizza Mostra post completo, mostra un’immagine reale di argomenti semanticamente correlati.
MODIFICA
Ecco una visualizzazione più vicina a ciò che sto pensando.
Devo essere onesto e notare che è la prima volta che sento parlare di “l’algoritmo”, ma sì, si allinea abbastanza con quello che sto pensando. Dovrò approfondire, ma non mi aspetto di essere in disaccordo con quello che hai scritto.
L’algoritmo di Twitter si riferisce al complesso insieme di regole matematiche e processi che la piattaforma di social media utilizza per determinare quali contenuti vengono mostrati agli utenti nelle loro timeline e feed. Questo algoritmo è progettato per curare e personalizzare i contenuti che gli utenti vedono in base ai loro interessi, alla cronologia di interazione e ad altri fattori. L’algoritmo di Twitter si è evoluto nel corso degli anni, ma generalmente mira a mostrare agli utenti i tweet più pertinenti e coinvolgenti, promuovendo al contempo l’interazione e la fidelizzazione degli utenti sulla piattaforma.
I componenti e i fattori chiave che possono influenzare l’algoritmo di Twitter includono:
Pertinenza: l’algoritmo considera la pertinenza di un tweet rispetto agli interessi e alle preferenze di un utente. Tiene conto degli account che un utente segue, dei contenuti con cui interagisce (mi piace, retweet, risposte) e delle parole chiave e degli hashtag che utilizza nei suoi tweet.
Coinvolgimento: i tweet che ricevono più mi piace, retweet, risposte e condivisioni hanno maggiori probabilità di essere promossi dall’algoritmo. Un maggiore coinvolgimento indica che un tweet sta risuonando con gli utenti ed è considerato più prezioso.
Recenza: Twitter spesso dà priorità ai tweet recenti per mantenere gli utenti aggiornati sulle ultime informazioni e tendenze. Tuttavia, potrebbe anche mostrare tweet più vecchi che sono ancora pertinenti e coinvolgenti.
Personalizzazione: l’algoritmo crea un’esperienza personalizzata per ogni utente adattando il proprio feed ai propri interessi e comportamenti specifici. Si adatta nel tempo man mano che gli utenti interagiscono con la piattaforma.
Numero di follower: anche il numero di follower di un account può influenzare la visibilità dei suoi tweet. Gli account con più follower hanno generalmente maggiori probabilità di vedere i propri tweet mostrati a un pubblico più ampio.
Tipo di media: i tweet con immagini, video o altri media tendono a ricevere un maggiore coinvolgimento e possono essere promossi dall’algoritmo.
Qualità e sicurezza: l’algoritmo di Twitter mira anche a promuovere contenuti di alta qualità e sicuri, riducendo al contempo la visibilità di spam, fake news e contenuti dannosi.
È importante notare che Twitter aggiorna e perfeziona periodicamente il proprio algoritmo per migliorare l’esperienza utente e affrontare le preoccupazioni relative alla diffusione di disinformazione e contenuti dannosi. Gli utenti possono anche avere un certo controllo sulla propria timeline regolando le proprie impostazioni, silenziando account o utilizzando le funzionalità di Twitter come Elenchi e l’opzione “Mostra prima i migliori Tweet” per personalizzare ulteriormente il proprio feed.
Adoro assolutamente questo. Sembra una versione di Watching senza avvisi, che è esattamente il tipo di cosa che stiamo cercando. Ciò che mi colpisce davvero è il poco sforzo cognitivo che provo mentre leggo questo formato! Onestamente non vedo l’ora di leggerne altri!
Ho ragione nel pensare che finora sia stato provato solo su Meta? Sono estremamente curioso di sapere come gestirebbe un forum tecnico con informazioni potenzialmente più ostiche.
L’ho provato anche su un forum molto tecnico e ha funzionato bene, è pronto per essere utilizzato, aggiungerò una documentazione adeguata la prossima settimana