Mi chiedo se, con i recenti progressi nei LLM, sarebbe possibile esaminare i post di un utente e la sua cronologia di lettura per fornire un feed Consigliato?
Questa sarebbe un’ottima funzionalità per il nostro caso d’uso incentrato su Domande e Risposte. Abbiamo molte categorie distinte, utenti (colleghi) molto attivi e molte informazioni estremamente utili che semplicemente non vedranno. Un buon elenco Consigliato aiuterebbe alcuni dei nostri utenti ad essere un passo avanti rispetto ai problemi che stanno cercando di risolvere.
Suppongo che il nostro ideale sarebbe un elenco composto da bug comuni, significativi e caldi di cui le persone parlano, relativi agli strumenti e alle conversazioni a cui l’utente sta già dimostrando interesse.
Ti dispiace condividere un link al sito se è pubblico.
Come utente che ha utilizzato le funzionalità di Discourse AI, molte prima che diventassero pubbliche, sono ansioso di saperne di più sul tuo sito. Comprendere i dettagli specifici che hai notato mi consentirà di fornire raccomandazioni più informate per Discourse AI, tenendo conto degli aspetti unici della tua piattaforma.
Mi piacerebbe ma purtroppo è una grande istanza aziendale interna
Posso forse darti un’idea di cosa stiamo facendo.
Contesto
Essenzialmente è come uno Stackoverflow interno dove condividiamo problemi specifici dell’azienda e del settore come “come diavolo configuro il proxy per questo?” o “non trovo risultati per Bug123 su Google, qualcun altro l’ha risolto?”.
Le nostre categorie sono specifiche per strumento, come:
Kubernetes
Gitlab
Cose difettose di IBM con la peggiore interfaccia utente che tu abbia mai visto
Come potrebbe essere utile un elenco di raccomandazioni?
Attualmente, se leggo/rispondo a un argomento nella categoria Gitlab che parla dell’integrazione con altri strumenti, come Kubernetes, non ricevo notifiche su argomenti correlati. Quindi, se c’è un post molto utile nella categoria Kubernetes, potrei non vederlo fino a molto tardi. Devo trovarlo da solo o sottoscrivere le giuste notifiche.
La maggior parte dei nostri utenti non avrà buone impostazioni di notifica:
Sono sotto pressione per ottenere risultati
Non passano abbastanza tempo sulla piattaforma per ottenere il massimo dalle loro impostazioni di notifica.
Un elenco di raccomandazioni fornirebbe informazioni potenzialmente utili, su richiesta, con un singolo clic. Essenzialmente, “sulla base dei tuoi recenti interessi, ecco alcuni argomenti che potrebbero esserti utili”. Potrebbe essere costruito dalla cronologia di ricerca dell’utente, dagli argomenti più popolari, dalle parole chiave comuni negli argomenti a cui partecipa, ecc. Quindi, se non visitano mai la categoria Buggy IBM, nulla da quella categoria verrà consigliato, a meno che non tocchi qualcosa in cui hanno già un forte interesse, ad esempio, Gitlab.
Fornisco un riassunto AI “daily buzz” in cima a questo sito che viene aggiornato ogni 12 ore e attinge a 2 giorni di post.
La soluzione è proprietaria e non è in un plugin pubblico, tuttavia, dimostra il concetto.
E sì, è incline agli errori!
Avevo intenzione di farlo collegare i contenuti… AGGIORNAMENTO: fatto, bastava GPT 4 Turbo e un po’ di prompt engineering. GPT 3.5 non può gestire quel livello di direttive.
Grazie, non l’avevo visto. Potrebbe rivelarsi fruttuoso se le cose cambiassero per noi, ma sfortunatamente non sembra soddisfare le nostre attuali restrizioni (che ho dimenticato di menzionare in precedenza ).
Restrizioni
Non posso usare la chat
Non posso usare i PM
Non posso fare affidamento sull’IA per generare risposte e fornirle silenziosamente ai nostri sviluppatori – creiamo software critico per la sicurezza
Queste restrizioni sono essenzialmente il motivo per cui un elenco di argomenti consigliati sarebbe una buona soluzione per noi: nessun contenuto viene generato, la chat non viene utilizzata, i PM non vengono utilizzati.
Questo sarebbe un modo interessante per fornire un riassunto giornaliero. Come dici tu, gli hyperlink sarebbero sicuramente una grande funzionalità. Stai pensando di personalizzarlo per il set di interessi distinti dell’utente? Cosa ha reso questo approccio interessante invece di fare affidamento sul digest giornaliero esistente?
Sospetto che questa sia la parte veramente impegnativa di questa richiesta, ma anche dove risiede una tonnellata di valore.
La maggior parte delle piattaforme di hosting di contenuti ha una qualche forma di sistema di raccomandazione personalizzato, sarei sorpreso se Discourse non si dirigesse anche in quella direzione ad un certo punto. È discutibilmente più realizzabile rispetto a piattaforme come Spotify/Youtube poiché tutto è basato sul testo, rimuovendo un livello di errore tra la traduzione di immagini/suoni in oggetti/testo/concetti.
Pensa fuori dagli schemi con la richiesta nel primo post. Sebbene tu abbia molti vincoli validi che devono essere soddisfatti, ciò non significa che non ci siano anche soluzioni potenzialmente migliori.
Nota a margine su Argomenti Correlati, che onestamente posso dire di aver visto qualche migliaio negli ultimi giorni e ho notato questo
Qualcosa da tenere d’occhio.
Rivedendo molti post in Argomenti Correlati per un sito in inglese (OpenAI), sto iniziando a notare che gli argomenti in spagnolo tendono ad essere raggruppati insieme e sospetto che se fossero prima tradotti in inglese ogni post avrebbe un vettore diverso e quindi sarebbe raggruppato con altri post.
Stiamo ancora affinando la funzione (annunceremo la prossima settimana), ma il nostro nuovo Report periodico con AI si adatta perfettamente alla tua visione:
Elenca le statistiche chiave come gli utenti principali e i conteggi di post/argomenti
Elenca circa 10 nuovi argomenti interessanti con un breve riassunto dell’attività svolta durante la giornata
Elenca circa 10 argomenti vecchi interessanti che hanno registrato un’attività significativa durante la giornata
Elenca un riepilogo dell’attività del gruppo @team con link agli argomenti da loro creati inline.
Fonti: SUPPORTA SEMPRE le affermazioni con link alle discussioni del forum.
Uso del Markdown: Migliora la leggibilità con grassetto, corsivo, > citazioni e link.
Collegamenti: Usa https://meta.discourse.org/t/-/ID_ARGOMENTO/NUMERO_POST per riferimenti diretti.
Menzioni utente: Riferisci gli utenti con @NOMEUTENTE
Aggiungi molti link agli argomenti: cerca di collegare almeno 30 argomenti nel rapporto. L’ID dell’argomento è inutile per gli utenti finali; se devi inserire un link, usa rif o, meglio ancora, incorporalo direttamente nella frase
Categorie e tag: usa il formato #TAG e #CATEGORIA per indicare tag e categorie
Gli argomenti bug sono super importanti per me: assicurati di dar loro priorità e sentiti libero di evidenziare eventuali bug classificati erroneamente se ne trovi. NON menzionare se le cose sono state classificate correttamente.
Quando fornisci un riassunto di un argomento, fallo in forma di paragrafo, ad esempio:
Navigazione sperimentale della barra laterale di amministrazione - @martin ha introdotto una navigazione sperimentale della barra laterale di amministrazione, scatenando discussioni sul suo design e funzionalità. Utenti come @packman e @Don hanno fornito feedback su voci mancanti e problemi di visualizzazione su mobile, che @martin ha riconosciuto e sta considerando per futuri aggiornamenti. Leggi di più.
Elenco argomenti consigliati - @Tris20 ha suggerito di aggiungere un elenco di argomenti consigliati al menu superiore, sfruttando i progressi negli LLM per personalizzare i contenuti in base agli interessi degli utenti. La conversazione si è evoluta con contributi da @EricGT, @merefield e altri, discutendo potenzialità e sfide delle raccomandazioni di contenuti personalizzati. Leggi di più.
Dieci anni di Discourse - Utenti come @Judy_Hawkins e @Quercus hanno espresso gratitudine per varie comunità Discourse che hanno influenzato le loro vite, celebrando il decimo anniversario della piattaforma. Leggi di più.
Plugin Locations - @Don ha segnalato un problema con il plugin Locations, a cui @merefield ha prontamente risposto, indicando la volontà di investigare il problema. Leggi di più.
Limitare gli utenti dalla modifica della barra di navigazione - @Yola ha chiesto aiuto per limitare gli utenti dalla modifica della barra di navigazione, e @JammyDodger ha chiarito che la funzione è progettata per la personalizzazione individuale. @pfaffman e @LOCOSP hanno fornito soluzioni CSS per nascondere il pulsante di modifica. Leggi di più.
Bug nel caricamento file - @Vladimir_P ha riscontrato bug durante il caricamento dei file, che @JammyDodger e @blake hanno affrontato, portando all’implementazione di una correzione. Leggi di più.
Creazione e installazione di plugin - @Gaurav_Kumar_Sandan ha chiesto informazioni su come creare e installare plugin sulla home page, con @JammyDodger e @pfaffman che hanno fornito indicazioni su componenti del tema e installazione di plugin. Leggi di più.
DiscoTOC - Indice automatico - Utenti come @digitaldominica e @Arkshine hanno discusso problemi con il componente DiscoTOC, risolti dopo aggiornamenti a Discourse. Leggi di più.
Impostazione utente personalizzata in un plugin - @pirhoo ha chiesto consigli sulla creazione di campi utente personalizzati da un plugin, con @merefield che ha fornito risorse per assistere nel processo. Leggi di più.
Posizione dettagli fatturazione - @Teresations aveva bisogno di aiuto per trovare i dettagli di fatturazione per il proprio Discourse ospitato con Communiteq, a cui @awesomerobot e @RGJ hanno assistito, indicando il pannello di controllo. Leggi di più.
Argomenti vecchi interessanti con attività significativa
Feedback sull’aggiustamento dell’altezza di riga delle emoji - @sam e @tynaut hanno discusso l’impatto degli aggiustamenti dell’altezza di riga delle emoji sullo stile dello stato utente, con @tynaut che ha confermato una correzione per la chat e sta cercando una soluzione per post/messaggi. Leggi di più.
Uso di FILTER per riassumere i dati - @JammyDodger ha condiviso una query SQL che utilizza la funzione FILTER per segmentare i dati utente in base alle preferenze di riepilogo dell’attività, fornendo una spiegazione dettagliata dei componenti della query. Leggi di più.
Stile di comunicazione come parte del profilo utente - @Saif e @simon hanno discusso potenzialità e preoccupazioni dell’implementazione dell’analisi del sentiment sui profili utente per valutare lo stile di comunicazione. Leggi di più.
Invio a nuova riga, Shift+Invio per inviare messaggio in chat - @meglio ha proposto una modifica alla configurazione del comportamento di input della chat, supportata da utenti come @Jagster e @Moin, per rendere più user-friendly la messaggistica a più paragrafi. Leggi di più.
Impossibile approvare il primo post di un utente se contiene un sondaggio - @Firepup650 ha segnalato un problema in cui il primo post di un utente contenente un sondaggio non poteva essere approvato a causa di un errore di permessi. Leggi di più.
Messaggio di errore durante il caricamento del logo - @spicerunner ha segnalato un messaggio di errore durante il caricamento di un logo, risolto dopo un aggiornamento. Questo argomento è stato correttamente classificato come bug. Leggi di più.
Fallimento delle e-mail di notifica in uscita - @managenet ha riscontrato problemi con le e-mail di notifica in uscita dopo aver tentato di modificare il limite di dimensione degli allegati. Leggi di più.
Impossibile ricostruire l’app bloccata nell’estrazione di un layer - @LOCOSP ha incontrato un problema con l’estrazione di un layer Docker durante una ricostruzione, chiedendo consigli su come forzare un nuovo download dei file. Leggi di più.
Discourse Launcher / Docker utilizza i server Postgresql e Redis locali? - @dalu74 ha chiesto se Discourse utilizza le installazioni locali di Postgresql e Redis dell’host, chiarito da @hello-smile6. Leggi di più.
In particolare, potresti attivare alcuni di questi rapporti automatizzati per cercare di evidenziare contenuti interessanti.
Il fatto che tu controlli la dimensione del contesto, il numero di giorni coperti dal rapporto e altro ancora ti permette di avere un controllo estremo in questo ambito.
Attenzione però: per funzionare bene serve GPT-4 turbo; Anthropic Claude ha una finestra di contesto ampia, ma i risultati prodotti non mi hanno impressionato.
Potresti già saperlo, ma lo dico anche per gli altri poiché potrebbe non essere così ovvio.
Se hai accesso al bot Discourse AI che si trova nell’angolo in alto a destra
quindi, utilizzando la persona Forum Helper, puoi anche provare diverse istruzioni che potrebbero essere utilizzate con le istruzioni personalizzate del Report periodico tramite AI. In altre parole, puoi usare Forum Helper per prototipare rapidamente il report.
Come uno che ha avuto il privilegio di assistere con il feedback durante lo sviluppo, posso dirti che le istruzioni personalizzate sono importanti per ottenere i risultati desiderati. Nell’esempio fornito sopra, posso vedere chiaramente che Sam ha aggiunto questo per la tua variazione di un report basato sulla tua richiesta iniziale
Mi piace molto l’aspetto di questo, anche se non sono sicuro di seguirne appieno la funzionalità. Sembra che questo produca qualcosa di simile al Digest. Mi piace molto questo nuovo formato per quelle informazioni.
Ciò che non ho potuto vedere dalla risposta è se questo possa fornire un riepilogo personalizzato. Mi è sfuggito qualcosa? È possibile generarlo per utente, in base agli interessi individuali dell’utente?
Per rendere questi pensieri più concreti, ecco approssimativamente cosa avevo in mente:
Identificare i principali interessi dell’utente: (Esegui una volta) Scansiona tutti gli argomenti e le risposte con cui l’utente ha interagito (mi piace, rispondi, crea) per parole chiave
Identificare i recenti interessi dell’utente: Scansiona gli argomenti e le risposte che l’utente ha letto questo mese per parole chiave
Identificare i concetti chiave degli argomenti recenti: scansiona tutti i nuovi argomenti questa settimana
La parte che le persone amano di più, guidata dall’LLM, è il semplice riassunto di 1 paragrafo delle modifiche in un argomento dalla data X alla Y.
Invece di far leggere all’LLM l’intero corpus e creare un report come questo, potremmo semplicemente mantenere una “cache di frammenti” in cui, ad esempio, memorizziamo paragrafi per argomento:
ID argomento
Intervallo di date per il riassunto
Riassunto molto breve
2343
12-1 → 12-9
…
Con ciò possiamo costruire riassunti personalizzati per utente. Quindi, stiamo essenzialmente dividendo questo in più problemi:
Identificare argomenti interessanti → programmazione tradizionale (tag/categorie monitorati o forse monitoraggio “in background” basato sull’attività - escludi già letti)
Riassumere argomenti → funzionalità basata su LLM
Questo presenta molteplici vantaggi. Scala molto bene, i riassunti possono essere molto più accurati perché la quantità di contesto è molto più limitata e c’è meno rischio di “context bleed” e allucinazioni.
Ho riflettuto su una variazione di questa idea. Invece di pensare ad argomenti correlati per tag o categorie, considerali in base alla loro somiglianza semantica. Sebbene non tutti gli argomenti semanticamente correlati formeranno una sfera ordinata, è utile pensarci in questo modo. Immagina una sfera che inizia come un singolo argomento; man mano che vengono aggiunti altri argomenti, la sfera si espande, ma ha una dimensione limitata dopo un po’. Tuttavia, è possibile aggiungere altri argomenti all’interno della sfera man mano che cresce e nel tempo, anche dopo aver raggiunto la sua dimensione massima. Pensa a questo come a uno spettacolo pirotecnico nel cielo, con rapide esplosioni che rappresentano argomenti con diverse somiglianze semantiche aggiunte nel tempo. Questa analogia mi aiuta a capire meglio il concetto. Sono particolarmente interessato a quelle rapide esplosioni e a quelle che persistono e scintillano per un lungo periodo. Se si avesse anche una rappresentazione visiva di ciò, sarebbe bello scegliere centri semantici e adattare un paragrafo su di essi.
Questo argomento, quando si utilizza Mostra post completo, mostra un’immagine reale di argomenti semanticamente correlati.
MODIFICA
Ecco una visualizzazione più vicina a ciò che sto pensando.
Devo essere onesto e notare che è la prima volta che sento parlare di “l’algoritmo”, ma sì, si allinea abbastanza con quello che sto pensando. Dovrò approfondire, ma non mi aspetto di essere in disaccordo con quello che hai scritto.
L’algoritmo di Twitter si riferisce al complesso insieme di regole matematiche e processi che la piattaforma di social media utilizza per determinare quali contenuti vengono mostrati agli utenti nelle loro timeline e feed. Questo algoritmo è progettato per curare e personalizzare i contenuti che gli utenti vedono in base ai loro interessi, alla cronologia di interazione e ad altri fattori. L’algoritmo di Twitter si è evoluto nel corso degli anni, ma generalmente mira a mostrare agli utenti i tweet più pertinenti e coinvolgenti, promuovendo al contempo l’interazione e la fidelizzazione degli utenti sulla piattaforma.
I componenti e i fattori chiave che possono influenzare l’algoritmo di Twitter includono:
Pertinenza: l’algoritmo considera la pertinenza di un tweet rispetto agli interessi e alle preferenze di un utente. Tiene conto degli account che un utente segue, dei contenuti con cui interagisce (mi piace, retweet, risposte) e delle parole chiave e degli hashtag che utilizza nei suoi tweet.
Coinvolgimento: i tweet che ricevono più mi piace, retweet, risposte e condivisioni hanno maggiori probabilità di essere promossi dall’algoritmo. Un maggiore coinvolgimento indica che un tweet sta risuonando con gli utenti ed è considerato più prezioso.
Recenza: Twitter spesso dà priorità ai tweet recenti per mantenere gli utenti aggiornati sulle ultime informazioni e tendenze. Tuttavia, potrebbe anche mostrare tweet più vecchi che sono ancora pertinenti e coinvolgenti.
Personalizzazione: l’algoritmo crea un’esperienza personalizzata per ogni utente adattando il proprio feed ai propri interessi e comportamenti specifici. Si adatta nel tempo man mano che gli utenti interagiscono con la piattaforma.
Numero di follower: anche il numero di follower di un account può influenzare la visibilità dei suoi tweet. Gli account con più follower hanno generalmente maggiori probabilità di vedere i propri tweet mostrati a un pubblico più ampio.
Tipo di media: i tweet con immagini, video o altri media tendono a ricevere un maggiore coinvolgimento e possono essere promossi dall’algoritmo.
Qualità e sicurezza: l’algoritmo di Twitter mira anche a promuovere contenuti di alta qualità e sicuri, riducendo al contempo la visibilità di spam, fake news e contenuti dannosi.
È importante notare che Twitter aggiorna e perfeziona periodicamente il proprio algoritmo per migliorare l’esperienza utente e affrontare le preoccupazioni relative alla diffusione di disinformazione e contenuti dannosi. Gli utenti possono anche avere un certo controllo sulla propria timeline regolando le proprie impostazioni, silenziando account o utilizzando le funzionalità di Twitter come Elenchi e l’opzione “Mostra prima i migliori Tweet” per personalizzare ulteriormente il proprio feed.
Adoro assolutamente questo. Sembra una versione di Watching senza avvisi, che è esattamente il tipo di cosa che stiamo cercando. Ciò che mi colpisce davvero è il poco sforzo cognitivo che provo mentre leggo questo formato! Onestamente non vedo l’ora di leggerne altri!
Ho ragione nel pensare che finora sia stato provato solo su Meta? Sono estremamente curioso di sapere come gestirebbe un forum tecnico con informazioni potenzialmente più ostiche.
L’ho provato anche su un forum molto tecnico e ha funzionato bene, è pronto per essere utilizzato, aggiungerò una documentazione adeguata la prossima settimana