Esiste un plugin word cloud per Discourse?
Carl
Esiste un plugin word cloud per Discourse?
Carl
Non c’è… c’è un motivo specifico per cui vorresti uno? Come verrebbe utilizzato?
Sarebbe figo in due modi. Primo, una nuvola di parole su cui potrei cliccare per visualizzare tutti gli argomenti che corrispondono a una parola come “abbonato”.
Secondo, si potrebbero mostrare altri tipi di ricerche come questa, o i postatori più attivi, o qualsiasi altra cosa si voglia.
Probabilmente potrebbe essere qualcosa che viene eseguito in un cron job una volta al giorno o più spesso.
Pensavo fosse un’idea divertente
… quindi l’ho creata*
È in una fase molto iniziale di “funzionamento base” e ha bisogno di molta rifinitura, di opzioni aggiuntive e potenzialmente di una funzionalità di clic:
Aggiunge un link nel tuo menu Hamburger. ![]()
Tieni presente che attualmente costruisce le statistiche delle parole da tutti i post, indipendentemente da tipo e posizione. Questo potrebbe effettivamente agire come una lieve violazione della privacy molto indiretta (potrebbero essere necessarie alcune ulteriori precauzioni per escludere parole dai post nelle aree private). Devi essere loggato per vederlo e accedere ai dati… e le parole vengono renderizzate come SVG… e mostra solo le prime centinaia di parole, quindi è improbabile che sia un grosso problema per la maggior parte dei siti. Ci lavorerò per renderlo più sicuro, ma in questo modo la query viene eseguita molto velocemente.
Buon divertimento. ![]()
*Si avvale di alcune librerie esistenti molto ingenue, che ho citato nel repository. Un saluto a @DiscourseMetrics la cui query ho utilizzato.
Molto figo. Penso che vorresti anche escludere alcune parole dalla nuvola di parole?
Certo, serve un bel po’ di esclusioni ragionevoli e le espressioni regolari devono essere perfezionate per eliminare la formattazione Markdown ecc., senza però renderle eccessivamente complesse. Questo è solo un inizio. Ho appena aggiunto un po’ di colore.
Solo per chiarire, è comunque fantastico lol
Aggiunta una lista localizzata di parole da ignorare:
che dovrebbe rendere i risultati un po’ più interessanti…
Ho anche aggiunto molta logica di sanificazione, quindi il risultato è molto migliore.
Bellissimo!
Mi piace questo sforzo. Ottimo lavoro. Se potessi richiedere delle funzionalità:
/wordcloud/categoryEcco come appare sul mio forum di quartiere.
Ottimo feedback, grazie, e alcune buone idee!
Sì, sembra un buon approccio. Al momento sono immerso nel lavoro con i clienti per circa 3 metri, ma esaminerò la selezione delle categorie per il prossimo aggiornamento.
La selezione della categoria è in:
Se non selezioni alcuna categoria (predefinita), viene eseguita una scansione di tutti i post del forum (inclusi i messaggi privati). Se aggiungi una sola categoria, le statistiche delle parole sono limitate a quella, e così via.

Sono stati apportati enormi miglioramenti alle espressioni regolari (
), che ora puliscono correttamente i “raw” ed eliminano la maggior parte, se non tutti, i marcatori Markdown.
NB: Le statistiche delle parole vengono aggiornate ogni ora (cosa che probabilmente è ancora eccessiva, ma per il momento rende più semplice verificare le modifiche in produzione mentre attraversiamo una fase iniziale di evoluzione del codice).
NB2: Al momento non ho considerato altre lingue oltre all’inglese (certamente non sono state testate). L’attuale manipolazione delle parole potrebbe non funzionare bene in alcune lingue. Sono benvenute suggerimenti e PR.
Fantastico! Ecco una wordle aggiornata che include solo le categorie più rilevanti.
La mia è una community piccola e ancora piuttosto nuova. A essere onesti, però, le informazioni presentate nella wordle sono belle da vedere ma non particolarmente significative o utili. Immagino che potrebbe essere utilizzata come elemento visivo in un argomento di retrospettiva sulla community o qualcosa di simile. Sarebbe divertente vedere più esempi di come le persone la utilizzano.
Alcune delle parole incluse sono comuni e prive di significato, ad esempio youd, off, got, add ecc. Mi chiedo se l’impostazione “word cloud ignore portion” (che per me è 100, il valore predefinito) stia funzionando correttamente? O forse esiste un’altra/elenco migliore di parole da ignorare?
Sì, sono felice di valutare un elenco più ampio (avevo trovato un elenco di 200 parole qui, ma mi sono affidato a Wikipedia come fonte più ‘autorevole’).
OK, ho:
NB: se ci sono ancora parole che desideri escludere, aggiungile all’inizio di:
come ho fatto qui (ad esempio: ‘ive’, ‘its’, ‘topic’, ‘post’)
Per vedere più rapidamente l’impatto di eventuali modifiche, riavvia semplicemente il lavoro da Sidekiq:
Per il momento è tutto. Suggerisco di creare un argomento dedicato.
OK, potrebbe piacerti questo:
Aggiornamento: Ho semplificato la configurazione dell’elenco di esclusione, quindi non è più presente un’impostazione per la ‘porzione’ dell’elenco di esclusione utilizzata; devi semplicemente eliminare o aggiungere parole all’elenco di esclusione utilizzando l’impostazione localizzata nativa:
https://github.com/merefield/discourse-word-cloud/commit/074e0902269e752c11c3c29018f8c68c813327d3
Dobbiamo disinstallare la versione precedente per ottenere questa?
Dovresti aver bisogno solo di aggiornare il plugin. Hai problemi?
Scusate, l’abbiamo risolto. ![]()
Nessun problema ![]()