Dump di dati pubblici di Discourse

Dato l’avvento dell’IA e la necessità di grandi set di dati sulle macchine di sviluppo locali, abbiamo messo insieme uno schema rapido per ottenere una copia “funzionante” di tutti i dati pubblici (visibili dagli anonimi) da un forum Discourse.

Mantenere la documentazione aggiornata su:

Perché ti interessa?

  • Vuoi un database locale con MOLTI argomenti
  • Non vuoi NESSUN dato personale sul tuo sistema

Questo è ancora in una forma molto grezza, ma è utilizzabile per esperimenti iniziali e ti fornisce una configurazione locale molto popolosa.


Questo documento è sotto controllo di versione - suggerisci modifiche su github.

21 Mi Piace

ciao, grazie per questo lavoro, sono abbastanza nuovo all’API di discourse. ma vorrei provarci. dalla lettura del file read me, sembra che topic_query e post_query siano i documenti chiave in questo repository. sai se possiamo personalizzare quei file per adattarli al nostro dump desiderato? ad esempio, vogliamo solo dumpare argomenti da una categoria o tag specifici. grazie