Scarico pubblico dei dati di Discourse

Dato l’avvento dell’IA e la necessità di grandi set di dati sulle macchine di sviluppo locali, abbiamo messo insieme un rapido schema per ottenere una copia “utilizzabile” di tutti i dati pubblici (visibili dall’anonimo) da un forum Discourse.

La documentazione aggiornata è disponibile qui:

Perché ti interessa?

  • Vuoi un database locale con MOLTI argomenti
  • Non vuoi NESSUN dato personale sul tuo sistema

Questo è ancora in una forma molto grezza, ma è utilizzabile per esperimenti iniziali e ti fornisce una configurazione locale molto popolosa.


Questo documento è controllato in versione - suggerisci modifiche su github.

21 Mi Piace

ciao, grazie per questo lavoro, sono abbastanza nuovo all’API di discourse. ma vorrei provarci. dalla lettura del file read me, sembra che topic_query e post_query siano i documenti chiave in questo repository. sai se possiamo personalizzare quei file per adattarli al nostro dump desiderato? ad esempio, vogliamo solo dumpare argomenti da una categoria o tag specifici. grazie