Scarico pubblico dei dati di Discourse

Discourse · 12 Maggio 2023, 5:22am

Dato l’avvento dell’IA e la necessità di grandi set di dati sulle macchine di sviluppo locali, abbiamo messo insieme un rapido schema per ottenere una copia “utilizzabile” di tutti i dati pubblici (visibili dall’anonimo) da un forum Discourse.

La documentazione aggiornata è disponibile qui:

github.com/SamSaffron/discourse_public_import

README.md

main

### Public Data Dump for you forum

This repo attempts to establish a pattern for a public data dump. It includes 2 data explorer queries you can use to export all your public data.

Public data is defined as forum topics and posts that anonymous users can access.

### How to use this?

First you need to define 2 queries using data explorer:

1. Topic query: [here](topic_query.sql)
2. Post query: [here](post_query.sql)

Once defined note the data explorer query ids as specified in the URL

Next, define an API key with rights to run the 2 queries.

### config.json

Create a [config.json](config.json.sample) specifying the domain of your discourse site, api key and data explorer query ids.

This file has been truncated. show original

Perché ti interessa?

Vuoi un database locale con MOLTI argomenti
Non vuoi NESSUN dato personale sul tuo sistema

Questo è ancora in una forma molto grezza, ma è utilizzabile per esperimenti iniziali e ti fornisce una configurazione locale molto popolosa.

Questo documento è controllato in versione - suggerisci modifiche su github.

bigkid · 13 Maggio 2025, 8:06am

ciao, grazie per questo lavoro, sono abbastanza nuovo all’API di discourse. ma vorrei provarci. dalla lettura del file read me, sembra che topic_query e post_query siano i documenti chiave in questo repository. sai se possiamo personalizzare quei file per adattarli al nostro dump desiderato? ad esempio, vogliamo solo dumpare argomenti da una categoria o tag specifici. grazie

Argomento		Risposte	Visualizzazioni
Archiving the public data of a forum Support	3	1903	Marzo 17, 2019
Exploring your Discourse Data with Discourse MCP Announcements data-explorer , ai , sql-query	0	319	Febbraio 6, 2026
How to get all the deleted posts for a specific topic Development rest-api	1	1049	Maggio 13, 2020
Public data dumps Feature	7	2163	Marzo 31, 2023
How do I extract raw data from my discourse community site? Support	5	2054	Marzo 9, 2022

Scarico pubblico dei dati di Discourse

Perché ti interessa?

Argomenti correlati