Public data dumps

I’d like to propose a public data export feature similar to Stack Exchange’s. This is not the same as the backup feature, because it requires sanitizing all private user data first. Both JSON and HTML export formats would be great.

This is useful for:

  • CC-licensed content to be made available more easily
  • users to feel more comfortable knowing that the site can’t suddenly disappear with all their content
  • data analysis, etc.

Let me know what you think.

5 Mi Piace

Sounds like a great idea, would you like to work on something like this?

1 Mi Piace

I would rather see the individual download button on the user page working first.

2 Mi Piace

Maybe these are related. E.g. the functionality provides filtering options during the export process. Export content from these users, these topics, these keywords etc.

1 Mi Piace

This would be great!

Did this feature ever get built? What’s the best way to provide public exports of a site?

Ora che ChatGPT ha portato il mondo dei bot e dell’IA al centro della scena, si inizia a parlare di utilizzare i dati di un forum Discourse come dati di addestramento. Pertanto, questo argomento sembrava una delle due possibilità, l’altra essendo la API REST di Discourse.

So che gli amministratori hanno la possibilità di ottenere un backup e quindi ripulire i dati, preferirei uno standard noto.

Possiamo avere uno stato attuale su questo, anche se fosse solo, nessun cambiamento dall’ultima volta. :slightly_smiling_face:

2 Mi Piace

Questo è ora nella nostra roadmap per il team AI. :smiley:

3 Mi Piace

Sono lieto di vedere che Discourse sta andando nella giusta direzione, così triste per il piccolo uccellino.

1 Mi Piace