Discourse Öffentlicher Daten-Dump

Discourse · 12. Mai 2023 um 05:22

Angesichts des Aufkommens von KI und des Bedarfs an großen Datensätzen auf lokalen Entwicklungssystemen haben wir ein kurzes Muster zusammengestellt, um eine „arbeitsfähige“ Kopie aller öffentlichen (für anonyme Benutzer sichtbaren) Daten aus einem Discourse-Forum zu erhalten.

Die Dokumentation wird aktuell gehalten unter:

github.com/SamSaffron/discourse_public_import

README.md

main

### Public Data Dump for you forum

This repo attempts to establish a pattern for a public data dump. It includes 2 data explorer queries you can use to export all your public data.

Public data is defined as forum topics and posts that anonymous users can access.

### How to use this?

First you need to define 2 queries using data explorer:

1. Topic query: [here](topic_query.sql)
2. Post query: [here](post_query.sql)

Once defined note the data explorer query ids as specified in the URL

Next, define an API key with rights to run the 2 queries.

### config.json

Create a [config.json](config.json.sample) specifying the domain of your discourse site, api key and data explorer query ids.

This file has been truncated. show original

Warum ist das für Sie wichtig?

Sie möchten eine lokale Datenbank mit VIELEN Themen
Sie möchten KEINE persönlichen Daten auf Ihrem System haben

Dies befindet sich noch in einem sehr groben Zustand, ist aber für erste Experimente brauchbar und ermöglicht Ihnen eine sehr bevölkerte lokale Einrichtung.

Dieses Dokument wird versioniert – schlagen Sie Änderungen auf GitHub vor.

bigkid · 13. Mai 2025 um 08:06

Hallo, danke für diese Arbeit, ich bin ziemlich neu bei der Discourse-API. Aber ich möchte es ausprobieren. Aus der Read-me-Datei scheint es, dass die topic_query und die post_query die wichtigsten Dokumente in diesem Repo sind. Weißt du, ob wir diese Dateien anpassen können, um sie an unseren gewünschten Dump anzupassen? Zum Beispiel möchten wir nur Themen aus einer bestimmten Kategorie oder mit Tags dumpen. danke

Thema		Antworten	Aufrufe
Archiving the public data of a forum Support	3	1903	17. März 2019
Exploring your Discourse Data with Discourse MCP Announcements data-explorer , ai , sql-query	0	319	6. Februar 2026
How to get all the deleted posts for a specific topic Development rest-api	1	1049	13. Mai 2020
Public data dumps Feature	7	2163	31. März 2023
How do I extract raw data from my discourse community site? Support	5	2054	9. März 2022

Discourse Öffentlicher Daten-Dump

Warum ist das für Sie wichtig?

Verwandte Themen