Despejo de Dados Públicos do Discourse

Discourse · Maio 12, 2023, 5:22am

Dado o advento da IA e a necessidade de grandes conjuntos de dados em máquinas de desenvolvimento locais, reunimos um padrão rápido para obter uma cópia “utilizável” de todos os dados públicos (visíveis por anônimos) de um fórum Discourse.

Mantendo a documentação atualizada em:

github.com/SamSaffron/discourse_public_import

README.md

main

### Public Data Dump for you forum

This repo attempts to establish a pattern for a public data dump. It includes 2 data explorer queries you can use to export all your public data.

Public data is defined as forum topics and posts that anonymous users can access.

### How to use this?

First you need to define 2 queries using data explorer:

1. Topic query: [here](topic_query.sql)
2. Post query: [here](post_query.sql)

Once defined note the data explorer query ids as specified in the URL

Next, define an API key with rights to run the 2 queries.

### config.json

Create a [config.json](config.json.sample) specifying the domain of your discourse site, api key and data explorer query ids.

This file has been truncated. show original

Por que você se importa?

Você quer um banco de dados local com MUITOS tópicos
Você não quer NENHUM dado pessoal no seu sistema

Isto ainda está em uma forma muito bruta, mas é utilizável para experimentos iniciais e lhe dá uma configuração local muito populosa.

Este documento tem controle de versão - sugira alterações no github.

bigkid · Maio 13, 2025, 8:06am

Olá, obrigado por este trabalho, sou bem novo na API do Discourse. Mas gostaria de tentar. Pelo arquivo README, parece que o topic_query e o post_query são os principais documentos neste repositório. Você sabe se podemos personalizar esses arquivos para adaptá-los ao nosso dump desejado? Por exemplo, queremos apenas extrair tópicos de uma categoria ou tags específicas. Obrigado

Tópico		Respostas	Visualizações
Archiving the public data of a forum Support	3	1903	17 de Março de 2019
Exploring your Discourse Data with Discourse MCP Announcements data-explorer , ai , sql-query	0	319	6 de Fevereiro de 2026
How to get all the deleted posts for a specific topic Development rest-api	1	1049	13 de Maio de 2020
Public data dumps Feature	7	2163	31 de Março de 2023
How do I extract raw data from my discourse community site? Support	5	2054	9 de Março de 2022

Despejo de Dados Públicos do Discourse

Por que você se importa?

Tópicos relacionados