Dump de Dados Públicos do Discourse

Dado o advento da IA e a necessidade de grandes conjuntos de dados em máquinas de desenvolvimento locais, reunimos um padrão rápido para obter uma cópia “funcional” de todos os dados públicos (visíveis por anon) de um fórum Discourse.

Mantendo a documentação atualizada em:

Por que você se importa?

  • Você quer um banco de dados local com MUITOS tópicos
  • Você não quer NENHUM dado pessoal em seu sistema

Isso ainda está em uma forma muito bruta, mas é funcional para experimentos iniciais e oferece uma configuração local muito populosa.


Este documento está sob controle de versão - sugira alterações no github.

21 curtidas

Olá, obrigado por este trabalho, sou bem novo na API do Discourse. Mas gostaria de tentar. Pelo arquivo README, parece que o topic_query e o post_query são os principais documentos neste repositório. Você sabe se podemos personalizar esses arquivos para adaptá-los ao nosso dump desejado? Por exemplo, queremos apenas extrair tópicos de uma categoria ou tags específicas. Obrigado