Dado o advento da IA e a necessidade de grandes conjuntos de dados em máquinas de desenvolvimento locais, reunimos um padrão rápido para obter uma cópia “utilizável” de todos os dados públicos (visíveis por anônimos) de um fórum Discourse.
Mantendo a documentação atualizada em:
Por que você se importa?
Você quer um banco de dados local com MUITOS tópicos
Você não quer NENHUM dado pessoal no seu sistema
Isto ainda está em uma forma muito bruta, mas é utilizável para experimentos iniciais e lhe dá uma configuração local muito populosa.
Este documento tem controle de versão - sugira alterações no github.
Olá, obrigado por este trabalho, sou bem novo na API do Discourse. Mas gostaria de tentar. Pelo arquivo README, parece que o topic_query e o post_query são os principais documentos neste repositório. Você sabe se podemos personalizar esses arquivos para adaptá-los ao nosso dump desejado? Por exemplo, queremos apenas extrair tópicos de uma categoria ou tags específicas. Obrigado