Vidage public des données Discourse

Étant donné l’avènement de l’IA et le besoin de grands ensembles de données sur les machines de développement locales, nous avons élaboré un modèle rapide pour obtenir une copie « utilisable » de toutes les données publiques (visibles par les utilisateurs anonymes) d’un forum Discourse.

La documentation est maintenue à jour ici :

Pourquoi cela vous concerne-t-il ?

  • Vous voulez une base de données locale avec BEAUCOUP de sujets
  • Vous ne voulez AUCUNE donnée personnelle sur votre système

Ceci est encore à un stade très préliminaire, mais c’est utilisable pour des expériences initiales et vous donne une configuration locale très peuplée.


Ce document est contrôlé par version - suggérez des modifications sur github.

21 « J'aime »

Bonjour, merci pour ce travail, je suis assez nouveau dans l’API Discourse. mais je voudrais essayer. d’après le fichier README, il semble que les fichiers topic_query et post_query soient les documents clés dans ce dépôt. Savez-vous si nous pouvons personnaliser ces fichiers pour les adapter à notre exportation souhaitée ? par exemple, nous voulons simplement exporter des sujets d’une catégorie ou de tags spécifiques. merci