Публичный дамп данных Discourse

Discourse · 12.Май.2023 05:22:23

Учитывая появление ИИ и необходимость в больших наборах данных для локальных машин разработки, мы подготовили быстрый шаблон для получения «рабочей» копии всех публичных (доступных анонимно) данных с форума Discourse.

Актуальную документацию можно найти по адресам:

github.com/SamSaffron/discourse_public_import

README.md

main

### Public Data Dump for you forum

This repo attempts to establish a pattern for a public data dump. It includes 2 data explorer queries you can use to export all your public data.

Public data is defined as forum topics and posts that anonymous users can access.

### How to use this?

First you need to define 2 queries using data explorer:

1. Topic query: [here](topic_query.sql)
2. Post query: [here](post_query.sql)

Once defined note the data explorer query ids as specified in the URL

Next, define an API key with rights to run the 2 queries.

### config.json

Create a [config.json](config.json.sample) specifying the domain of your discourse site, api key and data explorer query ids.

This file has been truncated. show original

Почему это важно?

Вам нужна локальная база данных с БОЛЬШИМ количеством тем
Вы не хотите хранить НИКАКИХ персональных данных на своей системе

Это решение всё ещё находится в очень черновом виде, но оно работоспособно для первоначальных экспериментов и позволяет создать локальную среду с большим количеством пользователей.

Этот документ находится под версионным контролем — предлагайте изменения на GitHub.

bigkid · 13.Май.2025 08:06:23

Привет, спасибо за эту работу! Я довольно новичок в API Discourse, но хотел бы попробовать. Из файла README видно, что topic_query и post_query — это ключевые файлы в этом репозитории. Подскажите, можно ли настроить эти файлы, чтобы адаптировать их под нужный нам дамп? Например, мы хотим выгрузить только темы из определённой категории или с определёнными тегами. Спасибо.

Тема		Ответов	Просм.
Archiving the public data of a forum Support	3	1902	17.03.2019
Exploring your Discourse Data with Discourse MCP Announcements data-explorer , ai , sql-query	0	319	06.02.2026
How to get all the deleted posts for a specific topic Development rest-api	1	1046	13.05.2020
Public data dumps Feature	7	2163	31.03.2023
How do I extract raw data from my discourse community site? Support	5	2053	09.03.2022

Публичный дамп данных Discourse

Почему это важно?

Связанные темы