Привет, друзья. Я рассматриваю варианты архивирования контента на сайте Discourse. Нашёл тему о создании и обслуживании WARC-файлов, что даёт мне некоторую основу для работы, но мне бы очень хотелось экспортировать все темы/ветки/что там ещё в формате Markdown.
Теперь хочу узнать, как перебрать все URL-адреса тем, чтобы превратить их в адреса формата /raw/ и скачать все ветки тем в виде Markdown. Есть ли какой-то простой способ получить список всех URL-адресов тем на сайте? Нужно ли открывать консоль Rails? Существует ли какой-то один класс Ruby, который может перечислить все URL-адреса тем? Что-то в этом роде?
Получите JSON-файл категории, например https://meta.discourse.org/c/support.json (который перенаправляет на https://meta.discourse.org/c/support/6.json).
Извлеките первую порцию идентификаторов тем из массива topic_list.topics в этом JSON.
Получите значение topic_list.more_topics_url и перейдите к шагу 2.