но мы ищем способ провести NLP-анализ всех обсуждений на нашем сайте Discourse. Кто-то из нашей команды спросил, можно ли это сделать, работая на низком уровне в бэкенде, например, экспортировав базу данных без таблиц, используя что-то вроде pg_dump --schema-only. Я не до конца понял, что имел в виду мой коллега, но подумал, что, возможно, вы разберётесь.
Итак, я установил плагин и просмотрел все запросы по адресу (Superseded) What cool data explorer queries have you come up with?, но не нашёл ничего, что могло бы экспортировать сами разговоры. Например, я запросил топ-100 самых активных тем. Получаю записи базы данных с ID тем (см. скриншот), но не сами разговоры. Не связано ли это с тем, что плагин предназначен только для извлечения данных из базы данных и не может извлекать сами разговоры? Если это так, существует ли способ использовать информацию, извлечённую из базы данных, чтобы получить разговоры в JSON-файлах, при этом ID тем в этих файлах будут теми, что были извлечены из базы данных плагином?
Я не понял ваш первый вариант, возможно, опечатка в тексте? Вы имели в виду, что получаю только первое сообщение темы?
Что касается второго варианта с расширением .json, есть ли альтернативный URL, использующий topic_id или любой другой параметр, который позволил бы программно получать разговор в формате JSON без необходимости знать заголовок темы?