pero estamos buscando una forma de realizar algún procesamiento de lenguaje natural (NLP) sobre todas las conversaciones de nuestro sitio Discourse. Alguien de nuestro equipo preguntó si esto podría hacerse actuando a un nivel bajo, en el backend, por ejemplo, exportando la base de datos pero sin los datos de las tablas, con algo como pg_dump --schema-only. No entendí completamente lo que quiso decir mi colega, pero pensé que quizás tú sí.
Así que instalé el plugin y revisé todas las consultas realizadas en (Superseded) What cool data explorer queries have you come up with?, pero no hay nada que permita exportar las conversaciones reales. Por ejemplo, he solicitado los 100 temas más activos. Obtengo entradas de base de datos con identificadores de tema (véase la captura de pantalla), pero no las conversaciones. ¿Es esto porque el plugin solo sirve para extraer datos de la base de datos y no obtiene las conversaciones en sí? Si es correcto, ¿existe una manera de usar la información extraída de la base de datos para obtener las conversaciones en archivos JSON, cuyos identificadores de tema sean los extraídos de la base de datos por el plugin?
No entendí tu primera opción; ¿quizás haya un error tipográfico en tu texto? ¿Quisiste decir que solo obtengo el primer mensaje del tema?
En cuanto a la segunda opción con la extensión .json, ¿existe una URL alternativa que utilice el topic_id o cualquier otro identificador que permita obtener la conversación en formato JSON de manera más programática sin necesidad de conocer el título del tema?
la consulta estaba bien, simplemente malinterpreté tu explicación sobre lo que realmente ofrece. Gracias por verificarlo de nuevo. Estas son excelentes soluciones.