Wenn ich das tun würde, würde ich:
-
Ein Backup der Seite herunterladen und in eine PostgreSQL-Datenbank laden; PostgreSQL ist die Datenbank, die Discourse unterstützt. (ref)
-
Aus den PostgreSQL-Daten eine NoSQL-Datenbank erstellen, speziell Neo4j. (ref)
-
Die Neo4j-Abfragesprache Cypher verwenden, um die Beziehungen zu finden.
Neo4j bietet eine Sandbox; das Beispiel zu den Panama Papers könnte Sie interessieren.
EDIT
Sobald die Neo4j-Datenbank eingerichtet und funktionsfähig ist, um die Neo4j-Datenbank mit der Discourse-PostgreSQL-Datenbank synchron zu halten, würde ich entweder
a. PostgreSQL-Trigger
b. Discourse-Webhooks
verwenden.