Vorgeschlagene Themen - Titel- und inhaltsbasierte Vorschläge

Hallo,

ich bin neu hier, also entschuldigt bitte, falls ich ein altes Thema wieder aufwärme.

Ich stimme @sam zu, dass es eine tiefgründige Materie ist, aber auf der anderen Seite ist die Technologie zur Themenmodellierung mittlerweile ziemlich ausgereift, und es gibt sehr gute fertige Tools. Bei einem kürzlichen Projekt habe ich etwa 5 Millionen Patentschriften und Zusammenfassungen analysiert; die Analyse von einigen tausend Themen auf meiner schicken neuen Discourse-Seite wäre ein Kinderspiel. Außerdem hat meine Community vielleicht die Energie, das umzusetzen.

An die Experten: Ich würde gerne Rat dazu bekommen, ob ich über die Entwicklung eines Plugins nachdenken sollte oder ob ich lieber direkt den Discourse-Quellcode (den ich von GitHub heruntergeladen habe) anpassen sollte.

Ich habe diesen Beitrag zum Scraping von Discourse-Themen mit Python gefunden, aber ich habe es noch nicht zum Laufen gebracht. Etwas Ähnliches sollte es mir ermöglichen, die Daten offline zu extrahieren, das Modell zu erstellen und es später für Abfragen zu laden.

Die meisten guten Tools sind in Python, FWIW…

4 „Gefällt mir“