Was ist der beste Weg, um eine Pipeline zum Posten von gescrapten Daten in Discourse-Kategorien mit benutzerdefinierten Tab-basierten Themen zu erstellen?

Steve_John · 26. März 2025 um 20:54

Wir möchten eine automatisierte Pipeline erstellen, die das von uns erstellte benutzerdefinierte Discourse-Theme aktualisieren kann, das verschiedene Tabs für unterschiedliche Arten von gescrapten Dateninhalten hat:

Sammelt Inhalte aus Quellen (RSS-Feeds, Websites usw.)
Strukturiert die Daten mit Metadaten: Titel, Quelle, Typ (Nachrichten/Konferenzen), URL, Datum
Verwendet die Discourse-API, um:
- Ein Thema unter der richtigen Kategorie zu erstellen und Inhalte in bestimmten Tabs des benutzerdefinierten Themes zu aktualisieren.
- Relevante Tags hinzuzufügen (damit es unter dem richtigen Tab erscheint)

Was sind die besten Möglichkeiten, gescrapte Daten zu speichern und zu rendern:

Lokale Datenbank oder externes CMS zum Speichern und Planen von Inhalten oder
YAML/JSON-Dateien (statische Quelle)

pfaffman · 26. März 2025 um 21:40

Schauen Sie sich vielleicht RSS Polling an

Steve_John · 28. März 2025 um 06:42

Vielen Dank, pfaffman, für die Plugin-Vorschläge. Wir haben jedoch keine RSS-Feed-Daten, wir speichern die gescrapten Daten in einer eigenständigen Datenbank. Können wir dieses Plugin verwenden, um eine Verbindung zur eigenständigen Datenbank herzustellen, die benötigten Daten abzurufen und den Inhalt zu rendern?

pfaffman · 28. März 2025 um 12:37

Es war ein Beispiel. Sie könnten entweder Ihre gescannten Daten in einen RSS-Feed umwandeln oder das Plugin so modifizieren, dass es jedes gewünschte Format liest.

Ich würde wahrscheinlich den Scraper in Ruby schreiben und ihn in ein Plugin integrieren.

Oder vielleicht Use the Discourse API ruby gem und es in eine Github-Aktion einbinden und die Daten pushen lassen. Das plane ich für einen Kunden zu tun, der gehostet wird und kein benutzerdefiniertes Plugin verwenden kann.

Steve_John · 30. März 2025 um 07:23

Danke Jay. Die Entwicklung des Scrapers mit Python ist bereits abgeschlossen … jetzt evaluieren wir, wie diese gesammelten Daten, die in MongoDB gespeichert sind, gerendert werden sollen.

Thema		Antworten	Aufrufe
Share your use cases of using Discourse REST API 🧑‍💻 Dev rest-api	2	782	8. August 2023
API / Functionality required to push Data from Discourse to external resource Dev	6	616	4. Februar 2024
Automating Discourse Topic Creation Extras	4	276	14. Dezember 2024
Do you have original customisations? Community	9	2786	2. April 2018
Rss feed to topics or posts in Discourse based forums Feature	9	3219	11. September 2022

Was ist der beste Weg, um eine Pipeline zum Posten von gescrapten Daten in Discourse-Kategorien mit benutzerdefinierten Tab-basierten Themen zu erstellen?

Verwandte Themen