构建将爬取数据发布到带有自定义选项卡主题的Discourse类别的最佳方法是什么？

Steve_John · 2025 年3 月 26 日 20:54

我们希望构建一个自动化管道，能够更新我们构建的 Discourse 自定义主题，该主题具有用于不同类型抓取数据内容的选项卡：

存储和渲染抓取数据的最佳方法是什么：

pfaffman · 2025 年3 月 26 日 21:40

也许可以看看 RSS Polling

Steve_John · 2025 年3 月 28 日 06:42

感谢 pfaffman 提供的插件建议。但是，我们没有 rss 订阅源数据，我们将抓取的数据存储在独立的数据库中。我们是否可以使用此插件连接到独立数据库并获取所需数据并呈现内容？

pfaffman · 2025 年3 月 28 日 12:37

这是一个示例。您可以将抓取的数据制成 RSS feed，或修改插件以读取您想要的任何格式。

我可能会用 Ruby 编写抓取器并将其集成到插件中。

或者，也许可以使用 Use the Discourse API ruby gem 并将其放入 Github action 中，让它推送数据。我正计划为一位无法使用自定义插件的托管客户这样做。

Steve_John · 2025 年3 月 30 日 07:23

谢谢 Jay。已经用 Python 完成了爬虫开发……现在我们正在评估如何渲染存储在 MongoDB 中的这些抓取的数据。

话题		回复	浏览量
Share your use cases of using Discourse REST API 🧑‍💻 Dev rest-api	2	782	2023 年8 月 8 日
API / Functionality required to push Data from Discourse to external resource Dev	6	617	2024 年2 月 4 日
Automating Discourse Topic Creation Extras	4	276	2024 年12 月 14 日
Do you have original customisations? Community	9	2786	2018 年4 月 2 日
Rss feed to topics or posts in Discourse based forums Feature	9	3219	2022 年9 月 11 日