你好,
有什么可以抓取其他网站新闻的插件吗?
你好,
有什么可以抓取其他网站新闻的插件吗?
它使用 RSS feed
配置 Discourse RSS 轮询插件 可以抓取许多网站,例如博客、YouTube 频道和播放列表,并在内容发布后仅几分钟内自动创建新主题。
我已安装该插件;并按照以下指南操作;
我设置了 3 个部分来测试来自 bleeping security 网站的 RSS 是否正常工作;
第一个类别 RSS 源
News in the Security category
类别过滤器:无。
已选择用户名;并选择了要发布 RSS 的类别。
第二个类别 RSS 源
BleepingComputer
类别过滤器:security
已选择用户名;并选择了要发布 RSS 的类别。
我还使用了另一个网站的 RSS
darkreading
类别过滤器:vulnerabilities-threats
已选择用户名;并选择了要发布 RSS 的类别。
但对我来说什么都不起作用??
您是否去 sidekiq 运行该进程?如果不是,则需要一段时间,具体取决于您的管理员设置。另外,请查看日志以获取任何错误。
您还必须确保使用 rss url。如果您打开这些 url,它们似乎不是 rss。还有一个设置可以使导入的主题默认情况下处于未列出状态。
我现在只看到第三个rss(darkreading.com)可以开始发布;它发布了100多篇相当不错的文章,但所有文章看起来都像这样
value:
https://www.darkreading.com/rss.xml
category filter: vulnerabilities-threats
username selected; and category to post rss selected.
我该如何包含带图片的完整帖子?
虽然从其他网站抓取内容有正当用途,例如用于内部社区,您希望监控重要的安全新闻,但我们不纵容侵犯版权的行为。
Discourse 社区所有者有责任按照所有适用的法律和托管服务条款运行他们的网站,就像对待网络上的任何其他网站一样。
暂时关闭此项以进行冷却。
尝试切换 embed truncate 站点设置。
有些站点的 RSS 标记很奇怪,所以你必须手动调试损坏的站点。
此主题在 21 小时后自动打开。
我建议使用第二个 RSS,但图片损坏 进行抓取。