Plugin para extrair notícias de outros sites

Olá,

Existe algum plugin para raspar notícias de outros sites?

1 curtida

Há: News Plugin 📰

Que usa feeds RSS

4 curtidas

O Plugin de Enquete RSS do Discourse pode fazer raspagem de muitos sites, como blogs, canais do YouTube e playlists, e criar automaticamente novos tópicos poucos minutos após a publicação do conteúdo.

5 curtidas

Instalei o plugin; e segui o guia abaixo;

coloquei 3 seções para testar o rss funcionando do site bleeping security;

1ª fonte de rss da categoria
News in the Security category
filtro de categoria: nenhum.
nome de usuário selecionado; e categoria para postar rss selecionada.

2ª fonte de rss da categoria
BleepingComputer
filtro de categoria: security
nome de usuário selecionado; e categoria para postar rss selecionada.

também usei o rss de outro site

darkreading
filtro de categoria: vulnerabilities-threats
nome de usuário selecionado; e categoria para postar rss selecionada.

mas nada funcionou comigo??

1 curtida

Você foi para o sidekiq executar o processo? Se não, levará um tempo, dependendo das suas configurações de administrador. Verifique também os logs em busca de erros.

Você também tem que ter certeza de usar uma URL de rss. Se você abrir essas URLs, elas não parecem ser rss. Há também uma configuração que torna os tópicos importados não listados por padrão.

Desculpe, perdi essa parte; os logs me mostram isto

Agora vejo que apenas o terceiro rss (darkreading.com) está funcionando para começar a postar; e ele posta coisas muito boas, mais de 100 posts, mas todos os posts se parecem com isto

valor:

https://www.darkreading.com/rss.xml
filtro de categoria: vulnerabilidades-ameaças
usuário selecionado; e categoria para postar rss selecionada.

como posso incluir o post completo com imagens?

@f1r4s e @Jagster, mantenham a civilidade aqui.

Embora existam usos legítimos para querer importar conteúdo de outros sites, como para uma comunidade interna onde você deseja monitorar notícias importantes de segurança, não aprovamos a violação de direitos autorais.

Os proprietários da comunidade Discourse são responsáveis por executar seu site de acordo com todas as leis aplicáveis e os termos de serviço de hospedagem, assim como qualquer outro site na web.

4 curtidas

Fechando temporariamente para um período de resfriamento.

Tente alternar a configuração do site embed truncate.

Alguns sites têm uma marcação RSS estranha, então você terá que depurar manualmente os quebrados.

2 curtidas

Este tópico foi aberto automaticamente após 21 horas.

Eu recomendei o uso do segundo RSS, mas as imagens estão quebradas em raspagem..