Hola,
¿Hay algún plugin para raspar noticias de otros sitios?
Hola,
¿Hay algún plugin para raspar noticias de otros sitios?
Hay: News Plugin 📰
Que utiliza feeds RSS
El Plugin de sondeo RSS de Discourse puede rastrear muchos sitios, como blogs, canales de YouTube y listas de reproducción, y crear automáticamente nuevos temas pocos minutos después de que se publique el contenido.
Instalé el plugin; y sigo la guía como se indica a continuación;
Pongo 3 secciones para probar el rss que funciona del sitio de seguridad de bleeping;
Fuente de rss de la 1ª categoría
News in the Security category
filtro de categoría: ninguno.
usuario seleccionado; y categoría para publicar rss seleccionada.
Fuente de rss de la segunda categoría
BleepingComputer
filtro de categoría: security
usuario seleccionado; y categoría para publicar rss seleccionada.
También uso el rss de otro sitio
darkreading
filtro de categoría: vulnerabilities-threats
usuario seleccionado; y categoría para publicar rss seleccionada.
¿Pero nada me funciona?
¿Fuiste a sidekiq para ejecutar el proceso? Si no, tardará un tiempo, dependiendo de tu configuración de administrador. Busca también errores en los registros.
También debes asegurarte de usar una URL de rss. Si abres estas URL, no parecen ser rss. También hay una configuración que hace que los temas importados no aparezcan en la lista de forma predeterminada.
Ahora solo funciona el tercer rss (darkreading.com) para empezar a publicar; y tiene más de 100 publicaciones, pero todas las publicaciones se ven así
valor:
https://www.darkreading.com/rss.xml
filtro de categoría: vulnerabilidades-amenazas
nombre de usuario seleccionado; y categoría para publicar rss seleccionada.
¿Cómo puedo incluir la publicación completa con imágenes?
@f1r4s y @Jagster, mantengan la civilidad aquí.
Si bien existen usos legítimos para querer extraer contenido de otros sitios, como para una comunidad interna donde se desea monitorear noticias de seguridad importantes, no aprobamos la infracción de derechos de autor.
Los propietarios de comunidades de Discourse son responsables de administrar su sitio de acuerdo con todas las leyes vigentes y los términos de servicio del host, al igual que con cualquier otro sitio en la web.
Cerrando esto temporalmente para un enfriamiento.
Intenta activar la configuración del sitio embed truncate.
Algunos sitios tienen un marcado RSS extraño, por lo que tendrás que depurar manualmente los que no funcionan.
Este tema se abrió automáticamente después de 21 horas.
Recomendé usar RSS, pero las imágenes están rotas en el raspado.