Buscando una función de "site health" / verificación de enlaces

Empezamos a usar Discourse hace unos 2 meses, así que aún estamos aprendiendo. Busco una forma de verificar que todo el contenido generado por los usuarios siga enlazando a ubicaciones válidas. Me interesan principalmente los enlaces, imágenes y descargas. Básicamente, necesito un informe de los errores 404 en enlaces salientes.

He revisado el foro de meta, el directorio de complementos y la documentación de la API, pero no encuentro exactamente lo que necesito. No estoy seguro de si existe un complemento o si debo armar algo usando la API.

¿Existe alguna herramienta así?

1 me gusta

Para las imágenes, esto se resuelve de forma nativa descargando localmente las imágenes con enlaces directos, lo que garantiza que las imágenes nunca se rompan.

Para los enlaces, necesitarás un plugin personalizado.

4 Me gusta

Gracias por la confirmación. Empezaremos con eso.

Es bueno saberlo sobre las imágenes. Suponemos que eso va en contra de nuestro límite de almacenamiento (versión alojada).

1 me gusta

Si estás alojado (y no en Enterprise), es probable que no puedas usar un plugin. Podría ser mejor que armar algo con la API. Puedes empezar con una consulta del explorador de datos que devuelva, por ejemplo, el ID del post y la URL. Luego, podrías hacer que verifique las URLs y, quizás, marcar el post si la URL falla.

1 me gusta

Hola Jay,

Estamos alojados por CDCK y tenemos un plan empresarial. Pero, también revisaré tu sugerencia.

Intento mantener al mínimo la rotura de enlaces en nuestros foros de desarrolladores sin dañar la utilidad general de las publicaciones. A veces, la tecnología subyacente queda obsoleta o se elimina, lo cual no se puede evitar.

Gracias

4 Me gusta

Hola Eric,

Como cliente alojado, recibes un trato especial aquí :hugs:

Lo que puedes hacer hoy es usar una consulta del explorador de datos (un plugin que soportamos tanto en Business como en Enterprise) para preguntarnos sobre los enlaces más recientes en las publicaciones:

SELECT url, post_id, click
FROM topic_links
WHERE not internal
ORDER BY post_id DESC
LIMIT 100

Esto mostrará los últimos 100 URLs externos enlazados en las publicaciones. Puedes descargarlo como CSV y luego ejecutar una herramienta de validación de enlaces en el resultado para señalar las publicaciones problemáticas.

Además, rastreamos los clics en los enlaces, por lo que podrías ordenar esto por cantidad de clics o excluir elementos que no recibieron ningún clic.

¿Te ayudaría esto a resolver tu problema?

6 Me gusta

Hola Sam,

Creo que eso funcionaría. No tendremos un volumen enorme de tráfico, pero no quiero que con el tiempo los enlaces se vuelvan obsoletos. Especialmente los enlaces que apuntan a nuestros sitios corporativos.

1 me gusta