À la recherche d'une fonctionnalité de "site health"/vérification des liens

Nous utilisons Discourse depuis environ 2 mois et nous sommes encore en phase d’apprentissage. Je cherche un moyen de vérifier que tout le contenu généré par les utilisateurs pointe toujours vers des emplacements valides. Je m’intéresse principalement aux liens, aux images et aux téléchargements. En résumé, j’aimerais obtenir un rapport des erreurs 404 sur les liens sortants.

J’ai parcouru le forum Meta, le répertoire des extensions et la documentation de l’API, mais je n’ai pas trouvé exactement ce que je recherche. Je ne sais pas si une extension existe ou si je dois assembler quelque chose en utilisant l’API.

Un tel outil existe-t-il ?

1 « J'aime »

Pour les images, nous couvrons cela nativement en téléchargeant localement les images hot-linkées, ce qui garantit qu’elles ne seront jamais brisées.

Pour les liens, vous aurez besoin d’un plugin personnalisé.

4 « J'aime »

Merci pour la confirmation. Nous allons nous y mettre.

C’est bien de savoir pour les images. Je suppose que cela va à l’encontre de notre limite de stockage (version hébergée).

1 « J'aime »

Si vous êtes hébergé (et que vous n’êtes pas sur Enterprise), il est probable que vous ne puissiez pas utiliser de plugin. Il serait peut-être préférable de bricoler quelque chose avec l’API. Vous pouvez commencer par une requête de l’explorateur de données qui renvoie, par exemple, l’ID du message et l’URL. Ensuite, vous pourriez, par exemple, vérifier les URL et signaler le message si l’URL ne fonctionne plus.

1 « J'aime »

Bonjour Jay,

Nous sommes hébergés par CDCK et avons un plan entreprise. Cependant, je vais examiner votre suggestion également.

Je m’efforce de minimiser les liens brisés dans nos forums pour développeurs sans nuire à l’utilité globale des publications. Parfois, la technologie sous-jacente est dépréciée ou supprimée, ce qui est inévitable.

Merci

4 « J'aime »

Bonjour Eric,

En tant que client hébergé, vous bénéficiez d’un traitement spécial ici :hugs:

Ce que vous pouvez faire dès aujourd’hui, c’est utiliser une requête d’explorateur de données (un plugin que nous prenons en charge sur les offres Business et Entreprise) pour nous interroger sur les liens les plus récents dans les publications :

SELECT url, post_id, click
FROM topic_links
WHERE not internal
ORDER BY post_id DESC
LIMIT 100

Cela affichera les 100 dernières URL externes liées dans les publications. Vous pouvez télécharger le résultat au format CSV, puis utiliser un outil de validation des liens pour identifier les publications problématiques.

De plus, nous suivons les clics sur les liens, vous pouvez donc trier cette liste par nombre de clics ou exclure les éléments qui n’ont jamais été cliqués.

Cela vous aiderait-il à résoudre votre problème ?

6 « J'aime »

Bonjour Sam,

Je pense que cela fonctionnera. Nous n’aurons pas un volume de trafic énorme, mais je ne veux pas que les liens se brisent avec le temps, en particulier ceux pointant vers nos sites d’entreprise.

1 « J'aime »