Supprimer le code HTML des publications fédérées ActivityPub

Ok, c’est un cas limite potentiel mais peut-être toujours intéressant.

Les publications importées avec rss-polling contiennent du code HTML. Si ces publications sont fédérées, la plupart du code HTML se brise et est traité comme du texte brut.

Dans un monde idéal, au moins les liens seraient traduits. Mais si c’est trop compliqué, au minimum, il serait bon de supprimer le code HTML, en ne laissant que le texte.

Quelques captures d’écran pour illustrer le problème :

Sujet Discourse importé via RSS :

Voici à quoi cela ressemble sur Mastodon :

Pourquoi fédérons-nous les publications importées via RSS ? Le cas d’utilisation est le suivant : nous sommes une communauté de podcasts, nous importons de nouveaux épisodes via RSS pour que les auditeurs puissent aimer et commenter en un seul endroit, et nous voulons offrir à ces podcasts une fenêtre sur le Fediverse, où ils pourraient obtenir plus d’auditeurs, de commentaires et de likes – sans ajouter plus de travail à leurs emplois du temps chargés.

1 « J'aime »

Pour votre information, lorsque le contenu ActivityPub est fédéré (depuis n’importe quelle plateforme), il est généralement fédéré sous forme de HTML. Nous fédérerons toujours les publications Discourse sous forme de HTML par défaut.

Ce que vous voulez probablement, c’est un filtre personnalisé pour le contenu ActivityPub. Nous pourrions l’ajouter bientôt, cependant, il s’agit d’un cas d’utilisation relativement spécifique et il n’est pas en tête de liste des priorités.

1 « J'aime »

Je comprends. Pensez-vous que nous pourrions essayer de pousser cela via Marketplace ? C’est un cas d’utilisation spécifique mais il nous impacte pleinement.

Ça ne peut pas faire de mal d’essayer de poster une demande dans Marketplace !

1 « J'aime »

En regardant la capture d'écran qu'ils ont publiée, il semble toujours y avoir certainement un bug, bien que je ne puisse pas dire s'il est du côté de Mastodon ou de Discourse.

Même le HTML le plus complexe devrait simplement se transformer en texte brut lorsque Mastodon l'analyse. Pas le balisage HTML défectueux qui se passe ici.

De plus, lorsque je consulte ce fil depuis https://socialhub.activitypub.rocks/t/remove-html-code-from-activitypub-federated-posts/5293, pourquoi les images sont-elles manquantes ?

Malheureusement, je ne peux pas consulter le sujet lui-même dans ActivityPub pour déterminer qui est en faute, le serveur renvoie 406 Not Acceptable :

curl -H 'Accept: application/activity+json' https://red.podkasts.org/t/el-canto-de-la-tripulacion-n-36-nuevas-voces/23408/1

Et la recherche de l'objet dans Mastodon ne renvoie pas non plus de résultat.

1 « J'aime »

Merci beaucoup @nightpool d’avoir examiné cela. Je peux voir la publication dans ma chronologie Mastodon car je suis le compte, mais je ne sais pas comment obtenir une URL qui ne soit pas la publication originale sur Discourse. Si vous le souhaitez, vous pouvez suivre l’acteur et je pourrai alors fédérer une autre publication à des fins de test.

Dans tous les cas, je prévois de soumettre cette demande à Marketplace bientôt.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.