Rimuovi il codice HTML dai post federati di ActivityPub

Ok, questo è un potenziale caso limite ma forse ancora interessante.

I post importati con rss-polling contengono codice HTML. Se questi post vengono federati, la maggior parte del codice HTML si interrompe e viene visualizzata come testo normale.

In un mondo ideale, almeno i link verrebbero tradotti. Ma se questo è troppo complicato, almeno sarebbe bene eliminare il codice HTML, lasciando il testo.

Un paio di screenshot per illustrare il problema:

Argomento Discourse importato tramite RSS:

Questo è come appare su Mastodon:

Perché stiamo federando post importati tramite RSS? Il caso d’uso è: siamo una community di podcast, importiamo nuovi episodi tramite RSS affinché gli ascoltatori possano mettere “mi piace” e commentare in un unico posto, e vogliamo offrire a questi podcast una finestra sul Fediverso, dove potrebbero ottenere più ascoltatori, commenti e “mi piace” – senza aggiungere altro lavoro ai loro già impegnati piatti.

1 Mi Piace

Solo per tua informazione, quando i contenuti di ActivityPub vengono federati (da qualsiasi piattaforma) vengono tipicamente federati come HTML. Federemo sempre i post di Discourse come HTML per impostazione predefinita.

Quello che probabilmente desideri è un filtro personalizzato per i contenuti di ActivityPub. Potremmo aggiungerlo presto, tuttavia questo è un caso d’uso relativamente specifico e non è in cima alla lista delle priorità.

1 Mi Piace

Capisco. Pensi che potremmo provare a promuoverlo tramite Marketplace? È un caso d’uso specifico ma ci impatta completamente.

Non può far male provare a pubblicare una richiesta in Marketplace!

1 Mi Piace

Guardando lo screenshot che hanno pubblicato, sembra ancora che ci sia quasi certamente un qualche tipo di bug qui, anche se non riesco a capire se sia dal lato Mastodon o dal lato Discourse.

Anche l'HTML più complesso dovrebbe semplicemente trasformarsi in testo normale quando Mastodon lo analizza. Non in quel markup HTML rotto che sta succedendo qui.

Inoltre, quando visualizzo questo thread da https://socialhub.activitypub.rocks/t/remove-html-code-from-activitypub-federated-posts/5293, perché le immagini mancano?

Sfortunatamente, non posso visualizzare l'argomento stesso in ActivityPub per determinare chi è il colpevole qui, il server restituisce 406 Not Acceptable:

curl -H 'Accept: application/activity+json' https://red.podkasts.org/t/el-canto-de-la-tripulacion-n-36-nuevas-voces/23408/1

E anche cercando l'oggetto in Mastodon non restituisce un risultato.

1 Mi Piace

Grazie mille @nightpool per aver indagato. Posso vedere il post nella mia timeline di Mastodon perché seguo l’account, ma non so come ottenere un URL che non sia il post originale su Discourse. Se vuoi, puoi seguire l’attore e poi potrò federare un altro post per scopi di test.

In ogni caso, ho intenzione di inviare presto questa richiesta a Marketplace.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.