Eliminar código HTML de las publicaciones federadas de ActivityPub

Ok, este es un posible caso límite pero quizás aún interesante.

Las publicaciones importadas con rss-polling contienen código HTML. Si estas publicaciones se federan, la mayor parte del código HTML se rompe y se muestra como texto plano.

En un mundo ideal, al menos los enlaces se traducirían. Pero si esto es demasiado complicado, al menos sería bueno eliminar el código HTML, dejando el texto.

Un par de capturas de pantalla para ilustrar el problema:

Tema de Discourse importado vía RSS:

Así es como se ve en Mastodon:

¿Por qué estamos federando publicaciones importadas vía RSS? El caso de uso es: somos una comunidad de podcasts, importamos nuevos episodios vía RSS para que los oyentes den “me gusta” y comenten en un solo lugar, y queremos ofrecer a estos podcasts una ventana al Fediverso, donde podrían conseguir más oyentes, comentarios y “me gusta”, sin añadir más trabajo a sus apretadas agendas.

1 me gusta

Solo como contexto, cuando el contenido de ActivityPub se federado (desde cualquier plataforma) típicamente se federado como HTML. Siempre federaremos las publicaciones de Discourse como HTML por defecto.

Lo que probablemente quieres es un filtro personalizado para el contenido de ActivityPub. Puede que lo añadamos en algún momento pronto, sin embargo, este es un caso de uso relativamente específico y no está en la lista de prioridades.

1 me gusta

Entiendo. ¿Crees que podríamos intentar impulsar esto a través de Marketplace? Es un caso de uso específico pero nos afecta por completo.

¡No puede hacer daño intentar publicar una solicitud en Marketplace!

1 me gusta

Mirando la captura de pantalla que publicaron, todavía parece que hay algún tipo de error aquí, aunque no puedo decir si está del lado de Mastodon o del lado de Discourse.

Incluso el HTML más complejo debería convertirse en texto plano cuando Mastodon lo procesa. No en el marcado HTML roto que está ocurriendo aquí.

Además, cuando veo este hilo desde https://socialhub.activitypub.rocks/t/remove-html-code-from-activitypub-federated-posts/5293, ¿por qué faltan las imágenes?

Desafortunadamente, no puedo ver el tema en sí en ActivityPub para determinar quién tiene la culpa aquí, el servidor devuelve 406 Not Acceptable:

curl -H 'Accept: application/activity+json' https://red.podkasts.org/t/el-canto-de-la-tripulacion-n-36-nuevas-voces/23408/1

Y buscar el objeto en Mastodon tampoco devuelve un resultado.

1 me gusta

Muchas gracias @nightpool por investigar esto. Puedo ver la publicación en mi línea de tiempo de Mastodon porque sigo la cuenta, pero no sé cómo obtener una URL que no sea la publicación original en Discourse. Si quieres, puedes seguir al actor y entonces podré federar otra publicación para fines de prueba.

En cualquier caso, planeo enviar esta solicitud a Marketplace pronto.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.