HTML-Code aus ActivityPub federated Posts entfernen

Ok, das ist ein potenzieller Grenzfall, aber vielleicht trotzdem interessant.

Mit rss-polling importierte Beiträge enthalten HTML-Code. Wenn diese Beiträge föderiert werden, bricht der meiste HTML-Code zusammen und wird als einfacher Text angezeigt.

Im Idealfall würden zumindest Links übersetzt werden. Aber wenn das zu viel Aufwand ist, wäre es zumindest gut, den HTML-Code zu entfernen und den Text beizubehalten.

Ein paar Screenshots zur Veranschaulichung des Problems:

Per RSS importiertes Discourse-Thema:

So sieht es auf Mastodon aus:

Warum föderieren wir per RSS importierte Beiträge? Der Anwendungsfall ist: Wir sind eine Gemeinschaft von Podcasts, wir importieren neue Episoden per RSS, damit Hörer sie an einem Ort liken und kommentieren können, und wir möchten diesen Podcasts ein Fenster zum Fediverse bieten, wo sie vielleicht mehr Hörer, Kommentare und Likes bekommen – ohne zusätzliche Arbeit für ihre bereits vollen Teller.

1 „Gefällt mir“

Zu Ihrer Information: Wenn ActivityPub-Inhalte (von jeder Plattform) föderiert werden, werden sie typischerweise als HTML föderiert. Wir werden Discourse-Posts immer standardmäßig als HTML föderieren.

Was Sie wahrscheinlich wollen, ist ein benutzerdefinierter Filter für ActivityPub-Inhalte. Wir werden diesen möglicherweise bald hinzufügen, dies ist jedoch ein relativ spezifischer Anwendungsfall und steht nicht ganz oben auf der Prioritätenliste.

1 „Gefällt mir“

Ich verstehe. Glauben Sie, dass wir das über Marketplace pushen könnten? Es ist ein spezifischer Anwendungsfall, aber er betrifft uns vollständig.

Es schadet nicht, einen Versuch im Marketplace zu posten!

1 „Gefällt mir“

Wenn ich mir den Screenshot ansehe, den sie gepostet haben, scheint es immer noch mit ziemlicher Sicherheit irgendeinen Fehler zu geben, obwohl ich nicht sagen kann, ob er auf der Mastodon-Seite oder auf der Discourse-Seite liegt.

Selbst das komplexeste HTML sollte einfach in reinen Text umgewandelt werden, wenn Mastodon es parst. Nicht was auch immer für fehlerhafte HTML-Markups hier vor sich gehen.

Außerdem, warum fehlen die Bilder, wenn ich diesen Thread von https://socialhub.activitypub.rocks/t/remove-html-code-from-activitypub-federated-posts/5293 aus aufrufe?

Leider kann ich das Thema selbst nicht in ActivityPub einsehen, um festzustellen, wer hier schuld ist, der Server gibt 406 Not Acceptable zurück:

curl -H 'Accept: application/activity+json' https://red.podkasts.org/t/el-canto-de-la-tripulacion-n-36-nuevas-voces/23408/1

Und die Suche nach dem Objekt in Mastodon liefert auch kein Ergebnis.

1 „Gefällt mir“

Vielen Dank, @nightpool, dass Sie sich darum kümmern. Ich kann den Beitrag in meiner Mastodon-Timeline sehen, da ich dem Account folge, aber ich weiß nicht, wie ich eine URL bekomme, die nicht der Originalbeitrag auf Discourse ist. Wenn Sie möchten, können Sie dem Akteur folgen und dann kann ich zu Testzwecken einen weiteren Beitrag föderieren.

Auf jeden Fall plane ich, diese Anfrage bald an den Marketplace zu senden.

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.