ActivityPub連合投稿からHTMLコードを削除

これは潜在的なコーナーケースですが、それでも興味深いかもしれません。

rss-polling でインポートされた投稿には HTML コードが含まれています。これらの投稿がフェデレーションされると、ほとんどの HTML コードが壊れてプレーンテキストとして表示されます。

理想的には、少なくともリンクは変換されるべきです。しかし、それが手間のかかることであれば、少なくとも HTML コードを削除してテキストだけを残すのが良いでしょう。

問題を説明するためのスクリーンショットをいくつか示します。

RSS 経由でインポートされた Discourse トピック:

Mastodon ではこのように表示されます:

なぜ RSS 経由でインポートされた投稿をフェデレーションしているのか?ユースケースは次のとおりです。私たちはポッドキャストのコミュニティであり、リスナーが 1 か所で「いいね!」やコメントをできるように RSS 経由で新しいエピソードをインポートしています。また、これらのポッドキャストに Fediverse への窓を提供したいと考えています。そこでは、忙しい彼らにさらなる負担をかけることなく、より多くのリスナー、コメント、いいね!を獲得できるかもしれません。

「いいね!」 1

参考情報として、ActivityPub コンテンツは(どのプラットフォームからであっても)フェデレーションされる際に、通常 HTML としてフェデレーションされます。Discourse の投稿は、デフォルトで常に HTML としてフェデレーションされます。

おそらく、ActivityPub コンテンツ用のカスタムフィルターが必要なのでしょう。これは近いうちに追加するかもしれませんが、比較的特殊なユースケースであり、優先順位リストの上位ではありません。

「いいね!」 1

承知いたしました。これは Marketplace 経由でプッシュできるものだと思いますか?特定のユースケースですが、私たちに完全に影響します。

#マーケットプレイスにリクエストを投稿してみるのも悪くない

「いいね!」 1

投稿されたスクリーンショットを見ると、バグがある可能性はほぼ確実ですが、Mastodon側なのかDiscourse側なのかは判断できません。

最も複雑なHTMLでさえ、Mastodonが解析する際にはプレーンテキストになるはずです。ここで表示されているような壊れたHTMLマークアップではありません。

また、このスレッドをhttps://socialhub.activitypub.rocks/t/remove-html-code-from-activitypub-federated-posts/5293から表示すると、画像が missing しているのはなぜでしょうか?

残念ながら、ActivityPubでトピック自体を表示して、誰が原因なのかを判断することはできません。サーバーは406 Not Acceptableを返します。

curl -H 'Accept: application/activity+json' https://red.podkasts.org/t/el-canto-de-la-tripulacion-n-36-nuevas-voces/23408/1

Mastodonでオブジェクトを検索しても結果は返されません。

「いいね!」 1

この件について調べてくださった @nightpool さん、本当にありがとうございます。フォローしているアカウントなので Mastodon のタイムラインで投稿を確認できますが、Discourse の元の投稿 ではない URL を取得する方法がわかりません。もしよろしければ、アクティビティ投稿者をフォロー していただければ、テスト目的で別の投稿をフェデレーションできます。

いずれにしても、まもなく Marketplace にこのリクエストを提出する予定です。

This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.