Abonnement RSS cassé par le contenu des publications

Sur le Discourse Python, j’ai remarqué que mon abonnement RSS à la catégorie users (renommée « Aide ») avait cessé de fonctionner. En essayant de le rétablir, l’abonnement https://discuss.python.org/c/users/7.rss donne un contenu invalide que mon lecteur (Thunderbird) ne charge pas. Il échoue à la validation sur le W3C :

Puisque cette vérification échoue, je suppose que je ne suis pas le seul concerné.

Le problème semble être un caractère inattendu dans la publication https://discuss.python.org/t/beginner-help-with-concatenating-arrays/36226. Dans le flux, la sous-chaîne fautive apparaît comme b'N \\x02x KSQT' (deux occurrences).

Ce n’est bien sûr pas la faute de l’utilisateur, mais celle de Discourse pour l’avoir laissé passer, et la solution à long terme vous incombe.

Un administrateur là-bas (ou du moins un développeur principal de CPython) m’a suggéré de le signaler ici.

3 « J'aime »

Ceci est un cas très étrange :

PrettyText.format_for_email(p.cooked, p)
=> "<p>Bonjour, j'essaie actuellement de suivre un pipeline d'apprentissage automatique décrit dans un article. Essentiellement, j'ai besoin de créer une matrice d'entrée de taille N x KSDT. L'article le décrit comme suit : « Ici, k, ks, kd et ksd sont des étiquettes et non des indices, et tous les termes sont compris comme des matrices de la même taille N x KSQT, donc par exemple Xk n'est pas une matrice de taille N x K, mais la matrice complète de taille N x KSQT avec N x k valeurs uniques répétées KSQ fois ».
<p>Actuellement, j'ai trois tableaux np.arrays suivants :<br>
<br>
bias_block : (348, 2, 151), bias_contrast : (348, 5, 151), et bias_decision : (348, 2, 151).<br>
<br>
D'après ma compréhension, afin de combiner ces trois tableaux, j'aurais besoin d'une taille finale de (348, 20, 20, 20, 151). Cependant, j'ai vraiment du mal à combiner ces tableaux. Quelqu'un pourrait-il m'aider avec cela, merci beaucoup.</p>"

Je ne vois pas ce qui ne va pas avec cette chaîne… le N x KSDT ne semble rien cacher.

(notez que le message est maintenant sorti des derniers, donc le rss fonctionne à nouveau comme effet secondaire, mais j’aimerais certainement résoudre ce problème.

Je suppose que c’est la ligne d’où cela provient :

1 « J'aime »

J’ai regardé le message plus tôt aujourd’hui. Il y avait un code hexadécimal unicode qui ressemblait à \u0026#x2610; (\u0026#x2610). Ce n’est pas le code exact cependant. Il s’affichait dans le contenu brut du message ce matin (https://discuss.python.org/posts/121311.json). Il semble qu’il ait été modifié depuis.

4 « J'aime »

Le caractère défectueux est &#x2; ou ^B

3 « J'aime »

La première occurrence est correcte, mais la deuxième et la troisième contiennent un octet 0x02 (lorsque j’enregistre depuis cette URL avec Firefox et que je lis le fichier en octets avec Python), comme dans mon premier message. validator.w3.org m’a donné suffisamment de contexte pour localiser le premier 0x02 dans la ligne.

U+002610 n’est que le symbole de la boîte que quelque chose remplace (mais pas dans le RSS).

J’ai demandé la réparation du message car je ne voyais pas comment mon abonnement pourrait fonctionner sans. Je peux vous envoyer mes octets enregistrés si cela peut aider.

1 « J'aime »

Conformément aux spécifications RSS 2.0, le flux doit être conforme à XML 1.0. Et conformément aux spécifications XML 1.0, plusieurs caractères de contrôle sont invalides.

La PR ci-dessous est une première tentative pour résoudre ce problème :

3 « J'aime »

Ce sujet a été automatiquement fermé après 39 heures. Les nouvelles réponses ne sont plus autorisées.