Creo que puede hacer que texto legítimo en hebreo o árabe sea ilegible.
Una de las soluciones que encontré fue deshabilitar los algoritmos de Unicode y simplemente mostrar una representación de caracteres no imprimibles (creo que se implementó en Pootle).
Así que, básicamente, la idea es convertir:
Este texto
En:
Este\\u003cLRM\u003e\\u003cRLM\u003e texto
De esta manera, el usuario puede elegir si esto es malicioso o no, entendiendo cuáles son los caracteres reales y posiblemente eligiendo habilitar los algoritmos de Unicode para poder leer el texto correctamente.
Gracias.
Gracias por plantear esto, tuvimos en cuenta esta preocupación. La corrección que enlazaste en el OP solo se aplica a los caracteres bidireccionales unicode en bloques pre y code, ya sea escritos manualmente como HTML o generados a partir de bloques de código delimitados por \u003ccode\u003e```\u003c/code\u003e, por lo que no debería ser un problema con texto hebreo o árabe normal en una publicación compuesta.
No es el mejor ejemplo del mundo, pero deberías entender la idea aquí, solo afecta al código fuente que se publica en el foro. Los caracteres Bidi en el código fuente no son algo que se suela hacer.
Me gustaría que el caso atípico aquí tuviera soluciones alternativas (captura de pantalla, cargas de archivos adjuntos, etc.), además de que está bastante claro que el carácter especial está en su lugar.
El riesgo de https://trojansource.codes/ es mayor que el riesgo de una leve interrupción en casos atípicos extremos.
Pero mi sugerencia rompe la oración con alguna señal, por lo que reemplazar RLM y LRM con \\u003cRLM\u003e o \\u003cLRM\u003e mostrará al usuario que había caracteres adicionales y ahora el texto se muestra sin ellos, informando que podría afectar la experiencia y que existe la opción de reemplazarlos manualmente si es necesario, eliminar los caracteres por completo sin ningún indicador no deja lugar a decisiones informadas.
Y también evitará el código fuente troyano como mencionaste porque el usuario podrá ver el código malicioso con los indicadores.
Intentaré obtener algunas capturas de pantalla de Pootle, no recuerdo haber visto esa opción de cadenas de texto sin procesar en los últimos años, fue muy útil cuando comenzamos a corregir la localización de LibreOffice.