No soy un experto en accesibilidad, pero no entiendo esta solicitud de funcionalidad. ¿Cuál es la diferencia, en la práctica, entre alt y figcaption y por qué abogan por que nos desviemos de CommonMark? ¿Qué me estoy perdiendo?
Cuando subo una foto, digamos de mi gato, se le da una leyenda que está asociada a la foto. Luego puedo editar la leyenda para compartir contexto.
La leyenda se muestra al pasar el ratón por encima (en escritorio) y en la parte inferior de la foto, cuando la seleccionas para verla más grande:

