アクセシビリティの専門家ではありませんが、この機能リクエストが理解できません。alt と figcaption の実質的な違いは何ですか?また、なぜ CommonMark から逸脱することを主張しているのですか?何か見落としていることはありますか?
猫の写真などをアップロードすると、写真に関連付けられたキャプションが付けられます。その後、コンテキストを共有するためにキャプションを編集できます。
キャプションは、マウスオーバー時(デスクトップ)と、写真を拡大表示するために選択したときに写真の下部に表示されます。

