Ho dato una rapida occhiata per curiosità. Sembra un problema con la libreria Nokogiri.
Da quello che usa Discourse qui:
doc = Nokogiri::HTML5.fragment(sanitized)
add_nofollow = !options[:omit_nofollow] && SiteSetting.add_rel_nofollow_to_user_content
add_rel_attributes_to_user_content(doc, add_nofollow)
strip_hidden_unicode_bidirectional_characters(doc)
sanitize_hotlinked_media(doc)
add_mentions(doc, user_id: opts[:user_id]) if SiteSetting.enable_mentions
scrubber = Loofah::Scrubber.new { |node| node.remove if node.name == "script" }
loofah_fragment = Loofah.fragment(doc.to_html)
loofah_fragment.scrub!(scrubber).to_html
end
def self.strip_hidden_unicode_bidirectional_characters(doc)
return if !DANGEROUS_BIDI_REGEXP.match?(doc.content)
doc
.css("code,pre")
.each do |code_tag|
next if !DANGEROUS_BIDI_REGEXP.match?(code_tag.content)
Loofah.fragment usa il parser HTML4 di Nokogiri.
Questo potrebbe essere risolto usando Loofah.html5_fragment finché Nokogiri >= 1.14.0 e Loofah >= 2.21.0. Discourse usa già Nokogiri::HTML5.fragment; avrebbe senso.
Nota: Loofah 2.21.0 non è ancora stato rilasciato; attualmente in RC1.
11 Mi Piace