Dei uma olhada rápida por curiosidade. Parece um problema com a biblioteca Nokogiri.
Pelo que o Discourse usa aqui:
doc = Nokogiri::HTML5.fragment(sanitized)
add_nofollow = !options[:omit_nofollow] && SiteSetting.add_rel_nofollow_to_user_content
add_rel_attributes_to_user_content(doc, add_nofollow)
strip_hidden_unicode_bidirectional_characters(doc)
sanitize_hotlinked_media(doc)
add_mentions(doc, user_id: opts[:user_id]) if SiteSetting.enable_mentions
scrubber = Loofah::Scrubber.new { |node| node.remove if node.name == "script" }
loofah_fragment = Loofah.fragment(doc.to_html)
loofah_fragment.scrub!(scrubber).to_html
end
def self.strip_hidden_unicode_bidirectional_characters(doc)
return if !DANGEROUS_BIDI_REGEXP.match?(doc.content)
doc
.css("code,pre")
.each do |code_tag|
next if !DANGEROUS_BIDI_REGEXP.match?(code_tag.content)
Loofah.fragment usa o parser HTML4 do Nokogiri.
Isso poderia ser corrigido usando Loofah.html5_fragment desde que Nokogiri >= 1.14.0 e Loofah >= 2.21.0. O Discourse já usa Nokogiri::HTML5.fragment; isso faria sentido.
Observação: Loofah 2.21.0 ainda não foi lançado; atualmente em RC1.
11 curtidas