Бросил быстрый взгляд из любопытства. Похоже, проблема в библиотеке Nokogiri.
Вот как это используется в Discourse:
doc = Nokogiri::HTML5.fragment(sanitized)
add_nofollow = !options[:omit_nofollow] && SiteSetting.add_rel_nofollow_to_user_content
add_rel_attributes_to_user_content(doc, add_nofollow)
strip_hidden_unicode_bidirectional_characters(doc)
sanitize_hotlinked_media(doc)
add_mentions(doc, user_id: opts[:user_id]) if SiteSetting.enable_mentions
scrubber = Loofah::Scrubber.new { |node| node.remove if node.name == "script" }
loofah_fragment = Loofah.fragment(doc.to_html)
loofah_fragment.scrub!(scrubber).to_html
end
def self.strip_hidden_unicode_bidirectional_characters(doc)
return if !DANGEROUS_BIDI_REGEXP.match?(doc.content)
doc
.css("code,pre")
.each do |code_tag|
next if !DANGEROUS_BIDI_REGEXP.match?(code_tag.content)
Loofah.fragment использует HTML4-парсер Nokogiri.
Это можно исправить, используя Loofah.html5_fragment, при условии, что Nokogiri >= 1.14.0 и Loofah >= 2.21.0. В Discourse уже используется Nokogiri::HTML5.fragment, так что это имеет смысл.
Примечание: Loofah 2.21.0 ещё не выпущен; сейчас доступна версия RC1.
11 лайков