Ошибка конвертации кодировки из ASCII-8bit в UTF-8 в логах

В логах я вижу это предупреждение, но не уверен, откуда оно берется. Раньше такого не встречал, началось после обновления с версии 3.2.0 до 3.3.0.

Это единственное предупреждение, связанное с временными метками, других ошибок или предупреждений нет (сначала думал, что дело в почте, но в это время не было ни ошибок, ни отказов в доставке писем).

Установлено

3.3.0.beta2-dev

(777b8f6d51)

Сообщение (4 сообщения)

Ошибка в RequestTracker.get_data: Encoding::UndefinedConversionError: "\xA1" из ASCII-8BIT в UTF-8

Трассировка стека

/var/www/discourse/lib/middleware/request_tracker.rb:190:in `encode'
/var/www/discourse/lib/middleware/request_tracker.rb:190:in `get_data'
/var/www/discourse/lib/middleware/request_tracker.rb:207:in `log_request_info'
/var/www/discourse/lib/middleware/request_tracker.rb:320:in `call'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/railties-7.0.8.1/lib/rails/engine.rb:530:in `call'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/railties-7.0.8.1/lib/rails/railtie.rb:226:in `public_send'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/railties-7.0.8.1/lib/rails/railtie.rb:226:in `method_missing'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-2.2.9/lib/rack/urlmap.rb:74:in `block in call'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-2.2.9/lib/rack/urlmap.rb:58:in `each'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/rack-2.2.9/lib/rack/urlmap.rb:58:in `call'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/unicorn-6.1.0/lib/unicorn/http_server.rb:634:in `process_client'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/unicorn-6.1.0/lib/unicorn/http_server.rb:739:in `worker_loop'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/unicorn-6.1.0/lib/unicorn/http_server.rb:547:in `spawn_missing_workers'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/unicorn-6.1.0/lib/unicorn/http_server.rb:143:in `start'
/var/www/discourse/vendor/bundle/ruby/3.2.0/gems/unicorn-6.1.0/bin/unicorn:128:in `<top (required)>'
/var/www/discourse/vendor/bundle/ruby/3.2.0/bin/unicorn:25:in `load'
/var/www/discourse/vendor/bundle/ruby/3.2.0/bin/unicorn:25:in `<main>'

Похоже, возникла проблема с конкретным веб-краулером; это не должно затронуть вас. :thinking:

Здесь возникает проблема с кодированием строки user agent краулера в UTF-8, так как она содержит недопустимый байт.
Метод scrub должен это исправить. Возможно, использование параметра :undef поможет здесь:
user_agent.encode("utf-8", :undef => :replace)

image

[51] pry(main)> string = "hello \xa1\x28world\x29".force_encoding("ASCII-8BIT")
=> "hello \xA1(world)"
[52] pry(main)> string.encode('utf-8')
Encoding::UndefinedConversionError: "\xA1" from ASCII-8BIT to UTF-8
from (pry):52:in `encode'
[53] pry(main)> string.encode('utf-8', :undef => :replace)
=> "hello �(world)"
4 лайка

Выглядит хорошо, есть PR?

2 лайка

Исправление объединено. :+1:

4 лайка

Отличная работа! :clap: :smiley: :dragon:

2 лайка

Эта тема была автоматически закрыта через 3 дня. Новые ответы больше не принимаются.