Последние проблемы с Onebox

Наши пользователи жалуются, что недавно Onebox не работает для некоторых сайтов, включая The New York Times и The Washington Post. Недавно ли в Onebox произошли изменения? См. ссылки ниже. Первая ссылка — это подарочная ссылка.

https://www.nytimes.com/2024/07/10/magazine/food-documentaries-health.html?unlocked_article_code=1.6U0.pZE2.lK4MeFMWelpV&smid=url-share

https://www.nytimes.com/2024/07/10/magazine/food-documentaries-health.html

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/?itid=hp_ts-1-sallys-mix_p001_f008

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/

1 лайк

Работал ли когда-нибудь onebox с paywall :thinking:

1 лайк

Я заметил, что в последнее время появляется много прямых URL-ссылок. Сначала я думал, что это проблема самих сайтов, но теперь мне кажется, что дело может быть в чём-то большем :man_shrugging:

1 лайк

Недавно я добавил поддержку приватных onebox для GitHub, но это не должно влиять на другие сайты. Как правило, мы не можем создавать onebox для сайтов с платным доступом или приватных сайтов:

Эти ссылки также не отображаются у меня, но ошибка видна в предпросмотре:

https://www.nytimes.com/2024/07/10/magazine/food-documentaries-health.html

https://www.washingtonpost.com/wellness/2024/07/16/nonstick-pans-pfas-teflon-flu/?itid=hp_ts-1-sallys-mix_p001_f008

3 лайка

Я недавно заметил некоторые странности в Stable. Когда я публикую ссылки из других экземпляров Discourse (Tests-passed), иногда, казалось бы, случайно, ссылка не превращается в onebox.

Я не пробовал публиковать ссылки из своего стабильного форума на форум Tests-passed.

Я пробовал пересобрать HTML, но это не помогло превратить ссылку в onebox.

Кажется, я помню, что здесь (на Meta) была ещё одна тема, где я опубликовал скриншот.

1 лайк

Нам нужны чёткие примеры ссылок, которые, по вашему мнению, должны были приводить к отображению одной карточки, но этого не сделали.

2 лайка

Эта ссылка на The New York Times сегодня не отображается в виде одной карточки:
https://www.nytimes.com/2022/03/10/dining/chowhound-closing.html#commentsContainer

Но в 2022 году на нашем форуме она отображалась в виде одной карточки. Смотрите первый пост.

Аналогично, эта ссылка на The Washington Post сегодня не отображается в виде одной карточки:
https://wapo.st/3J0aTO8

Но в марте этого года на нашем форуме она отображалась в виде одной карточки. Смотрите 33-й пост.

2 лайка

Похоже, сейчас он закрыт платным доступом

2 лайка

The New York Times и The Washington Post всегда были платными изданиями. Хотя я не знаю, меняли ли они недавно структуру своих платных ограничений.

Однако, если мне можно предложить: если проблема в платном доступе и если на странице с ограниченным доступом визуально видны заголовок статьи и подпись, не должна ли функция onebox уметь извлекать эту информацию?

3 лайка

Да, я в целом согласен с этим. Я посмотрел исходный код страницы, и кажется, что у нас достаточно информации, чтобы что-то показать.

2 лайка

The New York Times ввёл платный доступ в 2011 году. Однако некоторое время он позволял читать несколько статей без регистрации и привязки банковской карты — если я правильно помню, пять. В то же время он разрешал индексацию и просмотр через Google. Более новая система полностью блокирует доступ, и после конфликта с Google компания полностью прекратила бесплатное чтение.

Могло ли отключение oneboxing произойти в то же время?

2 лайка

Как я могу самостоятельно определить, что это такое?

У меня есть сайт, который не поддерживает onebox. Могу ли я что-то добавить к нему, чтобы это работало?

1 лайк

Вам стоит прочитать эту тему: Configuring and troubleshooting oneboxes

3 лайка

Вот ссылка на мой форум Stable Discourse со ссылками с другого экземпляра Discourse, где проходит тестирование:

https://community.openmr.com/t/apple-vision-pros-launch/41419/254?u=heliosurge

Вот скриншоты из этой темы: 1 xrtropolis — нет, ни одной коробки, а в более поздних сообщениях одна коробка — всё в порядке.

1 лайк

Будет ли команда рассматривать возможность добавления этой функции для Onebox, включая доступные детали для сайтов с платным доступом?

На 95% уверен, что onebox уже это делает. Если информации для отображения onebox’а достаточно, он её обязательно покажет, даже если контент в итоге закрыт платным доступом.

Я думаю, что дело в том, что эти сайты с платным доступом добавляют onebox в denylist из-за недавних краулеров/агентов LLM, поэтому он видит не тот же HTML, который мы могли бы увидеть в браузере.

Хотя я с радостью признаю свою ошибку. Если кто-то хочет быстро взглянуть и посмотреть, можно ли это как-то улучшить, pr-welcome :wink:

1 лайк

Эта тема была автоматически закрыта через 30 дней после последнего ответа. Новые ответы больше не принимаются.