"Onebox Assistant", crawl for those previews reliably!

Нет проблем. Давайте разберём это ещё раз.

В стандартной версии Discourse для создания превью onebox сервер Discourse должен иметь возможность видеть и извлекать данные с тегом “og” из метаданных целевой страницы. По сути, это процесс сканирования (краулинга).

Чтобы это сработало, целевой веб-сервер и его системы защиты не должны блокировать такое сканирование.

Похоже, что метаданные не разрешают доступ к этой странице со стороны её защитных механизмов.

Именно поэтому вы изначально рассматривали возможность использования этого плагина.

Этот плагин использует API для получения целевой страницы вместо прямого сканирования.

Это позволяет воспользоваться активностями и мерами управления, которые предпринимает провайдер API, чтобы значительно повысить шансы на получение доступа к контенту (например, используя ферму серверов с IP-адресами высокой репутации для запуска сканирования или даже имитируя просмотр с десктопа).

К сожалению, в данном случае, похоже, что даже у embed.rocks нет прав на сканирование этой страницы, поэтому в этой ситуации плагин не поможет.

Однако, если вы обратитесь в службу поддержки embed.rocks с этой проблемой, они, возможно, смогут найти способы устранения этого блокирования.

В целом этот плагин должен быть полезен, так как он должен обеспечивать лучшее превью onebox по сравнению со стандартной версией Discourse без него, хотя, конечно, вам придётся платить провайдеру API.

Обратите внимание: здесь могут быть и другие проблемы, например, у целевой страницы может отсутствовать качественная миниатюра.

Тем не менее, вы можете использовать инструмент отладки Facebook, чтобы изучить данные, и, насколько я понимаю, всё выглядит хорошо:

Это указывает на то, что проблема сейчас именно в embed.rocks.

Кстати, рост генеративного искусственного интеллекта может заставить платформы контента гораздо тщательнее проверять, кто может видеть их контент, опасаясь, что их материалы бесплатно попадут в чью-то модель.

Надеюсь, всё понятно.

3 лайка