Hallo,
wir haben kürzlich Anubis auf unserem Server bereitgestellt, um ihn vor ressourcenintensiven KI-Crawlern zu schützen. Er sendet eine statische Seite mit dem Titel “Making sure you’re not a bot!” an Anfragen, die mit browserähnlichen User-Agents gesendet werden, führt einen JavaScript-Proof-of-Work durch und leitet dann zur eigentlichen Seite weiter. User-Agents, die nicht “Mozilla” im Namen haben, können die Seite direkt aufrufen.
Jetzt sind die Discourse Onebox-Link-Vorschauen kaputt, aber nur für Inline-Links.
Wenn man sich die Server-Logs ansieht, sendet Discourse zwei verschiedene Arten von User-Agents:
-
Discourse Forum Onebox v3.4.1für große Onebox-Link-Vorschauen (siehelib/onebox/helpers.rb#L217-L226in03f3e84ce520d375aa1c66bb0e95cc5ed9832776) -
Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) AppleWebKit/605.1.15 (KHTML, like Gecko) Version/14.0 Safari/605.1.15für Inline-Link-Vorschauen (siehelib/final_destination.rb#L40in03f3e84ce520d375aa1c66bb0e95cc5ed9832776)
Ich habe “Force custom user agent hosts” in den Admin-Einstellungen ausprobiert, was besagt “Hosts, für die der benutzerdefinierte Onebox-User-Agent bei allen Anfragen verwendet werden soll.”, aber es hat keinen Unterschied gemacht.
Ich habe auch versucht, die versteckte Einstellung onebox_user_agent zu ändern, aber das ändert nur den User-Agent der regulären Onebox-Link-Vorschau, nicht den für Inline-Links.
Das sieht für mich wie ein Fehler aus. Wäre es nicht sinnvoller, denselben konfigurierbaren Discourse Forum Onebox-User-Agent auch für Inline-Link-Vorschauen zu verwenden?
Danke!