Rebake nach CDN-Änderung hat alte Beiträge verpasst

Der Discourse-Administrator hat mich kürzlich darauf hingewiesen, dass ich in Erwägung ziehen sollte, ein CDN zu nutzen, anstatt Inhalte direkt von S3 auszuliefern. Ich hatte das in der Vergangenheit bereits erwogen, doch die Kosten schienen für unsere kleine Community zu hoch und unnötig. Jetzt sehe ich, dass die Kosten deutlich niedriger sind, und habe es eingerichtet. Ich habe einen Cloudfront-Distribution-Punkt für den bestehenden Bucket erstellt und dann dessen URL in Discourse hinzugefügt. Anschließend habe ich eine vollständige Neubearbeitung (Rebake) durchgeführt.

Die Neubearbeitung wurde erfolgreich und ohne Fehler ausgeführt. Das Erstellen neuer Beiträge funktioniert einwandfrei und nutzt das CDN. Beiträge, die neuer als etwa 2018 sind (ich habe das genaue Stichtagsdatum nicht überprüft), wurden korrekt aktualisiert und verweisen nun auf das CDN. Doch Beiträge von 2017 und älter scheinen nicht tatsächlich neu bearbeitet worden zu sein. Sie enthalten weiterhin URLs, die direkt auf den S3-Bucket verweisen. Ich möchte diese Beiträge korrekt neu bearbeiten lassen, damit ich den öffentlichen Zugriff auf den S3-Bucket deaktivieren kann, ohne befürchten zu müssen, dass dadurch etwas kaputtgeht.

Ich bin mir nicht sicher, was ich sonst noch tun kann. Haben Sie Ideen? Danke.

Oh warte, halt mal. Ich glaube, ich weiß, was das Problem ist, ich muss es nur noch bestätigen.

Wenn du rake posts:rebake ausführst, werden dann tatsächlich alle Beiträge sofort neu aufbereitet, oder werden lediglich Jobs in Sidekiq eingereiht, die dann die eigentliche Neubearbeitung vornehmen? Mir ist aufgefallen, dass ich jetzt eine riesige Ansammlung von Jobs::PullHotlinkedImages in der Warteschlange habe, was ziemlich Sinn ergibt. Wenn nach dem Leerräumen der Warteschlange noch Beiträge sind, die neu aufbereitet werden müssen, dann habe ich wohl ein Problem. Ansonsten ist alles in Ordnung.

Ja, das ist korrekt – es handelt sich um einen Hintergrundprozess, der in der Reihenfolge von neuesten Beiträgen zu ältesten Beiträgen abgearbeitet wird, sodass die neuesten Beiträge zuerst verarbeitet werden und dann der große Rückstand an älteren Beiträgen folgt.