Topic: reset_all_highest exhausts all available disk space

pgcd · 31. Oktober 2024 um 14:00

Während der Arbeit an einem lokalen Container, in den ich Daten aus einem SMF2-Forum mit über 20 Jahren Aktivität importiert habe, bin ich auf einen Showstopper-Bug bei Topic.reset_all_highest gestoßen.
Nach dem Datenimport zeigt meine Datenbank etwa 60.000 reguläre Themen und etwa 400.000 private Nachrichten-Themen an, und die Abfragen in Topic.reset_all_highest verursachen eine Art geometrisches Wachstum der Zeilen, mit dem Ergebnis, dass mein Speicherplatz zur Neige geht (obwohl ich anfangs 120 GB frei hatte).
Ich versuche derzeit, die Abfragen in überschaubare Blöcke aufzuteilen und sie direkt in Postgres auszuführen, aber das ist natürlich suboptimal (und ich bin mir nicht sicher, ob es überhaupt funktioniert und die richtigen Ergebnisse liefert).
Ich habe versucht herauszufinden, ob andere dieses Problem hatten, aber nichts gefunden, daher frage ich mich, ob dies irgendwie mit meinem eigenen Setup zusammenhängen könnte – ich verwende übrigens die neueste Docker-Version.

pfaffman · 31. Oktober 2024 um 15:42

Ich habe kürzlich einen Import von bescheidener Größe durchgeführt, der anscheinend unbegrenzt bei Topic.reset_all_highest hängt und ich musste die Abfrage in Postgres beenden, um fortzufahren. Ich hatte dieses Problem bisher nicht und dachte, dass es vielleicht daran lag, dass mein Postgres-Server überlastet war (er hat eine Reihe von verbundenen Websites).

Mein nächster Schritt war, zu einem anderen Postgres-Server zu wechseln, aber dazu bin ich noch nicht gekommen.

pgcd · 31. Oktober 2024 um 16:44

Nachdem die ersten beiden Teile meines “Split Query”-Experiments reibungslos verliefen (X und Y für öffentliche Themen), habe ich es mit dem Z-Teil versucht, und es fror ein – das heißt, die Abfrage war laut PostgreSQL-Aktivität aktiv und top zeigte den Prozess mit 100% Auslastung an.
Also habe ich mir die SQL noch einmal angesehen und das Problem gefunden: beide Abfragen enden so

      WHERE
        topics.archetype <> 'private_message' AND
        X.topic_id = topics.id AND
        Y.topic_id = topics.id AND
          (
          topics.highest_staff_post_number <> X.highest_post_number OR
          topics.highest_post_number <> Y.highest_post_number OR
          topics.last_posted_at <> Y.last_posted_at OR
          topics.posts_count <> Y.posts_count OR
          topics.word_count <> Z.word_count
        )

(die andere hat natürlich ‘private_message’ als Archetyp)
Was bedeutet, dass der Abfrage fehlt
Z.topic_id = topics.id – was die gesamte geometrische Zunahme verursacht.

Ändern der WHERE-Klausel der Abfragen zu

      WHERE
        topics.archetype <> 'private_message' AND
        X.topic_id = topics.id AND
        Y.topic_id = topics.id AND
        Z.topic_id = topics.id AND
          (
          topics.highest_staff_post_number <> X.highest_post_number OR
          topics.highest_post_number <> Y.highest_post_number OR
          topics.last_posted_at <> Y.last_posted_at OR
          topics.posts_count <> Y.posts_count OR
          topics.word_count <> Z.word_count
        )

hat das Problem für mich behoben.

Soll ich einen PR öffnen?

pfaffman · 31. Oktober 2024 um 18:14

Ich würde sagen ja. Wenn Sie einen Commit finden könnten, der das kaputt gemacht hat, wäre das noch überzeugender.

pgcd · 1. November 2024 um 06:00

Ich habe einen PR dafür geöffnet, mit einigen unglücklichen Einschränkungen (d. h. ich kann mir nicht vorstellen, wie ich diese Änderung testen kann).

github.com/discourse/discourse

FIX: Prevents Topic.reset_all_highest from consuming all resources

main ← pgcd:fixes_reset_all_highest_geometric_growth

opened 05:57AM - 01 Nov 24 UTC

pgcd

+4 -2

This commit fixes an undesirable geometric query resource usage introduced in b…908abe35a0121e7df69ab3bbced259b6a2b7104 I have been unable to figure out a way of testing this usefully (as I fear it would require creating several thousands of objects), but existing tests pass and a manual test with ~400k topics succeeds after the fix, while it would hang indefinitely and/or consume all disk space before the fix. I have reported the initial problem and my findings in https://meta.discourse.org/t/topic-reset-all-highest-exhausts-all-available-disk-space/333837

sam · 3. November 2024 um 21:59

Diese Änderung sieht korrekt aus, ich werde sie zusammenführen.

(Testtechnisch sollte es eine Abdeckung geben und ein einfacher Test wäre ausreichend, um dies zu validieren. Wir müssen nur bestätigen, dass keine Regression auftritt.)

Thema		Antworten	Aufrufe
"Resetting topic counters" takes forever and crashes Migration	1	54	13. Juli 2024
Improving Instance Performance (Megatopics, Database Size and Extreme Load) Self-hosting	60	5831	13. Oktober 2020
PostgreSQL runaway IO Self-hosting	35	3380	3. März 2021
Performance improvements on long topics? Support	29	5650	12. Juli 2018
Unusually high CPU usage Self-hosting	31	1070	18. Februar 2026

Topic: reset_all_highest exhausts all available disk space

Verwandte Themen