Wiederherstellung schlägt wegen Speicherplatz auf Migration fehl, verursacht durch 70 Mio. Kalenderereignisse

pfaffman · 9. Februar 2026 um 19:36

Ich habe eine Standardinstallation, die versucht, eine Datenbank wiederherzustellen. Die Migration schlägt fehl.


ALTER TABLE
Datenbank wird migriert...
EXCEPTION: rake db:migrate
Datenbankmigration fehlgeschlagen.
rake abgebrochen!
StandardError: Ein Fehler ist aufgetreten, diese und alle späteren Migrationen wurden abgebrochen: (StandardError)

PG::DiskFull: ERROR:  konnte nicht in Datei „base/pgsql_tmp/pgsql_tmp11009.51“ schreiben: Kein Speicherplatz mehr auf dem Gerät
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rack-mini-profiler-4.0.1/lib/patches/db/pg/alias_method.rb:109:in `exec'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/rack-mini-profiler-4.0.1/lib/patches/db/pg/alias_method.rb:109:in `async_exec'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activerecord-8.0.4/lib/active_record/connection_adapters/postgresql/database_state
ments.rb:167:in `perform_query'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activerecord-8.0.4/lib/active_record/connection_adapters/abstract/database_stateme
nts.rb:556:in `block (2 levels) in raw_execute'
/var/www/discourse/vendor/bundle/ruby/3.3.0/gems/activerecord-8.0.4/lib/active_record/connection_adapters/abstract_adapter.rb:1017:in `block in with_raw_connection'

Auf der Festplatte sind noch 90 GB frei. Auf der Quellfestplatte ist das Postgres-Verzeichnis nur 23 GB groß.

Wie kann eine 23 GB große Datenbank bei der Datenbankmigration fehlschlagen, wenn noch 90 GB frei sind?

Quelle – Serverversion: 3.5.0.beta5-dev (Commit: b16fb6a60b3f1db475cbb91a51b7d4c734370083 — 7. Mai 2025)

Zielserverversion: 2026.2.0-latest (Commit: b39866eb8891648a54764755e2e36eb725bd6c73 — vor 4 Tagen)

23G     /var/discourse/shared/standalone/postgres_data/

pfaffman · 11. Februar 2026 um 00:55

-rw-r--r-- 1 discourse discourse  16G Feb 10 21:13 site-2026-02-10-174058-v20250507013646.sql
-rw-r--r-- 1 discourse discourse 2.9G Feb 10 21:11 site-2026-02-10-174058-v20250507013646.sql.gz

root@forum-data:/shared# # nach dem Löschen
root@forum-data:/shared# du -hs postgres_data/; df -h .
24G     postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G   87G   68G  56% /shared
....
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G  154G  607M 100% /shared
overlay         154G  154G  607M 100% /
91G     postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G  154G   82M 100% /shared
overlay         154G  154G   82M 100% /
1.1G    postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G   65G   90G  42% /shared
overlay         154G   65G   90G  42% /
1.1G    postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G   65G   90G  42% /shared
overlay         154G   65G   90G  42% /
1.1G    postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G   65G   90G  42% /shared
overlay         154G   65G   90G  42% /
1.1G    postgres_data/
Dateisystem      Größe Benutzt Verf. Verw% Eingehängt auf
/dev/vda1       154G   65G   90G  42% /shared
overlay         154G   65G   90G  42% /
1.1G    postgres_data/

pfaffman · 11. Februar 2026 um 15:27

Nachdem die Datenbank wiederhergestellt war, betrug postgres_data 24G.

Etwas in der Migration ließ postgres_data auf 91G aufblähen, bevor die Festplatte voll war und die Wiederherstellung fehlschlug. Dies geschieht bei einer sauberen Installation mit den oben gezeigten Discourse-Versionen.

Das scheint ein Fehler zu sein, daher kategorisiere ich neu. Ich habe dies auch gesehen, als ich versuchte, ein Upgrade durchzuführen. Ich dachte bei diesem Upgrade, dass eine Lösung darin bestehen würde, auf einen neuen Server umzuziehen, aber jetzt sehe ich, dass das nicht funktionieren wird.

Ich denke, das Nächste, was ich tun werde, ist zu versuchen herauszufinden, welche Abfrage dies verursacht und/oder welche Tabelle es ist. Ich bin mir nicht ganz sicher, wie ich das angehen soll.

sam · 11. Februar 2026 um 23:44

Ich gebe dies an den Support weiter, diese Meldung kommt direkt vom Dateisystem. Wenn PG denkt, es habe keinen Speicherplatz, hat es wahrscheinlich keinen, weil nicht genug dafür reserviert wurde.

pfaffman · 12. Februar 2026 um 03:06

Haben Sie irgendwelche Hinweise darauf, wie eine 24G-Datenbank während der Datenbankmigration auf 90G anwachsen könnte?

sam · 12. Februar 2026 um 03:39

nicht sicher.. Ich würde wahrscheinlich ncdu oder etwas Ähnliches ausführen und nachsehen, wann die Situation eingetreten ist.

pfaffman · 12. Februar 2026 um 14:20

Mit du und df habe ich beobachtet, wie die Größe von postgres_data von 25 GB auf 90 GB anwuchs und der Speicherplatz auf der Festplatte (nahezu) Null wurde, bevor es fehlschlug.

Ich schätze, ich muss herausfinden, wie ich das nächste Mal verfolgen kann, welche Abfrage läuft.

Ich habe dies auf mindestens zwei Websites gesehen. Eine bei einem Upgrade und eine bei einer Wiederherstellung. Beide hatten zu Beginn mehr freien Speicherplatz als die Größe der Datenbank.

Falco · 12. Februar 2026 um 16:02

Eine Reihe von Migrationen schreibt ganze Tabellen neu, was vorübergehend mehr Speicherplatz beanspruchen kann, und PostgreSQL gibt den Speicherplatz nicht aggressiv an das System zurück.

Hat dieses Forum KI mit Einbettungen aktiviert?

pfaffman · 12. Februar 2026 um 18:52

Ich dachte so etwas in der Art. . .

Das scheint ein wahrscheinlicher Grund zu sein. . . . seufz. Nein. Es ist nicht einmal das KI-Plugin installiert.

Falco · 12. Februar 2026 um 18:55

Wenn Sie tief in die Materie eintauchen möchten, könnten Sie es manuell auf eine Entwicklungsumgebung wiederherstellen, die sich beim Commit vom Mai 2025 befindet, dann zum aktuellen Commit gehen und die Migrationen eine nach der anderen ausführen und den Platz davor und danach jeweils ausgeben — natürlich mit einem Skript .

pfaffman · 14. Februar 2026 um 18:06

OK. Ich führe eine Wiederherstellung auf einer Produktionsseite durch. Sie wird migriert.

Hier ist eine Abfrage, die seit 30 Minuten läuft:

discourse=# SELECT pid, usename, state, query, query_start
FROM pg_stat_activity
WHERE state = 'active';
 pid |  usename  | state  |                                                    query                                                     |          query_start
-----+-----------+--------+--------------------------------------------------------------------------------------------------------------+-------------------------------
 519 | postgres  | active | SELECT pid, usename, state, query, query_start                                                              +| 2026-02-14 17:58:35.473337+00
     |           |        | FROM pg_stat_activity                                                                                       +|
     |           |        | WHERE state = 'active';                                                                                      |
 308 | discourse | active | DELETE                                                                                                      +| 2026-02-14 17:26:08.12598+00
     |           |        |   FROM calendar_events ce                                                                                   +|
     |           |        | WHERE                                                                                                       +|
     |           |        |   ce.id IN (SELECT DISTINCT(ce3.id) FROM calendar_events ce2                                                +|
     |           |        |             LEFT JOIN calendar_events ce3 ON ce3.user_id = ce2.user_id AND ce3.description = ce2.description+|
     |           |        |             WHERE ce2.start_date >= (ce3.start_date - INTERVAL '1 days')                                    +|
     |           |        |               AND ce2.start_date <= (ce3.start_date + INTERVAL '1 days')                                    +|
     |           |        |               AND ce2.timezone IS NOT NULL                                                                  +|
     |           |        |               AND ce3.timezone IS NULL                                                                      +|
     |           |        |               AND ce3.id != ce2.id                                                                          +|
     |           |        |               AND ce2.post_id IS NULL                                                                       +|
     |           |        |               AND ce3.post_id IS NULL                                                                       +|
     |           |        |   )                                                                                                         +|
     |           |        |                                                                                                              |
(2 rows)

Das stammt von hier:

github.com/discourse/discourse

plugins/discourse-calendar/db/migrate/20231124021939_delete_similar_holidays.rb

main

# frozen_string_literal: true

class DeleteSimilarHolidays < ActiveRecord::Migration[7.0]
  def up
    execute <<~SQL
      DELETE
        FROM calendar_events ce
      WHERE
        ce.id IN (SELECT DISTINCT(ce3.id) FROM calendar_events ce2
                  LEFT JOIN calendar_events ce3 ON ce3.user_id = ce2.user_id AND ce3.description = ce2.description
                  WHERE ce2.start_date >= (ce3.start_date - INTERVAL '1 days')
                    AND ce2.start_date <= (ce3.start_date + INTERVAL '1 days')
                    AND ce2.timezone IS NOT NULL
                    AND ce3.timezone IS NULL
                    AND ce3.id != ce2.id
                    AND ce2.post_id IS NULL
                    AND ce3.post_id IS NULL
        )
    SQL
  end

This file has been truncated. show original

Das zeigt, dass die neueste Migration später ist, aber ich nehme an, das liegt daran, dass diese Migration von einem Plugin stammt, das gerade hinzugefügt wurde;.

discourse=# SELECT version FROM schema_migrations ORDER BY version DESC LIMIT 1;
    version
----------------
 20250507013646
(1 row)

Es gibt eine Menge Kalenderereignisse!!! 69.724.384!

discourse=# select count(*) from calendar_events;
  count
----------
 69724384
(1 row)

Also, ich denke, das ist das Problem.

. . . aber sie haben nicht einmal discourse_calendar auf der Quellseite installiert!?

Aber sie haben diese Anzahl von Ereignissen in der Tabelle calendar_events auf der Quellseite. . . .

Thema		Antworten	Aufrufe
Restore Failing - Check Free Disk Space Installation server-resources	11	1660	19. Januar 2021
Problem with restore Discourse from backup (3.4, quite large DB) Support	18	259	14. Januar 2025
Testing Restore - not working Installation backups	4	403	22. August 2023
Database issues migrating form old version 20150822141540 Installation	14	998	22. Oktober 2022
Restore to New Host Support	13	593	15. Januar 2026

Wiederherstellung schlägt wegen Speicherplatz auf Migration fehl, verursacht durch 70 Mio. Kalenderereignisse

Quelle – Serverversion: 3.5.0.beta5-dev (Commit: b16fb6a60b3f1db475cbb91a51b7d4c734370083 — 7. Mai 2025)

Zielserverversion: 2026.2.0-latest (Commit: b39866eb8891648a54764755e2e36eb725bd6c73 — vor 4 Tagen)

Verwandte Themen