Wiederherstellung schlägt fehl: Mögliches Problem mit Data Explorer

Mark_Schmucker · 30. November 2019 um 03:02

Ich habe ein funktionierendes Forum und möchte einige Dinge sehen, die vor ein paar Tagen durcheinandergeraten sind. Ich bin bei AWS, also erstelle ich ein AMI des funktionierenden Forums, starte eine neue Instanz und versuche, ein Backup von vor ein paar Tagen wiederherzustellen. Das schlägt mit den unten stehenden Meldungen fehl.

Es kann kein Versions- oder Schemamismatch sein, da der Server aus einem frischen Image des funktionierenden Forums erstellt wurde.

Ich habe es mit einem Neuaufbau versucht.

Ich habe versucht, ein Backup von nur einem Tag zuvor wiederherzustellen – dasselbe Ergebnis.

Das Einzige, was ich Seltsames getan habe, ist, dass ich PDF-Dateien aus dem Upload-Verzeichnis (…/uploads/original/1X/*.pdf) gelöscht habe, um etwas Platz zu schaffen. Ich werde es ohne diesen Schritt noch einmal versuchen, aber es scheint unwahrscheinlich, dass dies der Übeltäter ist.

> [2019-11-30 01:17:44] 'admin' hat die Wiederherstellung gestartet!
> [2019-11-30 01:17:44] Markiere Wiederherstellung als laufend...
> [2019-11-30 01:17:44] Stelle sicher, dass /var/www/discourse/tmp/restores/default/2019-11-30-011744 existiert...
> [2019-11-30 01:17:44] Lade Archiv in das tmp-Verzeichnis herunter...
> [2019-11-30 01:23:24] Entpacke Archiv, das kann eine Weile dauern...
> [2019-11-30 01:27:52] Keine Metadatendatei zum Extrahieren vorhanden.
> [2019-11-30 01:27:52] Validiere Metadaten...
> [2019-11-30 01:27:52]   Aktuelle Version: 20191129144706
> [2019-11-30 01:27:52]   Wiederherzustellende Version: 20191120015344
> [2019-11-30 01:27:52] Extrahiere Dump-Datei...
> [2019-11-30 01:50:57] ungültiger Befehl \N
> [2019-11-30 01:50:57] ungültiger Befehl \N
> 
> 
> < wiederholt sich etwa 100 Mal >
> 
> [2019-11-30 01:51:07] ungültiger Befehl \N
> [2019-11-30 01:54:13] ungültiger Befehl \N
> [2019-11-30 01:54:13] AUSNAHME: psql ist fehlgeschlagen
> [2019-11-30 01:54:14] /var/www/discourse/lib/backup_restore/restorer.rb:331:in `restore_dump'
> /var/www/discourse/lib/backup_restore/restorer.rb:75:in `run'
> /var/www/discourse/lib/backup_restore.rb:166:in `block in start!'
> /var/www/discourse/lib/backup_restore.rb:163:in `fork'
> /var/www/discourse/lib/backup_restore.rb:163:in `start!'
> /var/www/discourse/lib/backup_restore.rb:22:in `restore!'
> /var/www/discourse/app/controllers/admin/backups_controller.rb:119:in `restore'
> usw...

RGJ · 30. November 2019 um 06:41

Dennoch ist der Fehler invalid command \N typisch für ein Postgres-Versionsmismatch…

Mark_Schmucker · 30. November 2019 um 07:01

root@example:/var/www/discourse# psql --version
psql (PostgreSQL) 10.10 (Debian 10.10-1.pgdg100+1)

Auf dem neuen Server ist dieselbe Version installiert, und das Forum funktioniert.

pfaffman · 30. November 2019 um 12:05

Ich verbinde diese Fehler zwar mit einer Übereinstimmung der PostgreSQL-Version, aber ich habe diese \N-Fehler vor kurzem auf einem System gesehen, dem der Speicherplatz ausgegangen war (ich stellte eine Sicherung auf demselben System wieder her, von dem sie erstellt wurde). Ich habe die Diagnose des Problems nicht abgeschlossen (es war ein anderes bizarres Problem, das ich hatte, und das Wiederherstellen einer Sicherung auf einem anderen Server hat das Problem gelöst; ich habe mich gefragt, ob das Wiederherstellen auf demselben Server das Problem ebenfalls gelöst hätte).

Sie haben erwähnt, dass Ihnen der Speicherplatz ausgeht. Ich vermute, dass dies das Problem ist. Beim Wiederherstellen wird viel Speicherplatz benötigt, da die Sicherung entpackt wird. Dadurch liegen zwei vollständige Kopien der Sicherung vor, plus der Speicherplatz, der für die Wiederherstellung und für die Möglichkeit einer Rückgängigmachung bei einem Fehler benötigt wird.

RGJ · 30. November 2019 um 14:59

Also dauert es 23 Minuten, bis es fehlschlägt?

Mark_Schmucker · 1. Dezember 2019 um 00:23

Es wird noch schlimmer, aber vielleicht näher am eigentlichen Problem… Unter der Hypothese, dass ich mehr Festplattenspeicher benötige, habe ich eine neue Instanz aus meinem Image erstellt, dieses Mal mit 100 GB im Vergleich zu den vorherigen 50 GB. (Backups sind jeweils 5 GB groß und werden auf S3 gespeichert.) Diesmal erhielt ich eine explizite Fehlermeldung: „No space left on device

RGJ · 1. Dezember 2019 um 07:42

[quote=“Mark_Schmucker, Beitrag: 6, Thema: 134734”]
Dieses Mal habe ich eine explizite Fehlermeldung erhalten: „No space left on device

Mark_Schmucker · 1. Dezember 2019 um 07:56

df -i
Dateisystem Inodes IUsed IFree IUse% Gemountet auf
devtmpfs 252562 437 252125 1% /dev
tmpfs 255203 1 255202 1% /dev/shm
/dev/xvda1 6553600 737194 5816406 12% /

Ich bin da etwas überfordert, aber ich vermute, das ist nicht schlimm?

RGJ · 1. Dezember 2019 um 08:14

Nein, das ist in Ordnung.

‘No space left on device’ tritt nicht nur auf, wenn ein Gerät keine Gigabytes mehr hat, sondern auch, wenn das Dateisystem keine Inodes mehr hat. Aber das ist hier eindeutig nicht das Problem. (iUse% wäre dann bei 100 %).

Mark_Schmucker · 7. Dezember 2019 um 05:30

Immer noch keine Lösung. Ich dachte, ich würde es mit einer Wiederherstellung auf einer neuen Lightsail-Instanz versuchen, anstatt ein AMI meiner funktionierenden EC2-Instanz zu starten. Es schlägt immer noch fehl, aber die Fehlermeldungen sind etwas anders.

Sowohl die alte als auch die neue Instanz sind auf dem neuesten Stand, beide sind Standard-Docker-Installationen, und beide verwenden dieselbe PostgreSQL-Version:

psql --version
psql (PostgreSQL) 10.10 (Debian 10.10-1.pgdg100+1)

Ist das normal:

Creating missing functions in the discourse_functions schema
Cannot restore into different schema, restoring in-place

Könnte es an Plugins liegen? Auf der „Quellseite“ sind mehrere Plugins installiert, sowohl unterstützte als auch benutzerdefinierte. Einige verwenden benutzerdefinierte Benutzerfelder. Ich habe versucht, auf saubere „Zielseiten“ mit und ohne Plugins wiederherzustellen.

Gibt es Hinweise, wie man beginnt, die Schemata zu vergleichen?

> [2019-12-07 04:51:36] 'admin' hat die Wiederherstellung gestartet!
> [2019-12-07 04:51:36] Markiere Wiederherstellung als läuft...
> [2019-12-07 04:51:36] Stelle sicher, dass /var/www/discourse/tmp/restores/default/2019-12-07-045136 existiert...
> [2019-12-07 04:51:36] Lade Archiv in tmp-Verzeichnis herunter...
> [2019-12-07 04:53:49] Entpacke Archiv, das kann eine Weile dauern...
> [2019-12-07 04:57:12] Keine Metadatendatei zum Extrahieren vorhanden.
> [2019-12-07 04:57:12] Validiere Metadaten...
> [2019-12-07 04:57:12]   Aktuelle Version: 20191129144706
> [2019-12-07 04:57:12]   Wiederhergestellte Version: 20191120015344
> [2019-12-07 04:57:12] Extrahiere Dump-Datei...
> [2019-12-07 04:59:10] Erstelle fehlende Funktionen im discourse_functions-Schema
> [2019-12-07 04:59:11] Kann nicht in ein anderes Schema wiederherstellen, stelle direkt wieder her
> [2019-12-07 05:05:02] ERROR: current transaction is aborted, commands ignored until end of transaction block
> [2019-12-07 05:05:03] ERROR: current transaction is aborted, commands ignored until end of transaction block
> < wiederholt sich etwa 100 Mal >
> [2019-12-07 05:05:03] ERROR: current transaction is aborted, commands ignored until end of transaction block
> [2019-12-07 05:05:03] EXCEPTION: psql failed
> [2019-12-07 05:05:03] /var/www/discourse/lib/backup_restore/restorer.rb:331:in `restore_dump'
> /var/www/discourse/lib/backup_restore/restorer.rb:75:in `run'
> /var/www/discourse/lib/backup_restore.rb:166:in `block in start!'
> /var/www/discourse/lib/backup_restore.rb:163:in `fork'
> /var/www/discourse/lib/backup_restore.rb:163:in `start!'
> /var/www/discourse/lib/backup_restore.rb:22:in `restore!'
> /var/www/discourse/app/controllers/admin/backups_controller.rb:119:in `restore'
> < Rest des Tracebacks >

RGJ · 7. Dezember 2019 um 05:49

Ja, das ist normal.

In PostgreSQL läuft eindeutig etwas schief. Hast du einen Blick in die Logs geworfen?

Weit hergeholt: Könnte dies speicherbezogen sein? Kannst du versuchen, die Ausgabe von free -m während der Wiederherstellung zu überwachen und zu prüfen, ob der (virtuelle) Speicher erschöpft ist?

Mark_Schmucker · 7. Dezember 2019 um 06:31

Ich weiß, dass es eine schwierige Frage ist, da wir nicht wissen, worin das Problem besteht, aber sollte ich die Plugins im Allgemeinen vor dem Versuch der Wiederherstellung auf der Zielseite installieren? Oder lädt und erstellt die Wiederherstellung die Plugins automatisch?

RGJ · 7. Dezember 2019 um 06:55

Ja, das solltest du – die Wiederherstellung übernimmt das nicht für dich.

Andererseits glaube ich nicht, dass dies dein Problem ist, da die Wiederherstellung doch für die korrekte Datenbankstruktur sorgt (einschließlich pluginspezifischer Dinge).

Mark_Schmucker · 7. Dezember 2019 um 07:58

Ich habe eine neue Lightsail-Instanz für 20 $ mit 4 GB Speicher erstellt. Ich habe während der Wiederherstellung „free -m

RGJ · 7. Dezember 2019 um 08:18

Ich denke, #1 ist nicht fatal und lediglich eine Nebenwirkung der Wiederherstellung am selben Ort.

Du könntest in Betracht ziehen, alle Data-Explorer-Abfragen zu exportieren und zu löschen sowie das Data-Explorer-Plugin vor der Erstellung deines Backups zu entfernen.

Alternativ könntest du den relevanten Inhalt der Tabelle plugin_store_rows hier posten?

Mark_Schmucker · 7. Dezember 2019 um 22:40

Es gibt tatsächlich doppelte Abfragen mit doppelten (plugin_name, key)-Paaren, z. B. q:-11 und q:-2, aber eindeutigen IDs. Ich erkenne kein Muster bei den Duplikaten; sie sind beispielsweise nicht meine Lieblingsabfragen oder ähnliches.

Mein nächster Schritt wird daher sein, die Duplikate zu entfernen, ein Backup zu erstellen und dann von diesem wiederherzustellen.

SELECT id, plugin_name, key from plugin_store_rows
WHERE plugin_name = ‘discourse-data-explorer’
ORDER BY key

id plugin_name key

1138 discourse-data-explorer q:-1

1136 discourse-data-explorer q:-10

813 discourse-data-explorer q:10

1142 discourse-data-explorer q:-11

1397 discourse-data-explorer q:-11

825 discourse-data-explorer q:11

889 discourse-data-explorer q:13

1004 discourse-data-explorer q:14

1005 discourse-data-explorer q:15

1043 discourse-data-explorer q:17

1044 discourse-data-explorer q:18

514 discourse-data-explorer q:-2

1249 discourse-data-explorer q:-2

764 discourse-data-explorer q:2

1053 discourse-data-explorer q:21

1066 discourse-data-explorer q:22

1082 discourse-data-explorer q:23

1097 discourse-data-explorer q:24

1131 discourse-data-explorer q:26

1132 discourse-data-explorer q:27

1134 discourse-data-explorer q:28

1135 discourse-data-explorer q:29

775 discourse-data-explorer q:3

1137 discourse-data-explorer q:30

1140 discourse-data-explorer q:31

1141 discourse-data-explorer q:32

1143 discourse-data-explorer q:33

1149 discourse-data-explorer q:34

1155 discourse-data-explorer q:35

1156 discourse-data-explorer q:36

1157 discourse-data-explorer q:37

1158 discourse-data-explorer q:38

1161 discourse-data-explorer q:39

513 discourse-data-explorer q:-4

777 discourse-data-explorer q:4

1211 discourse-data-explorer q:40

1215 discourse-data-explorer q:41

1223 discourse-data-explorer q:42

1224 discourse-data-explorer q:43

1225 discourse-data-explorer q:44

1226 discourse-data-explorer q:45

1269 discourse-data-explorer q:46

1272 discourse-data-explorer q:47

1273 discourse-data-explorer q:48

1274 discourse-data-explorer q:49

1279 discourse-data-explorer q:50

1281 discourse-data-explorer q:51

1282 discourse-data-explorer q:52

1301 discourse-data-explorer q:53

1349 discourse-data-explorer q:54

1369 discourse-data-explorer q:55

1373 discourse-data-explorer q:56

1384 discourse-data-explorer q:57

1387 discourse-data-explorer q:58

1396 discourse-data-explorer q:59

1222 discourse-data-explorer q:-6

1348 discourse-data-explorer q:-6

781 discourse-data-explorer q:6

763 discourse-data-explorer q:-7

782 discourse-data-explorer q:7

515 discourse-data-explorer q:-8

791 discourse-data-explorer q:8

1139 discourse-data-explorer q:-9

798 discourse-data-explorer q:9

507 discourse-data-explorer q:_id

Mark_Schmucker · 7. Dezember 2019 um 22:56

Wie kann ich eigentlich die Duplikate löschen? Alle drei gehören dem „system

Mark_Schmucker · 7. Dezember 2019 um 23:02

Das Muster wurde gefunden. Wenn ich eine vom System gehaltene Abfrage ausführe, wird ein Duplikat erstellt, was offenbar die Wiederherstellung unterbricht.

Mark_Schmucker · 7. Dezember 2019 um 23:55

Ich kann das auf einer sauberen Testumgebung nicht nachstellen, aber es tritt auf meiner Produktionsumgebung konsequent auf. Ich habe alle Produktions-Plugins auf der Testumgebung installiert, kann es aber immer noch nicht reproduzieren.

Wie kann ich herausfinden, was mit meiner Produktionsumgebung nicht stimmt?
Wie kann ich die doppelten Abfragen entfernen, da sie vom System verwaltet werden? Muss ich sudo -u postgres psql discourse... ausführen? Das klingt beängstigend.

riking · 8. Dezember 2019 um 01:33

Damit die Sicherung wiederhergestellt werden kann, können Sie wahrscheinlich die doppelten Zeilen aus der gesicherten SQL-Datei löschen.

Es ist möglich, dass der Entwickler-Datenbank aus irgendeinem Grund dieser Index fehlt?

Thema		Antworten	Aufrufe
Can't restore due to corrupt indexes (with some clues on how to deal with corrupt indexes) Self-hosting	12	4800	6. Januar 2020
Error when restore DB backup Self-hosting	25	1939	23. August 2018
Restore problem: relation "theme_fields" does not exist Self-hosting	10	2870	5. Juni 2020
Problem with restore Discourse from backup (3.4, quite large DB) Support	17	366	14. Januar 2025
Error Restoring Backup on Migration Bug	40	4902	14. Januar 2020

id	plugin_name	key
1138	discourse-data-explorer	q:-1
1136	discourse-data-explorer	q:-10
813	discourse-data-explorer	q:10
1142	discourse-data-explorer	q:-11
1397	discourse-data-explorer	q:-11
825	discourse-data-explorer	q:11
889	discourse-data-explorer	q:13
1004	discourse-data-explorer	q:14
1005	discourse-data-explorer	q:15
1043	discourse-data-explorer	q:17
1044	discourse-data-explorer	q:18
514	discourse-data-explorer	q:-2
1249	discourse-data-explorer	q:-2
764	discourse-data-explorer	q:2
1053	discourse-data-explorer	q:21
1066	discourse-data-explorer	q:22
1082	discourse-data-explorer	q:23
1097	discourse-data-explorer	q:24
1131	discourse-data-explorer	q:26
1132	discourse-data-explorer	q:27
1134	discourse-data-explorer	q:28
1135	discourse-data-explorer	q:29
775	discourse-data-explorer	q:3
1137	discourse-data-explorer	q:30
1140	discourse-data-explorer	q:31
1141	discourse-data-explorer	q:32
1143	discourse-data-explorer	q:33
1149	discourse-data-explorer	q:34
1155	discourse-data-explorer	q:35
1156	discourse-data-explorer	q:36
1157	discourse-data-explorer	q:37
1158	discourse-data-explorer	q:38
1161	discourse-data-explorer	q:39
513	discourse-data-explorer	q:-4
777	discourse-data-explorer	q:4
1211	discourse-data-explorer	q:40
1215	discourse-data-explorer	q:41
1223	discourse-data-explorer	q:42
1224	discourse-data-explorer	q:43
1225	discourse-data-explorer	q:44
1226	discourse-data-explorer	q:45
1269	discourse-data-explorer	q:46
1272	discourse-data-explorer	q:47
1273	discourse-data-explorer	q:48
1274	discourse-data-explorer	q:49
1279	discourse-data-explorer	q:50
1281	discourse-data-explorer	q:51
1282	discourse-data-explorer	q:52
1301	discourse-data-explorer	q:53
1349	discourse-data-explorer	q:54
1369	discourse-data-explorer	q:55
1373	discourse-data-explorer	q:56
1384	discourse-data-explorer	q:57
1387	discourse-data-explorer	q:58
1396	discourse-data-explorer	q:59
1222	discourse-data-explorer	q:-6
1348	discourse-data-explorer	q:-6
781	discourse-data-explorer	q:6
763	discourse-data-explorer	q:-7
782	discourse-data-explorer	q:7
515	discourse-data-explorer	q:-8
791	discourse-data-explorer	q:8
1139	discourse-data-explorer	q:-9
798	discourse-data-explorer	q:9
507	discourse-data-explorer	q:_id

Wiederherstellung schlägt fehl: Mögliches Problem mit Data Explorer

Verwandte Themen