A me sembra che venga attivato quando le richieste vengono messe in coda troppo a lungo, in altre parole, le richieste in arrivo sono più veloci di quelle elaborate. Ci si potrebbe chiedere perché così tante richieste o perché un servizio così lento. A livello di Discourse, ci sono parametri configurabili già discussi in questo thread e anche, ad esempio, in Errore di carico estremo.
A livello Linux, controllerei
uptime
free
vmstat 5 5
ps auxrc