Problème avec les sessions obsolètes ? impossible d'allouer une nouvelle session dans la session SSL

Je ne suis pas sûr de ce qui se passe ici ; cela pourrait être un bug. J’ai quelques sites qui rencontrent des erreurs fantômes comme celles-ci :

2021/09/29 12:46:34 [alert] 11364#11364: *1226080 impossible d'allouer une nouvelle session dans le cache partagé de session SSL « SSL » lors de la poignée de main SSL, client : x.x.42.250, serveur : 0.0.0.0:443

Sur l’un d’eux, j’ai réussi à augmenter le nombre maximal de sessions de cette manière :

  after_bundle_exec:
    - replace:
       filename: "/etc/nginx/nginx.conf"
       from: "  worker_connections 768;"
       to: "  worker_connections 1280;"
  after_letsencrypt:
    - replace:
       filename: "/etc/nginx/letsencrypt.conf"
       from: "  worker_connections 768;"
       to: "  worker_connections 1280;"

Je pensais que cela avait résolu le problème (je n’ai pas vu de telles erreurs le lendemain), mais je les revois maintenant sur ce site.

Cela sort un peu de mon domaine de compétence, mais mon meilleur pari est qu’un certain nombre de connexions restent actives au lieu d’être fermées, et que nginx épuise ses sessions ?

Les deux installations sont standards et ne génèrent pas un trafic particulièrement élevé. L’un est une instance de 4 Go sur AWS, l’autre un droplet DO de 8 Go (environ 40 000 vues de page par jour). J’ai d’autres sites avec beaucoup plus de trafic et je ne me souviens pas avoir jamais vu cela auparavant, donc je me demande s’il y a quelque chose de nouveau en cours ici.

C’est encore arrivé. Je vois que ssl_session_timeout est défini sur 1d dans /etc/nginx/conf.d/discourse.conf. Pourquoi est-il passé de la valeur par défaut de 10m à cette valeur ?

Je vois aussi cela dans le journal - pas trop, mais ils apparaissent. Avez-vous trouvé des informations sur ce changement de configuration ou l’avez-vous reconfiguré sur une période plus courte pour vous-même ?

Nous pourrions probablement augmenter la taille du cache de 1 Mo à environ 40 Mo. Autant que je sache, cela doit aller de pair avec le délai d’attente, et nous avons augmenté l’un sans l’autre.

C’est logique. Le changement de la taille du cache a-t-il été ajouté à la liste de quelqu’un ?