如何着手排查一个网站(毫无征兆地)突然变慢的问题?
资源使用率非常低:
这是一个 16 GB 内存 / 4 AMD vCPU / 200 GB 磁盘 / SFO3 - Ubuntu 24.04 (LTS) x64 droplet,磁盘使用率为 30%。
DigitalOcean 服务状态 全天正常。
用户在不同地点报告了网站变慢的问题。
yaml:
UNICORN_WORKERS: 8
db_shared_buffers: "1024MB"
db_work_mem: "40MB"
我已经重建到最新版本,并为 Sidekiq 分配了更多内存 UNICORN_SIDEKIQ_MAX_RSS: 1000
控制台中出现一些 429 错误:
过去 3 天的错误日志:
1 个赞
在安全模式下,我在控制台中没有看到错误,但速度慢得多。加载任何内容大约需要 10-15 秒,图像加载缓慢,就像通过 14.4 Kbps 调制解调器传输一样。
加载 /logs 大约需要 20 秒。返回 /admin 大约需要一分钟。
一次“轮询”似乎花费了很长时间:
顺便说一句,这些是正在运行的插件:
1 个赞
这里是今天早上另外两个数据点。Sidekiq 看起来很平静:
有趣的内存图表 - 应用重建后约为 20-30%,然后在备份期间跃升至 46% 并保持在那里:
哇!移除帖子徽章组件后,效果天壤之别。禁用它没有区别,但删除它却有。控制台也没有错误了。
谢谢你,@Falco!
5 个赞
好吧,恐怕那不是,或者至少不是全部。
现在我看到损坏的图片,并且控制台中出现此信息:
仍然加载缓慢或根本不加载,并且旋转器一直在转动……
1 个赞
我想知道这是否与问题有关:
大约 4 周前,当我将 Discourse 从旧的 Ubuntu 16.4 LTS 实例迁移到运行 Ubuntu 24.04 的新实例时,我从备份中恢复了 Discourse。我没有手动重新烘烤。
2 个赞
越来越奇怪了。这是从 /logs 导航到 /admin 时,点击“返回网站”链接的截图。
1 个赞
Moin
12
最近还有一个关于“no route named admin”错误的帖子。
也许这也与 Cloudflare 有关
2 个赞
嗯。我的没有使用 Cloudflare,但在 Chrome 中我确实看到了重复的标头,就像第一个帖子那样。
我刚刚重建了,除了 docker_manager 之外没有其他插件,我会报告它的行为。
还有一件事要注意,当它在 Chrome 中挂起时,我不得不关闭那个标签页,并在新标签页中打开它。强制重新加载没有任何效果。
1 个赞
现在到 S3 的夜间备份失败了,但设置没有任何变化:
[2024-10-10 15:03:04] Uploading archive...
[2024-10-10 15:14:33] EXCEPTION: multipart upload failed: Net::WriteTimeout with #<TCPSocket:(closed)>
编辑:两次手动触发的备份都因上述相同错误而失败,但随后两次手动备份成功了。所有这些都没有更改设置。
1 个赞
控制台中未显示错误,只是间歇性地加载速度非常慢:
Discourse Doctor 有时运行正常,但在第二次运行时报告端口 587 可能被阻止,这很奇怪,因为它在第一次运行和第三次成功运行时都发送了测试邮件:
连接到端口 587 失败。
====================================== 解决方案 =======================================
最可能的问题是您的服务器阻止了传出的 SMTP 流量。
如果您使用的是 Mailgun 或 Sendgrid 等服务,请尝试使用端口 2525。
我猜想这个 DigitalOcean 虚拟机会有问题吗?
这个 droplet 似乎存在一些网络问题 - 下载速度相当慢,但请注意上传速度
:
speedtest-cli
正在检索 speedtest.net 配置...
正在从 Digital Ocean (24.199.xxx.xxx) 进行测试...
正在检索 speedtest.net 服务器列表...
根据 ping 选择最佳服务器...
由 Next Level Infrastructure (Santa Clara, CA) [4.38 km] 托管:2.242 ms
正在测试下载速度................................................................................
下载:839.25 Mbit/s
正在测试上传速度......................................................................................................
上传:1.27 Mbit/s
1 个赞
这是这场闹剧的圆满结局……
在运行了 speedtest-cli 和 iperf3 网络吞吐量测试,显示液滴与外界之间的速度非常慢之后,我要求 DigitalOcean 进行调查,他们在进行了自己的测试后得出结论:
我们发现您液滴所在的虚拟机管理程序存在一些问题。我们正在与我们的后端团队合作,将您的液滴迁移到另一个虚拟机管理程序。
一切又恢复正常了。
3 个赞
system
(system)
关闭
18
This topic was automatically closed 30 days after the last reply. New replies are no longer allowed.