0
我们最近在掩盖造成一个应用程序的影响有一定的用例或场景与ELB运行状况检查的问题。
任何人都可以提出一种容错方法来处理这个问题吗?
- 我们有一个应用程序的NodeJS在一个端口上运行 - 80
- 我们有3个实例中&目标集团是在ELB就读。
- ELB HealthCheck被配置为在端口80上命中根路径,如果它获得HTTP 200则返回成功
- 最近有一个节点在应用程序装载上填充了100%的磁盘,并且root装载仍有空间。
- 虽然HealthCheck按ELB成功,但服务器没有响应任何其他服务,并且它非常不健康。这意味着有一些请求得到 成功,但其中一些失败(这是路由到这个磁盘填充服务器)。
- 我们确实收到了来自其他监控系统的磁盘填充通知,但由于压倒性的电子邮件&有限的资源它被错过了。
- 是否有任何其他方法可以即兴创建HealthCheck策略,只需将这些场景呈现给AutoScaling组或ELB ,以便我们可以将这些节点的目标移除并自动替换它们?