我在寻找有经验监控AWS中的Oracle RDS数据库经验的任何人的一般建议。我正在使用的系统将涉及AWS中的几个企业Oracle RDS数据库(数量级为几十)。我的组织正在考虑为监控两个选项:AWS上的Oracle监控:EM Express与云控制
- 设置在AWS云控制,由住房的OMS和EC2实例存储数据库和启用OEM_AGENT我们的RDS实例。
- 完全依赖EM Express/CloudWatch和我们可以使用的任何其他第三方软件,而无需Cloud Control的开销。
与选项1所关注的是它破坏了我们对移动到RDS的原因,即,以消除一些保持传统的内部部署Oracle数据库的管理开销。 OEM存储库数据库不能安装在RDS中,因为OMS需要对存储库进行SYS级访问,而RDS不允许这样做。因此,拥有云控制将需要我们希望远离的许多类型的维护。
与选项2的问题是主要是缺乏度量报警的。 CloudWatch /增强监控为警报提供了一些基本指标,但缺少更具体的指标和警报,例如警报日志错误,表空间,长时间运行的查询,使用的归档区域等。我们不介意缺乏集中化,因为我们只是创建一个内部页面,并链接到所有不同的数据库,EM Express为我们提供了从性能监控角度来看所需的内容。唯一值得关注的是缺乏指标提示。如果没有其他方式来做这件事,我们也可以简单地编写我们自己的PL/SQL脚本来触发警报。
不过,我很好奇,想知道别人是如何解决这个问题,甚至只是一般,已经确定什么样的基于AWS-甲骨文监测系统的建立与它们如何工作。
是的,RDS事件对于高级基础架构监视非常有用,但问题仍然是内部数据库监视,因为RDS事件不提供任何此类事件。 – amparito
@amparito没错。 RDS事件不是很好。为了克服这个问题(在某种程度上),将监控脚本转换为lambda函数(是的,不是一件容易的事),或者让一个经理盒(一个单独的EC2)加载你的脚本并在所有RDS上执行它。 – vira