2

我在寻找有经验监控AWS中的Oracle RDS数据库经验的任何人的一般建议。我正在使用的系统将涉及AWS中的几个企业Oracle RDS数据库(数量级为几十)。我的组织正在考虑为监控两个选项:AWS上的Oracle监控:EM Express与云控制

  1. 设置在AWS云控制,由住房的OMS和EC2实例存储数据库和启用OEM_AGENT我们的RDS实例。
  2. 完全依赖EM Express/CloudWatch和我们可以使用的任何其他第三方软件,而无需Cloud Control的开销。

与选项1所关注的是它破坏了我们对移动到RDS的原因,即,以消除一些保持传统的内部部署Oracle数据库的管理开销。 OEM存储库数据库不能安装在RDS中,因为OMS需要对存储库进行SYS级访问,而RDS不允许这样做。因此,拥有云控制将需要我们希望远离的许多类型的维护。

与选项2的问题是主要是缺乏度量报警的。 CloudWatch /增强监控为警报提供了一些基本指标,但缺少更具体的指标和警报,例如警报日志错误,表空间,长时间运行的查询,使用的归档区域等。我们不介意缺乏集中化,因为我们只是创建一个内部页面,并链接到所有不同的数据库,EM Express为我们提供了从性能监控角度来看所需的内容。唯一值得关注的是缺乏指标提示。如果没有其他方式来做这件事,我们也可以简单地编写我们自己的PL/SQL脚本来触发警报。

不过,我很好奇,想知道别人是如何解决这个问题,甚至只是一般,已经确定什么样的基于AWS-甲骨文监测系统的建立与它们如何工作。

回答

0

的问题,几乎所有的这些移动云企业今天面对。公司转向云以摆脱他们的一些管理任务,然后他们发现他们无法完成他们在本地进行的所有定制。

所以,这里是你如何可以使选项2更好。特别是对于解决您的问题

唯一要担心的还真是提醒

  1. RDS事件进行监视的好方法缺乏度量。您可以订阅事件并以多种方式收到通知,如群组电子邮件,闲置频道或第三方监控工具(如pagerduty)。

  2. 使用和λRDS活动的整合。我强烈建议看看Lambda。正如我上面提到的,除了订阅事件,您还可以调用/触发lambda函数来针对特定事件采取操作。我们使用Lambda来克服mysql中的slave跳过错误。

  3. LAMBDA的另一种使用情况是计划作业的替代方案。像每天检查磁盘空间,以确保增量备份过夜。

让我知道,如果你有关于“如何实现”这些选项的具体问题。我很乐意添加更多信息。

+1

是的,RDS事件对于高级基础架构监视非常有用,但问题仍然是内部数据库监视,因为RDS事件不提供任何此类事件。 – amparito

+0

@amparito没错。 RDS事件不是很好。为了克服这个问题(在某种程度上),将监控脚本转换为lambda函数(是的,不是一件容易的事),或者让一个经理盒(一个单独的EC2)加载你的脚本并在所有RDS上执行它。 – vira