2014-10-01 63 views
0

我有一个快速增长的数据库,我使用Elastic Search来管理它。它只有一个索引并且每天获得200 K个新文档。每个文档包含约5 KB的文本。
我是否应该只使用一个索引,或者最好每天有一个索引或其他东西? 如果是这样,有多个指数有什么好处?我应该在弹性搜索中控制索引大小吗?

回答

1

你绝对应该担心你的碎片/索引的最大尺寸。我们使用每日索引来填充每天插入数百万条记录的数据和每月插入数百万条数据的月度索引。

一个好的经验法则是,碎片最多应该在4 GB左右(记住每个索引有一个可配置的碎片数量)。

优点是,当您有每日/每周/每月的索引时,最终可以在集群变得太大或数据不再有用时关闭/删除它们。如果您的数据是时间序列数据,那么您可以制定查询以仅查找用于给定数据的索引。另外,如果您在真正需要多少碎片时犯了错​​误,您可以更正它(因为您会定期创建一个新索引)。

缺点是你必须管理所有额外的索引,但有些工具可以做到这一点(例如elasticsearch-curator)。