Elasticsearch数据库同步

我正在使用jdbc河来同步Elasticsearch和数据库。已知的问题是，从数据库中删除的行保留在ES中，jdbc河插件不能解决这个问题。 jdbc river的作者提出了解决问题的方法：Elasticsearch数据库同步

一个好方法是窗口索引。每个时间范围（可能每天或每周一次）为河流创建一个新索引，并添加到别名中。过了一段时间后，旧指数将会下跌。这种维护类似于> logstash索引，但它不在河流范围内。

我的问题是，这是什么意思准确的方式？

可以说我有表中的数据库调用Table有600万行，我试试如下：

这是正确的方法吗？

2015-02-11 Igor H

如何使用_ttl字段？将SQL语句中的静态_ttl定义为比SQL更新频率更长。

当河定于1小时内频繁地运行更多的SQL是这样的：

"select '1h' as _ttl, some_id as _id, ..."

这样的河流运行时的_ttl被更新，但删除的行不会得到更新，将在_ttl到期时从ES中删除。

2015-03-03 11:18:07 tepe

是的，它可以使用_ttl场完成，但我使用脚本它解决。

每晚的脚本都以索引表格开始，并创建当天的索引。索引可以持续数小时。

另一个脚本周期性地从localhost:9200/_river/jdbc/*/_state?pretty读取输出并检查是否所有河流都已完成（通过检查lastEndDate字段的存在）。当所有的河流完成后，别名会被新创建的索引刷新。旧索引被删除。

2015-03-09 12:35:38

回答