0
当发布xml文档索引到solr时,一些文档正在增加并且重复的记录被丢弃。一些记录也会随着新值一起更新。我如何知道对索引进行的这些更改。我的意思是我将如何知道添加的记录数量,不。更新记录,发布到solr核心的文档数量?我如何知道在solr索引中更改,更新和索引的文档?
当发布xml文档索引到solr时,一些文档正在增加并且重复的记录被丢弃。一些记录也会随着新值一起更新。我如何知道对索引进行的这些更改。我的意思是我将如何知道添加的记录数量,不。更新记录,发布到solr核心的文档数量?我如何知道在solr索引中更改,更新和索引的文档?
在Solr 4中,在集合的部分下,有一个子部分叫做Plugins/Stats。其中,有UpdateHandler类别的统计类似于你所要求的。
此外,可以观察变化。综合起来,这可能会给你一个方法,看看这些是你想要的。如果是,那么您应该通过JMX访问相同的值以进行更灵活/长期的跟踪。
http:// localhost:8983/solr/collection1/admin/mbeans?stats = true 此网址只显示索引,张贴和丢弃文档的数量。但我想知道文档编号索引(添加)的编号,在发布索引文档时删除。我正在执行文档重复检测。所以我想知道solr丢弃的重复文档。 –
还是有什么办法知道文件是否已经存在于solr-index之前发布新的xml文件到solr? –
这些问题似乎与您从一开始就非常不同。我建议关闭这个并重新开始。但很快,请查看UpdateRequestProcessors,或者查看现有Solr Dedupe组件的源代码。 –