2017-03-01 158 views
1

我正在使用logstash-rss输入插件在elasticsearch中为rss提要编制索引,但是我得到了文本和html标记,而我只想获取文本而不是html标记。 任何人都可以说我应该使用哪个过滤器插件以及如何过滤它?从rss输入logstash插件删除HTML标记

回答

1

关于Logstash怎么样xml plugin

filter { 
    xml { 
    source => "my_source" 
    #other configs, see the doc 
    } 
} 
+0

XML过滤器可以让我解压的文章文字,但它仍然包含HTML标记 – jamal

+0

什么html_strip? – jamal

+0

这取决于您是否希望过滤来自logstash的rss提要,或主要将推荐过滤推迟到弹性搜索。 – Adonis