1
我正在使用logstash-rss输入插件在elasticsearch中为rss提要编制索引,但是我得到了文本和html标记,而我只想获取文本而不是html标记。 任何人都可以说我应该使用哪个过滤器插件以及如何过滤它?从rss输入logstash插件删除HTML标记
我正在使用logstash-rss输入插件在elasticsearch中为rss提要编制索引,但是我得到了文本和html标记,而我只想获取文本而不是html标记。 任何人都可以说我应该使用哪个过滤器插件以及如何过滤它?从rss输入logstash插件删除HTML标记
关于Logstash怎么样xml plugin:
filter {
xml {
source => "my_source"
#other configs, see the doc
}
}
XML过滤器可以让我解压的文章文字,但它仍然包含HTML标记 – jamal
什么html_strip? – jamal
这取决于您是否希望过滤来自logstash的rss提要,或主要将推荐过滤推迟到弹性搜索。 – Adonis