我正在寻找像索尔一样的搜索和替换功能。在Solr中搜索并替换?
我已经将文档转储到solr中,并对其进行了一些文本分析。有时候我可能需要将几个词组合在一起,并希望solr把它当作一个单一的标记。
例如:“南非”将被视为一个单一的令牌进行进一步处理。同时也注意到这些可以是动态的,并且即将让最终用户决定他/她必须分组哪些词。所以NO语义是必需的。
我现在的计划是在这两个单词之间添加一个特殊字符,所以Solr会将它视为一个单一标记(StandardTokenizerFactory)以供进一步处理。
所以即时寻找类似:
replace("South Africa",South_Africa")
任何人都可以有什么解决办法?
我猜你需要共发现和其他的自然语言技术(词性)“理解”令牌。我对可以理解单词的过滤器感兴趣(例如,在“IT经理”和“正在下雨”中区分“它”) – aitchnyu 2012-03-16 12:47:23