我正在发现一种简单的单数 - 复数关键词搜索解决方案。我听说过干扰,但我不想使用它的所有功能,只有复数/单数转换。该语言是荷兰语。之前看过http://www.snowball.tartarus.org。有人知道单数|复数相关搜索的简单解决方案吗? 在此先感谢。单/复数搜索和词干
1
A
回答
2
使用词典,停用词表(不想单数化的词)以及语言规则。如果你不知道荷兰的话,我帮不了你,但是告诉你如何会在西班牙进行,例如:
- 复数以s结尾,如果没有的话,它的完成
- 如果它以s结尾,
- 检查,如果它是一个动词或结合以s结尾,如果它是一个,那么它这样做(动词可以被添加到禁用词列表)
- ,如果它不是一个动词,删除s
- 如果工作d存在于字典中,如果它不删除前一个字母,并在字典中检查,则完成
- 。
- 如果它仍然不是有这是你需要手动检查代码的异常(我现在不能想到的任何异常,但他们始终存在:)
- 如果它以s结尾,
当然这不会直接转化为荷兰语。
一般而言,茎秆已经完成并提供大部分你需要的东西,你为什么不需要它们?
1
Stemmers引起了很多用户的烦恼,所以如果我使用其中之一,除单数/复数之外的所有功能应该被禁用。所以要求只使用复数/奇异变换。
1
答案是正确的,但值得一提的是,荷兰语有大量的不规则动词。这使得更多的表查找问题比一组单一的规则更难。
您需要访问语料库,您可以在这里找到一个用于荷兰语的语言:http://corpus1.mpi.nl/ds/imdi_browser/
相关问题
- 1. 在搜索引擎中搜索单数和复数的单词
- 2. 索尔索引,搜索词干
- 3. Solr - 一个单词词组搜索,以避免干扰
- 4. 使用Lucene搜索与词干启用
- 5. 基于词干的Solr搜索
- 6. Neo4j用于搜索的文档,关键词和词干的数据模型
- 7. Lucene.Net 3.0.3搜索与词干或搜索最佳匹配
- 8. 在Ruby中搜索单个单词和组合单词
- 9. MySQL的全文搜索复数/词的单数形式
- 10. 单词搜索拼图:如何搜索字母数组来查找单词?
- 11. 搜索多个单词uisng postgres和javascript
- 12. 从单词表和打印单词中搜索字母
- 13. 在textarea中搜索单词
- 14. 搜索数据库中的单词
- 15. 当启用词干时,搜索根词没有命中
- 16. 如何模糊搜索词典单词?
- 17. 替换单词在搜索词之前
- 18. 正则表达式 - 如何搜索单数或复数形式的单词
- 19. Elasticsearch和symfony的搜索词
- 20. 使用索引搜索相似单词
- 21. 简单搜索只搜索记录的最后一个单词
- 22. SQL复数/单数的搜索
- 23. 如何在jTable中编辑和搜索数据(单词)?
- 24. 搜索单词和清除单元格,如果它包含该单词
- 25. 复合词搜索引擎设计
- 26. 如何使用ElasticSearch搜索复合词?
- 27. 防止词干的单词在PostgreSQL的全文检索,从第
- 28. 复杂结构的词干
- 29. 使用sphinx索引和搜索带有像(++,#,。)标志的单词
- 30. 搜索对一个单词列表词组列表和计数occurances