任何人都可以请建议我一种方法,通过该方法可以将chm文件编入索引,例如pdf格式的pdfbox。有没有办法在Lucene中索引CHM文件?
回答
如果你有,你需要指数也其他文件格式,你可能会发现在Apache Tika
一个更好的,更全面的解决方案,他们只是增加了一个CHM解析器最近(供参考:Support of CHM Format),这将是在下一个版本。
谢谢你。我会看一下 :) – 2011-06-13 11:57:23
如果你正在谈论Microsoft Compiled HTML Help文件,你可以用JChm从它们中提取文本,然后以正常的方式对其进行索引。
thnx。我会看一下。 :) – 2011-06-10 14:04:58
要小心。可能有一个二进制和一个文本(.xml存储为.hhk)索引,并且它们可能不包含相同的内容。 – 2011-06-11 20:06:39
我用ChmParser amd使用它的检索文件,并提出了一些解决方法。它似乎运作良好,并且.hhc问题已解决。 Thnx再次 – 2011-06-13 11:47:53
- 1. 有没有办法在Lucene中使用RegexpQuery搜索术语?
- 2. 有没有办法在mongoDB中填充文档的索引文件?
- 3. 更快的搜索在Lucene中 - 有没有办法将整个索引保存在RAM中?
- 4. 有没有办法在Mailkit中递归搜索文件夹?
- 5. 有没有办法解决索引索引
- 6. 有没有办法在KendoUI网格中索引数字
- 7. 有没有办法在Fluent nHibernate中命名唯一索引?
- 8. 有没有办法在Slick中创建一个聚类索引?
- 9. 有没有办法通过枚举在Rust中索引数组?
- 10. lucene文件索引
- 11. 索引后有没有办法返回文档体?
- 12. 有没有办法在.doc文件里搜索?
- 13. 有没有办法在Eclipse中搜索包中的文本?
- 14. 有没有办法在使用时获得索引值.... Array.IndexOf?
- 15. 有没有办法从Repeater中的DataTable获取Item的索引?
- 16. 有没有办法只索引MySQL中的特定列值?
- 17. 有没有办法在C#中的LINQ Where方法中捕获索引值?
- 18. 有没有办法在弹性搜索中加入2个索引?
- 19. 有没有办法将特定版本的文件添加到git索引?
- 20. 在Lucene中索引txt文件
- 21. 有没有办法测试CSS文件?
- 22. 有没有办法调试plist文件?
- 23. 有没有办法区分C++文件?
- 24. 有没有办法通过它的URL搜索文件?
- 25. 有没有办法通过CouchDB的文件搜索串
- 26. 有没有什么办法可以通过cs文件搜索
- 27. 有没有办法在XML文件中使用条件语句?
- 28. lucene如何索引文件?
- 29. 在lucene中没有索引的计算术语向量4
- 30. 有没有办法在R中读写内存中的文件?
Apache Tika更常用于Lucene,我只是不知道他们对CHM的支持。所以,请接受死亡的答案。 – ffriend 2011-06-13 14:13:27