2017-10-10 108 views
1

我有一个关于分析文档的问题。 使用Apache Tika,可以创建不同类型的不同文件的内容和元数据。Apache Tika与Apache Lucene

是否有可能用Tika获得文件关键字(词干)还是我仍然需要Lucene的呢?

回答

0

我不知道是否有可能,但我会建议在lucene中进行所有关键字分析。我个人的原因:

  • Tika的主要目的是提取信息出文件
  • Lucenes的定义数据将如何进行分析和索引。怎样的数据进行分析,对如何(你希望找到的东西找到)中搜索您的Lucene索引performes
  • 它是一种担心提卡只提取和Lucene关心搜索分离的相关事物
大的影响