2011-12-14 50 views
0

正如标题所示,我需要找到/创建一个能够为查询检索相关信息的系统,方法是搜索一组给定的文档。从我自己的研究中,我只找到了执行基于索引的搜索的库,可以指出哪些文档与查询相匹配,但是他们无法提取相关信息。简而言之,用户会问一个问题,系统将通过搜索给定的一组文档来尝试找到该问题的答案。通过搜索给定的一组文档寻找问题答案的方法

任何人都可以指向一种实现此目的的方法,或者一个可能对我有帮助的库吗?

回答

0

为了让自定义通知到您的使用情况下,这些相关信息将是有益的:

  • 什么文件类型:主题,写作风格;
  • 编程语言或操作系统的任何优先级?
  • 结果是否应该在找到的文本段落或短语的周围显示正确的答案句子?

通常这个任务似乎需要对文本进行标记和语义分析。我最喜欢nltk http://www.nltk.org/

+0

文件类型各不相同,它可以是从科学辣椒到文学的任何东西(尽管后者会更丰富)。首选语言是C#。没有上下文是必要的,只是一个简单的答案。 – 2011-12-14 11:18:48