0
我正在使用Apache Solr 6.6.0,以通过递归编制索引文件夹中的所有文件来构建搜索引擎。更新Solr中的字段配置6.6.0
我如何做到这一点如下:1)我创建一个基于云示例的索引。 2)我索引给定文件夹中的所有文件。
bin\solr start -e cloud -noprompt
java -Dc=gettingstarted -Dauto=yes -Ddata=files -Drecursive=yes -jar example\exampledocs\post.jar <path_to_folder>
后来,当我搜索在用户界面中查询时,我看到的是,即使它为我提供了顶级的比赛,它没有提供我的文档内容。经过一番研究,我发现在托管模式文件命名字段,“_text_”和它的配置:
<field name="_text_" type="text_general" multiValued="true" indexed="true" stored="false"/>
正如你看到的,本场不会被保存,我认为这就是为什么响应确实的原因不提供内容。
我在正确的轨道上吗?如果是这样,我该如何编辑这个字段的配置?我应该删除它并创建一个具有相同名称和存储=真的新的吗?
谢谢。
是的,我意识到,正如你所说,'_text_ '抓住所有人,所以它必须包含一切,包括内容。但是,我觉得编辑这个字段并不是存储文档内容的最合适的方式。没有更好的方法来存储内容? –
这取决于你对内容的处理方式;)正如我所说的,人们经常通过外部http服务提供文件内容。如果您认为这是您正在寻找的内容,请接受答案 – Andrea
我知道它会增加索引大小,但我的目标是了解Solr如何解析文档并提取其内容。因此,自己提供内容对我的目标无益。此外,突出显示匹配短语是我想要添加的另一个功能。 –