lucene

    0热度

    1回答

    我使用Solr的4开始,我已经到位 <filter class="solr.LengthFilterFactory" min="3" max="99"/> 长度滤清器厂如果我的查询字符串使用具有少于3个字符的单词开始,solr不会返回任何结果。我并不期待这会成为问题,因为我正在使用LengthFilterFactory。下面是例子: 的标题是: “在不远的未来...” 如果我搜索q:In th

    0热度

    1回答

    我有以下映射Elasticsearch: PUT /traffic-data { "mappings": { "traffic-entry": { "_all": { "enabled": false }, "properties": { "CameraId": { "type":"keyword"

    0热度

    1回答

    我想写一个查询,可以检测特定人员(由PersonId标识)是否在过去3个月内连续2个月每月至少访问过一次城市。 可以使用Elasticsearch查询语言吗? 我可以统计一个人每个月访问一个城市的次数。但是,我不知道如何计算在过去3个月内连续两个月的访问。 GET visits/_search? { "size":0, "query": { "bool": { "mus

    0热度

    1回答

    如何按年份和月份分组?如果我离开1个任期,我的查询就可以工作,例如Month。但我无法用多个词组分组。 GET traffic-data/_search? { "size":0, "query": { "bool": { "must": [ { "match": { "VehiclePlateNumber": "111" }}

    0热度

    1回答

    我想通过删除或替换带有类似字符的重音符号来搜索希腊字符(不区分变音)。例如:当搜索一个希腊口音词说πῬοἲὅν时,我们希望重音不敏感的搜索,即在搜索结果中需要相当希腊口音像προιον。 此外,我没有更多的关于希腊字符的知识。所以只有我在寻找标准规则来执行希腊语重音不敏感的搜索。 ICUFoldingFilter能解决我的问题吗?我已经尝试过了。它适用于希腊口音人物。但这不是语言特定的......

    -1热度

    2回答

    我有很多图像文件,我想按名称搜索特定文件。我正在寻找建议来实现这个使用Java。 注:我已经使用Apache lucene,但它不适用于图像文件。我认为它通过文件内容进行搜索。 请提出什么是可以用于在大量图像文件(以TB计)中按名称搜索文件的最佳技术。 编辑 例子: 用户进入 '引擎',它应该给结果一样: X60_031004_P05_16_AJ126SC_ENGINE_COVER_AWD_2.j

    0热度

    1回答

    我需要编写一个查询来计算EventId“AAA”事件的最早和最近事件日期之间的差异(以天测量)。 所以,这意味着我应该为EventId标识最早和最近的事件日期。 我该怎么办?

    0热度

    1回答

    我有一个1M到10M字符串的列表,我想查看它们中的哪些可以在单个文档中找到(比如说1页文本)。 我知道我可以使用Lucene(Solr/Elasticsearch)来查找包含字符串的所有文档。但这是相反的。 我可以编写一些基于字符串搜索算法之一的临时解决方案,如Aho-Corasic,try等,但我认为我会重新发明轮子。有没有任何图书馆/框架? (我很好的分割字符串和文档进言,如果这有什么差别)

    1热度

    1回答

    这是我得到的信息从LucenePDFDocument: doc = LucenePDFDocument.getDocument(file); System.out.println("field list: \n" + doc.getFields()); 这是输出: field list: [<stored<path:D:\Kuliah\rancangan document indexing

    2热度

    1回答

    我使用Apache Nutch-1.13和solr 6.6.0版本。 我运行下面的命令来抓取内容: bin/crawl -i -D solr.server.url=http://localhost:8983/solr/nutch urls/seed.txt TestCrawl 2 我得到这个异常: Indexer: java.io.IOException: Job failed! a