elasticsearch

    1热度

    1回答

    我已经使用asciifolding过滤器设置了分析器。 此过滤器替换字母ç=> c和ñ=> n。我需要保留原来的ç和ñ在令牌。 有没有办法在asciifolding过滤器中设置异常?如果没有,我可以使用char_filter来做什么asciifolding过滤器为重音,而不是ç和ñ或有更好的方法?

    0热度

    1回答

    我写这个代码我CustomAnalyzer的一部分:现在 public class CustomAnalyzer extends Analyzer { SynonymMap mySynonymMap = null; CustomAnalyzer() throws IOException { SynonymMap.Builder builder = new SynonymMap.B

    1热度

    1回答

    我正在尝试为Elastic Search编写一个查询,该查询将返回前20个最接近的匹配项。 我想返回标题字段的前20个匹配项。 curl -X POST "localhost:9200/xxx/_search?pretty=true" -d ' { "from" : 0, "size" : 20, "query" : { "term" : {"title" : "art"} }}' 我

    6热度

    3回答

    即时通讯使用django干草堆elasticsearch但存在索引问题。当重建我的指数上升 python manage.py rebuild_index以下错误: Traceback (most recent call last): File "/home/palo/.virtualenvs/toro/local/lib/python2.7/site-packages/haysta

    1热度

    1回答

    我要索引的文档具有名称为type的属性。当我使用的轮胎来存放它,例如: Tire.index 'mydocuments' do delete create store :name => name, :type => 'pdf' refresh end 然后在这个文件是_type = pdf指标,因此我可以http://localhost:9200/my

    2热度

    1回答

    没有索引外部数据进行过滤,我不能找到一种方法,做与ElasticSearch如下: 我已经200万项ElasticSearch 索引我有30000级的玩家保存在MySQL 每个项目都有一个玩家的名字作为属性。 这些球员的在线状态每15分钟更改一次,可以是真或假(显然)。 我想只能显示在线玩家的物品。 我不认为我可以将项目的在线状态编入索引,因为它经常变化。 我无法真正获得在线玩家的所有ID,并将其

    -2热度

    1回答

    我已经尝试了使用Amazon EC2中的3个节点的弹性搜索群集配置。但在调用后,我得到了UnavailableShardsException $type->addDocument($doc); 以下是custer中3个节点中每个节点的配置。请帮忙 ! Node1 ===== cluster.name: MyCluster node.name: node1 node.master: true

    3热度

    2回答

    如何知道特定文档类型需要的大小(以字节为单位)(比如,类型1和类型2)? 如果我尝试: curl -XGET 'http://localhost:9200/my_index/_stats?clear=true&store=true&indexing=true&types=type1,type2' 我只在指数的字节拿到总规模。 我在某种类型的文件的平均大小真正感兴趣的,但是这可以从数量和总大小

    1热度

    2回答

    我想使用bool查询其中的条件之一(例如在应该部分)是否定某事。 具体来说: 1)一个字段不存在。例如,我试过查询: {"query":{ "bool":{ "must":[ {"match":{"field1":"val1"}}, ], "should":[ {"match":{

    0热度

    1回答

    我开始与NEST一起工作。 我在a previous question中看到我应该在程序开始时只使用TryConnect一次,然后使用Connect。 但是这对于长时间运行的系统来说似乎有点太天真了。 如果我有3台机器的集群,我想确保可以连接到任何3台机器,该怎么办? 这样做的建议方式是什么? 应该我: - 每次都使用TryConnect,如果失败则使用不同的主机+端口(下行 - 每次额外往返)?