aggregation

    0热度

    1回答

    我有一堆包含招聘广告信息的弹性搜索文档。我试图汇总attributes.Title字段以从作业发布中提取“体验”实例的数量。例如初级,高级,领导等。相反,我得到的是与整个标题相匹配的桶,而不是每个单词都是标题栏。例如“初级Java开发人员”,“高级.NET分析师”等。 如何判断弹性搜索是否根据标题中的每个单词分割聚合,而不是匹配整个字段的值。 我稍后想要扩展查询以提取“技能级别”和“角色”,但如果

    0热度

    1回答

    编辑:解决方案发现在第一条评论中,你也可以检查that question,我们达到同样的效果。 比方说,我有包括这些文件 {name: 'John', fruit:'apples'}, {name:'Zac', fruit:'bananas'}, {name:'Sara', fruit:'oranges'}, {name:'John', fruit:'oranges' }, {name:'

    0热度

    1回答

    我试图聚合多个列上的数据帧。我知道聚合需要的所有东西都在分区内 - 也就是说,不需要洗牌,因为聚合的所有数据都是分区本地的。 以一个example,如果我有像 val sales=sc.parallelize(List( ("West", "Apple", 2.0, 10), ("West", "Apple", 3.0, 15), ("West", "Orang

    0热度

    2回答

    我是elasticsearch的新手,我有一些技术难点。目前我有按小时索引存储的文档,它们是时间序列数据。我试图弄清楚的是如何有效地提取只有key字段值,它被定义为"key": { "type": "long" }。我最初尝试的是天真的方法,它滚动浏览所有索引并提取字段,但显然这不会很快完成,每个小时索引大约有10M个文档,并且滚动3个索引已经耗尽了。 然后我来到terms aggregation

    0热度

    3回答

    我正在使用来自https://www.kaggle.com/c/titanic的泰坦尼克号数据集。 我想让“0-4”,“1-5”,“2-6”,“3-7”等不同的年龄段,并找出存活百分比的年龄组最高。我的年龄组在整数区间内[0,80]。原始数据集中的“Age”列也包含NAs。 “Survived”列包含该人是否存活的信息(0 =否,1 =是)。 我试图解决这个问题,但它没有奏效。我会很感激任何帮助。

    0热度

    1回答

    我有一个表table1,它有一些列,必须根据某些条件计算并移动到另一个表table2中。为了符合条件,我创建了一个临时表#ttemp,并将临时表更改为创建两个新变量var1和var2,以根据不同的列设置一些值,并稍后检查这些条件。如果条件通过,我做一些聚合,然后我会插入table2将有聚合列。 首先,从table1创建#temp表和变量。 SELECT * INTO #ttemp FROM t

    1热度

    1回答

    我在C#中有一些聚合问题。现在,我有以下代码: namespace ShapeDrawing { public abstract class Shape { protected Drawing myDrawing; public Shape(Drawing drawing) { myDrawing = drawing;

    0热度

    1回答

    是否可以在geo_point字段上使用最大聚合或最小聚合? 我试图max直接到我的坐标属性,它的类型是geo_point { "size": 0, "aggs" : { "max_lat" : { "max" : { "field" : "coordinate" } } } } 这可以理解返回ClassCastException,所以我想直接的coo

    1热度

    3回答

    非常新的火花/斯卡拉。我想知道是否有一种简单的方法来以列式方式聚合Array [Double]。这里有一个例子: c1 c2 c3 ------------------------- 1 1 [1.0, 1.0, 3.4] 1 2 [1.0, 0,0, 4.3] 2 1 [0.0, 0.0, 0.0] 2 3 [1.2, 1.1, 1.1] 然后,一旦聚集,我会看起来像一个表

    0热度

    1回答

    我一直在测试Mongo上的部分索引,并且似乎在$match阶段中使用aggregation expression会干扰使用正确的索引。 例如,我有一个data收集与下列文件: { "type": "person", "value": { "id": 1, "name": "Person 1", "age": 10 } }, {