aggregate

5热度

4回答

我有R的工作表，我有这样的数据： data <- structure(list(Col1 = 1:9, Col2 = structure(c(2L, 2L, 2L, 1L, 3L, 3L, 3L, 3L, 3L), .Label = c("Administrative ", "National", "Regional"), class = "factor"), Col3 = structure

0热度

3回答

星火斯卡拉 - 基于时间段

聚集和旋转，我想实现旋转火花截至目前，我使用sqlContext和SQL应用内全部改造类似于SQL Server。我想知道我是否可以直接从sql server中获取数据并使用spark实现数据透视功能。下面是什么，我想achieve- 的SQL Server查询如下─ create table #temp(ID Int, MonthPrior int, Amount float); inse

2热度

1回答

node.js - mongodb native中的RegExp

我使用node-mongodb-native来实现MongoDB查询功能。我需要执行一个查询，如果tag相匹配的部分或组合firstName和lastName这样的： filter50WithTagSkip(tag, skip) { return new Promise((resolve, reject) => { const regex = new RegExp(tag

0热度

1回答

MongoDB的骨料项目返回_id

数组我们知道，如果我们想获得_id的数组，我们可以这样做： db.collections.distinct("_id"); 我的问题是怎样才能得到_id数组，如果我需要做的一个复杂的聚合逻辑。例如： db.getCollection('users').aggregate({ $match : { is_register_completed : { $ne : tru

0热度

1回答

我应该使用哪些elasticsearch聚合？

我需要创建一个“按活动用户数量”的条形图。活跃用户表示最近7天登录的用户。所以我需要统计last_activity日期在7天内的用户总数。我需要为我的图表中的每个酒吧（日）执行此操作。我明白它需要使用聚合弹性搜索来完成，但不确定我应该使用哪些聚合？存储桶聚合，管道聚合？如果你知道类似的例子，请告诉我。在这里您可以找到用户样本文件的两个实例“约翰” { "userid": "jo

1热度

2回答

分组行和定义列聚合规则

我正在寻找合并多行不同dtypes的熊猫。我有我的.groupby()参数：['ID']。当按['ID']分组时，列['A']可能重复值，或者每行的数据不同。仅需要通过.sum()汇总列['B']。 input_df ID A B 140-1 Apple 3.2 140-1 Pear 5.0 143-2 Plum 1.2 143-2 Plum 2.0 什么是由['ID'

2热度

1回答

Mongolite GROUP BY/JSON对象合计

我有我的MongoDB集合这样一个JSON文件：更新文件： { "_id" : ObjectId("59da4aef8c5d757027a5a614"), "input" : "hi", "output" : "Hi. How can I help you?", "intent" : "[{\"intent\":\"greeting\",\"confidence\":0.81540894

0热度

1回答

在KafkaStreams中使用SessionWindows聚合数据（0.11）

我想在Kafka（0.11）中的聚合函数中使用SessionWindows，但无法理解，为什么我会收到错误。这里是我的代码片段： // defining some values: public static final Integer SESSION_TIMEOUT_MS = 6000000; public static final String INTOPIC = "input"; pu

0热度

1回答

ElasticSearch - 术语聚合按空白分割

我有一堆包含招聘广告信息的弹性搜索文档。我试图汇总attributes.Title字段以从作业发布中提取“体验”实例的数量。例如初级，高级，领导等。相反，我得到的是与整个标题相匹配的桶，而不是每个单词都是标题栏。例如“初级Java开发人员”，“高级.NET分析师”等。如何判断弹性搜索是否根据标题中的每个单词分割聚合，而不是匹配整个字段的值。我稍后想要扩展查询以提取“技能级别”和“角色”，但如果

0热度

1回答

在一个函数中使用两个分组变量聚合一个变量R

我想写一个函数，它会给我一个按年龄和国家的人口简单的描述性统计。这里是我的数据的例子： popcount = 200:250 sex = rep(c("M", "F"), 25) country = rep(c("NZ", "Aus", "Fiji", "PNG", "Samoa"), 10) 为了得到聚集，我指定了以下功能 Aggregate_fun <- function(pop,