2016-09-29 41 views
0

我有一个表格,其中包含40个lac行,列'playcount',其中最小值为1,最大值为17,000。在配置单元中将相等部分的数字范围拆分

我想通过添加一个基于'playcount'列的值为1到15的列来将此表分成15个组。

Hive有一个函数NTILE允许做类似的事情。在这里,如果我做了NTILE(15) OVER (ORDER BY playcount) AS mygroup,它确实分解了它,但基于playcount值的计数,并且由于更低的值更多(超过50%的值小于5),所以分组使得超过35的值具有组值15(最大)。

我想根据playcount进行分组,而不是根据playcount值进行分组。

配置单元中的东西可能类似。

谢谢,我能想到的

回答

0

一种可能性是playcount%15 as mygroup