假设有一些数据的表格和与日期的柱:分区通过在蜂房
column1, column2, date
a, a, 2016
a, b, 2016
a, c, 2017
b, d, 2017
b, e, 2017
的情况是进行计数的每个列1列2 OCCURENCES并应用分钟日期为每个列1。
第一部分是一个简单的小组。第二个可以通过分区划分条款获得。但是,我怎样才能以聪明而干净的方式将这两者结合? 真的需要分区才能获得最短日期吗?任何明智的建议都会很棒!
预期输出:
column1, count, min_date
a, 3, 2016
b, 2, 2017
添加预期的输出 –
@ bry888也添加您的代码 –
我没有代码,这是一个关于编写代码的问题:)关于格式化。 – bry888