2014-10-18 130 views
0

我在处理Excel和pentaho时遇到了一些问题(我猜是由于我对这些工具的0经验...)。 具有下列数据集:Excel/Pentaho double group by + count

Interaction date interaction_name 
    21/08/13 course view 
    21/08/13 course view 
    21/08/13 forum view forum 
    21/08/13 course view 
    21/08/13 course view 
    21/08/13 course view 
    22/08/13 forum view forum 
    22/08/13 course view 
    22/08/13 forum view forum 
    22/08/13 user view all 
    22/08/13 user view 
    22/08/13 blog view 
    22/08/13 user view all 

我想表示在21/08/2013出现了4周的景色和1个论坛视图中,22/08/2013 2论坛次,1个场查看,3个用户查看所有...等等。

这就是(从SQL角度来看)双数组中的一种计数。按日期先组,然后通过交互进行分组并计数。正确的SQL查询也可以帮助我。

我只是不知道如何做到这一点。我尝试用excel和pentaho,但似乎我缺少的东西...

任何帮助将真正apreciated!谢谢

到目前为止,我在pentaho中的报告:已经尝试过聚合计数,但它计算了每个交互,而没有在它们之间做出任何区别。
enter image description here

+2

原始数据在哪里?在Excel工作表中?你成功地将它读入Pentaho吗?可以包括到目前为止Pentaho转型的截图吗? – 2014-10-18 11:02:51

+0

这里没有涉及任何编程。这个问题应该去一个不同的网站。例如。 Pentaho论坛,因为它关于使用Pentaho软件? – 2014-10-18 11:11:16

+0

我在这个论坛上看到很多有关分析的问题,所以我决定在这里发布。问题不在于pentaho软件本身,而在于分析。 @MarcusRickert是的,原始数据是在Excel表格中,我添加了当前报告状态的屏幕截图。谢谢 – 2014-10-18 11:22:52

回答

1

由于@Marcus李凯尔特问,你没有指定数据源,但我会假设,就像数据库中的一些SQL,因为你问正确的SQL查询。

这一个:

SELECT Interaction_date, Interaction_name, count(Interaction_name) from your_table group by Interaction_date,Interaction_name order by Interaction_date asc; 

它会产生:

Interaction_date Interaction_name count 
--------------------------------------------- 
21/08/13   course view   5 
21/08/13   forum view forum 1 
22/08/13   forum view forum 2 
22/08/13   course view   1 
22/08/13   user view all  2 
22/08/13   user view   1 
22/08/13   blog view   1 

现在,你可以把它放在Pentaho的报表设计器和group by(报表设计器内)的Interaction_date。