2017-08-17 59 views
1

我正在尝试使用SAS/SQL从事务数据的数据集创建百分比列表,以了解特定部门如何为特定季度的整体销售数量做出贡献。例如,如果有100个销售处ID 234980和那些20的人在部门在2006年第四季度,则列表应该输出:表格不能正确聚合

Store ID 234980 , 20%. 

这是我用来实现这一结果的代码。

data testdata; 
    set work.dataset; 
    format PostingDate yyq.; 
run; 

PROC SQL; 
    CREATE TABLE aggregatedata AS 
     SELECT DISTINCT testdata.ID, 
      SUM(CASE 
        WHEN testdata.Store='A' THEN 1 ELSE 0 
         END)/COUNT(Store) as PERCENT, 
      PostingDate 
     FROM work.testdata 
     group by testdata.ID, testdata.PostingDate; 
QUIT; 

不过,我收到的输出更像是这样的:

StoreID DepartmentA Quarter 
    100   1 2014Q1 
    100   0 2014Q2 
    100   1 2014Q2 
    100   0 2014Q2 
    100   0 2014Q2 
    100   0 2014Q2 
    101   1 2015Q3 
    101   0 2015Q3 
    101   0 2015Q4 

为什么我的代码不骨料商店水平?

+1

因为您包含日期字段 - 您希望在汇总之前将其转换为四分之一。 – Hogan

+0

@Hogan数据步骤适当地转换格式。 –

+0

数据步骤将转换输出 - 这对服务器上发生的内部组无效。试着把这个领域拿出来,看看结果是否改变。 – Hogan

回答

1

如果您想按QTR进行分组,那么您需要将日期值转换为季度值。否则'01JAN2017'd和'01FEB2017'd将被视为两个不同的值,尽管它们都会使用YYQ显示相同的值。格式。

proc sql; 
create table aggregatedata as 
    select id 
     , intnx('qtr',postingdate,0,'b') as postingdate format=yyq. 
     , sum(store='A')/count(store) as percent 
    from work.testdata 
    group by 1,2 
; 
quit; 
1

你不想同时设置DISTINCT和GROUP BY

也许尝试:

select t.testingdate 
     ,t.StoreID 
     ,t.Department 
     ,count(t.*)/count(select t2.* 
          from testdata t2 
          where t.testingdate = t2.testingdate 
          and t.StoreID = t2.StoreID) AS Percentage 
from testdata t 
group by t.testingdate 
     ,t.StoreID 
     ,t.Department 

或者你可以使用一个左连接,这可能是更有效的。嵌套选择来统计所有记录,不管部门可能更清楚地阅读。