我有一个.dbf包含大约280万条记录,包含住宅地块数据,包含一年建成类别字段,县代码字段和windzone字段(用于构建代码限制)。有3年建成的类别和5个风区。我需要为每个县的每个风区获取每年建成类别的包裹数量。基本上我有一个县(CNTY_ID = 11),其中三个建成类别(BUILT_CAT =“1”,“2”,“3”),每个类别也分配给五个风速类别之一(WINDSPEED =“100”,“110 “,”120“等)。我想我需要使用aggregate()函数,但没有任何运气。生成的表格最好如下所示:使用聚合生成基于多个类别的报告
CNTY_ID = 11
BUILT_CAT
1 2 3
WINDSPEED
100 x x x
120 x x x
.
.
.
150 x x x
CNTY_ID = 12
BUILT_CAT
1 2 3
WINDSPEED
100 x x x
120 x x x
.
.
.
150 x x x
是否可以完成这种任务?
谢谢你,这是更容易阅读。当你发布这个时,我实际上正在查看dplyr软件包! – Michael
@迈克尔,这不给你数量,但臭氧测量的总和。这是一个完全不同的问题。如果你努力阅读函数'table',你可能想研究更多一点。我喜欢'dplyr'包裹,在这种情况下,您使用的是火箭筒拍摄蚊子。如果你真的需要计数,那就是...... –
'table'一直是我的快速列表。如果需要,对于频繁与R交互的人来说,阅读和转换很容易。正如@ joris-meys所指出的那样,上述解决方案确实适用于“求和”,主要是因为我没有一个现成的数据集,我可以很容易地让这个点通过并且可以重现。在任何分组变量中使用'length'会给出我在解决方案中提到的计数。 – Drj