我有一个非常大的客户数据集,他们购买了一些日期(年)。我想R键给我:R - 每年新客户数和前一年购买客户的百分比
- 每年新客户的数量,并
- 从当年客户之前%(N-1)。
我的数据是这样的:
customer_id year
12001 2007
12001 2008
12001 2009
12002 2006
12002 2007
12003 2005
... ...
每个客户做了一段时间的各种购买。
我想有输出是这样的:
# Table1
year no. of new customers
2005 34
2006 25
2007 17
... ...
表1报告每年独特的新价值;和:
# Table2
year % of customers that also purchased at (year-1)
2005 25%
2006 17%
... ...
此表2表示“记录在2005年的所有客户,25%也被记录在2004年,2006年记录的所有客户,17%也被记录在2006年,等等。”
我知道第一部分是partially answered,但它不适用于R.而我在其他地方找不到类似的东西。
您需要同时提供与所提供的数据集相对应的数据集和所需的输出。就目前来看,你似乎提供了一个太小的数据集和一些虚构的想要的输出,它与提供的数据集无关。这种行为通常会让用户跳过你的问题并继续前进,而理论上可以很容易地回答 – 2014-10-12 11:15:39