我在下面的长格式逐行交易数据从长[R重塑数据来宽,聚集在一个变量
TransactionId ItemCode
101 123
101 521
102 423
103 871
103 982
103 131
我要重塑这个让所有项目在一个事务中的一行,因此,新的重塑表看起来像这样(宽)
TransactionID ItemCode(s)
101 123 521
102 423
103 871 982 131
我试图融化和R中铸造,但我有点困惑的方法是如何工作的。另外我的数据集很大,有30M行。我应该如何去做这个过程?
您的输出表格不是矩形形式。你有太多的列相对于它下面的数据(其中有三列) –
@CyrusMohammadian我编辑了事务ID,也许这使得我想做的更清楚。我的行不总是具有相同数量的输出,因为交易中可能有不定数量的项目。 – SuhrudL
您是否希望将商品代码放在单独的列或一列中,并且如果在一列中,您希望将它们作为字符矢量还是将其作为每个单元格的data.frame? – aichao