我有一个表user_aisles
其是含有由user_id
和user_aisles
其n
是通过在过道用户购买的物品的数目分组的数据帧。变换各USER_ID组特征向量
kable(head(summarize(user_aisles, n=n()) , 9))
给
| user_id| aisle_id| n|
|-------:|--------:|--:|
| 1| 2| 8|
| 1| 3| 12|
| 1| 4| 5|
| 2| 1| 1|
| 2| 3| 6|
| 2| 14| 1|
| 2| 17| 2|
| 2| 20| 1|
| 2| 21| 5|
我想转换成特征向量这对于每个用户ID。这样的特征向量应该是尺寸为nrow(aisles)
。
所以每个user_id
都得到一个对应的特征向量。用户1的特征向量可以(基于数据)看起来像
1: [0, 8, 12, 5, 0, .., 0]
我该怎么做?
嗯。不,这不是我需要的。 'x $ aisle_id'应该是每个特征向量中的_index_。我不确定你为什么重复这个价值? – displayname