0
如何预处理多值特征(genre_ids)?预处理多值功能?
由于我需要为一列的每一行分配一个数值,但我可以如何有效地预处理此genre_ids?
msno |city |bd |gender| song_id| song_length| genre_ids| artist_name
1 12 33 0 11 222 372 89
2 11 23 1 1 202 372|374|375 99
3 14 22 1 2 300 386 78
所以一点战的方式来构建一列每个genre_id并将其编码为稀疏矩阵也许(One_Hot_encoding)。然而,为了压缩这个巨大的矩阵,你可以尝试使用一些无监督的学习方法? – Quickbeam2k1