2016-12-16 143 views
-1

因此,我已经生成了各种音乐文件的缩放MFCC值的“.csv”文件,并按流派分组这些文件。每个流派有25个文件。使用Scikitlearn为音乐流派分类创建kNN分类器

每个csv文件的每一列代表每个帧的12 mfccs(mfccs 1-13)。我将如何使用scikit学习来创建模型?我是否会迭代每列,然后使用此列作为输入数组并将该类型作为标签来训练模型?

回答

0

对不起。正如你所说的,你需要把你的csv的列作为你的矩阵X,把这个类型作为一个y向量。熊猫提供了一个简单的方法来阅读csv。 (http://pandas.pydata.org/)然后你可以使用kNN分类器:http://scikit-learn.org/stable/modules/generated/sklearn.neighbors.KNeighborsClassifier.html

分类器有一个适合您的数据的拟合方法和预测新样本的预测方法。

+0

我想用kNN做监督式学习。它完全可能。因为我不知道如何构建数据,所以我只是在挠头。我喜欢做这样的事情,除了我提到的数据:http://modelai.gettysburg.edu/2012/music/ – ohbrobig

+0

我相信你是kNN混淆kMeans。 kMeans是无人监督的。 – ohbrobig