2013-02-13 67 views
-3

首先使用scikit-learn模块的机器学习算法进行图像处理,如何准备特征图像? 我可以用标准偏差(即最近的Neigbour还是集群算法)对值进行归一化? 或者我可以用(featureValue-min)/(max -min)进行线性缩放,就像我在这里看到的那样:http://www.csie.ntu.edu.tw/~cjlin/talks/mlss_kyoto.pdf用于svm。scikit-learn标准化值中的机器学习算法?

+2

我建议将您的问题重新描述为“什么是典型的必须在机器学习数据上执行的预处理步骤“。使用Scikit-learn或任何其他库无关紧要。 – 2013-02-13 14:10:39

回答

2

请仔细阅读下面的问题:ftp://ftp.sas.com/pub/neural/FAQ2.html#A_std 如果你的特征是从高斯分布中得出的,那么你用SD和mean来标准化。否则,您只需进行标准化/重新调整,使其达到0-1的范围。大量的预处理往往取决于数据和选择的技术。找到最适合您的数据和技术。

0

并非所有的算法都需要规范化的输入向量,例如随机森林算法。然而,如果您选择的算法要求归一化,那么SVM将对其进行归一化处理,使用预处理模块中的Sklearn中可用的归一化器,并在拟合之前将数据转换为归一化数据。此外,如果您尝试对图像进行分类,然后在sklearn中查看PCA(主成分分析),这有助于您使用选定的特征进行处理,并提供更好的性能和结果。