如何使用sklearn获取无用功能列表？

我有一个数据集建立一个classificator：如何使用sklearn获取无用功能列表？

dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') 
X=dataset.ix[:, dataset.columns != 'class'] 
Y=dataset['class']

我想只选择重要的功能，所以我做的：

clf=svm.SVC(probability=True, gamma=0.017, C=5, coef0=0.00001, kernel='linear', class_weight='balanced') 
model = SelectFromModel(clf, prefit=True) 
X_train, X_test, Y_train, Y_test = cross_validation.train_test_split(X, Y, test_size=0.5, random_state=5) 
y_pred=clf.fit(X_train, Y_train).predict(X_test) 
X_new = model.transform(X)

所以X_new的形状3000x72而X有3000x130。我想获得X_new中没有的功能列表。我该怎么做？

X是一个带有标题的数据框，但X_new是一个列表，其中包含没有任何名称的特征值的列表，因此我无法像在熊猫中那样合并它。谢谢你的帮助！

来源

2016-09-28 Polly

请问您能否提供一个例子，只需要几行'X_new'和'X'的外观以及它的输出是什么？ –

clf.coef_返回给您一个特征权重列表（在fit()之后应用）。按重量排序，你会发现哪些不是很有用。

来源

2016-09-28 14:15:01 sergzach

，但如果我没有弄错它不给我一个功能名称列表，只是订购了selectfrommodel我已经得到的系数 – Polly

您的分类器对最初的DataFrame中的名称一无所知，所以我建议手动构建它，类似于'权重= pd.DataFrame（{'功能'：df.columns，'权重'：clf.coef _}）' – arsenyinfo

@arsenyinfo我认为你不需要功能名称。顺序与您的对象（X）中的顺序相同。 – sergzach

你可能也想看看Feature Selection。它描述了一些更系统的技术和工具。

来源

2016-09-28 23:23:06 shahins

尝试运行这段代码：如果选择与否的功能

import pandas as pd 
import numpy as np 

dataset = pd.read_csv(sys.argv[1], decimal=",",delimiter=";", encoding='cp1251') 
X=dataset.ix[:, dataset.columns != 'class'].values 
Y=dataset['class'].values 
feature_names = data_churn.columns.tolist() 
feature_names.remove('class') 

from sklearn.feature_selection import SelectFromModel 
from sklearn.svm import SVC 
from sklearn.model_selection import train_test_split 
clf = SVC(probability=True, gamma=0.017, C=5, coef0=0.00001, kernel='linear', class_weight='balanced') 
model = SelectFromModel(clf, prefit=True) 
X_train, X_test, Y_train, Y_test = train_test_split(X, y, test_size=0.5, random_state=5) 
y_pred=clf.fit(X_train, Y_train).predict(X_test) 
X_new = model.transform(X) 
print pd.DataFrame(np.c_[feature_names, model.get_support(0)], 
         columns=[ 'feature_name', 'feature_selected'])

的“feature_selected”栏显示。

来源

2017-02-01 12:28:04 prashanth

如何使用sklearn获取无用功能列表？

回答

相关问题