在机器学习包,比如liblinear的分类和NLTK提供了一个方法show_most_informative_features()
,这是调试功能真的有用:如何为scikit-learn分类器获取最丰富的功能?
viagra = None ok : spam = 4.5 : 1.0
hello = True ok : spam = 4.5 : 1.0
hello = None spam : ok = 3.3 : 1.0
viagra = True spam : ok = 3.3 : 1.0
casino = True spam : ok = 2.0 : 1.0
casino = None ok : spam = 1.5 : 1.0
我的问题是,如果类似的东西是在scikit学习的分类实施。我搜查了文档,但找不到类似的东西。
如果还没有这样的功能,有人知道如何获得这些值的解决方法吗?
非常感谢!
你是指最具歧视性的参数? – Simon
我不确定你的意思是什么参数。我的意思是最挑剔的功能,如在袋的词模型的垃圾邮件分类,哪些词给每个类的最证据。不是我所理解的“设置”分类的参数 - 就像学率等 – tobigue
@eowl:在机器学习的说法,*参数*是通过基于学习过程*特点*你的训练集产生的设置。学习率等是超参数*。 –