背景:我刚刚开始使用scikit-learn,并在页面底部阅读有关joblib, versus pickle的信息。 可能更有趣的使用JOBLIB的替代泡菜(joblib.dump & joblib.load),这是对大数据更有效,但只能咸菜到磁盘,而不是一个字符串 我读过这个Q & A在Pickle上, Common use-cases for pickle in Python并想知道这里的社区
我想复制StratifiedShuffleSplit的例子,X不是一个数组,而是一个稀疏矩阵。在下面的例子中,这个矩阵是由一个DictVectorizer拟合到一个混合名义和数字特征的数组。 from sklearn.feature_extraction import DictVectorizer
from sklearn.preprocessing import LabelEncoder
f