5
在我scikits学习管道,我想自定义的词汇传递给CountVectorizer():Scikits学习:使用自定义的词汇连同管道
text_classifier = Pipeline([
('count', CountVectorizer(vocabulary=myvocab)),
('tfidf', TfidfTransformer()),
('clf', LinearSVC(C=1000))
])
但是,据我了解,当我打电话
text_classifier.fit(X_train, y_train)
流水线使用CountVectorizer()的fit_transform()方法,该方法忽略myvocab。我如何修改我的管道以使用myvocab?谢谢!
感谢您的修复! – mathias