2016-09-30 57 views
0

我训练的模型与特征矩阵尺寸(200716),其中,200是文档716的数量和被总feature.Now的编号i想测试与模型输入测试数据具有特征词(7)1。如何能够映射此功能完全相同的许多特征的,其中我们的模型得到培训,这样,我可以使用model.predict(TEST_DATA)功能用于检查的预测新数据模型。输入测试数据改变成特征矩阵的维

+0

你应该提供更多的细节关于你的问题,也许一个例子来帮助理解这个问题。例如:您是否使用某种指标变量矩阵来表示您的数据?文档中的特征词是什么? – raghu

回答

0

答案会不会对你来说不错,但......你必须使用你在第一个地方用同样的方法。没有一般,“神奇”实现这一目标,你必须在原始格式的培训文档,并通过一些改造f你把它映射到功能的方式,你必须存储转换本身(的功能,它的字典等等。)。如果你删除它,你什么都不能做。通常,您将以pickle文件或您选择的任何其他格式保存模型(分类器)和预处理流水线(f,从数据到特征的转换)。然后,在预测期间,您只需加载两个零件并将其重新应用于新数据。