我已经能够使用result = logit.fit()
做模型预测。python的statsmodel包中的测试和验证
现在进行测试和验证设置我们只需要做result.predict(test_df[features])
和result.predict(vald_df[features])
?这就是全部?或者我错过了一些步骤?当我尝试部署该模型进行日常预测时,情况会有什么不同?
我是statmodel的新手,事实上从今天开始,种类不足。我查了几个博客,信息不相关,所以只是想确定一下。
另外,有没有一种方法可以直接从statsmodel中提取'Area under ROC'
而不是编码我们的方式?
对于预测就是这样。一旦你从一个拟合模型得到了结果实例,你可以在新数据上调用'predict'。新数据需要与原始数据的结构相匹配。如果您使用公式,那么数据将按照与训练数据相同的方式进行转换。如果您直接将设计矩阵作为DataFrame或numpy数组提供,则用于预测的数据需要与此相匹配,例如,你需要明确包含常量,它不会自动添加。 – user333700