我具有以下的输入数据:大规模数据Logistic回归
head(data1)
VarA VarB VarC VarD VarE VarG VarH VarI
2016-06-01 09:30:05 14.2 31228 ABCD IS Equity 1 139 192 23
2016-06-01 09:30:07 14.2 31128 ABCD IS Equity 0 0 0 0
2016-06-01 09:30:09 14.2 36128 ABCD IS Equity 1 138 192 23
2016-06-01 09:30:19 14.2 36028 ABCD IS Equity 0 0 0 0
2016-06-01 09:30:21 14.2 27028 ABCD IS Equity 1 112 190 23
2016-06-01 09:30:37 14.2 26528 ABCD IS Equity 0 0 0 0
VarA
POSIXct
是类型,VarD
是chr
类型的,并且是rests
num
类型。
VarE
是我的因变量。 VarC, VarB, VarG, VarH and VarI
是我的解释变量。数据集的总行数为7.4 million
。我想运行逻辑回归。我试过bigglm
从biglm
包使用binomial family
。但它是failing to converge
。由于我没有得到适当的偏差值。所以我有问题计算McFadden's R-Sqr
值相同。你可以请建议任何替代包/方式?
在此先感谢。
Downvote ??我可以知道为什么吗?如果可能的话,请给我解释一下,这样下次我可以小心了。 – Zico