2017-04-24 43 views
-3

我有一个机器学习问题,其中因变量是二项式(是/否)并且一些自变量是分类的(超过100个级别)。我不确定对这些分类变量进行虚拟编码,然后将它们传递给机器学习模型是一个最佳解决方案。在机器学习中具有太多水平的分类变量

有没有办法解决这个问题?

谢谢!

+2

这些类型的问题不涉及编程,不属于StackOverflow。在互联网上搜索它或发布到https://stats.stackexchange.com –

回答

0

您可以尝试在分类变量上创建虚拟变量。在此之前,尝试组合一些分类变量。