2015-09-28 34 views
0

我正在使用TextClassificationEngine。给定示例https://docs.prediction.io/demo/textclassification/有两种用于文本分类的算法(朴素贝叶斯和Logistic回归)。朴素贝叶斯算法工作正常,但是当我使用Logistic回归时,它给出了一些错误。找不到的关键字:LogParam in Logistic Regression PredictionIO

{ 
    "id": "default", 
    "description": "Default settings", 
    "engineFactory": "org.template.textclassification.TextClassificationEngine", 
    "datasource": { 
    "params": { 
     "appName": "Logistic" 
    } 
    }, 
    "preparator": { 
    "params": { 
     "nGram": 2 
    } 
    }, 
    "algorithms": [ 
    { 
     "name": "regParam", 
     "params": { 
     "regParam":2,5 
     } 
    } 
    ] 
} 

上述代码在现场定,它具有在regParam一些错误,由于阵列。任何人都可以请解释我regParamengine.json和什么是最后engine.json逻辑回归?

+0

错误是因为你的''regParam“:2,5'有逗号,而不是''regParam”:2.5'有句号。 @EmergentOrder解释了它的使用方式 – pferrel

回答

1

这是文档中的一个错误,我将提交一个拉来修复它。

regParam期待一个双,所以像 "regParam":0.1

具体而言,该param用于(在火花ML)为L2正则化, 这降低过度拟合的机会[其中该模型不概括以及]通过惩罚过于复杂的模式。

确切的价值使用是一个经验问题, 我会建议,如果你担心的价值做一些搜索值的空间值为regParam,使用一个持有验证集(或k倍)确定胜利者。