我想用n元分类文本中的不同概念。我的数据tyically存在六列的:在进行n-gram分类时,Rapidminer中的多项式错误
- 需要分类
- 分类
- 第一个字上的1左)
- 第二个字上1左边的字)
- 第一字1)
- 第二个字的第02期1权)
当我尝试在Rapidminer中使用SVM,我得到它无法处理多项式值的错误。我知道这是可以做到的,因为我已经在不同的论文中阅读过。我将第二列设置为'label',并尝试将其余部分设置为'text'或'real',但它似乎没有效果。我究竟做错了什么?
我想用n元分类文本中的不同概念。我的数据tyically存在六列的:在进行n-gram分类时,Rapidminer中的多项式错误
当我尝试在Rapidminer中使用SVM,我得到它无法处理多项式值的错误。我知道这是可以做到的,因为我已经在不同的论文中阅读过。我将第二列设置为'label',并尝试将其余部分设置为'text'或'real',但它似乎没有效果。我究竟做错了什么?
您必须使用Support Vector Machine (LibSVM)
运算符。 与仅支持两个类问题的经典SVM相比,LibSVM实现(http://www.csie.ntu.edu.tw/~cjlin/papers/libsvm.pdf)支持多类分类以及回归。
一种方法可以是创建名称等于距离感兴趣单词的距离的单词和值的属性。当然,所有可能的单词都需要表示为属性,因此输入数据会很大。