vowpalwabbit

    0热度

    1回答

    我有一个工作逻辑回归分类器使用one-against-all(oaa)方法。尽管目前我正在训练分类器来识别15个类,但我希望将来可以从N个额外的类中提供示例,以便让我的分类器学习。但是,使用--save_resume选项的vowpal wabbit命令不允许我使用--oaa来指定新的总类数。 我使用oaa选项,因为当我做出预测时,我想选择具有最高可能性为真的前3个预测类,我使用--probabil

    3热度

    4回答

    我想通过Java使用Vowpal Wabbit。我已经下载并成功编译了GitHub的代码。命令行工具正常工作。 在快速浏览版本库(尤其是here)之后,我只能假设通过Java使用它已经是可能的了,我并不想重新发明轮子。 Vowpal Wabbit的包装,允许通过Java使用。这个包装被设计成独立包装。由于使用JNI的 ,这个JAR支持许多平台。 我已经加入了Maven的依赖关系(找到here)到我

    2热度

    1回答

    在我的ubuntu-14.04机器上安装vowpal wabbit时遇到问题。 根据https://github.com/JohnLangford/vowpal_wabbit的指南,一切正常,直到我输入make’. The error shows that致命错误:rapidjson/reader.h:没有这样的文件或目录'。 我检查了./vowpal_wabbit/vowpalwabbit/ra

    0热度

    1回答

    我有一个非常简单的数据集,见下文(姑且称之为a.vw): -1 |a 1 |b c57 1 |a 2 |b c3 2的命名空间(a和b),阅读维基之后,我知道,大众汽车自动会使a^1或b^c57的真实功能。 然而,之前我就知道,我其实犯了这样的一个VW文件(称之为b.vw): -1 |a a_1 |b b_c57 1 |a a_2 |b b_c3 正如你所看到的,我只需要添加前缀每个手

    0热度

    2回答

    我正在尝试使用Vowpal Wabbit来执行二进制分类,即给定的特征值vw会将其分类为1或0.这就是我如何将训练数据格式化的方法。 1 'name | feature1:0 feature2:1 feature3:48 feature4:4881 ... -1 'name2 | feature1:1 feature2:0 feature3:5 feature4:2565 ... etc

    1热度

    2回答

    我正在尝试使用Vowpal Wabbit来预测广告展示的转化率,并且我得到了非直观的概率输出,这些输出集中在36%左右正面课堂的全球频率小于1%。 我在我的数据集中的正负不平衡是1/100(我已经欠负样本),所以我在正例中使用了100的权重。 负面的例子有标签-1和正面的1.我用shuf来洗牌正面和负面的例子,使在线学习正常工作。 样品线路中的VW文件: 1 100 'c4ac3440|i sea

    1热度

    1回答

    Vowpal Wabbit到文件--span_server模式让它训练模式并行。我不知道我应该如何在这种情况下指定-f参数? $ ./cluster/spanning_tree $ vw --span_server localhost --total 2 --node 0 -d part1.data --holdout_off $ vw --span_server localhost --tota

    0热度

    1回答

    从pyvw wrapper调用时的预测文件是空的。 例如,我在做这样的事情, vw = pyvw.vw(" -i cb.model --cb_explore 50 --cover 10 -p prediction.txt") ex = vw.example(" | label label2") vw.predict(ex) vw.finish() ex.finish() 这将创建pre

    2热度

    1回答

    我已经在我的mac上使用brew install vowpal-wabbit安装了vowpal-wabbit。 vw命令正常工作。不过,我想用一些脚本在\utl\folder of the library. 具体来说,我想运行vw_lda.py 我试图复制这个脚本我的机器并运行它,但我得到以下错误: reading dataset... ERROR: vw-doc2lda not found in

    0热度

    1回答

    我正在尝试一个反对所有逻辑回归分类编辑文章的主题类别根据他们的文本使用vowpal wabbit。当我尝试使用用于培训的相同数据对新文章进行预测时,结果很差,但由于过度拟合,我期望得到不切实际的好结果。在这种情况下,我实际上想要过度拟合,因为我想验证我是否正确使用了vowpal wabbit。 我的模型被训练上的例子看起来像这样的,其中每个功能是从文章一个字,每一个标签是一个类别的标识符,如体育或