opennlp

    -1热度

    2回答

    我打算从tripadvisor获取一些评论数据,我希望能够提取酒店相关方面并为他们分配极性,并将它们分类为负面或正面。 我可以使用哪些工具来实现此目的以及如何和从哪里开始?我知道有一些工具像GATE,斯坦福NLP,Open NLP等,但是我能够执行上述特定任务吗?如果是这样,请让我知道一个前进的方法。我打算使用Java作为编程语言的选择,并且希望使用一些API 另外,如果我继续使用基于规则的方法或

    1热度

    1回答

    我正在尝试使用OpenNLP分析文本内容。但是,当我使用的代码: InputStream is = new FileInputStream("en-sent.bin"); 有FileInputStream下红色的波浪线。它表示类型不匹配,无法从FileInputStream转换为InputStream。我已经导入了一些jar包,但我仍然不知道如何修复它。这与环境变量问题有关吗? 进口: imp

    0热度

    1回答

    我有一个名为my-training.train的文件。 (.train是open-nlp中的培训文件的扩展名)。该文件已经填充了一些数据: Refund What is the refund status for my order #342? Can I place a refund request for electronics? NewOffers Are there any new off

    0热度

    1回答

    我很难搞清楚什么库和数据集合在一起。 工具包/库,我发现: CoreNLP - Java的 NLTK - Python的 OpenNLP - Java的 ClearNLP - Java的 出所有这些的,有些缺少功能。例如OpenNLP没有依赖解析。 我需要找到一个快速的库,它也会执行依赖分析和词性标注。 下一个障碍是我们从哪里获取数据集。我发现了很多东西,但没有充分和全面。 数据,我发现: NLT

    0热度

    1回答

    我的要求是分析像这样的句子。 “找我饥饿的潮书。”或“饥饿的浪潮或破碎的镜子哪一个更好”。 Hungry Tide和Broken Mirror是图书的名称,因此我需要创建一个自定义模型来查找给定的标记数组中的图书标题。所以,以后我可以根据给定的句子创建一个查询。请让我知道我可以做到这一点,或者如果有任何其他方式来分析这样的句子。

    6热度

    1回答

    在OpenNLP培训中,cut-off和iteration的含义是什么?或者就此而言,自然语言处理。我只需要一个外行人对这些条款的解释。就我的想法而言,迭代是算法重复和切断的次数,如果文本的值高于某个特定类别的值,它将被映射到该类别。我对吗?

    2热度

    3回答

    我一直在试图安装“OpenNLP”软件包的链接指向。但是,我得到了显示如下的错误信息 R packages for openNLP

    0热度

    2回答

    我使用我自己的方法来创建独特的令牌。 Apache Open-NLP中是否有内置的方法?

    0热度

    1回答

    我正在为集合构建文档相似度图。我已经做了所有基本的事情,如使用Jaccard系数来表示文档和计算相似性的标记化,词干化,停止词移除和bag-of-word表示。我现在试图提取命名实体并评估它们是否有助于提高文档相似度图的质量。我花了很多时间为我的分析找到地面真实数据集。我对消息理解会议(MUC)数据集感到非常失望。他们是神秘的理解和需要足够的数据清洗/按摩才可以在不同的平台(比如Scala) 我的

    2热度

    1回答

    我想训练模型提取人名(NER系统的一部分),但我想使这个模型无caseless(我的意思是模型不会考虑字母大小写,大写之间没有区别和小写字母),因为我有嘈杂的文字。 那么在训练步骤中是否有任何参数可以做到这一点,或者任何其他方式?