named-entity-recognition

    5热度

    10回答

    我有一些输入文本,其中包含一个或多个人类的人的名字。我没有任何这些名字的字典。哪个Java库可以帮助我从输入文本中定义名称? 我翻看OpenNLP,但没有找到任何示例或指南或至少描述如何将它应用到我的代码。 (我看到的javadoc,但它是这样一个项目文档相当差。) 我想找到一些随机的文字名称。如果输入的文字是“我的朋友乔·史密斯去商店”,那么我想得到“乔·史密斯”。我认为在智能引擎上应该有足够大

    8热度

    4回答

    是否有任何付费或免费的命名实体识别Web服务可用。 基本上我寻找的东西 - 在那里,如果我传似文本: “约翰薯条汉堡王” 它应该是确定 - 东西沿线: 人:约翰 组织:汉堡王 我听说过Annie from GATE - 但我不认为它有可用的网络服务。

    9热度

    2回答

    什么是自动标记文本与城市/地区或起源的一些好算法?也就是说,如果博客是关于纽约的,我怎么能够以编程方式来讲述。是否有包装/纸张声称以任何确定程度进行此操作? 我看了一些基于tfidf的方法,专有名词的交集,但到目前为止,没有壮观的成功,我会很感激的想法! 更一般的问题是关于如何给主题分配文本,给出一些主题列表。 在贝叶斯方法中,简单/朴素方法更喜欢完整,但我是开放的。

    11热度

    8回答

    我有兴趣了解更多有关Natural Language Processing(NLP),如果目前有没有被基于字典识别为文本识别专有名词任何策略很好奇?另外,任何人都可以解释或链接到解释当前基于字典的方法的资源吗?谁是NLP的权威专家,或者关于这个问题的权威资源是什么?

    7热度

    2回答

    什么是条件随机场? 条件随机字段如何在结构化或非结构化文本中将专有名称标识为人员,组织或地点? 例如:本品由计算器公司订购 是什么条件随机场做鉴定计算器公司作为一个组织?

    25热度

    4回答

    我正在寻找一个简单但“足够好”的java命名实体识别库(和字典),我期待处理电子邮件和文档并提取一些“基本信息”,如: 名称,地点,地址和日期 我一直在环顾四周,而且大多数人似乎是在沉重的一面和完整的NLP类型的项目。 有什么建议吗?

    9热度

    3回答

    我正在寻找一个免费标记语料库系统来培训名称实体识别。我发现的大部分(如纽约时报的)都很贵,而且没有开放。谁能帮忙?

    5热度

    9回答

    在HTML页面上识别结构化数据的最佳算法是什么? 例如Google会在电子邮件中识别住宅/公司的地址,并提供该地址的地图。

    3热度

    3回答

    我有一个字符串列表(本例中为公司名称),以及一个Java程序,它从大多数非结构化文本中提取公司名称的公司名称列表。我需要将提取文本的每个元素与列表中的字符串进行匹配。警告:非结构化文本有错别字,例如“Blah,Inc.”简称为“Blah”等。我尝试了Levenshtein编辑距离,但由于可预见的原因而失败。是否存在解决这个问题的最佳实践方法?或者我回到手动数据输入?