named-entity-recognition

    2热度

    2回答

    我不知道索引视图是什么,但我想知道底层表中的数据发生了什么变化时发生了什么? 整个视图缓存丢弃od只是改变了行吗? 我对用于搜索酒店可用性(+ 100k记录)的几个表(+5)进行了非常复杂的查询,并且IMHO索引视图可以显着提高性能。 但是数据(少数几行)经常更改(房间已售出,管理员atc处更改了免费房间),并且如果每次只更改一行时都会重新构建视图,那么对我的应用来说就是瓶颈。 或任何想法如何“缓

    5热度

    6回答

    我尝试实例化在控制台应用程序中的服务器场上的SPSite实例,我给参数整个网站(http://sp2010/)。我还确保运行MyApp.exe的帐户是网站集管理员。 但是,无论我尝试做什么,我都无法创建SPSite的实例。我总是回馈“FileNotFoundException”。 有人有想法吗? 堆栈跟踪: System.IO.FileNotFoundException:找不到在http://lo

    4热度

    1回答

    我正在查看NLTK的命名实体识别功能。是否有可能找出哪些提取的关键词与原文最相关?另外,是否有可能知道提取的关键词的类型(人物/组织)?

    1热度

    1回答

    如何标记斯坦福NER中的搭配?目前,它标记为Federal Reserve Bank of New York <wi num="11" entity="ORGANIZATION">Federal</wi> <wi num="12" entity="ORGANIZATION">Reserve</wi> <wi num="13" entity="ORGANIZATION">Bank</wi> <wi

    19热度

    5回答

    我需要将单词分类为他们的词类。就像一个动词,名词,副词等。 我用 nltk.word_tokenize() #to identify word in a sentence nltk.pos_tag() #to identify the parts of speech nltk.ne_chunk() #to identify Named entities. 的放出来的,这是一棵树。 如

    0热度

    1回答

    是否可以计算一篇文章中提及实体的次数?例如 ABC Company是全球最大的汽车制造商在世界 一个。 It也是公司年产量最大的 公司。 It也是豪华轿车的第二大出口国,经过XYZ 公司。 ABC和XYZ 合计产生​​的汽车总产量超过n% 该国的生产。 提到ABC公司4次。

    0热度

    1回答

    我的MFC应用程序出现问题。当我试图从存档中反序列化CBitmap并创建新的CBitmap时,它不会正确加载CBitmap的位。 下面的代码: BITMAP bm; ar >> bm.bmType; ar >> bm.bmWidth; ar >> bm.bmHeight; ar >> bm.bmWidthBytes; ar >> bm.bmPlanes; ar >> bm.bmBits

    1热度

    2回答

    我曾尝试使用SourceForge中的OpenNLP工具1.5从文本中获取命名实体。我在OpenNLP下载中找到了JWNL文件。这是否意味着OpenNLP反过来将WordNet用于命名实体识别。 (具体来说,这是否意味着名称模型文件是使用WordNet生成的)?

    2热度

    1回答

    有一些服务,如Open Calais和Alchemy API可以从非结构化文本生成RDF。有工具可以离线吗?有没有人试过WebCAT或OpenCyc可以用于这种用例?

    2热度

    1回答

    我有使用NER标记的文本文件,我需要将它们链接到Google地图。 <p>Gardai|NNP|O fear|VBP|O a|DT|O 28-year-old|JJ|O man|NN|O ,|,|O missing|VBG|O from|IN|O his|PRP$|O Dublin|NNP|I-PER home|NN|O for|IN|O a|DT|I-DAT week|NN|I-DAT 虽然