pos-tagging

    1热度

    1回答

    我正在尝试创建一个新的列,该列中的数据框中有clean_word列的pos标签。如下图所示,该列有单个单词。所以不需要标记等等。 下面是我的代码。 import nltk datahitword['pos_tag'] = nltk.pos_tag(datahitword['clean_word']) datahitword.head() 即使在将列转换为列表和系列以将其隔离并添加到数据框

    0热度

    2回答

    我想使用文本文件作为输入来评估NLTK中的不同POS标记。 例如,我将采用Unigram标记器。我发现如何使用棕色语料库评估Unigram标签。 from nltk.corpus import brown import nltk brown_tagged_sents = brown.tagged_sents(categories='news') brown_sents = brown.se

    0热度

    2回答

    我正在寻找一种方法来为我在R中的列表中的单个词/标记创建POS标记。我知道,如果我为单个标记执行此操作,准确性会降低而不是句子,但我拥有的数据是来自维基百科的“删除编辑”,人们大多删除单个不连接的单词而不是整个句子。我几次看到这个问题的Python,但我还没有找到它在R的解决方案。 我的数据看起来somehwat这样 Tokens <- list(c("1976","green","Normand

    1热度

    2回答

    我使用nltk .tokenize(),.pos_tag()和wordnet .synsets()获得以下输出。输出是用于文件和共发现自己的部分词性标注每个令牌可能匹配的列表的列表(在这里,我们有4个令牌,因此,比赛的4名名单): [[Synset('document.n.01'), Synset('document.n.02'), Synset('document.n

    0热度

    1回答

    我是一名Python新手,想在从本地计算机导入csv文件后进行POS标记。我从网上查找了一些资源,发现下面的代码有效。 text = 'Senator Elizabeth Warren from Massachusetts announced her support of Social Security in Washington, D.C. on Tuesday. Warren joined

    0热度

    1回答

    我使用textacy的pos_regex_matches方法来查找句子中的某些文本块。 例如,假设我有文本:Huey, Dewey, and Louie are triplet cartoon characters.,我想检测Huey, Dewey, and Louie是枚举。 要做到这一点,我用下面的代码(在testacy 0.3.4,可用的版本在写作的时间):它打印 import textac

    1热度

    1回答

    nltk tagged_sents与tagged_words有什么区别? 他们似乎都是元组列表(单词,标签)。如果你做的类型(),它们都是 nltk.collections.LazySubsequence

    0热度

    1回答

    我想为每行中的每个单词做标记(每行包含几个句子)。 我有这样的代码: import nltk import pos_tag import nltk.tokenize import word_tokenize f = open('C:\Users\test_data.txt') data = f.readlines() #Parse the text file for NER with

    0热度

    2回答

    如何返回true如果输入中的第一个单词是动词,我需要我的函数返回true。 我试过这个,但它不起作用(即使它是一个动词也没有返回任何东西),有人可以告诉我一个我做错了什么的例子。还有一个正确的做法是,谢谢你! def All(): what_person_said = input() what_person_said_wt = nltk.word_tokenize(what_p

    1热度

    1回答

    每个记录词性标注我有这样 Task Response 1 NA 2 NA 3 EFFICACY 4 I was sent to external vendor for solution (PDA parts), but at PDA parts they identified within few minites that new battery would not solve the