2012-03-14 90 views
0

是否可以从句子中删除标签?一个人可以通过扫描文件并找到标签并将其删除,但由于标签很多(某些型号有30多个,一些有48-50个,基本上跟着penn treebank pos tags),是否有一种快速和甜美的方式以更高效的方式去除标签? 我没有检查API,但没有这种方法去除标签。删除POS tagger的标签

+0

你能用一个例子来解释你想要什么吗?如果你只是不想要POS标签,你不会运行一个POS标签.... – 2012-03-15 02:51:18

+0

假设我使用标签标签了一个文件,现在我想根据下一个出现的标签在文件上应用某些条件到每个单词。之后,在修改过的文件中,我显然不希望标签出现,它们根本没有用处,并且不受用户的欢迎。所以,我想删除标签。 我已经找到了解决这个问题的方法,它不像上面我刚才解释的那样简单,我必须同时扫描原始文档和标记文档中的每一行以实现它。但是,我只是好奇,是否有一种更简单的方法去除标签。 :-) – 2012-03-15 12:22:15

回答

1

这里没有什么特别的内容,但是由于输出包括单词和它的标签,我不确定为什么你需要再次扫描原始文档。难道你不能通过从最后一个tagSeparator字符('/'或其他)中删除直到空格来删除标签吗?或者,它可能是简单的使用

-outputFormat tsv 

然后你会得到与在第一列的话,并在第二列标签两列的输出,你可以只保留第一列完成时。