brat

    1热度

    1回答

    当使用快速注释器工具brat时,看起来创建的注释文件将按注释由用户执行的顺序显示注释。如果您从文档的开始处开始执行注释,那么注释自然会处于正确的偏移顺序。但是,如果您需要在文档的前面添加另一个注释,则输出.ann文件中注释的偏移顺序将失序。 怎样才能重新排列.ann文件,使得注释在完成时按偏移顺序排列?在小朋友面前有什么选择可以让你做到这一点,还是人们必须编写自己的脚本来执行?

    0热度

    1回答

    我使用Brat软件(http://brat.nlplab.org)来注释我的数据。我有我的注释文件,并希望手动更改它们,例如。删除一些实体,编辑实体类型等。 每次进行更改,页面重新加载大约需要5-10秒。这是因为孩子在网络服务器上工作(http://brat.nlplab.org/installation.html),所以当做出更改时,它会将更改后的文件上载到服务器上,然后重新加载。 我需要做一些

    0热度

    1回答

    以下异常的原因是什么? DOMException: Failed to execute 'getStartPositionOfChar' on 'SVGTextContentElement': The charnum provided (0) is greater than or equal to the maximum bound (0). 实际上,我试图将https://github.co

    -2热度

    1回答

    在Brat中,要注释一个文本,您应该参考一个名为'annotation.conf'的配置文件,我有超过150个标记来注释特定于域的文本的语义和这些注释标记的应在不同的配置文件分开,因此注释不会分心,如果所有的标签存储在一个单一的“annotation.conf”文件从一个长的列表中进行选择。 一个典型的情况是,该注释将上传文本,然后为每个语句有哪些应该从我创建了组织我的语义标签组触发一个annot

    1热度

    2回答

    如何在google nl api中为语法分析开发一棵树。像斯坦福corenlp使用小子注释工具来生成树。我们可以使用类似的东西为google nl api生成json响应的依赖分析树,如果是这样的话? 感谢提前:)

    3热度

    1回答

    这是一个自我回答的问题,它描述了如何解决安装brat annotation tool时出现的问题,该问题用于创建用于NLP的注释语料库,一台启用了SELinux的普通Linux机器。这是基于该工具的1.3版本。 安装过程如documented包括以下步骤: 拆开.tar.gz文件在(Apache)的web服务器的目录,通常/var/www/html或$HOME/public_html 可能源自br

    1热度

    1回答

    我有一个使用brat注释的数据。我想将.ann文件转换为.xml以简化计算。 有没有工具? 谢谢

    0热度

    1回答

    我想注释多个实体的标签为单个单词。 在小伙子的关于"the Colorado Richly Annotated Full Text Corpus (CRAFT)"的例子中,“胶原蛋白”一词由多个标签注释,如“RR”和“GC CC”。 现在,我尽量多批注实体的标签,一个字,但小子说的错误与 "AnnotationError: Error [LABEL A] cannot have identical

    2热度

    2回答

    我有170本荷兰文学小说的语料库,我将在其上应用命名实体识别。对于荷兰语的现有NER标签的评估,我想手动注释这个语料库的随机样本中的命名实体 - 为此我使用brat。手动注释的随机样本将作为我评估NER标签的“黄金标准”。我写了一个Python脚本,在句子级别输出我的语料库随机样本。 我的问题是:根据每部小说的句子数量,随机样本的理想大小是多少?就目前而言,我每条小说使用了100个句子,但是这导致