machine-learning

    9热度

    3回答

    我研究了一些简单的语义网络实现和解析自然语言的基本技术。但是,我还没有看到许多项目试图弥合两者之间的差距。 例如,考虑的对话框: "the man has a hat" "he has a coat" "what does he have?" => "a hat and coat" 一个简单的语义网络,基于上述句子的语法树分析,可能是这样的: the_man = Entity('the m

    7热度

    2回答

    我有一个二进制类数据集(0/1),朝着“0”级(大约30000 vs 1500)倾斜很大。每个实例有7个特征,没有缺失值。 当我使用J48或任何其他树分类器时,几乎所有的“1”实例被错误分类为“0”。 将分类器设置为“unpruned”,将每片叶子的最小实例数设置为1,将置信度因子设置为1,添加带有实例ID号的虚拟属性 - 所有这些都没有帮助。 我只是不能创建一个模型,过度我的数据! 我也尝试了几

    4热度

    2回答

    使用PyClips,我试图建立在从Python解释器动态检索数据的剪辑中的规则。为此,我注册了the manual中列出的外部功能。 下面的代码是该问题的一个玩具示例。我这样做是因为我的应用程序拥有大量的数据库,采用SQL数据库的形式,我希望使用剪辑进行推理。但是,如果我可以直接将剪辑直接插入Python的名称空间,我不想浪费时间将所有这些数据转换为剪辑断言。 但是,当我尝试创建规则时,出现错误。

    0热度

    1回答

    我有一个约1700万的句子列表。我需要将句子标识为垃圾邮件/火腿/不确定。在互联网上有训练有素的模型,我可以将这些模型作为“测试”集合提供给我,并且系统会将我的句子分类为垃圾邮件/火腿? 注意:句子不是电子邮件。

    12热度

    3回答

    有没有机会让信息获取的价值成为负值?它是根据以下文章中的公式计算的。我无法写出公式,因为它包含了一些硬性符号。 http://citeseerx.ist.psu.edu 谢谢!

    1热度

    1回答

    我有一大堆已经计算好TF-IDF的文档。我准备向集合中添加更多文档,并且我想知道是否有一种方法可以在不重新处理整个数据库的情况下将TF-IDF分数添加到新文档中?

    0热度

    1回答

    是否有人知道在Python或Java中实现的hierarchical task network规划器?我发现了几个open source systems,但几年后它们看起来都是dead projects和haven't been maintained。

    3热度

    3回答

    如何为本体中不同用户声明的语句赋予客观确定性? 例如,考虑用户A声称“Bob的帽子是蓝色的”,而用户B声称“Bob的帽子是红色的”。你如何确定是否: 用户A和用户B指的是不同的人名为鲍勃,可能会或可能不正确。 这两个用户都指的是同一个人,但用户A是正确的,用户B是错误的(反之亦然)。 这两个用户都指的是同一个人,但用户A是正确的,用户B在说谎(反之亦然)。 这两个用户都指的是同一个人,并且这两种用

    0热度

    1回答

    如何在规则的LHS中匹配的事实中取消引用插槽?如果一个变量 符合事实,我找不到如何创建更多的条件, 匹配该事实中的插槽。 例如,在下面的代码中,如果存在“(do(action?action))”形式的事实,我想打印一些文本。然而,“行动”本身就是一个事实,如果事实的“名称”位置是“运行”,我只希望触发规则。我怎么做到这一点? (deftemplate do (slot action)

    12热度

    1回答

    RDF/OWL能够表示多少用自然语言表达的概念?我仍然在学习RDF和其他语义技术,但正如我目前所了解的那样,信息通常表示为表单的三元组(主体,谓词,对象)。所以我可以想象一下,“鲍勃有一顶帽子”的句子可能会如何表现出来。然而,你会如何表述一个更复杂的句子,比如“第42街上的鲍勃,在业主批准后在商场有工作”?代表名词/动词/所有权/因果关系/时态等的标签是否有约定? 请注意,我不是问如何自动将任意自