categorization

    1热度

    3回答

    我有以下两个表记录支出,并提供支出类别的信息: 表交易: +-------+--------+--------+ | month | cat_id | amount | +-------+--------+--------+ | 1 | 2 | 3 | | 1 | 2 | 8 | | 2 | 1 | 7 | | 2 | 1 | 5 | +-------+---

    0热度

    1回答

    我在写一个webrobot,它将基于关键字/元/链接的网站分类到预定义的类别列表中。 我一直在寻找各种本体论方法,并已经看过Wordnet(用于hypernym/hyponym),ResearchCyc,WebKb,并且想知道这是否像我想的那样难以解决问题或者是否已经解决了某个问题别的之前。 本质上,我有大量的排序关键字值,并希望使用它们来匹配类别名称。我目前的想法是在某种本体层次结构中检查类别名

    18热度

    5回答

    我的大型(120GB)音乐收藏包含许多重复的歌曲,并且我一直试图通过指纹轨道来检测重复内容。而且因为我是CS少校,所以我很好奇在那里做了什么?我做的没有几乎像Shazam或Lala.com的准确性。他们如何“散列”轨道?我对所有的文件(26,000个文件)都运行了标准的MD5哈希,并且在不同的轨道上发现了数百个相同的哈希值,因此不起作用。 我对Lala.com更感兴趣,因为他们与完整的文件一起工作

    5热度

    5回答

    我有一个如下所示的表: ID |关键字|类别|子分类|子子类别|子子类别 是否需要将它分成两个表格(关键字表格和具有父级ID的类别表格) 如果一个关键字只能属于一个类别,子类别...等等这意味着没有重复。是否仍然需要将其拆分?

    2热度

    5回答

    迄今为止,我一直在使用Java,Prolog,SQL和C#语言。我知道Java和C#是必不可少的,Prolog声明式和SQL有些声明式语言。 Java和C#是面向对象的,您可以使用它们开发面向方面的程序。 这已经是四种不同的特征,某些语言可能适合或实现:命令性的,声明性的,面向对象的,面向方面的,并且我遇到了各种其他类别:函数式语言,汇编语言,可能还有很多我避难没听说过。 是否有某种同意和/或逻辑