semantic-analysis

    0热度

    3回答

    我正在阅读有关管道和过滤器架构模式的面向模式的软件体系结构。在这里我不需要知道编译器的设计,但作者给出了编译器设计的例子。我遵循了大部分,但我很难理解以下内容。在编译器设计中,我们有不同的阶段,如扫描器,解析器,语义分析,中间代码生成和后端(MIPS后端,英特尔后端...)。 这里作者提到了前端阶段,解析器,语义分析,中间代码生成。后端是MIPS后端。 以下是文字片段 我们决定不明确构建一个抽象语

    0热度

    1回答

    我一直在努力使用Mahout中提供的SparseVectorsFromSequenceFiles,RowIdJob和RowSimilarityJob Hadoop作业,其运行地图进行潜在语义分析/ Reduce作业。我一直在试图为这些在内存中运行的功能找到一个等效的实现,无论是在单个线程中,还是在多个线程中。 有这样的事吗?

    2热度

    1回答

    假设C涉及一组容器{c1,c2,c3....cn},其中这些容器中的每一个都包含一组有限的整数{i1,i2,i3...im}。此外,假设一个整数可能存在于多个容器中。给定一组有限整数S{s1,s2,s3...sz},找到包含S中所有整数的最小子集C的大小。 请注意,可能有成千上万个容器,每个容器都有数百个整数。因此,蛮力对于解决这个问题很慢。 我试图用贪婪算法解决这个问题。也就是说,每次我选择集合

    0热度

    1回答

    我公司的名单:在列表中 New York Times Sony Washington Post Panasonic Toyota others... 对每一家公司,我需要的: Company URL Twitter @Username LinkedIn Username Facebook Username 是否有确实,在自动方式的API服务?也许各种服务的组合可以起作用?

    1热度

    2回答

    我正试图编写一个程序来评估文本之间的语义相似性。我已经比较了文本之间的n-gram频率(词汇量度)。我想要一些比这更浅的东西,我认为在句子结构中寻找相似性是评估文本相似性的一种方法。 但是,我能想出的方法是计算POS(例如,每个文本4个名词,2个动词等)。这就类似于只计算n-grams(实际上它的工作效果不如ngram)。 postags = nltk.pos_tag(tokens) self.

    4热度

    1回答

    如何确定使用WordNet的Python中两个文本之间的语义相似度? 明显的预处理将删除停用词和词干,但那又如何? 我能想到的唯一方法是计算两个文本中每个单词之间的WordNet路径距离。这是unigrams的标准。但是这些都是大的(400字)文本,它们是自然语言文件,没有任何特定顺序或结构的文字(除了英文文法强加的文字外)。那么,你会在文本之间比较哪些单词?你将如何在Python中做到这一点?

    0热度

    1回答

    我对NLP很新手......有没有任何API或方法可以从句子中识别动词或形容词或副词? 我需要它在一个项目中?

    2热度

    1回答

    我想了解叮当的来龙去脉,而且我不太确定“Sema”库。语法分析是编译器编译程序所用的路径吗?还是仅供程序员用来分析他/她的代码? 从我收集的内容中,解析器创建一个AST,然后有“AST消费者”使用AST来做不同的事情。因此,代码生成库将AST转换为IR。语义分析库使用AST来分析代码。这种理解是否正确,或者语义分析器是否也用于编译?

    0热度

    1回答

    我是新来的本体,并有一个关于OWL推理的基本问题。这个问题可能看起来很漫长,对此感到抱歉。 考虑一个具有以下公理的本体: (猫头鹰:类C1)和(猫头鹰:类P),具有对象属性(rdfs:域观察C1)( RDFS:范围观察p),与单独的沿着(RDF:p型p) 我然后通过创建类C2(RDFS限制类C1:用限制性subClassOf C2 C1)(观察到C2 p) 现在,当我创建一个新的个体(rdf:ty

    2热度

    2回答

    我正在尝试为Rails中的一家杂货店构建一个搜索界面。 我有几个杂货店产品存储在我的数据库中,但我正在努力寻找一种很好的方式来搜索他们。 到目前为止,我用Thinking Sphinx来做产品的全文搜索。 这适用于某些项目,比如“鸡蛋”,但对其他搜索有一些问题,例如“石灰”。 例如,当我搜索“石灰”,我得到以下归还物品: 饮食塞拉利昂雾酸柠檬冰箱伴侣苏打 G2酸柠檬低热量电解质饮料 鹿公园贝瑞石灰