aho-corasick

    4热度

    2回答

    最近我想用python2.7.5在centos5.8_x64中使用ahocorasick,但是我发现结果不正常,那么请您告诉我原因吗?我发现模块运行完全在我的Windows 7与python2.7.5.Here是我的测试代码,并在Linux中的结果。 >>> import ahocorasick >>> tree=ahocorasick.KeywordTree() >>> tree.add("

    1热度

    1回答

    我有这个exercice一个问题: 给定一个范围A和1 <= A,B <= 10^18 和表示子Ni与1 <= i <= 1000一些整数到乙; 返回可能数目的总数的范围内A,B之间(包括甲和乙)包含任何给定的子串。 输入 A, B, i N1 N2 ... Ni 例如: 简单输入 10 22 2 1 10 简单输出 11 说明:10至22包含以下的数字的范围内,10* 1

    2热度

    2回答

    我正在使用Aho-Corasick文本匹配,并想知道它是否可以更改为匹配条款而不是字符。换句话说,我希望条款成为匹配的基础而不是角色。举个例子: 搜索查询: “他”, 一句话: “世界,你好”, 阿霍Corasick将匹配 “他” 来了一句 “Hello World” 的索引2结束,但我宁愿没有匹配。所以,我的意思是用“术语”而不是字符。

    1热度

    1回答

    我有一个名单上有数百万名着名人物(来自维基数据),我需要创建一个系统,以相当短的文本有效地找到所有人提到的:它可以只是一个词(例如“爱因斯坦”)到几页文字(例如维基百科页面)。我需要系统对拼写错误(比如迈克尔杰克逊而不是迈克尔杰克逊)和短格式(例如M.杰克逊)相当宽容。如果含糊不清,它应该返回所有可能的人(例如,“乔治布什”应该返回父亲和儿子,以及可能的其他同名词)。 这个related ques

    1热度

    1回答

    如果是这样,有人可以解释后缀树中的后缀链接的目的是为了确切的字符串匹配吗?

    -1热度

    1回答

    请帮我找到这段代码中的错误。我写了一个简单的程序,它通过Aho-Corasick算法将n个字符串添加到trie中,但它不能正常工作。输入字符串后崩溃了。出什么问题了用这个代码? #include <cstdlib> #include <iostream> #include <vector> #define ALPHABET 26 using namespace std; struct

    2热度

    1回答

    我有Aho-Corasick算法的代码。但是当在给定的字符串列表中搜索文本时,我仍然不明白如何在查找过程中使用状态信息。 例如我有一个字符串列表[MOSCOW][COLA],现在我需要确定CA是否在列表中,如果是,它的位置是什么? 这是link to the code。

    1热度

    1回答

    我在这里得到了aho-corasick算法的代码:http://www.komodia.com/aho-corasick。 我用它作为指南说,添加线条并构建树。 但是我改变它从使用std wstring到std字符串,但这应该不重要。我只是改变了typedef。 当我使用它并搜索某些东西时,如果找不到结果就没有问题。当找到结果时,我会得到一个标准超出范围的异常。 它崩溃的位置: if (aIte

    2热度

    1回答

    请帮助我了解Aho-Corasick算法中多个模式的状态转换表的构造。 请给我一个简单而详细的解释,以便我能理解。 我跟着this纸和here是这样的动画。 谢谢。用一个例子 Starting at the root, follow the path labeled by chars of Pi If the path ends before Pi, continue it by ad

    10热度

    1回答

    我在理解Haskell中的Knuth-Morris-Pratt算法的实现方面遇到困难。 http://twanvl.nl/blog/haskell/Knuth-Morris-Pratt-in-Haskell 我特别不理解自动机的建设。我知道它使用“绑结”方法来构建它,但我不清楚,我也不知道为什么它应该具有正确的复杂性。 我想知道的另一件事是,你是否认为这个实现可以很容易地推广到实现Aho-Cora