fuzzy

    0热度

    1回答

    我正在读取2个hive表中的数据。令牌表具有需要与输入数据匹配的令牌。输入数据将包含说明栏和其他栏。我需要拆分输入数据,并且需要将每个拆分元素与令牌表中的所有元素进行比较。 目前我正在使用me.xdrop.fuzzywuzzy.FuzzySearch库进行模糊匹配。下面 是我的代码snippet- val tokens = sqlContext.sql("select token from tok

    0热度

    1回答

    下面是我写的模糊匹配的简单脚本。输入文件中有大约24,000个关键字,主列表中大约有900,000个。 目前需要花费很长时间来处理24,000个关键字。 任何想法,我可以消除for循环,以更快的东西的青睐? > #=====Install Packages====# library(stringdist) > > #=====Import Master List======# master

    0热度

    1回答

    还有像一些模糊逻辑字符串规则: IF Input1.A和Input2.B然后Output1.A IF Input1.A AND(NOT Input2.B) AND Input3.C Then Output1.A 我想在AND和after之后捕获组。 并且还用括号捕获(NOT Input2.B)。 以及IF之后。

    1热度

    1回答

    我试过自动完成模式。但建议是不模糊,它需要完全匹配。 也尝试过(全局设置密钥(kbd“M-C-I”)'ac-fuzzy-complete),但这需要触发器(而不是您输入的内容)。 以下是Sublime的截图。即使'HW'表明的helloWorld在Emacs类似 的东西吗?

    0热度

    1回答

    我无法找到一个参考,它告诉我如何将SSIS中的模糊查找连接到Excel文件而不是数据库。 在网上搜索我发现了这个技巧:Excel Source as Lookup Transformation Connection,但它提供了一个使用查找而非模糊查找的解决方案。 任何人都可以帮我设置模糊查找与Excel数据源吗?

    0热度

    1回答

    比如我实现模糊搜索,我有跟名字,中间名和姓的名称。我需要搜索名字的不同组合,如{名,中间名,姓氏},{中间名,名,姓}等等(6种组合)。同时,名字也必须用语音搜索。就像名字“John”一样,它必须选择“Jonn”。亦作“穆罕默德”,必须会一炮打响“穆罕默德”或“Mouhammed”这个拼音搜索是适用于所有名的三个部分。

    0热度

    1回答

    我有2个系统,我用PHP构建的界面和机器是用python构建的,因为我在python中使用模糊。 我必须尝试让与PHP的具体数据和工作 ,我已经做出与Python的功能,收到一个变量,而该工作 但是我有一个问题 的问题是,如何使用PHP从MySQL中抛出一个变量并用python处理它? 完成该过程后,如何将结果返回给PHP,然后发送到mySQL数据库? 在这样的PHP代码,该代码是从SQL fun

    1热度

    1回答

    由于数据在遗留系统中存储错误,因此我使用R和agrep()来匹配公司名称列表 - 因为数据在传统系统中存储错误 - 没有第四种常规格式,公司在同一级别上录制作为客户,这意味着每个新客户都有一个新的公司条目,这导致一家公司拥有许多不同的公司名称 - 这在很多情况下都能正常工作。 有时,特别是对于短字符串,我得到的 - 至少对我来说 - 奇怪的比赛,例如(ABC是第一家名称): ABC ABAXIS

    0热度

    1回答

    如何建立查询来搜索精确的短语以及带有一些拼写错误的短语?我被困在这一点上,看起来我正朝着错误的方向前进。 例如,我有一个字段在我edismax查询: q=apple iphone 它的工作原理,但现在我需要,使其更耐错别字。更新我的查询,现在它返回相同的结果,甚至当用户类型的故障前: q=aple~2 iphane~2 接下来,我发现现在准确的查询匹配什么并不总是第一页(例如,我真的有产品

    1热度

    1回答

    我正在试验stringdist软件包以便进行模糊连接,并遇到一个我不明白的问题,但未能找到答案。 我想用“dl”方法连接这两个数据表,它会产生一个NA,我完全不明白。也许你们其中一个对此有解释。 代码: library(fuzzyjoin) test1<-as.data.frame(test1<-c("techniker")) test2<-as.data.frame(test2<-c("te