我正在读取2个hive表中的数据。令牌表具有需要与输入数据匹配的令牌。输入数据将包含说明栏和其他栏。我需要拆分输入数据,并且需要将每个拆分元素与令牌表中的所有元素进行比较。 目前我正在使用me.xdrop.fuzzywuzzy.FuzzySearch库进行模糊匹配。下面 是我的代码snippet- val tokens = sqlContext.sql("select token from tok
还有像一些模糊逻辑字符串规则: IF Input1.A和Input2.B然后Output1.A IF Input1.A AND(NOT Input2.B) AND Input3.C Then Output1.A 我想在AND和after之后捕获组。 并且还用括号捕获(NOT Input2.B)。 以及IF之后。