2
我想使用一个特定的UDF
使用Spark
星火如何使用UDF与加入
这里的计划:
我有一个table A
(10万行)和table B
(15百万行)
我想用table A
和的table B
之一的UDF
比较一个元素是有可能
下面是我的代码示例。在某些时候,我还需要说我UDF
比较必须大于0,9
更大:
DataFrame dfr = df
.select("name", "firstname", "adress1", "city1","compare(adress1,adress2)")
.join(dfa,df.col("adress1").equalTo(dfa.col("adress2"))
.and((df.col("city1").equalTo(dfa.col("city2"))
...;
这可能吗?