3
我想知道这究竟工程时,从凤凰过滤,加载表
df = sqlContext.read \
.format("org.apache.phoenix.spark") \
.option("table", "TABLE") \
.option("zkUrl", "10.0.0.11:2181:/hbase-unsecure") \
.load()
如果这是加载整个表或将推迟装载知道是否将被应用的过滤。
在第一种情况下,如何告诉phoenix在加载spark数据框之前过滤表格?
谢谢
我知道它是用于其他类型的负载,但是现在不能在负载之前放置一个过滤器:S。 (我与pyspark和phoenix) –
@PabloCastilla如果你写'spark。(..)。load()。其中(...)。count',那么Spark将自动执行谓词下推。你不必处理它 –
你是完全正确的。我已经用explain()函数看过了。 谢谢! –