3
我试图使用Stratio的Spark-MongoDB library来查询MongoDB集合。我跟着this线程上手和我目前正在运行下面的代码:使用Stratio的Spark-MongoDB库的MongoDB查询过滤器
reader = sqlContext.read.format("com.stratio.datasource.mongodb")
data = reader.options(host='<ip>:27017', database='<db>', collection='<col>').load()
这将在整个集合加载到星火数据框和收集是大的,这是一个采取了大量的时间。有什么方法可以指定查询过滤器并只将选定的数据加载到Spark中?