我想用spark在Cassandra表上做一些简单的计算,但我很迷茫。Spark与Cassandra python安装
我试图遵循:https://github.com/datastax/spark-cassandra-connector/blob/master/doc/15_python.md
于是我运行PySpark外壳:用
./bin/pyspark \
--packages com.datastax.spark:spark-cassandra-connector_2.11:2.0.0-M3
但我不知道如何从这里设置的东西,。我如何让Spark知道我的Cassandra群集在哪里?我已经看到CassandraSQLContext
可以用于这个,但我也读过,这已被弃用。
我已阅读本:How to connect spark with cassandra using spark-cassandra-connector?
但是,如果使用
import com.datastax.spark.connector._
Python中说,它无法找到该模块。 有人可能会指出我如何正确设置正确的方向吗?