我使用Spark 2.1和Cassandra(3.9)作为数据源。 C *有一个有50列的大表,对我的用例来说这不是一个好的数据模型。所以我为每个传感器创建了拆分表以及分区键和集群键列。 All sensor table
-----------------------------------------------------
| Device | Time | Sensor1 | Sens
我需要实施星火下面的SQL逻辑DataFrame SELECT KEY,
CASE WHEN tc in ('a','b') THEN 'Y'
WHEN tc in ('a') AND amt > 0 THEN 'N'
ELSE NULL END REASON,
FROM dataset1;
我输入DataFrame是如下: val dataset1 = S