我想用scala来访问spark应用程序中的HIVE。 我的代码: val hiveLocation = "hdfs://master:9000/user/hive/warehouse"
val conf = new SparkConf().setAppName("SOME APP NAME").setMaster("local[*]").set("spark.sql.warehouse.dir
我写一个斯卡拉/火花程序,会发现该雇员的薪水最高。员工数据可以CSV文件形式提供,而薪金列有数千个逗号分隔符,并且还有一个$前缀,例如$ 74,628.00。 为了解决这个逗号和美元符号,我已经用Scala编写这将分割每行一个解析器功能“”然后每一列映射到各个变量被分配到一个案例类。 我的解析器程序看起来像下面。为了消除逗号和美元符号,我使用替换函数将其替换为空,然后最终将类型转换为Int。 de