2017-10-10 65 views
-1

字符I具有低于代码读取XML替换或移除新行“ n”个从火花数据集中列值

Dataset<Row> dataset1 = SparkConfigXMLProcessor.sparkSession.read().format("com.databricks.spark.xml") 
       .option("rowTag", properties.get(EventHubConsumerConstants.IG_ORDER_TAG).toString()) 
       .load(properties.get("C:\\inputOrders.xml").toString()); 

列值获得新行字符中的一个。 我想用一些字符替换它,或者只是想删除它。 请帮助

回答

-1

下面的代码解决我的问题

Dataset<Row> newDF = dataset1.withColumn("menuitemname", regexp_replace(col("menuitemname"), "[\\n]", ""));