2016-04-26 120 views
0

我在格式字符串的RDD的文件:转换的RDD [字符串]以JSON文件,无须转换为DataFrames [斯卡拉]

78656|twitterId:14|Hi|2010-05-19 

我想转换此RDD [字符串]对在格式JSON文件:

tweetTable.toJSON.saveAsTextFile("Gaga") 

将其转换为一个JSON文件,但T:

"78656","twitterId:14","Hi","2010-05-19" 
我目前使用的代码

他的数据格式如下:

"_1":"78656|twitterId:14|Hi|2010-05-19" 

有人可以帮助我吗?

+1

' “78656”, “twitterId:14”, “你好”, “2010-05-19” 是'无效的JSON,可能你想要的东西像'{“id”:“78656”,“twitterId”:“14”,“test”:“你好”,“日期”:“2010-05-19”}'? –

+0

你在这里使用什么语言,'python','r'或'scala'? – SymbolixAU

+0

@VitaliyKotlyarenko:对,对不起,错字。你提到它的方式正是我想要的方式。 – user2122466

回答

0

基于你有什么的问题,你可以做这样的事情:

value <- "78656|twitterId:14|Hi|2010-05-19" 
valueList <- strsplit(value, split ="\\|") 
library("jsonlite") 
res <- toJSON(valueList) 
+0

这是Scala吗? – user2122466

+0

@ user2122466,不,它是'r',因为你在你的问题中包含'r'标记。我已经删除了额外的标签。 – SymbolixAU