我在dataframe(d1)
中有一列:MODEL_SCORE
,其值为nulll7880
。 我想在datframe
中创建另一个column MODEL_SCORE1
,它是MODEL_SCORE
的子串。根据另一列的子字符串在数据框中创建列,scala
我正在试着这个。它的创建列,但没有给予预期的结果:
val x=d1.withColumn("MODEL_SCORE1", substring(col("MODEL_SCORE"),0,4))
val y=d1.select(col("MODEL_SCORE"), substring(col("MODEL_SCORE"),0,4).as("MODEL_SCORE1"))
谢谢,能我这样做没有创建UDF? – muni
您也可以使用df.withColumn(“col2”,substring(df(“col1”),4,3))。show 这里4是字符串中的位置,3是从该位置开始的字符串的总长度。 – vindev