我有如图逗号分隔的数字数组:将多个连续的条目中的Scala /火花
一个:{108,109,110,112,114,115,116,118}
我所需要的输出是这样的:
一个:{108-110,112,114-116,118}
我试图将连续的数字与之间的“ - ”进行分组。 例如,108,109,110是连续数字,所以我得到108-110。 112是单独的条目; 114,115,116再次代表一个序列,所以我得到114-116。 118是分开的,如此对待。
我在Spark中这样做。我写以下代码:
import scala.collection.mutable.ArrayBuffer
def Sample(x:String):ArrayBuffer[String]={
val x1 = x.split(",")
var a:Int = 0
var present=""
var next:Int = 0
var yrTemp = ""
var yrAr= ArrayBuffer[String]()
var che:Int = 0
var storeV = ""
var p:Int = 0
var q:Int = 0
var count:Int = 1
while(a < x1.length)
{
yrTemp = x1(a)
if(x1.length == 1)
{
yrAr+=x1(a)
}
else
if(a < x1.length - 1)
{
present = x1(a)
if(che == 0)
{
storeV = present
}
p = x1(a).toInt
q = x1(a+1).toInt
if(p == q)
{
yrTemp = yrTemp
che = 1
}
else
if(p != q)
{
yrTemp = storeV + "-" + present
che = 0
yrAr+=yrTemp
}
}
else
if(a == x1.length-1)
{
present = x1(a)
yrTemp = present
che = 0
yrAr+=yrTemp
}
a = a+1
}
yrAr
}
val SampleUDF = udf(Sample(_:String))
我正在输出如下:
一个:{108-108,109-109,110-110,112,114-114,115- 115,116-116,118}
我无法弄清楚我哪里出错了。你能帮我解决这个问题吗? TIA。
请解释导致您的预期输出的规则。而且,这不是真的与spark相关,它只是一个scala问题 –
@RaphaelRoth我在我的问题中编辑了规则。 –