我有一个包含约20000行数据的CSV文件。 我需要比较/准确找出eacy阵列重复自我的次数,结果按从高到低排序。如何比较数组并查找以ruby排序的匹配数
例
a[0000001] = [23.2 ,54 ,87.9 ,34 ,8]
a[0000002] = [3.2 ,4.9 ,8.7 ,54.3 ,98]
a[0000003] = [2.32 ,24 ,37.9 ,32 ,8.7]
a[0000004] = [22.2 ,54 ,72.1 ,3.4 ,8.8]
等等等等
我试图找到每个阵列到底有多少次可以说例如[0000001] = [23.2,54,87.9,34, 8]在整个数据中重复了自己。 数组需要按照从高到低的顺序进行排序,并且还需要将排序数量从高到低排序。
如果我伪代码来描述所需要的
a1 = [1,2]
a2 = [1,4]
a3 = [1,5]
a4 = [1,2]
a5 = [1,4]
a6 = [1,4] ...........
a20000[1,8]
for each a# (a1 for example)
compare a# with a.all
a1occuredindata = 2
go to next a# (a2 for example)
compare a# with a.all
a2occuredindata = 3 ..... until a20000
in the end
sort
a2 occured highest number of time = 3 followed by
a1 = 2 so on so forth
我不太明白;你能否编辑这个问题来澄清?这个问题提到了CSV,但随后切换到了数组(或者显然是一个数组数组)。您显示的数据与CSV有什么关系?另外,当你说“从高到低排序”时,你能解释一下什么使阵列比另一个更高?同时查看输入数据和预期输出会很有帮助。 –
对此感到抱歉。请不要提及CSV。我有示例中给出的数组,其中大约有20,000个。 – user2716736
这样比较好。这个问题仍然可以用一些改进,但现在我认为它不需要搁置。感谢您改进您的问题。 –