2010-03-02 56 views
39

我有一个包含数据,这样的列表:检测连续整数列表中的

[1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14] 

我想打印出连续整数的范围:

1-4, 7-8, 10-14 

是否有一个内置在/快速/有效的方式做到这一点?

+0

见http://stackoverflow.com/questions/2154249/identify-groups-of-continuous-numbers-in-a-list,这点你到http://文档。 python.org/library/itertools.html#examples – 2010-03-02 09:14:46

+1

家庭作业?你向我们展示了你所尝试过的东西,我们会看看我们能否做得更好。 – 2010-03-02 09:16:12

+0

谢谢,我应该在发现之前发现:/ – James 2010-03-02 09:18:13

回答

62

the docs

>>> from itertools import groupby 
>>> from operator import itemgetter 
>>> data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28] 
>>> for k, g in groupby(enumerate(data), lambda (i, x): i-x): 
...  print map(itemgetter(1), g) 
... 
[1] 
[4, 5, 6] 
[10] 
[15, 16, 17, 18] 
[22] 
[25, 26, 27, 28] 

你可以很容易适应这种获得印刷范围集合。

+0

不要忘记'导入itertools'。此外,这只适用于Python 2.4及更高版本。 – Gabe 2010-03-02 09:48:16

+1

实际上你至少在Python 2.6中需要从'itertools import *'和'from operator import *'(或者等价的)。 – 2011-04-11 11:12:34

+18

不要使用明星进口! **从不**使用明星进口!改用'from itertools import groupby'和'from operator import itemgetter'来代替。 – 2013-08-28 20:41:12

3

内置:否,据我所知。您必须在数组中运行。首先将第一个值放在一个变量中并打印出来,然后只要你继续敲下一个数字,别忘了记住另一个变量的最后一个数字。如果下一个数字不符合,请检查记住的最后一个数字与第一个数字。如果它是一样的,什么都不要做。如果不同,请打印“ - ”和最后一个数字。然后将当前值放入第一个变量中并重新开始。 在数组的末尾,您运行相同的例程,就好像您已经输入了一个数字。

我可以写代码,当然,但我不想破坏你的家庭作业:-)

1

你指定这正是打印:

>>> nums = [1, 2, 3, 4, 7, 8, 10, 11, 12, 13, 14] 
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), []) 
>>> iranges = iter(nums[0:1] + ranges + nums[-1:]) 
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges]) 
1-4, 7-8, 10-14 

如果列表任何单一的号码范围,它们将被表示为NN:

>>> nums = [1, 2, 3, 4, 5, 7, 8, 9, 12, 15, 16, 17, 18] 
>>> ranges = sum((list(t) for t in zip(nums, nums[1:]) if t[0]+1 != t[1]), []) 
>>> iranges = iter(nums[0:1] + ranges + nums[-1:]) 
>>> print ', '.join([str(n) + '-' + str(next(iranges)) for n in iranges]) 
1-5, 7-9, 12-12, 15-18 
0

这里是不使用任何模块,这是良好的采访,通常在他们要求,而不USI面试另一碱性溶液NG任何模块:

#!/usr/bin/python 

def split_list(n): 
    """will return the list index""" 
    return [(x+1) for x,y in zip(n, n[1:]) if y-x != 1] 

def get_sub_list(my_list): 
    """will split the list base on the index""" 
    my_index = split_list(my_list) 
    output = list() 
    prev = 0 
    for index in my_index: 
     new_list = [ x for x in my_list[prev:] if x < index] 
     output.append(new_list) 
     prev += len(new_list) 
    output.append([ x for x in my_list[prev:]]) 
    return output 

my_list = [1, 3, 4, 7, 8, 10, 11, 13, 14] 
print get_sub_list(my_list) 

输出:

[[1], [3, 4], [7, 8], [10, 11], [13, 14]] 
0

我有一个类似的问题,我使用排序列表如下。它输出一个字典中列出的值范围的字典。这些键分隔连续数字的每次运行,并且也是序列之间数字之间的非连续项目的运行总数。

你的清单给我的{0: [1, 4], 1: [7, 8], 2: [10, 14]}

def series_dictf(index_list): 
    from collections import defaultdict  
    series_dict = defaultdict(list) 
    sequence_dict = dict() 

    list_len = len(index_list) 
    series_interrupts = 0  

    for i in range(list_len): 
     if i == (list_len - 1): 
       break 

     position_a = index_list[i] 
     position_b = index_list[i + 1] 

     if position_b == (position_a + 1): 
      sequence_dict[position_a] = (series_interrupts) 
      sequence_dict[position_b] = (series_interrupts) 

     if position_b != (position_a + 1): 
      series_interrupts += 1 

    for position, series in sequence_dict.items(): 
     series_dict[series].append(position) 
    for series, position in series_dict.items(): 
     series_dict[series] = [position[0], position[-1]] 

    return series_dict 
0

输出使用设置操作,下面的算法可以执行

def get_consecutive_integer_series(integer_list): 
    integer_list = sorted(integer_list) 
    start_item = integer_list[0] 
    end_item = integer_list[-1] 

    a = set(integer_list) # Set a 
    b = range(start_item, end_item+1) 

    # Pick items that are not in range. 
    c = set(b) - a # Set operation b-a 

    li = [] 
    start = 0 
    for i in sorted(c): 
     end = b.index(i) # Get end point of the list slicing 
     li.append(b[start:end]) # Slice list using values 
     start = end + 1 # Increment the start point for next slicing 
    li.append(b[start:]) # Add the last series 

    for sliced_list in li: 
     if not sliced_list: 
      # list is empty 
      continue 
     if len(sliced_list) == 1: 
      # If only one item found in list 
      yield sliced_list[0] 
     else: 
      yield "{0}-{1}".format(sliced_list[0], sliced_list[-1]) 


a = [1, 2, 3, 6, 7, 8, 4, 14, 15, 21] 
for series in get_consecutive_integer_series(a): 
    print series 

输出为上述列表中的 “a”
1-4
6-8
14-15

-1

您可以使用具有名为Counter的类的集合库。计数器可以派上用场,如果试图轮询没有明显的元素的可迭代的

from collections import Counter 
data = [ 1, 4,5,6, 10, 15,16,17,18, 22, 25,26,27,28] 
cnt=Counter(data) 
print(cnt) 

输出来这样

Counter({1: 1, 4: 1, 5: 1, 6: 1, 10: 1, 15: 1, 16: 1, 17: 1, 18: 1, 22: 1, 25: 1, 26: 1, 27: 1, 28: 1}) 

这就像任何其他的字典,可以查询的键值

+0

这并没有回答这个问题,你只是在计算出现的事件,而OP问到对'范围' – user1767754 2018-01-06 22:47:56

0

一个简短的解决方案,无需额外的导入工作。它接受任何可迭代,排序无序的投入,并删除重复的项目:

def ranges(nums): 
    nums = sorted(set(nums)) 
    gaps = [[s, e] for s, e in zip(nums, nums[1:]) if s+1 < e] 
    edges = iter(nums[:1] + sum(gaps, []) + nums[-1:]) 
    return list(zip(edges, edges)) 

例子:

>>> ranges([2, 3, 4, 7, 8, 9, 15]) 
[(2, 4), (7, 9), (15, 15)] 

>>> ranges([-1, 0, 1, 2, 3, 12, 13, 15, 100]) 
[(-1, 3), (12, 13), (15, 15), (100, 100)] 

>>> ranges(range(100)) 
[(0, 99)] 

>>> ranges([0]) 
[(0, 0)] 

>>> ranges([]) 
[] 

这是一样的@ dansalmo的solution我发现惊人的,虽然有点难以阅读和适用(因为它不是作为函数给出的)。

请注意,它可以很容易地修改,以便通过例如喷出“传统”开放范围[start, end)。改变return语句:

return [(s, e+1) for s, e in zip(edges, edges)]