2017-07-25 79 views
3

此代码重新排列534x713 RGBA4纹理中的位。为什么Cython中这个循环太慢了?

cpdef bytes toDDSrgba4(bytearray data): 
    cdef bytes new_data = b'' 

    cdef int pixel 
    cdef int red 
    cdef int green 
    cdef int blue 
    cdef int alpha 
    cdef int new_pixel 
    cdef int i 

    for i in range(len(data) // 2): 
     pixel = int.from_bytes(data[2*i:2*i+2], "big") 

     red = (pixel >> 12) & 0xF 
     green = (pixel >> 8) & 0xF 
     blue = (pixel >> 4) & 0xF 
     alpha = pixel & 0xF 

     new_pixel = (red << 8) | (green << 4) | blue | (alpha << 12) 

     new_data += (new_pixel).to_bytes(2, "big") 

    return new_data 

它一样快,因为它是Python的等价物,它是这样的:

def toDDSrgba4(data): 
    new_data = b'' 

    for i in range(len(data) // 2): 
     pixel = int.from_bytes(data[2*i:2*i+2], "big") 

     red = (pixel >> 12) & 0xF 
     green = (pixel >> 8) & 0xF 
     blue = (pixel >> 4) & 0xF 
     alpha = pixel & 0xF 

     new_pixel = (red << 8) | (green << 4) | blue | (alpha << 12) 

     new_data += (new_pixel).to_bytes(2, "big") 

    return new_data 

他们两人都是很慢。

我已经写了非常复杂的调酒甚至不是最优化和测试了这种质地的代码,它仍然waaay比这更快。

+0

也许把所有'新数据'放到一个列表中,而不是在每一步中连接它,然后在最后加入它。 – khelwood

+0

好的,我会试试。 – AboodXD

回答

4

您正在使用+=追加到bytes对象。这真的很慢,因为它每次都需要复制整个现有的bytes对象。

不要这样做。一个更好的选择是使用bytearray,并且最后只从bytearray中构建一个bytes对象。

+0

Wooooooow,现在更快的方式waaaaay,谢谢。 :d – AboodXD

0

from_bytes和to_bytes方式太慢我想。尝试而不是from_bytes:

pixel = (data[2*i]) << 8 | (data[2*i+1]) 

它真的比你的代码更快,我测试过它。 但to_bytes我无法想象现在的快速版本。

+0

速度相同,整个功能大约需要30秒才能执行。 – AboodXD

+0

不,我已阅读关于to_bytes()是多快的文章。 – AboodXD

+0

这很奇怪。在python版本中,我的代码速度提高了15%。不知道如何尝试使用电子琴。 – CrazyElf