此代码重新排列534x713 RGBA4纹理中的位。为什么Cython中这个循环太慢了?
cpdef bytes toDDSrgba4(bytearray data):
cdef bytes new_data = b''
cdef int pixel
cdef int red
cdef int green
cdef int blue
cdef int alpha
cdef int new_pixel
cdef int i
for i in range(len(data) // 2):
pixel = int.from_bytes(data[2*i:2*i+2], "big")
red = (pixel >> 12) & 0xF
green = (pixel >> 8) & 0xF
blue = (pixel >> 4) & 0xF
alpha = pixel & 0xF
new_pixel = (red << 8) | (green << 4) | blue | (alpha << 12)
new_data += (new_pixel).to_bytes(2, "big")
return new_data
它一样快,因为它是Python的等价物,它是这样的:
def toDDSrgba4(data):
new_data = b''
for i in range(len(data) // 2):
pixel = int.from_bytes(data[2*i:2*i+2], "big")
red = (pixel >> 12) & 0xF
green = (pixel >> 8) & 0xF
blue = (pixel >> 4) & 0xF
alpha = pixel & 0xF
new_pixel = (red << 8) | (green << 4) | blue | (alpha << 12)
new_data += (new_pixel).to_bytes(2, "big")
return new_data
他们两人都是很慢。
我已经写了非常复杂的调酒甚至不是最优化和测试了这种质地的代码,它仍然waaay比这更快。
也许把所有'新数据'放到一个列表中,而不是在每一步中连接它,然后在最后加入它。 – khelwood
好的,我会试试。 – AboodXD