2010-05-03 110 views
3

当我尝试将黑白PIL图像转换为numpy数组时,出现奇怪的错误。下面是我正在使用的代码示例。将PIL B&W图像转换为Numpy阵列时出错

if image.mode != '1': 
     image = image.convert('1') #convert to B&W 
    data = np.array(image) #Have also tried np.asarray(image) 
    n_lines = data.shape[0] #number of raster passes 
    line_range = range(data.shape[1]) 
    for l in range(n_lines): 
     # process one horizontal line of the image 
     line = data[l] 
     for n in line_range: 
      if line[n] == 1: 
       write_line_to(xl, z+scale*n, speed) #conversion to other program code 
      elif line[n] == 0: 
       run_to(xl, z+scale*n) #conversion to other program code 

我已经尝试过使用数组和asarray进行转换,并且得到了不同的错误。如果我使用数组,那么我得到的数据与我放入的数据不同。它看起来像是几个非常缩小的局部图像并排放置,其余图像空间填充为黑色。如果我使用asarray,那么在栅格步骤期间(在随机线上)整个python崩溃。如果我使用灰度图像('L'),那么无论是阵列还是asarray都不会出现这些错误。

有谁知道我在做什么错? PIL编码B & W图像的方式有些奇怪,或者需要通过numpy才能正确转换的东西?

+0

子公司的问题是我们刚刚发现,转换似乎在抖动,我们希望有实线。 – Elliot 2010-05-04 14:35:45

+0

在这种情况下(抖动不可取),将图像保持为灰度(模式'L'/ dtype np.uint8)并使用numpy阈值可能最有意义。例如。 “data = np.array(im); data = data> 127”对于灰度图像应该可以很好地工作,并且完全避免抖动。你也可以在PIL中设定阈值,但是如果你转换为numpy数组,那么使用numpy可以更容易。无论如何,只是我的想法...祝你好运! – 2010-05-04 19:03:22

回答

7

我相信你已经找到了PIL的错误! (或可能在numpy,但我打赌它是在PIL方面的东西...)

@ c的答案上面给出了一个解决方法(使用im.getdata()),但我不知道为什么numpy .asarry(图像)是segfaulting为他...(旧版本的PIL和/或numpy,也许?)它适用于我,但在1位PIL图像上产生乱码(并且适用于其他任何事情,我经常使用它!)。

另一个解决方法是在转换为numpy数组之前将BW图像转换回灰度(模式'L')。

如果速度很重要,在转换为numpy数组之前将BW图像转换回灰度似乎更快。

In [35]: %timeit np.array(im_bw.convert('L')).astype(np.uint8) 
10000 loops, best of 3: 28 us per loop 

In [36]: %timeit np.reshape(im_bw.getdata(), im_bw.size) 
10000 loops, best of 3: 57.3 us per loop 

在一个单独的音符,如果修改就地数组内容,一定要使用numpy.array而不是numpy.asarray,因为后者将创建由PIL图像实例阵列时不复制内存,从而返回一个只读数组。仅仅提到这一点,因为我使用asarray()以下...

下面是这印证了错误一个独立的例子...

import numpy as np 
import Image 

x = np.arange(256, dtype=np.uint8).reshape((16,16)) 
print 'Created array' 
print x 

im = Image.fromarray(x) 
print 'Vales in grayscale PIL image using numpy.asarray <-- Works as expected' 
print np.asarray(im) 

print 'Converted to BW PIL image...' 
im_bw = im.convert('1') 

print 'Values in BW PIL image, using Image.getdata() <-- Works as expected' 
print ' (Not a simple threshold due to dithering...)' 
# Dividing by 255 to make the comparison easier 
print np.reshape(im_bw.getdata(), (16, 16))/255 

print 'Values in BW PIL image using numpy.asarray() <-- Unexpected!' 
print ' (Same occurs when using numpy.array() to copy and convert.)' 
print np.asarray(im_bw).astype(np.uint8) 

print 'Workaround, convert back to type "L" before array conversion' 
print np.array(im_bw.convert('L')).astype(np.uint8)/255 

,输出:

Created array 
[[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15] 
[ 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31] 
[ 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47] 
[ 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63] 
[ 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79] 
[ 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95] 
[ 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111] 
[112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127] 
[128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143] 
[144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159] 
[160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175] 
[176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191] 
[192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207] 
[208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223] 
[224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239] 
[240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255]] 

Vales in grayscale PIL image using numpy.asarray <-- Works as expected 
[[ 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15] 
[ 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31] 
[ 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47] 
[ 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63] 
[ 64 65 66 67 68 69 70 71 72 73 74 75 76 77 78 79] 
[ 80 81 82 83 84 85 86 87 88 89 90 91 92 93 94 95] 
[ 96 97 98 99 100 101 102 103 104 105 106 107 108 109 110 111] 
[112 113 114 115 116 117 118 119 120 121 122 123 124 125 126 127] 
[128 129 130 131 132 133 134 135 136 137 138 139 140 141 142 143] 
[144 145 146 147 148 149 150 151 152 153 154 155 156 157 158 159] 
[160 161 162 163 164 165 166 167 168 169 170 171 172 173 174 175] 
[176 177 178 179 180 181 182 183 184 185 186 187 188 189 190 191] 
[192 193 194 195 196 197 198 199 200 201 202 203 204 205 206 207] 
[208 209 210 211 212 213 214 215 216 217 218 219 220 221 222 223] 
[224 225 226 227 228 229 230 231 232 233 234 235 236 237 238 239] 
[240 241 242 243 244 245 246 247 248 249 250 251 252 253 254 255]] 

Converted to BW PIL image... 

Values in BW PIL image, using Image.getdata() <-- Works as expected 
    (Not a simple threshold due to dithering...) 
[[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] 
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] 
[0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0] 
[0 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0] 
[0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1] 
[0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0] 
[1 0 1 0 1 0 1 0 1 0 0 0 1 1 0 1] 
[0 1 0 1 0 0 1 0 0 1 1 0 1 0 1 0] 
[1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1] 
[0 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1] 
[1 1 0 1 1 1 1 0 1 1 0 1 1 0 1 1] 
[1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 0] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 0 1 0 1 1 0 1 1 0 1 1 1 0 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]] 

Values in BW PIL image using numpy.asarray() <-- Unexpected! 
    (Same occurs when using numpy.array() to copy and convert.) 
[[0 0 0 0 0 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[0 1 1 1 1 1 1 0 0 0 0 0 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]] 

Workaround, convert back to type "L" before array conversion 
[[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] 
[0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0] 
[0 0 0 0 0 0 0 0 0 0 1 0 0 0 1 0] 
[0 0 1 0 1 0 1 0 1 0 0 0 1 0 0 0] 
[0 1 0 0 0 0 0 0 0 0 1 0 0 1 0 1] 
[0 0 0 1 0 1 0 1 0 1 0 1 0 0 0 0] 
[1 0 1 0 1 0 1 0 1 0 0 0 1 1 0 1] 
[0 1 0 1 0 0 1 0 0 1 1 0 1 0 1 0] 
[1 0 1 0 1 0 1 1 0 1 0 1 0 1 0 1] 
[0 1 0 1 0 1 0 1 0 1 1 0 1 1 0 1] 
[1 1 0 1 1 1 1 0 1 1 0 1 1 0 1 1] 
[1 0 1 1 0 1 0 1 1 0 1 1 0 1 1 0] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 0 1 0 1 1 0 1 1 0 1 1 1 0 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1] 
[1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1]] 
+0

我不认为这个bug已经消失。我仍然得到'print(np.array(Image。新的('1',(4,2),color = 1)))' - >'[[True True False False] [False False False False]]'在我的树莓派上Image.VERSION 1.1。 7和'np .__ version__' 1.13.3。但有趣的是,在Mac OS X上,我得到了正确的结果:'[[True True True True] [True True True True]]与两个版本相同。 – Bill 2017-11-05 04:42:43

3

不知道这行:

data = numpy.array(image) 

事实上,这给了我一个段错误。但我只是尝试以下,它工作正常:

import numpy 
import Image 

im = Image.open("some_photo.jpg") 
im = im.convert("1") 

pixels = im.getdata() # returns 1D list of pixels 
n = len(pixels) 
data = numpy.reshape(pixels, im.size) # turn into 2D numpy array 

for row in data: 
    # do your processing 
    pass 

# Check that the numpy array's data is good 
im2 = Image.new("1", im.size) 
im2.putdata(numpy.reshape(data, [n, 1])) 
im2.show() 
+0

黑白转换有些奇怪。它没有正确注册边缘。所以不是一个标志,我正在变成一个大圈子。 – Elliot 2010-05-04 15:37:07