2012-02-27 146 views
7

我一直在尝试通过Python绑定使用抓取方法的OpenCV实现。我曾尝试在cv和cv2中使用该版本,但我无法找到正确的参数来使该方法正确运行。我尝试了几个参数的排列,似乎没有任何工作(基本上我在Github上看到过的每个示例)。这里有几个例子我试图遵循:GrabCut算法的OpenCV Python绑定

Example 1

Example 2

这里是方法的文档和已知的bug报告:

Documentation

Known Grabcut Bug

我可以得到执行我们的代码下面的例子,但它返回一个空白(全黑)图像掩码。

img = Image("pills.png") 
mask = img.getEmpty(1) 
bgModel = cv.CreateMat(1, 13*5, cv.CV_64FC1) 
fgModel = cv.CreateMat(1, 13*5, cv.CV_64FC1) 
for i in range(0, 13*5): 
    cv.SetReal2D(fgModel, 0, i, 0) 
    cv.SetReal2D(bgModel, 0, i, 0) 

rect = (150,70,170,220) 
tmp1 = np.zeros((1, 13 * 5)) 
tmp2 = np.zeros((1, 13 * 5)) 
cv.GrabCut(img.getBitmap(),mask,rect,tmp1,tmp2,5,cv.GC_INIT_WITH_RECT) 

我正在使用SimpleCV加载图像。 img.getBitmap()中的掩码类型和返回类型为:

iplimage(nChannels=1 width=730 height=530 widthStep=732) 
iplimage(nChannels=3 width=730 height=530 widthStep=2192) 

如果有人有此代码的工作示例,我很乐意看到它。我在OSX Snow Leopard上运行它的价值是什么,而我的OpenCV版本是从SVN存储库安装的(截至几周前)。作为参考我的输入图像是这样的: Input Image

我试着改变结果掩码枚举值更明显的东西。这不是问题的返回值。这会返回一个完全黑色的图像。我会尝试更多的价值观。

img = Image("pills.png") 
mask = img.getEmpty(1) 
bgModel = cv.CreateMat(1, 13*5, cv.CV_64FC1) 
fgModel = cv.CreateMat(1, 13*5, cv.CV_64FC1) 
for i in range(0, 13*5): 
    cv.SetReal2D(fgModel, 0, i, 0) 
    cv.SetReal2D(bgModel, 0, i, 0) 

rect = (150,70,170,220) 
tmp1 = np.zeros((1, 13 * 5)) 
tmp2 = np.zeros((1, 13 * 5)) 
cv.GrabCut(img.getBitmap(), mask, rect, tmp1, tmp2, 5, cv.GC_INIT_WITH_MASK) 
mask[mask == cv.GC_BGD] = 0 
mask[mask == cv.GC_PR_BGD] = 0 
mask[mask == cv.GC_FGD] = 255 
mask[mask == cv.GC_PR_FGD] = 255 
result = Image(mask) 
result.show() 
result.save("result.png") 
+0

将示例移动到主线程。 – kscottz 2012-02-28 17:38:38

回答

5

吉,这个版本的代码似乎为我工作。

import numpy as np 
import matplotlib.pyplot as plt 
import cv2 


filename = "pills.png" 
im = cv2.imread(filename) 

h,w = im.shape[:2] 

mask = np.zeros((h,w),dtype='uint8') 
rect = (150,70,170,220) 
tmp1 = np.zeros((1, 13 * 5)) 
tmp2 = np.zeros((1, 13 * 5)) 

cv2.grabCut(im,mask,rect,tmp1,tmp2,10,mode=cv2.GC_INIT_WITH_RECT) 

plt.figure() 
plt.imshow(mask) 
plt.colorbar() 
plt.show() 

产生一个这样的图,标签为0,2和3。 enter image description here

1

你的面具充满following values

  • GC_BGD定义了一个明显的背景像素。
  • GC_FGD定义了一个明显的前景(对象)像素。
  • GC_PR_BGD定义了一个可能的背景像素。
  • GC_PR_FGD定义了一个可能的前景像素。

这是一个enum的一部分:

enum { GC_BGD = 0, // background 
     GC_FGD = 1, // foreground 
     GC_PR_BGD = 2, // most probably background 
     GC_PR_FGD = 3 // most probably foreground 
    }; 

它转换为颜色:全黑的,很黑,暗黑色和黑色。我想你会发现,如果你添加以下代码(从example 1取出并略作修改)你的面具将看起来更好:

mask[mask == cv.GC_BGD] = 0 //certain background is black 
mask[mask == cv.GC_PR_BGD] = 63 //possible background is dark grey 
mask[mask == cv.GC_FGD] = 255 //foreground is white 
mask[mask == cv.GC_PR_FGD] = 192 //possible foreground is light grey 
+1

所以我注意到这一点,当我试图让这个工作。我刚刚运行了以下代码片段: – kscottz 2012-02-28 17:36:51

+0

请参阅上面我添加的代码片段,这也不起作用。谢谢您的帮助。如果你可以提供你使用的示例图片,我将不胜感激。 – kscottz 2012-02-28 17:42:16

+0

如果您在下面的Jan Erik的评论中尝试下面的代码,会发生什么? – 2012-02-29 15:28:30