2009-11-11 53 views
14

想象我有以下几点:什么是OpenCV的cvMat的内存结构?

CvMat* mat = cvCreateMat(3,3,CV_16SC3) 

这是通道的整数3x3矩阵3.

现在,如果你看一下OpenCV的文档,你会发现下面的减速CvMat中为:

typedef struct CvMat { 

int type; 
int step; 

int* refcount; 

union 
{ 
    uchar* ptr; 
    short* s; 
    int* i; 
    float* fl; 
    double* db; 
} data; 

union 
{ 
    int rows; 
    int height; 
}; 

union 
{ 
    int cols; 
    int width; 
}; 
} CvMat; 

现在,我想玩弄data.ptr,它是存储在cvMat中的数据的指针。但是,我很难理解内存是如何布局的。如果我有3通道矩阵,这是如何工作的?对于一个通道来说它很简单,因为它只是一个简单的MxN矩阵,其中M是行,N是列。但是对于3通道,这些MxN矩阵中是否有3个 ?有人可以告诉我如何通过data.ptr创建3通道矩阵,以及如何访问这些值吗?谢谢。

+0

基本上这个问题归结为我如何访问可以说第2行第2列第2列? – 2009-11-11 04:56:58

回答

19

This webpage是对OpenCV 1.1的一个很好的介绍。我会推荐使用最新版本,Open CV 2.0,它具有处理图像,矩阵等类的一般Mat类,与OpenCV 1.1不同。

上述网页已详述的元件访问下列方法中的多通道的图像:

间接访问:(一般,但效率低,获得的任何类型的图像)

对于多通道浮动(或字节)的图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); 
CvScalar s; 
s=cvGet2D(img,i,j); // get the (i,j) pixel value 
printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]); 
s.val[0]=111; 
s.val[1]=111; 
s.val[2]=111; 
cvSet2D(img,i,j,s); // set the (i,j) pixel value 

直接访问:(高效访问,但容易出错)

对于多通道浮动图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); 
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B 
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G 
((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R 

直接访问使用指针:(简体和下限制性假设有效的访问)

对于多通道浮动图像(假设4字节对准):

IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); 
int height  = img->height; 
int width  = img->width; 
int step  = img->widthStep/sizeof(float); 
int channels = img->nChannels; 
float * data = (float *)img->imageData; 
data[i*step+j*channels+k] = 111; 

直接访问使用C++包装:(简单和高效的访问)

定义单通道字节图像,多路字节的图像,和多通道浮动图像的C++包装:

template<class T> class Image 
    { 
    private: 
    IplImage* imgp; 
    public: 
    Image(IplImage* img=0) {imgp=img;} 
    ~Image(){imgp=0;} 
    void operator=(IplImage* img) {imgp=img;} 
    inline T* operator[](const int rowIndx) { 
     return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));} 
    }; 

    typedef struct{ 
    unsigned char b,g,r; 
    } RgbPixel; 

    typedef struct{ 
    float b,g,r; 
    } RgbPixelFloat; 

    typedef Image<RgbPixel>  RgbImage; 
    typedef Image<RgbPixelFloat> RgbImageFloat; 
    typedef Image<unsigned char> BwImage; 
    typedef Image<float>   BwImageFloat; 

对于多通道浮动图像:

IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); 
RgbImageFloat imgA(img); 
imgA[i][j].b = 111; 
imgA[i][j].g = 111; 
imgA[i][j].r = 111; 
+1

谢谢你这个完整的答案 – user261002 2012-04-20 16:33:29

+2

这个答案应该涵盖了cvMat的一些细节。 cvMat完全没有提及 – vishal 2013-05-03 10:45:47