OpenCV_编程简介(入门必读)

OpenCV_编程简介(入门必读)OpenCV 编程简介（矩阵/图像/视频的基本读写操作） http://www.opencv.org.cn/index.php/OpenCV_%E7%BC%96%E7%A8%8B%E7%AE%80%E4%BB%8B%EF%BC%88%E7%9F%A9%E9%98%B5/%E5%9B%BE%E5%83%8F/%E8%A7%86%E9%A2%91%E7%9A%84%E5%9F%BA%E6%9C%AC%E8%AF%BB%E5%86%99%E6%93%8D%E4%BD%9C%EF%BC%89 Introduction to...

OpenCV 编程简介（矩阵/图像/视频的基本读写操作） http://www.opencv.org.cn/index.php/OpenCV_%E7%BC%96%E7%A8%8B%E7%AE%80%E4%BB%8B%EF%BC%88%E7%9F%A9%E9%98%B5/%E5%9B%BE%E5%83%8F/%E8%A7%86%E9%A2%91%E7%9A%84%E5%9F%BA%E6%9C%AC%E8%AF%BB%E5%86%99%E6%93%8D%E4%BD%9C%EF%BC%89 Introduction to programming with OpenCV OpenCV编程简介作者： Gady Agam  Department of Computer Science  January 27, 2006  Illinois Institute of Technology  URL: http://www.cs.iit.edu/~agam/cs512/lect-notes/opencv-intro/opencv-intro.html#SECTION00040000000000000000 翻译： chenyusiyuan  January 26, 2010  http://blog.csdn.net/chenyusiyuan/archive/2010/01/26/5259060.aspx 摘要：本文旨在帮助读者快速入门OpenCV，而无需阅读冗长的参考手册。掌握了OpenCV的以下基础知识后，有需要的话再查阅相关的参考手册。目录 [隐藏]  1 一、简介 o 1.1 1、OpenCV的特点  1.1.1 （1）总体描述  1.1.2 （2）功能  1.1.3 （3） OpenCV模块 o 1.2 2、有用的学习资源  1.2.1 （1）参考手册：  1.2.2 （2）网络资源：  1.2.3 （3）书籍：  1.2.4 （4）视频处理例程(在 /samples/c/):  1.2.5 （5）图像处理例程 (在 /samples/c/): o 1.3 3、OpenCV 命名规则  1.3.1 （1）函数名:  1.3.2 （2）矩阵数据类型:  1.3.3 （3）图像数据类型:  1.3.4 （4）头文件: o 1.4 4、编译建议  1.4.1 （1） Linux:  1.4.2 （2） Windows: o 1.5 5、C例程  2 二、GUI 指令 o 2.1 1、窗口管理  2.1.1 （1）创建和定位一个新窗口:  2.1.2 （2）载入图像:  2.1.3 （3）显示图像:  2.1.4 （4）关闭窗口:  2.1.5 （5）改变窗口大小: o 2.2 2、输入处理  2.2.1 （1）处理鼠标事件:  2.2.2 （2）处理键盘事件:  2.2.3 （3）处理滑动条事件:  3 三、OpenCV的基本数据结构 o 3.1 1、图像数据结构  3.1.1 （1） IPL 图像: o 3.2 2、矩阵与向量  3.2.1 （1）矩阵:  3.2.2 （2）一般矩阵:  3.2.3 （3）标量: o 3.3 3、其它结构类型  3.3.1 （1）点:  3.3.2 （2）矩形框大小（以像素为精度）:  3.3.3 （3）矩形框的偏置和大小:  4 四、图像处理 o 4.1 1、图像的内存分配与释放  4.1.1 （1）分配内存给一幅新图像:  4.1.2 （2）释放图像:  4.1.3 （3）复制图像:  4.1.4 （4）设置/获取感兴趣区域ROI:  4.1.5 （5）设置/获取感兴趣通道COI: o 4.2 2、图像读写  4.2.1 （1）从文件中读入图像:  4.2.2 （2）保存图像: o 4.3 3、访问图像像素  4.3.1 （1）假设你要访问第k通道、第i行、第j列的像素。  4.3.2 （2）间接访问: (通用，但效率低，可访问任意格式的图像)  4.3.3 （3）直接访问: (效率高，但容易出错)  4.3.4 （4）基于指针的直接访问: (简单高效)  4.3.5 （5）基于 c++ wrapper 的直接访问: （更简单高效） o 4.4 4、图像转换  4.4.1 （1）字节型图像的灰度-彩色转换:  4.4.2 （2）彩色图像->灰度图像:  4.4.3 （3）不同彩色空间之间的转换: o 4.5 5、绘图指令  4.5.1 （1）绘制矩形:  4.5.2 （2）绘制圆形:  4.5.3 （3）绘制线段:  4.5.4 （4）绘制一组线段:  4.5.5 （5）绘制一组填充颜色的多边形:  4.5.6 （6）文本标注:  5 五、矩阵处理 o 5.1 1、矩阵的内存分配与释放  5.1.1 （1）总体上:  5.1.2 （2）为新矩阵分配内存:  5.1.3 （3）释放矩阵内存:  5.1.4 （4）复制矩阵:  5.1.5 （5）初始化矩阵:  5.1.6 （6）初始化矩阵为单位矩阵: o 5.2 2、访问矩阵元素  5.2.1 （1）假设需要访问一个2D浮点型矩阵的第（i, j）个单元.  5.2.2 （2）间接访问:  5.2.3 （3）直接访问（假设矩阵数据按4字节行对齐）:  5.2.4 （4）直接访问（当数据的行对齐可能存在间隙时 possible alignment gaps）:  5.2.5 （5）对于初始化后的矩阵进行直接访问: o 5.3 3、矩阵/向量运算  5.3.1 （1）矩阵之间的运算:  5.3.2 （2）矩阵之间的元素级运算:  5.3.3 （3）向量乘积:  5.3.4 （4）单一矩阵的运算:  5.3.5 （5）非齐次线性方程求解:  5.3.6 （6）特征值与特征向量 (矩阵为方阵):  6 六、视频处理 o 6.1 1、从视频流中捕捉一帧画面  6.1.1 （1） OpenCV 支持从摄像头或视频文件（AVI格式）中捕捉帧画面.  6.1.2 （2）初始化一个摄像头捕捉器:  6.1.3 （3）初始化一个视频文件捕捉器:  6.1.4 （4）捕捉一帧画面:  6.1.5 （5）释放视频流捕捉器: o 6.2 2、获取/设置视频流信息  6.2.1 （1）获取视频流设备信息:  6.2.2 （2）获取帧图信息:  6.2.3 （3）设置从视频文件抓取的第一帧画面的位置: o 6.3 3、保存视频文件  6.3.1 （1）初始化视频编写器:  6.3.2 （2）保持视频文件:  6.3.3 （3）释放视频编写器: [编辑] 一、简介 [编辑] 1、OpenCV的特点 [编辑] （1）总体描述  OpenCV是一个基于C/C++语言的开源图像处理函数库  其代码都经过优化，可用于实时处理图像  具有良好的可移植性  可以进行图像/视频载入、保存和采集的常规操作  具有低级和高级的应用程序接口（API）  提供了面向Intel IPP高效多媒体函数库的接口，可针对你使用的Intel CPU优化代码，提高程序性能（译注：OpenCV 2.0版的代码已显着优化，无需IPP来提升性能，故2.0版不再提供IPP接口） [编辑] （2）功能  图像数据操作（内存分配与释放，图像复制、设定和转换） Image data manipulation (allocation, release, copying, setting, conversion).  图像/视频的输入输出（支持文件或摄像头的输入，图像/视频文件的输出） Image and video I/O (file and camera based input, image/video file output).  矩阵/向量数据操作及线性代数运算（矩阵乘积、矩阵方程求解、特征值、奇异值分解） Matrix and vector manipulation and linear algebra routines (products, solvers, eigenvalues, SVD).  支持多种动态数据结构（链表、队列、数据集、树、图） Various dynamic data structures (lists, queues, sets, trees, graphs).  基本图像处理（去噪、边缘检测、角点检测、采样与插值、色彩变换、形态学处理、直方图、图像金字塔结构） Basic image processing (filtering, edge detection, corner detection, sampling and interpolation, color conversion, morphological operations, histograms, image pyramids).  结构分析（连通域/分支、轮廓处理、距离转换、图像矩、模板匹配、霍夫变换、多项式逼近、曲线拟合、椭圆拟合、狄劳尼三角化） Structural analysis (connected components, contour processing, distance transform, various moments, template matching, Hough transform, polygonal approximation, line fitting, ellipse fitting, Delaunay triangulation).  摄像头定标（寻找和跟踪定标模式、参数定标、基本矩阵估计、单应矩阵估计、立体视觉匹配） Camera calibration (finding and tracking calibration patterns, calibration, fundamental matrix estimation, homography estimation, stereo correspondence).  运动分析（光流、动作分割、目标跟踪） Motion analysis (optical flow, motion segmentation, tracking).  目标识别（特征方法、HMM模型） Object recognition (eigen-methods, HMM).  基本的GUI（显示图像/视频、键盘/鼠标操作、滑动条） Basic GUI (display image/video, keyboard and mouse handling, scroll-bars).  图像标注（直线、曲线、多边形、文本标注） Image labeling (line, conic, polygon, text drawing) [编辑] （3） OpenCV模块  cv – 核心函数库  cvaux – 辅助函数库  cxcore – 数据结构与线性代数库  highgui – GUI函数库  ml – 机器学习函数库 [编辑] 2、有用的学习资源 [编辑] （1）参考手册：  /docs/index.htm （译注：在你的OpenCV安装目录内） [编辑] （2）网络资源：  官方网站: http://www.intel.com/technology/computing/opencv/  软件下载: http://sourceforge.net/projects/opencvlibrary/ [编辑] （3）书籍：  Open Source Computer Vision Library by Gary R. Bradski, Vadim Pisarevsky, and Jean-Yves Bouguet, Springer, 1st ed. (June, 2006). chenyusiyuan: 补充以下书籍  Learning OpenCV - Computer Vision with the OpenCV Library by Gary Bradski & Adrian Kaehler, O'Reilly Media, 1 st ed. (September, 2008).  OpenCV教程——基础篇作者：刘瑞祯于仕琪，北京航空航天大学出版社，出版日期：200706 [编辑] （4）视频处理例程(在 /samples/c/):  颜色跟踪: camshiftdemo  点跟踪: lkdemo  动作分割: motempl  边缘检测: laplace [编辑] （5）图像处理例程 (在 /samples/c/):  边缘检测: edge  图像分割: pyramid_segmentation  形态学: morphology  直方图: demhist  距离变换: distrans  椭圆拟合: fitellipse [编辑] 3、OpenCV 命名规则 [编辑] （1）函数名: cvActionTargetMod(...) Action = 核心功能（core functionality） (e.g. set, create) Target = 目标图像区域（target image area） (e.g. contour, polygon) Mod = （可选的）调整语（optional modifiers） (e.g. argument type) [编辑] （2）矩阵数据类型: CV_(S|U|F)C S = 符号整型 U = 无符号整型 F = 浮点型 E.g.: CV_8UC1 是指一个8位无符号整型单通道矩阵, CV_32FC2是指一个32位浮点型双通道矩阵. [编辑] （3）图像数据类型: IPL_DEPTH_(S|U|F) E.g.: IPL_DEPTH_8U 图像像素数据是8位无符号整型. IPL_DEPTH_32F图像像素数据是32位浮点型. [编辑] （4）头文件: #include #include #include #include #include // 一般不需要，cv.h 内已包含该头文件 [编辑] 4、编译建议 [编辑] （1） Linux: g++ hello-world.cpp -o hello-world \ -I /usr/local/include/opencv -L /usr/local/lib \ -lm -lcv -lhighgui -lcvaux [编辑] （2） Windows: 在Visual Studio的‘选项’和‘项目’中设置好OpenCV相关文件的路径。 [编辑] 5、C例程 //////////////////////////////////////////////////////////////////////// // // hello-world.cpp // // 该程序从文件中读入一幅图像，将之反色，然后显示出来. // //////////////////////////////////////////////////////////////////////// #include #include #include #include #include int main(int argc, char *argv[]) { IplImage* img = 0; int height,width,step,channels; uchar *data; int i,j,k; if(argc<2){ printf("Usage: main \n\7"); exit(0); } // load an image img=cvLoadImage(argv[1]); if(!img){ printf("Could not load image file: %s\n",argv[1]); exit(0); } // get the image data height = img->height; width = img->width; step = img->widthStep; channels = img->nChannels; data = (uchar *)img->imageData; printf("Processing a %dx%d image with %d channels\n",height,width,channels); // create a window cvNamedWindow("mainWin", CV_WINDOW_AUTOSIZE); cvMoveWindow("mainWin", 100, 100); // invert the image // 相当于 cvNot(img); for(i=0;i0 将读入的图像强制转换为一幅三通道彩色图像 =0 将读入的图像强制转换为一幅单通道灰度图像 <0 读入的图像通道数与所读入的文件相同. [编辑] （2）保存图像: if(!cvSaveImage(outFileName,img)) printf("Could not save: %s\n", outFileName); 保存的图像格式由 outFileName 中的扩展名确定. [编辑] 3、访问图像像素 [编辑] （1）假设你要访问第k通道、第i行、第j列的像素。 [编辑] （2）间接访问: (通用，但效率低，可访问任意格式的图像)  对于单通道字节型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1); CvScalar s; s=cvGet2D(img,i,j); // get the (j,i) pixel value, 注意cvGet2D与cvSet2D中坐标参数的顺序与其它opencv函数坐标参数顺序恰好相反.本函数中i代表y轴，即height;j代表x轴，即weight. printf("intensity=%f\n",s.val[0]); s.val[0]=111; cvSet2D(img,i,j,s); // set the (j,i) pixel value  对于多通道字节型/浮点型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); CvScalar s; s=cvGet2D(img,i,j); // get the (i,j) pixel value printf("B=%f, G=%f, R=%f\n",s.val[0],s.val[1],s.val[2]); s.val[0]=111; s.val[1]=111; s.val[2]=111; cvSet2D(img,i,j,s); // set the (i,j) pixel value [编辑] （3）直接访问: (效率高，但容易出错)  对于单通道字节型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1); ((uchar *)(img->imageData + i*img->widthStep))[j]=111;  对于多通道字节型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3); ((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B ((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G ((uchar *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R  对于多通道浮点型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); ((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 0]=111; // B ((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 1]=112; // G ((float *)(img->imageData + i*img->widthStep))[j*img->nChannels + 2]=113; // R [编辑] （4）基于指针的直接访问: (简单高效)  对于单通道字节型图像: IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1); int height = img->height; int width = img->width; int step = img->widthStep/sizeof(uchar); uchar* data = (uchar *)img->imageData; data[i*step+j] = 111;  对于多通道字节型图像: IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3); int height = img->height; int width = img->width; int step = img->widthStep/sizeof(uchar); int channels = img->nChannels; uchar* data = (uchar *)img->imageData; data[i*step+j*channels+k] = 111;  对于多通道浮点型图像（假设图像数据采用4字节（32位）行对齐方式）: IplImage* img = cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); int height = img->height; int width = img->width; int step = img->widthStep/sizeof(float); int channels = img->nChannels; float * data = (float *)img->imageData; data[i*step+j*channels+k] = 111; [编辑] （5）基于 c++ wrapper 的直接访问: （更简单高效）  首先定义一个 c++ wrapper ‘Image’，然后基于Image定义不同类型的图像: template class Image { private: IplImage* imgp; public: Image(IplImage* img=0) {imgp=img;} ~Image(){imgp=0;} void operator=(IplImage* img) {imgp=img;} inline T* operator[](const int rowIndx) { return ((T *)(imgp->imageData + rowIndx*imgp->widthStep));} }; typedef struct{ unsigned char b,g,r; } RgbPixel; typedef struct{ float b,g,r; } RgbPixelFloat; typedef Image RgbImage; typedef Image RgbImageFloat; typedef Image BwImage; typedef Image BwImageFloat;  对于单通道字节型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,1); BwImage imgA(img); imgA[i][j] = 111;  对于多通道字节型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_8U,3); RgbImage imgA(img); imgA[i][j].b = 111; imgA[i][j].g = 111; imgA[i][j].r = 111;  对于多通道浮点型图像: IplImage* img=cvCreateImage(cvSize(640,480),IPL_DEPTH_32F,3); RgbImageFloat imgA(img); imgA[i][j].b = 111; imgA[i][j].g = 111; imgA[i][j].r = 111; [编辑] 4、图像转换 [编辑] （1）字节型图像的灰度-彩色转换: cvConvertImage(src, dst, flags=0); src = float/byte grayscale/color image dst = byte grayscale/color image flags = CV_CVTIMG_FLIP (垂直翻转图像) CV_CVTIMG_SWAP_RB (置换 R 和 B 通道) [编辑] （2）彩色图像->灰度图像: // Using the OpenCV conversion: cvCvtColor(cimg,gimg,CV_BGR2GRAY); // cimg -> gimg // Using a direct conversion: for(i=0;iheight;i++) for(j=0;jwidth;j++) gimgA[i][j]= (uchar)(cimgA[i][j].b*0.114 + cimgA[i][j].g*0.587 + cimgA[i][j].r*0.299); [编辑] （3）不同彩色空间之间的转换: cvCvtColor(src,dst,code); // src -> dst code = CV_2 / = RGB, BGR, GRAY, HSV, YCrCb, XYZ, Lab, Luv, HLS e.g.: CV_BGR2GRAY, CV_BGR2HSV, CV_BGR2Lab [编辑] 5、绘图指令 [编辑] （1）绘制矩形: // 在点 (100,100) 和 (200,200) 之间绘制一矩形，边线用红色、宽度为 1 cvRectangle(img, cvPoint(100,100), cvPoint(200,200), cvScalar(255,0,0), 1); [编辑] （2）绘制圆形: // 圆心为(100,100)、半径为20. 圆周绿色、宽度为1 cvCircle(img, cvPoint(100,100), 20, cvScalar(0,255,0), 1); [编辑] （3）绘制线段: // 在 (100,100) 和 (200,200) 之间、线宽为 1 的绿色线段 cvLine(img, cvPoint(100,100), cvPoint(200,200), cvScalar(0,255,0), 1); [编辑] （4）绘制一组线段: CvPoint curve1[]={10,10, 10,100, 100,100, 100,10}; CvPoint curve2[]={30,30, 30,130, 130,130, 130,30, 150,10}; CvPoint* curveArr[2]={curve1, curve2}; int nCurvePts[2]={4,5}; int nCurves=2; int isCurveClosed=1; int lineWidth=1; cvPolyLine(img,curveArr,nCurvePts,nCurves,isCurveClosed,cvScalar(0,255,255),lineWidth); void cvPolyLine( CvArr* img, CvPoint** pts, int* npts, int contours, int is_closed, CvScalar color, int thickness=1, int line_type=8, int shift=0 ); img 图像。 pts 折线的顶点指针数组。 npts 折线的定点个数数组。也可以认为是pts指针数组的大小 contours 折线的线段数量。 is_closed 指出多边形是否封闭。如果封闭，函数将起始点和结束点连线。 color 折线的颜色。 thickness 线条的粗细程度。 line_type 线段的类型。参见cvLine。 shift 顶点的小数点位数 [编辑] （5）绘制一组填充颜色的多边形: cvFillPoly(img,curveArr,nCurvePts,nCurves,cvScalar(0,255,255)); cvFillPoly用于一个单独被多边形轮廓所限定的区域内进行填充。函数可以填充复杂的区域,例如，有漏洞的区域和有交叉点的区域等等。 void cvFillPoly( CvArr* img, CvPoint** pts, int* npts, int contours,CvScalar color, int line_type=8, int shift=0 ); img 图像。 pts 指向多边形的数组指针。 npts 多边形的顶点个数的数组。 contours 组成填充区域的线段的数量。 color 多边形的颜色。 line_type 组成多边形的线条的类型。 shift 顶点坐标的小数点位数。 [编辑] （6）文本标注: CvFont font; double hScale=1.0; double vScale=1.0; int lineWidth=1; cvInitFont(&font,CV_FONT_HERSHEY_SIMPLEX|CV_FONT_ITALIC, hScale,vScale,0,lineWidth); cvPutText (img,"My comment",cvPoint(200,400), &font, cvScalar(255,255,0)); 其它可用的字体类型有: CV_FONT_HERSHEY_SIMPLEX, CV_FONT_HERSHEY_PLAIN,

                    本文档为【OpenCV_编程简介(入门必读)】，请使用软件OFFICE或WPS软件打开。作品中的文字与图均可以修改和编辑，
                    图片更改请在作品中右键图片并更换，文字修改请直接点击文字进行修改，也可以新增和删除文档中的内容。 
 该文档来自用户分享，如有侵权行为请发邮件ishare@vip.sina.com联系网站客服，我们会及时删除。

                    [版权声明] 本站所有资料为用户分享产生，若发现您的权利被侵害，请联系客服邮件isharekefu@iask.cn，我们尽快处理。

                    本作品所展示的图片、画像、字体、音乐的版权可能需版权方额外授权，请谨慎使用。

                    网站提供的党政主题相关内容(国旗、国徽、党徽..)目的在于配合国家政策宣传，仅限个人学习分享使用，禁止用于任何广告和商用目的。
                

下载需要：免费已有0 人下载

立即下载

OpenCV_编程简介(入门必读)

你可能还喜欢