基于测地线的图像分割实现.doc
《基于测地线的图像分割实现.doc》由会员分享,可在线阅读,更多相关《基于测地线的图像分割实现.doc(24页珍藏版)》请在沃文网上搜索。
1、目 录1引言12开发平台22.1Visual Studio 201022.1.1MFC简介32.2OpenCV简介42.2.1OpenCV的模块42.2.2OpenCV的特征42.2.3OpenCV的功能43基本概念53.1图像分割53.1.1图像分割的定义53.1.2图像分割的意义63.2Parzen窗方法73.3图像梯度的计算83.3.1梯度的定义83.3.2图像梯度的定义93.4测地线93.4.1测地线的定义93.4.2短程线103.4.3测地线的性质104基于测地线的图像分割114.1用Parzen窗方法求PDF114.2梯度的计算134.3测地线距离的计算154.3.1前景测地线距离
2、计算154.3.2背景测地线距离计算165实验结果与分析176总结19参考文献19致谢20附录A20*大学本科毕业论文基于测地线的图像分割实现*(信息与电气工程学院,计算机科学与技术专业,2008级*班,*)摘 要:图像分割是指把图像分解成各具特性的区域并提取出目标的技术和过程,是图像处理的重要内容之一,分割结果的好坏将直接影响到基于图像分割的高级应用。在计算机视觉中,图像分割得到广泛的应用。本文实现了一种基于测地线距离的图像分割方法,提供了对图像进行软分割和目标提取的一个交互框架,通过用户对图像中的前景和背景标注,训练出前景种子点和背景种子点的概率密度函数,对图像中的其他像素进行类别判断。最
3、后将前景提取出来。关键词:图像分割; Parzen窗方法;梯度;测地线;PDFGeodesics Based on Image Segmentation Realized*(School of Information &Electrical Engineering , Computer Science & Technology, Class *Grade2008,*)Abstract:Image Segmentation is the technique and the process to segment an image into different parts with diverse
4、characters and to extract the interested region, which is also one of the important contents in image processing, and the quality of image segmentation directly affects the performance of advanced applications based on it. As an important and basic procedure in the field of computer vision, image se
5、gmentation has been widely used in our daily life. In this paper, one interactive framework for soft segmentation and matting of natural images and videos is presented. The proposed technique is based on the optimal, linear time, computation of weighted geodesic distances to the user-provided scribb
6、les, from which the whole data is automatically segmented. The weights are based on spatial or temporal gradients, without explicit optical flow or any advanced and often computationally expensive feature detectors.Key words:image segmentation; Parzen; gradient; geodesic; PDF1引言计算机科学技术的飞速发展使得图像处理和分析
7、逐渐形成了自己的科学体系。尽管其发展历史不长,但新的处理方法层出不穷,引起了各方面人士的广泛关注。视觉是人类最重要的感知手段之一,视觉信息是人类从自然界获得信息的主要来源,“眼见为实”,视觉信息所提供的直观作用是文字和声音无法比拟的。图像是指对客观存在的物体的一中相似性的、生动的写真和描述,是日常生活中广泛接触的一种媒体,如:照片、医学图像、天文观测图像、卫星遥感图像等。图像的特点是:(1)直观形象,可以将客观事物的原形真实的展现在面前,供不同能力、不同目的、不同水平的人去观察、理解;(2)易懂,只要将图像呈现在人的眼前,其视觉系统就会立即得到这幅图像所描述的信息;(3)“一图胜千言”,图像本
8、身所携带的信息远比文字、声音信息丰富。因此,数字图像成为心理学、生理学、计算机科学等诸多领域内的学者们研究视觉感知的有效工具。其次,图像处理在军事、遥感、气象等大型应用中有不断增长的需求。其中,图像分割在计算机视觉中的应用越来越广泛,如:航空照片、卫星照片、视频片段等的解释、医学辅助诊断等。图像分割就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。图像分割能够按照某一特征把图像分成若干具有一定意义的、互不交叠的区域,是由图像处理到图像分析的关键一步。图像分割是图像处理重要的研究内容,通过图像分割、目标分离、特征提取、参数估计等技术可以将原始图像转化为更抽象更紧凑的形式
9、,使得更高层的图像分析和理解成为可能。它是图像理解的重要组成部分,是图像处理到图像分析的关键步骤,图像分割结果的好坏直接影响到对于图像后续处理,同时也是图像处理中最重要和最困难的问题之一。图像分割的结果是图像特征提取和识别等图像理解的基础,对它的研究一直是图像技术研究中的热点和焦点。本文提出了对图像进行软分割和抠图的一个交互框架,该技术是基于对用户提供的标注中的数据进行最优的,线性的,加权的测地线距离的计算,标注中的数据是自动分割的。对标注中的数据进行运算求得最小距离短程线,来对图像处理,进行分割得到目标。2开发平台针对不同的应用平台我们要选择合适的设计工具,采用更为有效实用的技术。对基于测地
10、线的图像分割实现采用的是Microsoft Visual Studio 2010,并在VS2010中配置OpenCV2.1版本。2.1Visual Studio 2010Visual Studio是微软公司推出的开发环境。是目前最流行的Windows平台应用程序开发环境。Visual Studio 2010版本于2010年4月12日上市,其集成开发环境(IDE)的界面被重新设计和组织,变得更加简单明了。Visual Studio 2010同时带来了 NET Framework 4.0、Microsoft Visual Studio 2010 CTP (Community Technology
11、PreviewCTP),并且支持开发面向Windows 7的应用程序。除了Microsoft SQL Server,它还支持 IBM DB2和Oracle数据库。根据微软发布的一份官方文档宣称,Visual Studio 2010将在下面五个方面有所创新: (1)民主化的应用程序生命周期管理Visual Studio Team System 2010将坚持打造一个功能平等、共同分担的平台以用于组织内的应用程序生命周期管理过程。通过Visual Studio 2010,微软将为开发者提供合适的工具和框架,以支持软件开发中最新的架构、开发和部署。 (2)让开发商惊喜从Visual Studio的第
12、一个版本开始,微软就将提高开发人员的工作效率和灵活性作为自己的目标。Visual Studio 2010将继续关注并且显著地改进开发者最核心的开发体验。 (3)下一代平台浪潮的弄潮儿微软将继续投资于市场领先的操作系统、工具软件和服务器平台,为客户创造更高的价值。使用Visual Studio 2010,将可以在新一代的应用平台上,为你的客户创造令人惊奇的解决方案。 (4)跨部门的应用客户将在不同规模的组织内创建应用,跨度从单个部门到整个企业。Visual Studio 2010将确保在这么宽泛的范围内的应用开发都得到支持。 (5)高效的开发环境Microsoft Visual Studio 2
13、010 采用拖曳式便能完成软件的开发,简简单单的操作便可以实现一个界面的生成。但拖曳的界面,也应当有相应的代码来实现功能。Microsoft Visual Studio 2010支持C#、C+ 、VB。Microsoft Visual Studio 2010的新特性: C# 4.0中的动态类型和动态编程; 多显示器支持; 使用Visual Studio 2010的特性支持TDD; 支持Office ; Quick Search特性; C+ 0x新特性; IDE增强; 使用Visual C+ 2010创建Ribbon界面; 新增基于.NET平台的语言 F#。2.1.1MFC简介MFC是微软把Wi
14、ndows API进行封装的类库,该类库以层次结构组织起来,其中封装了大部分Windows API函数和Windows控件。并且包含一个应用程序框架,以减少应用程序开发人员的工作量。其中包含的类包含大量Windows句柄封装类和很多Windows的内建控件和组件的封装类。MFC不只是一个功能单纯的界面开发系统,它提供的类绝大部分用来进行界面开发,关联一个窗口的动作,但它提供的类中有好多类不与一个窗口关联,即类的作用不是一个界面类,不实现对一个窗口对象的控制(如创建、销毁),而是一些在WinOS(用MFC编写的程序绝大部分都在WinOS中运行)中实现内部处理的类,如数据库的管理类等。应用MFC编
15、程的好处:使Windows程序员能够利用C+面向对象的思想进行编程。2.2OpenCV简介OpenCV是一个基于C/C+语言的开源计算机视觉函数库。OpenCV由一系列C函数和C+类构成,功能涵盖图像处理、结构分析、运动检测、摄像机定标、三维重建以及机器学习等方面,并有较高的运行效率。2.2.1OpenCV的模块OpenCV包括以下几个模块,其具体功能是: CV 主要的OpenCV函数; CVAUX 辅助的OpenCV函数; CXCORE 数据结构与线性代数支持; HIGHGUI 图像界面函数; ML 机器学习,包括模式分类和回归分析等; CVCAM 负责读取摄像头数据的模块。2.2.2Ope
16、nCV的特征OpenCV具有以下特征:其代码都经过优化,可用于实时处理图像;具有良好的可移植性;可以进行图像、视频载入、保存和采集的常规动作;具有低级和高级的应用程序接口(API);提供了面向Intel IPP高效多媒体函数库的接口,可针对所使用的Intel CPU代码进行优化,提高程序性能; 具有底层和高层的应用开发包; 开源计算机视觉库采用C/C+编写; 独立于操作系统、硬件和图形管理器。2.2.3OpenCV的功能应用OpenCV可以实现以下功能:对图像数据的操作,包括分配、释放、复制、设置和数据转换;对图像和视频的输入输出,指文件和摄像头作为输入,图像和视频文件作为输出;具有对矩阵和向
17、量的操作以及线性代数的算法程序,包括矩阵积、解方程、特征 值以及奇异值等;可向各种动态数据结构,如列表、队列、集合、树和图等进行操作;具有基本的数字图像处理能力,如可进行滤波、边缘检测、角点检测、采样与差值、色彩转换、形态操作、直方图和图像金字塔等操作;可对各种结构进行分析,包括连接部件分析、轮廓处理、距离变换、各种距的计算、模板匹配、Hough变换、多边形逼近、直线拟合、椭圆拟合和Delaunay三角划分等;对摄像头的定标,包括发现与跟踪定标模式、定标、基本矩阵估计、齐次矩阵估计和立体对应;对运动的分析,如对光流、运动分割和跟踪的分析;对目标的识别,可采用特征法和隐马尔可夫模型法;具有基本的
18、GUI功能,包括图像与视频显示、键盘和鼠标事件处理及滚动条等。3基本概念在对图像进行分割时需要理解以下概念:图像分割、Parzen窗方法估计概率密度、梯度的计算、测地线距离的计算。 3.1图像分割3.1.1图像分割的定义图像分割是指将图像中具有特殊含义的不同区域划分开来,这些区域是互相不交叉的,每个区域都满足特定区域的一致性。从集合的角度出发,图像分割定义如下: 设R代表整个图像区域,对R的分割可看作将R分成若干个满足以下5个条件的非空子集,如图3.1所示。 图3.1(1)即分割成的所有子区域的并应能构成原来的区域 R;该条件指出分割所得到的全部子区域的总和(并集)应能包括图像中所有像素。 (
19、2)对所有的和及,有;该条件指出各个子区域是互不重叠的 (3)对于,有;该条件指出在分割后得到的属于不同区域中的像素应该具有某些相同特性; (4)对于,有;该条件指出在分割后得到的属于不同区域中的像素应该具有一些不同的特性;(5)对于,是联通区域;该条件要求同一子区域内的像素应当是连通的。 3.1.2图像分割的意义图像分割是数字处理图像中的一项关键技术,它使得后续的图像分析,识别等处理阶段所要处理的数据量大大减少,同时又保留有关图像结构特征的信息。由于分割中出现的误差会传播至高层次处理阶段,因此分割的精确程度非常重要,多年来一直受到研究人员的高度重视,被认为是计算机视觉中的一个瓶颈。图像分割是
- 1.请仔细阅读文档,确保文档完整性,对于不预览、不比对内容而直接下载带来的问题本站不予受理。
- 2.下载的文档,不会出现我们的网址水印。
- 3、该文档所得收入(下载+内容+预览)归上传者、原创作者;如果您是本文档原作者,请点此认领!既往收益都归您。
下载文档到电脑,查找使用更方便
20 积分
下载 | 加入VIP,下载更划算! |
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- 基于 地线 图像 分割 实现
