图像处理和计算机视觉 基础经典以及最近发展
demo或者 source code,很多作者都愿意给出 matlab版本的,然后别人再呼哧 呼哧改成c版本的。现在作者干脆给出c/c++版本,或者自己集成到 OpenCv中 去,这样能快速提升白己的影响力 如果想在图像处理和计算札视觉界有比较深入的研究,并且以后打算进入这 个领域工作的话,建议把 Opencv作为自己的主攻方向。如果找工作的时候敢号 称自己精通 OpenCv的话,肯定可以找到一份满意的工作。 4.本文的特点和结构,以及适合的对象 本文面向的对象是即将进入或者刚刚进入图像处理和计算机视觉领域的童 鞋,可以在阅读书籍的同时参阅这些文献,能对书中提到的算法有比铰深刻的理 解。由于本文涉及到的范围比较广,如果能对计算札视觉的资深从业者也有一定 的帮助,我将倍感欣慰。为了不至太误人子弟,每一篇文章都或多或少的看了 下,最不济也看了摘要(这勹话实在整理之前写的,实际上由于精力有限,好多 文献都只是人概扫了一眼,然后看了看 google的引用数,一般在1000以人上就放 上来了,把这些文章细细品味一遍也是我近一两年之内的目标)。在成文的过程 中,我本人也受益匪浅,希望能对大家也有所帮助 由于个人精力和视野的关系,有一些我未涉足过的领域不敢斗胆推荐,只是 列出了一些引用率比较高的文章,比如摄像机标定和立体视觉。不过将来,由于 工作或者其他原因,这些领域也会接触到,我会逐步增减这些领域的文章。尽管 如此,仍然会有疏漏,忘见谅。同时文章的挑选也夹带了一些个人的喜好,比如 我个人比铰喜欢 low level方向的,尤其是IJCV和PAMI上面的文章,因此这方 面也稍微多点,希望不要引起您的反感。如果有什么意见或者建议,欢迎mai 我。文章和资源我都会在我的 csdn blog和 sina ishare同步更新。在此申明: 这些论文的版权归作者及其出版商所有,请勿用于商业目的。 个人b1og http://blog.csdnnet/dcraw 新浪iask地址 http://iask.sinacomcn/u/2252291285/ish?folderid=868438 本文的安排如下。第一部分是绪论。第二部分是图像处理中所需要用到的理 论基础,主要是这个领域所涉及到的一些比较好的参考书籍。第三部分是计算机 视觉中所涉及到的信号处理和模式识别文章。由于图像处理与图像分析太难区分 ∫,第四部分集中讨论」它们。第五部分是计算机视觉部分。最后是小结。 图像处理与计算机视觉相关的书籍 1.数学 我们所说的图像处理实际上就是数字图像处理,是把真实世界中的连续三维 随机信号投影到传感器的二维平面上,采样并量化后得到二维矩阼。数字图像处 理就是二维矩阵的处理,而从二维图像中恢复出三维场景就是计算机视觉的主要 任务之一。这里面就涉及到了图像处理所涉及到的三个重要属性:连续性,二维 矩阵,随札性。所对应的数学知识是高等数学(微积分),线性代数(矩阵论) 概率论和随机过程。这三门课也是考硏数学的三个组成部分,构成了图像处理和 计算机视觉最基础的数学基础。如果想要更进步,就要到网上搜搜林达华推荐 的数学书日了。 2.信号处理 图像处理其实就是二维和三维信号处理,而处理的信号又有一定的随机性 因此经典信号处理和随机信号处理都是图像处理和计算机视觉中必备的理论基 础 2.1绎典信号处理 信号与系统(第2版) Alan v.0 ppenhe im等著刘树棠译 离散信号处理(第2版)A.V.奥本海姆等著刘树棠译 数字信号处理:理论算法与实现胡广书(编者) 2.2随机信号处理 现代信号处理张贤达著 统计信号处理基碰:佑计与捡测理论 Steven m.Kawy等著罗鹏飞等译 白适应滤波器原理第4版) Simon haykin著郑宝玉等译 2.3小波变换 信号处理的小波导引:稀碗方法(原书第3版) tephane Malla著,戴道清 等译 2.4信息论 信息论基碰(原书第2版) Thomas m cover等著阮吉寿等译 3.模式识别 Pattern Recognition and Machine Learning Bishop, Christopher M Springer 模式识别英文版)(第4版)西奥多里德斯著 Pattern Classification(2nd Edition) Richard 0. Duda E Statistical Pattern Recognition, 3rd Edition Andrew R. Webb a 模式祆刎第3版)张学工著 4.图像处理与计算机视觉的书籍推荐 图像处理,分析与机器视第三版 Sonka等著艾海舟等译 Image Processing, Analysis and Machine Vision 这本书是图像处理与计算机视觉里面比较全的一本书了,几乎涵盖了图像视 觉领域的各个方面。中文版的个人感觉也还可以,值得一看。 数字图像处理第三版冈萨雷斯等著 Digital Image Processing 数字图像处理永远的经典,现在已经出到了第二三版,相当给力。我的导师曾 经说过,这本书写的很优美,对写英文论文也很有帮助,建议购买英文版的 计算机视觉:理论与算法 Richard szelisk i著 Computer Vision: Theory and algorithm 微软的 Szeliski写的一木最新的计算机视觉著作。内容非常丰富,尤其包 括了作者的研究兴趣,比如一般的书里面都没有的 Image Stitching和 Image Matting等。这也从另一个侧面说明这本书的通用性不如 Sonka的那本。不过作 者开放了这本书的电子版,可以有选择性的阅读。 http://szeliski.org/book, Multiple view Geometry in Computer vision第二版 Harley等著 引用达一万多次的经典书籍了。第二版到处都有电子版的。第一版曾出过中 文版的,后来绝版了。网上也可以找到中英文版的电子版 计算机视觉:一种现代方法 DA Forsyth等著 Computer Vision: A Modern approach MIT的经典教材。虽然已经过去十年了,还是值得一读。期待第二版 Machine vision; theory, aigorithms, practicalities第三版 Davies 为数不多的英国人写的书,偏向于工业应用。 数字图像处理第四版 Pratt著 Digital Image Processing 写作风格独树一帜,也是图像处理领域很不错的一本书。网上也可以找到非 常清晰的电子版。 5.小结 罗嗦了这么多,实际上就是几个建议: (1)基础书千万不可以扔,也不能低价处理给同学或者师弟师妹。不然到 时候还得一本本从书店再买回来的。钱是一方面的问题,对着全新的书看完全没 有看自己当年上过的误木有感觉。 2)遇到冇相关的课,果断选修或者蹭之,比如随机过程,小波分析,模 式识别,机器学习,数据挖掘,现代信号处理甚至泛函。多一些理论积累对将来 科研和工作都有好处。 (3)资金允许的话可以多囤一些经典的书,有的时候从牙缝里面省一点都 可以买一本好书。不过千万不要像我一样只囤不看。 计算机视觉中的信号处理与模式识 别 从本章开始,进入本文的核心章节。一共分三章,分别讲述信号处理与模式 识别,图像处理与分析以及计算机视觉。与其说是讲述,不如说是一些经典文章 的罗列以及自己的简单点评。与前一个版本不同的是,这次把所有的文章按类别 归了类,并且增加了很多文献。分类的时候并没有按照传统的分类方法,而是划 分成了一个个小的门类,比如SIFT, Harris都作为了单独的一类,虽然它们都 可以划分到特征提取里面去。这样做的目的是希望能突出这些比较实用且比较流 行的方法。为∫以后维护的方便,按照字母顺序排的序 1. Boosting Boos ting是最近来年来最成功的一种模式识别方法之一,个人认为可以 和SWM并称为模式识别双子星。它真正实现了“三个臭皮匠,赛过诸葛亮”。只 要保证每个基本分类器的正确率超过50%,就可以实现组合成任意精度的分类器 这样就可以使用最简单的线性分类器。 Boosting在计算机视觉中的最成功的应 用无疑就是 Viola- Jones提出的基于Haar特征的人脸检测方案。听起来似乎不 可思议,但Haar+ Adaboost t确实在人脸检测上取得了巨大的成功,经成了工业 界的事实标准,并且逐步推广到其他物体的检测。 Rainer lienhart在2002ICIP发表的这篇文章是Haar+ Adaboost的最好的 扩展,他把原始的两个方向的Haar特征扩展到了四个方向,他本人是 Opencv 积极的参与者。现在 OpenCv的库里面实现的 Cascade classification就包含了 他的方法。这也说明了盛会(如ICIP,ICPR, ICASSP)也有好文章啊,只要用 心去发掘。 1997 A Decision-Theoretic Generalization of on-Line Learning and an Application to boosting [1998 Boosting the margin A new explanation for the effecliveness of voting me thods [2002 ICIP TR Empirical Analysis of Detection Cascades of Boosted Classifiers for rapid ob ject Delection [2003 The Boosting Approach to Machine Learning An Overview [2004 IJCV] Robust Real-time Face Detection 2. Clustering 聚类主要有K均值聚类,谱聚类和模糊聚类。在聚类的时侯如果自动确定聚 类中心的数日是一个一直没有解决的问题。不过这也很正常,评价标准不同,得 到的聚类中心数目也不一样。不过这方面还是有一些可以参考的文献,在使用的 时候可以基于这些方法设计白己的准则。关于聚类,一般的模式识别书籍都介绍 的比较详细,不过关于 cluster validity讲的比较少,可以参考下面的文章看 看 [1989 PAMI] Unsupervised Optimal Fuzzy Clustering [1991 PAMI] A validity measure for fuzzy clustering [1995 PAMI] On cluster validity for the fuzzy c-means model [1998 Some New Indexes of Cluster Validity [1999 ACM Data Clustering A Review [1999 JIIS] On Clustcring Validation Techniques L2001 Estimating the number of clusters in a dataset via the gap statistic [2001 NIPS On Spectral Clustering [2002 A stability based method for discovering structure in clustered data [2007 A tutorial on spectr cal clustering 3. Compressive Sensing 最近大红大紫的压缩感知理论。 [2006 TIT] Compressed Sensing [2008 SPM] An Introduction to Compressive Sampling [2011 TSP] Structured Compressed Sensing From Theory to Applications 4. Decision trees 对决策树感兴趣的同学这篇文章是非看不可的了。 [1986 Introduction to Decision Trees 5. Dynamical Programming 动态规划也是一个比较使用的方法,这里挑选了一篇PAMI的文章以及一篇 Book Chapter [1990 PAMI] using dynamic programming for solving variational problems in vision LBook Chapter] Dynamic Programming 6. Expectation Maximization HM是计算机视觉中非常常见的一种方法,尤其是对参数的估讣和拟合,比 如高斯混合模型。酬M和GMM在 Bishop的PRML里单独的作为一章,讲的很不错。 关于EM的 tutorial,网上也可以搜到很多。 [1977 Maximum likelihood froml incomplete data via the EM algorithill [1996 SPM] The Expectation-Maximzation Algorithm 7. Graphical Models 伯克利的乔丹大师的 Graphical Model,可以配合这 Bishop的PRML一起看 1999 ML An Introduction to Variational Methods for graphical Models 8. Hidden markov model HM在语音识别中发挥着巨大的作用。在信号处理和图像处理中也有一定的 应用。最早接触它是跟小波和检索相关的,用HM来描述小波系数之问的相互关 系,并用来做检索。这里提供篇1989年的经典综述,几篇HM在小波,分割, 检索和纹理上的应用以及一本比较早的中文电子书,现在也不知道作者是谁,在 这里对作者表示感谢。 1989] A tutorial on hidden markov models and selected applications in speech recognition [1998 TSP] Wavelet-based statistical signal processing using hidden Markov models L2001 TIP Multiscale image segmentation using wavelet-domain hidden Markov models [2002 TMM] Rotation invariant texture characterization and retrieval using steerable wavelet-domain hidden markov models [2003 TIP] Wavelet-based texture analysis and synthesis using hidden Markov mode l Hmm Chinese book. pdf 9. Independent Component Analysis 同PCA一样,独立成分分析在计算机视觉中也发挥着重要的作用。这里介绍 两篇综述性的文章,最后一篇是第二篇的TR版本,内容差不多,但比较清楚 此 [1999 Independent Component Analysis A Tutorial L2000 NN] Independent component analysis algorithms and applications [2000 Independent Component Analysis Algorithms and Applications 10. Information Theory 计算机视觉中的信息论。这方面有一本很不错的书 Information Theory in Computer vision and Pattern Recognition。这本书有电子版,如果需要用到 的话,也可以参考这本书。 [1995 NC An Information-Maximization Approach to Blind Separation and Blind Deconvolution [2010 An information theory perspective on computational vision
暂无评论