第9章基于特征匹配的英文印刷字符识别

9.1 案例背景

在日常学习和生活中，人眼是人们接收信息最常用的通道之一。据统计，人们日常处理的信息有75%～85%属于视觉信息范畴，文字信息则占据着重要的位置，几乎涵盖了人类生活的方方面面。如对各种报纸期刊的阅读、查找、批注；对各种文档报表的填写、修订；对各种快递文件的分拣、传送、签收等。因此，为了实现文字信息解析过程的智能化、自动化，就需要借助计算机图像处理来对这些文字信息进行识别。

早在20世纪50年代初期，欧美就开始对文字识别技术进行研究。特别是1955年印刷体数字OCR产品的出现，推动了英文和数字识别技术的发展。美国IBM公司的Casey和Nagy最早开始了对汉字识别的研究，并于1966年发表了第一篇关于汉字识别的论文，采用模板匹配法识别1000个印刷体汉字，从此在世界范围内拉开了汉字识别研究的序幕。日本于20世纪70年代中期开始进行手写体汉字识别的研究，我国于20世纪80年代初期开始进行手写体汉字识别的研究。

本案例重点研究印刷体图像的灰度转换、中值滤波、二值化处理、形态学滤波、图像与字符分割等算法，形成一套效果明显、简便易行的印刷体字符图像识别算法。在印刷体字符的识别过程中，采用字符的归一化和细化处理方法，通过二值化和字体类型特征相结合的处理方式完成特征提取，并建立字符标准特征库，运用合理的模板匹配算法实现对印刷体字符的识别。

本周热推：

探索新型智库发展之路：蓝迪国际智库报告·2015（上册）深入解析Oracle：数据库的初始化 SAS金融数据挖掘与建模：系统方法与案例解析数据化网站运营深度剖析短文本数据理解

第9章 基于特征匹配的英文印刷字符识别

9.1 案例背景

第9章基于特征匹配的英文印刷字符识别