英雄联盟为什么进不去-硬盘寻道错误率

千彩手写识别系统
2023年4月6日发(作者:rpgvx rtp)

手写文字识别技术的研究

关兵

摘要:随着计算机性能的提高和科技的不断发展,随着信息时代的到来,为适应社会的

需要,文字识别技术也将更完善。OCR技术,利用光学技术对文字或字符进行扫描并转换成

计算机内码,其工作原理是通过扫描仪或数码相机等输入设备获取文字、表格、图片等信息,

利用各种模式算法分析文字形态特征,判断出文字的标准编码存储在文件中。在现实生活中

有着广泛的应用价值。

关键词:手写文字识别OCR技术形态特征模式识别

引言

计算机文字识别,俗称光学文字识别,其英文术语为OpticalCharacterRecognition(缩

写为OCR),是指通过计算机技术及光学技术对印刷或书写的文字进行自动的识别,达到认知

的目的,是实现文字高速自动录入的一项关键技术。到目前为止,汉字OCR是模式识别技术

的一个分支,其主要目的是将汉字(手写体与印刷体)自动读入计算机。而手写文字识别技

术,是指通过计算机来识别手写文字的一种识别文字的技术。

随着信息化的到来,OCR文字识别技术发展很快,在日常生活中日益重要。文字识别是

中文信息录入的快捷手段,由于汉字是非字母、非拼音化的文字,笔划复杂多样,人工键入

速度慢而劳动强度大,计算机自动识别文字或语言方式解决了这一难题,能快速高效地将汉

字输入进计算机;文字识别技术是提高办公自动化水平的主要因素。办公自动化就是要借助

计算机来进行文档的处理,以代替人们日常的办公活动,在现代社会,图像信息占有较大的

比重,存在大量文字信息,因此,文字的自动识别对图像的处理有重要的意义;文字识别技

术丰富和完善了文字识别理论。现在人们已可通过手写文件经OCR产品的识别录入计算机,

大大推动发展了文字识别理论;文字识别是智能计算机智能接口的重要组成部分,智能计算

机能认识文字、图像和景物,能听懂语音、理解文字。视觉是智能计算机接受外界信息的主

要手段,而识别文字是智能计算机必备的功能。

一、OCR技术的发展

OCR概念的诞生,要早于计算机的问世。早期的OCR多以文字的识别方法研究为主,识别

的文字当时仅为0-9这几个数字。后来随着计算机的出现和发展,OCR研究才在全球范围内广

泛研究和发展。OCR发展至今,可分为三个阶段:

1、第一代OCR产品出现于60年代初期,在此期间,IBM公司、NCR等公司分别研制出了自

己的OCR软件,最早的OCR产品应该是IBM公司的IBM1418。它们只能识别印刷体的数字,

英文字母及部分符号,而且都是指定的字体。60年代末,日立公司和富士通公司也

研制出了各自的OCR产品。

2、第二代OCR系统是基于手写体字符的识别,前期只限于手写体数字,从时间上来看,

是60年代中期到70年代初期。1965年IBM公司研发出IBM1287,并在纽约世界博览会上展出,

开始能识别印刷体数字、英文字母及部分简单的符号。第一个实现信函自动分拣系统的是东

芝公司,两年后NEC公司也推出了这样的系统,到1974年,分拣率达到92%-93%。

3、第三代OCR系统要解决的技术问题是对于质量较差的文稿及大字符集的识别,例如汉

字的识别。1966年,IBM公司开发的OCR系统利用简单的模板匹配法识别了1000个复杂的印刷

体汉字,到了1977年,东芝公司又制出可识别2000多印刷体汉字的单字汉字识别系统。

我国在OCR的研究方面起步相对较晚,70年代开始进行数字、英文及符号的识别研究,

70年代末开始进行汉字的研究,到1986年,汉字的识别进入了一个具有成果性的阶段,不少

单位推出了中文OCR产品。到目前为止,印刷体汉字的识别率达到了98%以上,手写体的识别

率也在70%以上,并且可对多种字体、不同字号混排识别,国家“863”计划对该方面的研究

给予了很大的资助。目前,我国正在争取实现OCR产品识别精度更高、识别速度更快,能同

时支持单机和网络操作,使得使用更方便,应用更广泛,达到不同用户的使用要求。

二、文字识别的原理与方法

汉字OCR的原理是将文字通过光电输入设备,如扫描仪、摄像机、写字板等,转换成二

维的点阵信息后,通过对相应的识别方法转换成汉字文字。完成这一套转换工作的是汉字识

别系统。文字的识别是指通过一定的方法和技术提取文字的特征并将其存储于机器设备中,

实现对文字的自动判别。

1、汉字识别系统的组成

汉字识别系统主要包括以下几个步骤:汉字图形输入、预处理、单字识别及后处理。汉

字图形输入是指通过录入设备将文稿录入到计算机中,也就是说实现原始稿件的数字化,现

在用的比较普遍的设备是数字化扫描仪、数字相机等;预处理是指在进行文字识别之前的一

些准备工作,主要包括版面分析、图像净化及二值化处理、文字切分、正规化处理等,这一

阶段的工作是很重要的,处理的效果如何,直接影响到识别的准确率;单字识别则体现着文

字识别的核心技术,主要包括文字特征抽出的方法及分类判别算法。人能够通过大脑很简单

地认识文字,是因为在人的大脑中已经保存了文字的特征,像文字的结构,笔画等。要想让

计算机去认识文字,首先也要存储类似的信息,那么,存储什么样的信息及如何提取这些信

息,则是一个比较复杂的事情,而且要求达到很高的识别率。通常的做法是根据文字的笔画、

特征点、投影信息、点的区域分布等进行分析,常用的方法是结构分析方法和统计分析方法;

后处理是指对识别出的文字,或者多个识别结果采用词语进行上下文匹配,即将单字识别的

结果进行分词,与词库中的词进行比较,以提高系统的识别率,减少误识率。

2、汉字识别方法

对于文字的识别,从文字类型上划分,通常分为印刷体文字的识别和手写体文字的识别;从

识别的方式划分,通常分为在线识别和脱机识别。由于印刷体与手写体的文字特征差异较大,

所以在软件识别上,其处理方法是不同的。下图描述了文字识别系统的组成:

图1文字识别系统组成图

在汉字识别系统中最为重要的部分是识别器,识别器的质量可以说基本决定了汉字识别

系统的性能。目前汉字的识别还只停留在模式识别上,模式识别主要有两种,即统计模式识

别和结构模式识别。OCR的应用主要表现在以下几个方面:在线式的文字识别,是指书写完

一个文字后立刻进行识别,如在PDA中文字的录入,汉字手写板等;表格文字识别,是指对

在固定印刷的表格中填写的数据进行识别,如税务申报表的录入;纯文本文字识别,如文件

的录入,报刊杂志的录入等。

统计模式识别是指提取待识别汉字的一组特征值,然后按经一定准则所建立的统计函数

模式输

预处理特征抽

特征选

特征匹配

输出结果

模型字符特征

进行数值分析,根据数值分析的结果确定汉字。由于统计分析理论比较成熟,因此,这种方

法对单个汉字的识别准确率高,但对不同字体的混排,特别是手写文稿的识别,效果不理想。

结构模式识别与统计模式识别相比,有比较严格的规律性。中国的汉字量虽然很大,但

是汉字是图形字符,含有丰富的结构信息。结构模式识别就是设法提取汉字结构的特征信

息及其组字的特定规律,然后根据特征信息及其特定规律进行汉字的识别。结构识别是将汉

字看作是若干个简单结构的集合,这个简单的结构叫做基元,每一个汉字都可以由这些基元

组成,汉字识特定基元的集合。汉字的识别则是将汉字分解成若干个基元。由于印刷体文稿

汉字字体规整,结构清晰,从理论上讲,结构模式特别适用。

利用结构信息,吸取统计模式的优点,近几年统计结构识别法得到广泛的确认和应用,

为解决汉字识别这个难题提供了一条新思路。由于集成电路技术的飞速发展,今后研究方向

主要集中于吸收和应用先进技术,如神经网络、人工智能等方面的成果,促进汉字识别技术

发展。

3、实现数据自动录入的几种技术手段

信息时代的到来,将会很大程度的改变人们的生活方式与工作方式。信息也变成了当今

社会的热门话题。信息的来源及所表达的含义也是各种各样的,尤其是近几年因特网的迅猛

发展,为信息的传递提供了绝好的工具。政府、企业对计算机的依赖程度越来越激烈,以计

算机为核心工具的办公及业务处理的时代已经到来。

只有信息被电子化之后,它才能得到快速地处理与传递。所谓信息电子化,其实是以计

算机能够处理的数字的形式来表达信息。那么大量的信息如何录入到计算机里呢?总结起来,

应该有以下几种方式:人工键盘录入、数据自动采集设备、数字化处理设备、智能录入系统

等。自动录入设备方面主要有传感器,A/D设备,扫描仪,数字相机,图像处理卡等,它们

主要应用在一些特殊的场合。智能录入系统有OCR系统及语音识别录入系统,这些系统经过

几十年的研究与发展,在很多场合完全能够达到实用的程度,比传统的手工录入方式的速度

提高几十倍或上百倍。

像税务、银行、工商、海关、教育等部门都有大量的报表数据需要录入到计算机中,这

不是一个简单问题,而是一个影响整个计算机应用系统的瓶颈。传统的做法是聘用大量的录

入人员,这种做法不但成本高,而且录入的数据错误比较多,为了避免录入错误,通常的做

法是多个人分别录入,由软件来比较去发现可能出现的错误。另外,还有OCR录入方式、IC

卡方式、远程数据交换方式等。现以税务行业的纳税申报表的录入为例,说明它们的优缺点。

IC卡方式其实就是人工键盘录入方式,只不过是把大量需要集中录入的数据,分散到由纳税

人各自完成录入工作,存储到IC卡(或软盘)中,报税时将此卡里的数据拷贝到税务部门的

服务器里。每个纳税人需要购买一个报税器的IC卡读写器,这种方式唯一的特点是通过增加

纳税人的负担,而减轻了税务部门的负担。远程数据交换方式其实就是EDI(ElectronicData

Lnterchange)的一个具体应用,从数据录入技术的发展来看,未来的模式应该是EDI,尤其

是近几年,网络技术的发展很迅速,未来若干年后,计算机网络应该像现在的电话网络,计

算机的普及程度会像现在的电话一样,那时EDI就变得现实了,但是,这一时刻何时能到来

呢?现在已经有一些用户在考虑EDI的应用,通过已经应用的单位的结果看,太超前了,不

是技术不行,而是整个社会计算机应用的层次没有达到。从数据录入方式来看,OCR技术是

一种比较直观的,原业务方式不需要做多大变革的,现阶段较为现实的替代手工录入的一种

方式。目前,OCR的技术较为成熟,识别率较高,而且还有专用的OCR录入设备,在软件支持

上,通过逻辑运算,算数运算等多种后处理手段,使数据在高速路入的同时,保证了准确性。

三、OCR技术的应用

OCR技术,在现实生活中有着广泛的应用价值。通过它可完成高速的文字录入任务,在

很多场合可替代键盘录入。文件的识别录入是很多办公部门经常使用的工具,国内已有很多

这样的产品,而且已经实用;邮件的自动分拣系统更能快速地解决大量信函的分拣问题,国

外已普遍使用,国内也有很多大型邮局在使用;在线手写电子记事本等也在人们的生活中发

挥重要的作用;手写体表格数据自动录入系统,则可应用在具有大量人工填表的行业,如税

务申报表、海关申报表、财务发票、财务报表、社会调查表等的录入。这类系统在发达国家

已经发挥着作用,在我国,随着计算机在各部门的应用,这方面的需求已经开始。目前国内

市场能见到的中文OCR产品有近10种,但真正进入市场,并占有一定份额的产品主要有以下

几种:清华文通公司的TH-OCR系列、北京北信工程学院的BI-OCR系列、中自智能公司的ICR

系列、沈阳自动化所的SY-OCR系列、北京曙光公司的NI-OCR系列,可根据需要选择应用。

汉字是一种图形符号,且数量大,一、二级常用汉字就有几千个,随着信息交流速度的

加快,汉字输入的瓶颈问题日益严重,因此,汉字OCR技术有着广泛的发展前途及使用价值。

1、手写体汉字单字识别方面

手写体汉字单字识别技术主要解决汉字的手工输入问题。到目前为止,汉字的手工输入

方法种类繁多,但无论是声码还是形码输入,都必须进行必要的汉字拼法(结构码)的记忆,

记忆量多少不一,必须进行必要的学习,且容易遗忘。一旦手写体汉字识别技术进入实用化,

汉字的输入将变得易如反掌,因为,再不需要为输入汉字进行任何的前期培训和必要的记忆,

汉字的输入同平时手写一样,任何人都随时都能完成。汉字手写体识别技术的发展,必将产

生巨大的社会效益和经济效益。

2、汉字文稿识别方面

汉字文稿的识别是将已有的文稿(手写、印刷稿)通过汉字OCR系统转换成计算机进行

编辑的文本文件。文稿识别的意义在于:

(1)提高信息的存储效率,延长信息的存储时间。如在档案室、图书馆,可以将汉字

书稿通过OCR系统转换成文本文件,储存在光盘中(一张光盘可以存储上千万册图书),从

而节省空间,减少维护费用。

(2)彻底解决书稿的文字输入瓶颈问题。对于规范的手写文稿,通过汉字OCR系统,可

以直接输入计算机进行编辑排版,从而缩短出版周期。使用汉字OCR系统可以改变传统的资

料收集方法。如在计算机自动检索的图书馆,书的简介输入是一项庞大、繁琐的工作,现在

利用汉字OCR系统,可以在短时间内完成这项工作。

(3)提高书稿检索、使用效率。随着INTERNET的发展,可以通过汉字OCR系统将大量的

书稿转换成文本文件,为需要的人提供服务。

四、结语

为进一步提高事务处理能力,社会上对实现办公自动化给予极大的关注。办公事务要处

理各种文书,国内外对OCR技术的利用正在普及,国内较多的用来制作文书材料,现时的输

人手段主要靠键盘输人,长时间操作键盘和观看屏幕,操作者视力和体力负担都比较重。为

减轻操作者的劳动,方便快速地制作文书材料,手写汉字作为将来有效的自动输人手段,社

会呼声也很高,但是要实现处理效率高的手写汉字,仍需解决手写文字识别上的许多技术问

题。

参考文献:

[1]邱伟峰:手写体汉字的计算机自动识别,上海计算机技术研究所,1989年1月。

[2]王林泉:关于手写汉字识别的研究,计算机研究与发展,1987年2月。

[3]张烯中:汉字识别技术,北京清华大学出版社,1992年9月。

[4]朱学芳:计算机图像处理导论,北京科学技术文献出版社,2003年6月。

[5]边肇棋,张学工:模式识别,北京清华大学出版社,1993年6月。

[6]周长乐:手写汉字的机器识别,北京科学出版社,1997年。

[7]沈庭芝,方子文:数字图像处理及模式识别,北京理工大学出版社,1998年8月。

[8]夏莹:交互式自学习脱机手写文字识别系统,中国计算机学会中文信息技术专业委

员会第二届学术年会论文集,1990年10月。

[9]孙承鉴:联机手写汉字识别与智能笔划编码输入相结合的实用系统,第三届全国汉字

及汉语语音识别学术会议,1989年9月。

[10]孙承鉴,夏莹等:手写汉字输入在办公自动化系统中的应用,计算技术与自动化,

1986年第4期。

学号:2009010216

哈尔滨师范大学

学年论文

题目手写文字识别技术的研究

学生关兵

指导教师陈彦军

年级2009级

专业信息与计算科学

系别信息科学系

学院数学科学学院

20011年12月

更多推荐

千彩手写识别系统