首页 百科知识 自动识别技术发展的历史进程

自动识别技术发展的历史进程

时间:2022-10-24 百科知识 版权反馈
【摘要】:自动识别技术体系的建立与发展经历了漫长的历史进程。从早期的条码自动识别技术,到现在受到广泛关注的射频识别技术、生物特征识别技术、图像识别技术等,都无不体现了时代的进步与社会需求的变革。此后,条码的应用及相关产品相继出现。Norand公司的第一台便携式扫描装置Norand101的问世预示着便携式扫描装置在零售业应用的发展,并开拓了自动识别技术的一个崭新领域。

1.2.1 自动识别技术发展的历史进程

自动识别技术体系的建立与发展经历了漫长的历史进程。从早期的条码自动识别技术,到现在受到广泛关注的射频识别技术(radio frequency identification,RFID)、生物特征识别技术、图像识别技术等,都无不体现了时代的进步与社会需求的变革。

1.条码自动识别技术发展的历史进程

条码技术最早产生于20世纪20年代,诞生于威斯丁豪斯(Westinghouse)的实验室里。一位名叫John Kermode的发明家想对邮政单据实现自动分拣,他的想法是在信封上做条码标记,条码中的信息是收信人的地址,就像今天的邮政编码。然后,他又发明了由基本的元件组成的条码识读设备:一个扫描器(能够发射光并接收反射光),一个测定反射信号“条”和“空”的方法,即边缘定位线圈,以及使用测定结果的方法,即译码器。

此后不久,Kermode的合作者Douglas Young在Kermode码的基础上做了一些改进,新的条码符号可在同样大小的空间对一百个不同的地区进行编码,而Kermode码只能对十个不同的地区进行编码。

直到1949年的专利文献中才第一次有了Joe Woodland和Beny Silver发明的全方位条码符号的记载,在这之前的专利文献中始终没有条码技术的记录,也没有投入实际应用的先例。Joe Woodland和Beny Silver的想法是利用Kermode和Young的垂直的“条”和“空”,并使之弯曲成环状,非常像射箭的靶子。这样,扫描器通过扫描图形的中心能够对条码符号解码。此后,条码的应用及相关产品相继出现。

1967年,位于美国俄亥俄州辛辛那提市的Kroger超市安装了第一套条码扫描零售系统。1968年,第一家生产条码相关设备的公司——美国的Computer-Identics公司由David Collins创建。1969年,第一台固定式氦-氖激光扫描器由该公司研制成功。

但是条码的实际应用和发展还是在20世纪70年代。1970年,美国超级市场AdHoc委员会制定了通用商品代码UPC条码(universal product code),UPC商品条码首先在杂货零售业中试用,这为以后该码制的统一和广泛采用奠定了基础。

1971年,AIM(国际自动识别技术制造商协会)成立,当时有4家成员公司:Computer-Identics、Identicon、3M(minnesota mining and manufacturing company,明尼苏达矿业及制造公司,成立于1902年,总部位于美国明尼苏达州首府圣保罗市)以及Mekoontrol。

1972年,又研发出多种条码码制。

1)Plessey码制

第一个欧洲码制Plessey由英国Plessey公司推出。该码制及系统最初是为国防部的文件处理系统而设计的,后在图书管理中得到应用。

2)交插二五条码

交插二五条码由美国易腾迈(Intermec)公司的David Allais博士发明,提供给Computer-Identics公司使用,该条码可在较小的空间内容纳更多的信息。

3)库德巴条码(Codabar)

库德巴条码(Codabar)由美国的莫那奇·马金(Monarch Marking)等人研制成功,该码制是第一个利用计算机校验准确性的码制。库德巴条码研制成功后,开始广泛应用于医疗卫生和图书管理以及邮政快递,美国输血协会还将其作为血袋标识码。

在本年度,还生产了一些条码的便携式扫描设备,它为实现“从货架上直接写出订单”提供了便利,大大减少了制定订货计划的时间。如美国Control Module公司的Jim Bianco研制出PCP便携式条码阅读器,这是首次在便携机上使用微处理器(Intel 4004)和数字盒式存储器,此存储器提供500K存储空间,为当时之最。Norand公司的第一台便携式扫描装置Norand101的问世预示着便携式扫描装置在零售业应用的发展,并开拓了自动识别技术的一个崭新领域。

此外,NCR公司(总部设在美国俄亥俄州戴顿市)还推出了用于零售POS系统的彩色条码。

随着条码技术的发展,1973年,美国统一代码委员会UCC(uniformcode council)建立了通用商品条码UPC(universal product code)应用系统。在美国奥克马州的Marsh超级市场安装了第一台UPC条码识读扫描器,开始了条码在零售业大规模的应用。

1974年,第一种字符条码码制三九码由易腾迈(Intermec)公司的David Allais博士和Ray Sterens研制成功。

1976年,UPC商品条码应用系统在美国和加拿大的超级市场上获得成功的应用,引起了欧洲各国对条码技术的关注。1977年,欧洲建立了自己的欧洲物品编码系统(European article numbering system,简称EAN系统),并正式成立了欧洲物品编码协会(European article numbering association,简称EAN)。

条码在商业领域的应用对条码的质量提出了更高的要求,使得条码的检测和标准化成为当务之急。1978年,第一台注册专利的条码检测仪Lasercheck 2701由美国的讯宝(Symbol)公司推出。

20世纪70年代,日本也开始了对条码识别技术的关注,于1978年加入国际物品编码协会,开始了厂家登记注册,并全面转入条码技术及其系列产品的开发工作,并在80年代有所突破。1980年,日本的佐藤株式会社(Sato公司)推出第一台热转印打印机5323型,该打印机最初是为零售业打印UPC条码设计的。

20世纪80年代,欧美也生产了一些有影响力的条码产品,二维条码出现,多种条码开始应用并得到标准化。1981年,128条码由Computer Identics公司推出。1982年,讯宝(Symbol)公司推出LS7000,这是首台成功的商用手持式、移动光束激光扫描器,标志着便携式激光条码扫描器应用的开始。1983年,ANSI MH10.8M成为第一个美国国家技术标准,它包括三种码制:39码、库德巴码、交插二五码。汽车工业行动小组(AIAG)选用39码作为行业标准,这是第一个制造行业使用条码。1984年,美国医疗保健业条码委员会采用39码作为其行业标准。1985年,美国BISAC图书行业系统顾问委员会采用书刊EAN条码。1987年,第一个二维条码49码由David Allais博士研制成功,易腾迈(Intermec)公司推出。1988年,美国Laserlight系统公司的Ted William先生推出第二种二维条码16K码。

在整个80年代,随着条码技术的发展和各种应用的扩展,相应的物品编码组织也发生了很大的变化。1981年,欧洲物品编码协会(EAN)已经发展成为一个国际性组织,改名为国际物品编码协会(international article numbering association,简称EAN International)。1988年底,我国成立中国物品编码中心。

进入90年代后,一维条码继续发挥其优势,二维条码得到了较快的发展。1990年,美国国家标准ANSI X 3.182“条码印制质量”颁布。同年,讯宝(Symbol)公司推出PDF 417二维条码。1994年,日本Denso公司发明QR码(quick response code)。

进入21世纪,条码技术已经成熟。国际上的编码组织又发生了新的变化,趋于整合。继2002年11月美国统一代码委员会(UCC)和加拿大电子商务委员会(ECCC)加入国际物品编码协会后,在2005年2月,EAN International正式向全球发布了更名信息,将组织名称正式变更为GS1。

2.射频识别技术发展的历史进程

曾工作于美国洛斯阿拉莫斯国家实验室的Jeremy Landt博士是RFID技术最初的五位研究人员之一。他在《光阴荏苒——RFID技术的历史》(Shrouds of Time—The History of RFID)一文中写道:“在历史的进程中,有些事情会随着时间的推移被人们遗忘。对后来者来说,追根溯源将是一项艰巨而富有挑战性的任务。但是,只有了解过去才能展望未来,最终它将会带给我们应有的回报。不管我们是否意识到,RFID已经成为我们生活中的重要组成部分。它在效率和方便性等方面的优势使得其在成百上千的地方都有应用,如汽车防盗系统、不停车收费管理、交通管理、门禁系统、停车场自动化、机动车通道控制系统、机场或者校园的一体化管理、物流配送、滑雪场管理、图书管理、供应链管理资产追溯与跟踪,甚至买个汉堡包都离不开它。”

RFID技术可称为无线通讯技术的一种。追溯无线通讯技术,我们可以看到一系列的重要事件:从公元前一世纪中国人发明的指南针,到18世纪的发明家本杰明·富兰克林,再到19世纪的迈克尔·法拉第詹姆斯·麦克斯维尔、海因里希鲁道夫·赫兹、亚历山大·波波夫、古列尔莫·马克尼等先驱,人们对未知领域不断的探索使电磁技术和无线电技术产生了前所未有的跨越。1906年,第一台连续波信号发生器和无线信号接收器的诞生标志着近代无线通讯时代的诞生。20世纪初,大约于1922年,雷达诞生了。

RFID技术很早就和军事联系在一起。在20世纪30年代第二次世界大战期间,英国空军受到雷达工作原理的启发,开发了敌我飞机识别(identification friend or foe,IFF)系统,希望被物体反射回来的雷达无线电波信号中能够包含敌我识别的信息,从而避免误伤,当时的应用仅仅是一种加密的ID号而已。

1948年10月,哈里·斯托克曼发表的《利用能量反射进行通讯》一文奠定了射频识别技术的理论基础。实现哈里·斯托克曼的梦想走了30年,相关的技术如晶体管、集成电路、微处理器、通讯网络在这期间相继取得突破。20世纪50年代,F.L.弗农提出“微波零差应用”的设想,D.B.哈里斯也申请了“带可调制无源应答器的无线传输系统”的发明专利;1963~1964年,R.F.Harrington在他的《主动散射体的场测量方法》和《加载散射体理论》等论文中研究了RFID相关的电磁理论;Robert Richardson于1963年发明“遥控启动射频装置”;J.P.Vinding于1967年发明“询问器-应答器识别系统”;J.H.Vogelman于1968年发明“利用雷达波束的被动数据传输技术”;Otto Rittenback于1969年发明“雷达波束通信”,RFID技术发展的车轮开始转动。

最初的商业行为也在20世纪60年代开始出现。如60年代末期成立的Sensormatic和Checkpoint公司,它们与Knogo等公司开发了电子防盗器(EAS)来对付商场里的窃贼。这类系统使用存储量只有1比特的标签来表示商品是否已售出,既可以使用基于超高频和微波的电磁反射系统,也可以使用基于高频的电磁感应系统,价格便宜,又可以有效地遏制偷窃行为,被认为是RFID技术首个世界范围的商用模式。

进入20世纪70年代,RFID技术继续吸引人们的广泛关注,射频识别技术与产品研发在此阶段处于一个大发展时期,各种射频识别技术测试得到加速发展。在工业自动化和动物识别方面出现了一些最早的射频识别商业应用。制造、运输、仓储等行业都试图研究和开发基于IC的RFID系统的应用,如工业自动化、动物识别、车辆跟踪等。

例如,Raytheon公司(美国国防公司)于1973年推出了“RayTag”,RCA公司(美国老牌电器公司)的Richard Klensch于1975年开发了“电子识别系统”,F.Sterzer于1977年开发了“汽车电子车牌”,Fairchild公司(美国精密仪器商)的Thomas Meyers和Ashley Leigh于1978年开发了“被动编码的微波发射机”等。纽约-新泽西港还对通用电子、西屋电器、飞利浦和Glenayre等公司建立的系统进行了测试,结果令人满意。在欧洲,由于动物标记受到重视,瑞典的Alfa Laval公司、荷兰的Nedap公司等都开发了各自的RFID系统。国际桥梁隧道和收费公路协会(IBTTA)以及美国联邦高速公路管理局于1973年资助的一次会议,结束了没有政府部门关注电子车牌识别标准的历史。

在此期间,基于IC的标签体现出了可读写存储器、更快的速度、更远的距离等优点。但这些早期的系统仍然是专有的设计,没有相关的标准,也没有功率和频率的管理。

RFID技术在20世纪80年代开始较大规模的应用,射频识别技术及产品进入商业应用阶段,在不同地域和不同应用方向上焕发生机。美国人关注的主要在于交通管理、人员控制,对动物管理的需求次之;而欧洲人则主要关注动物识别以及工商业的应用。挪威于1987年建成了全球第一个商业化公路电子收费系统,在意大利、法国、西班牙和葡萄牙等国的高速公路上,也相继安装了该系统。美国铁路协会和集装箱管理合作计划委员会积极推动RFID技术的应用。RFID电子收费系统的测试持续了数年,继挪威之后于1989年在达拉斯北部的公路投入使用。同时,纽约-新泽西港也开始在经过林肯隧道的公共汽车上运行RFID系统。RFID技术终于通过电子收费系统找到实用化的立足点,并不断扩大其应用领域。

20世纪90年代,射频识别技术的标准化问题日趋得到重视,射频识别产品得到广泛的采用,并逐渐成为人们生活中的一部分。在这个时期,多个区域和公司开始注意这些系统之间的互操作性,即运行频率和通信协议的标准化问题。只有标准化,RFID技术才能得到更广泛的应用。比如,这时期美国出现的E-ZPass系统。

同时,作为访问控制和物理安全的手段,RFID卡钥匙开始流行起来,并试图取代传统的访问控制机制。这种称为非接触式的IC智能卡具有较强的数据存储和处理能力,能够针对持有人进行个性化处理,也能够更灵活地实现访问控制策略。沃尔玛(Wal-Mart)、美国国防部等开始推行RFID计划,美国铁路运输开始应用RFID技术。一些公司也开始进行RFID产品的研发。1991年,美国TI(texas instruments)开始成为RFID方面的推动先锋,建立了德州仪器注册和识别系统(texas instruments registration and identification systems,TIRIS),目前被称为TI-RFid系统(texas instruments radio frequency identification system),已经是一个主要的RFID应用开发平台。

1991年,世界上第一个开放的高速公路电子收费系统在美国俄克拉荷马州建立。在这条公路上,汽车可以高速地通过收费点,而不需要设置升降栏杆阻挡以及照相机拍摄车牌。世界上最早的集成交通管理和收费系统也于1992年在休斯顿地区投入使用。堪萨斯州收费公路首次安装了符合21号标准(Title 21 standard,美国加州交通部门制定的电子收费规范)的读写器,使其能够识别与南部相邻的俄克拉荷马州车辆的电子标签信息。乔治亚州也迅速跟进,并使用升级之后的读写器,不仅能够读取新的Title 21标签,还可以兼容以前使用的标签。可以说,这两个电子收费系统的应用开创了多协议兼容的先河。德国汉莎航空公司试用非接触的射频卡作为飞机票,改变了传统的机票购销方式,简化了机场安检的手续。

欧洲的许多公司,如Microdesign、CGA、Alcatel、Bosch以及飞利浦的子公司Combitech、Baume和Tagmaster等也加入到RFID的竞赛当中。这些公司还在欧洲标准化委员会(CEN)的组织下制定了统一的欧洲电子收费标准。

亚洲也不甘落后,多个国家纷纷采用电子收费系统。1996年,韩国在汉城(现更名为首尔)的600辆公共汽车上安装了RFID系统,还计划将这套系统推广到铁路和其他城市。在中国,佛山市政府安装了RFID系统用于自动收取路桥费,以提高车辆通过率,缓解公路瓶颈;上海市也安装了基于RFID的养路费自动收费系统;广州市将RFID系统应用于开放的高速公路上,对正在高速行驶的车辆进行自动收费。

值得一提的是,20世纪90年代中期,中国铁道部建设的铁路车号自动识别系统(ATIS),确定RFID技术为解决“货车自动抄车号”的最佳方案。ATIS系统的目标是在所有机车、货车上安装电子标签,在所有区段站、编组站、大型货运站和分界站安置地面识别设备(AEI),对运行的列车及车辆信息进行准确的识别。经计算机处理后,为TMIS(铁路管理信息系统)等系统提供列车、车辆、集装箱实时追踪管理所需的准确的、实时的基础信息。此外,还可以为分界站货车的精确统计提供保证,为红外轴温探测系统提供车次、车号的准确信息,实现部、局、车站各级车的实时管理、车流的精确统计和实时调整等功能。在此基础上建立的铁路列车车次、机车和货车号码、标识、属性和位置等信息的计算机自动报告采集系统,实现了铁路车辆管理系统统计的实时化、自动化,成为RFID技术最典型的应用之一。

1999年,美国麻省理工学院Auto-ID中心正式提出了产品电子代码EPC(electronic product code)的概念,EPC与RFID技术相结合,构筑无所不在的“物联网”,引起了全球的广泛关注。

进入21世纪,全球几家大型零售商Wal·Mart、Metro、Tesco以及一些政府机构如美国国防部(DoD)等,相继宣布了各自的RFID计划。如在2003年,沃尔玛要求其前100家最大的供应商于2005年1月在向其位于美国得克萨斯州的三大物流配送中心运送产品时,产品的包装盒和货盘上必须贴有RFID标签。到2006年,已有200余家供应商在为沃尔玛供货的托盘上采用了电子标签。

同时,标准化的纷争出现了多个全球性的RFID标准和技术联盟,主要有EPCglobal、AIM global、ISO/IEC、UID、IP-X等。这些组织主要在标签技术、频率、数据标准、传输和接口协议、网络运营和管理、行业应用等方面试图达成全球统一的平台。

从此,RFID技术开拓了一个新的巨大的市场。随着成本的不断降低和标准的统一,RFID技术还将在无线传感网络、实时定位、安全防伪、个人健康、产品全生命周期管理等领域开拓新的市场。

3.生物特征识别技术发展的历史进程

生物特征识别技术可追溯到几千年前,当时,尼罗河流域的人们就在日常交易中利用生物特征(如疤痕、肤色、眼睛的颜色、身高等)进行鉴定。生物特征识别一直为研究人员所关注,在1686年,意大利Bologna大学的学者Marcello Malpighi用显微镜发现了指纹的涡型,推进了对生物特征的认识。

到了19世纪,研究犯罪学的学者对生物特征识别产生了浓厚的兴趣,他们希望能将身体特征与犯罪倾向结合起来,由此产生了一系列测量设备,并收集了大量数据。1880年,科学家发现每个人的指纹都独一无二,并意识到指纹可作为身份识别的可行性。从此,测量个人身体特征的概念就确定下来,指纹也成为安全部门进行身份确认的国际通用方法。

20世纪,世界上的指纹技术在司法方面得到了广泛应用。60年代,一些公司开发出能自动识别指纹的仪器,以用于法律的实施。在60代末期,美国联邦调查局FBI(federal bureau of investigation)开始使用自动识别指纹的设备。70年代中期,现代生物识别技术开始形成并兴起,但由于早期的识别设备比较昂贵,因而仅限于安全级别要求较高的原子能实验、生产基地等的应用。70年代末期,已经有一定数量的自动识别指纹的设备开始在美国大范围使用。80年代,生物特征识别技术发展了虹膜识别、掌纹识别、面部识别等利用除指纹之外的生物特征进行身份鉴定。第一个介绍测定视网膜的系统出现于此阶段。同时,剑桥大学的Joho Daughman教授已开始了虹膜识别技术的研究,同时对签字与面部识别技术的研究也已启动。一些公司开始从事生物特征识别。1986年,从事掌纹识别的Recognition System Inc.成立。1987年,Drs.Flom和Safir研究发现:没有两个人的虹膜是相似的,这一理论获得了专利,为生物特征识别的快速发展作出了贡献。

进入20世纪90年代,更多从事生物特征识别的公司相继成立,为生物特征识别技术的发展及应用打下了基础。1990年,从事签字识别的PenOp Inc.在英国成立,从事指纹识别的Technologies Inc.成立。1994年,由于能用计算机辨识复杂模式的算法的发展,Drs.Atick和Griffin成立了从事面部识别的Visionics Corp.,Dr.Daugman获得第二项基础科技的专利权——IriScan的许可证。1996年,从事签字识别的Cyber Sign在美国加州成立,从事指纹识别的Biometric Identification Inc.成立。1999年,Biometrics宣布参与FBI的自动指纹识别系统(AFIS)项目,其活体指纹采集系统已用于FBI总部。

生物特征识别技术在21世纪受到了格外的重视,被广泛用于反恐、刑侦、信息安全、金融安全等多方面。2000年,美国国防高级研究项目署(DARPA)资助HID(human identification at a distance)计划,它的任务就是开发多模式的、大范围的视觉监控技术,以实现远距离情况下人的检测、分类和识别,从而增强国防、民用等场合免受恐怖袭击的自动保护能力。2001年,美国在“9·11”事件后连续签发了爱国者法案、边境签证法案、航空安全法案,都要求必须采用生物识别技术作为法律实施保证,要求将指纹、虹膜等生物特征加入护照中。2003年,世界民用航空组织向其188个成员国公布了生物识别技术的应用规划,提出在个人护照中加入生物特征,并在进入各个国家的边境时进行个人身份的确认。此规划已获得美国、欧盟、澳大利亚、日本、韩国、南非等国的通过。

不久的将来,在各国政府的重视与推动下,生物特征识别技术将越来越深入到人们的日常生活中。以身份证、护照为基础的生物特征识别技术的应用将在社会生活的各个方面逐步开始大规模的应用。

4.语音识别技术发展的历史进程

语音识别的研究已有50多年的历史。半个世纪来,从最初的特定人、孤立词识别发展到非特定人的连续语音识别,从朗读式连续语音的识别发展到如今的自然口语的识别。

最早的语音识别尝试始于20世纪50年代。1952年,美国Bell实验室的Davis、Biddulph和Balashek等人建立了第一个特定人的孤立数字识别系统,这个系统通过测量每个数字元音区域的共振峰来进行孤立数字识别。1956年,RCA实验室的Olson和Belar基于谱测量构造了单音节词识别系统,能识别10个独立的音节。1959年,美国麻省理工学院Lincoln实验室的J.W.Forgie and C.D.Forgie构造了与话者无关的元音识别器,识别了10个英文元音,其中使用了滤波器组的频谱分析技术。

到了60年代,语音识别的几个基本思想相继出现并公开发表。瑞典人Fant在他的博士论文《The Acoustic Theory of Speech Production》中研究了语音产生的声学机理和模型。人们还对人类听觉的生理和心理进行了研究,发现了人耳对声音中的不同的频率成分有着不同的分辨力的反应力,并提出了临界频带理论。60年代末,基于对语音的可靠的端点检测,美国普林斯顿大学RCA实验室的Martin等人提出了一系列基本的时间归一化方法,解决语音问题中的时间尺度的非均匀问题。与此同时,前苏联科学家Vintsyuk在1968年将动态规划方法应用于语音的校准,其中包含了DTW(dynamic time warping)算法的本质概念。在这期间,日本的一些研究所和大公司首先开展了语音识别的硬件实现的研究,并开发出了元音识别器、音子识别器、数字识别器等。60年代末,引人注目的成就还有Reddy在连续语音识别领域用动态音素追踪所做的研究,Reddy的研究最终催生了Carnegie-Mellon大学的语音识别研究项目。60年代多方面的基础性研究为以后20多年语音识别的迅速发展打下了基础。

70年代,语音识别的研究取得了几项里程碑式的成就,无论在理论上还是在系统实现上,都有了迅速的发展。由Itakura在1975年提出的基于线性预测编码(linear predictive coding,LPC)的谱系数不仅成功地用于低速率语音编码,而且也成为语音识别中最有效的特征参数之一。同时,日本学者Sakoe和Chiba在1978年提出了动态时间规整(DTW)算法,在孤立词语音识别中得到了广泛应用。这个期间的主流识别技术是模板匹配方法,一般把孤立字(词)视作一个整体来建立模板。70年代研究的重点集中在孤立词语音识别方面,出现了许多成功的孤立词识别系统,如CMU的Hearsay-II、IBM的大词汇量自动语音听写系统、Bell Labs的与话者无关的语音识别系统。

进入80年代以后,语音识别从基于模板的方法转向基于统计的方法。80年代中期,在几家大的实验室(主要是IBM、IDA、Dragon System)的已有的应用和广泛的出版介绍下,隐马尔可夫模型(hidden markov models,HMMs)成为研究的主流,非特定人大词汇表的连续语音识别成为可能。美国国防部于70年代开始推行的DARPA(defense advanced research projects agency)计划在这期间也对语音识别研究给予了很大的支持,很多目前非常成功的语音识别系统都是在这个计划下发展起来的。矢量量化(vector quantization,VQ)和隐马尔可夫模型的应用产生了像CMU的SPHINX这样成功的非特定人连续语音识别系统,这是世界上第一个非特定人大词汇表连续语音识别系统。

从90年代开始,随着信号处理、声学模型、语言模型、解码搜索算法等理论的日益成熟,计算机软硬件系统性能的不断提高,语音识别进入了一个快速发展的时期,非特定人大词汇表的连续语音识别系统进一步成熟,在实验室环境下可以获得很高的识别性能,并出现了一些大词汇量连续语音识别系统,如IBM的ViaVoice、CMU的SPHINX-Ⅱ、Microsoft的Whisper等。这些系统采用了大体相似的技术,即采用基于隐马尔可夫模型的声学模型、基于统计的语言模型以及动态规划的解码算法,对于朗读式的大词汇量非特定人连续语音识别的识别率通常可以达到90%~95%。

这一时期,中小词汇量的语音识别技术已经比较成熟,可以在一般的环境下得到应用,其性能可以被接受,但还面临着噪声环境下稳健语音识别的问题。时至今日,大词汇量的连续语音识别技术对应用来讲还不能够达到人们使用的要求。

在经过90年代末的快速发展之后,近几年来没有新的很大的突破,目前的发展又进入一个新的平台期,主要是面临着来自实际应用方面的重大挑战,学科研究方向目前也处于一个重要的调整时期。就目前总的研究趋势来看,研究方向越来越侧重于口语对话系统,比较活跃的研究领域有鲁棒语音识别、话者自适应技术、大词汇量关键词识别算法、语音识别的置信度估计、基于类的语言模型和自适应语言模型等。

我国汉语语音识别技术的研究也一直在紧跟国际语音识别技术研究的步伐稳步发展,其研究历程可分为以下三个阶段。

20世纪70年代至80年代的引进、移植阶段。这一时期,我国汉语语音识别技术的研究起步不久,因此以吸收和引进国外理论和技术为主,通过对汉语语音识别的实验研究和方法改进,成功地进行了以孤立字小字表、特定人、实验室环境条件为主的汉语语音识别研究,为汉语语音识别技术的研究和发展奠定了基础。

90年代初、中期的自成体系阶段。该时期在基础理论研究和实现技术上有较大的进展,逐渐走出一条适合汉语特点的研究路子,将汉语语音识别技术的研究拓展到连续语音、中大字表、非特定人语音识别及说话人识别等领域,并逐渐形成自己的研究体系,缩小了与国际研究水平的差距。

90年代后期以来的成熟阶段。该阶段,汉语语音识别技术在细化模型的设计、参数提取和优化以及系统的适应能力上取得了一些关键性的突破,汉语语音识别技术进一步成熟,并开始向市场提供应用产品。目前,中国科学院、清华大学、北京大学、沃克斯技术院等研究机构和公司都在大力发展语音识别技术。

5.图像识别技术发展的历史进程

早在20世纪20年代,人们就利用巴特兰(Bartlane)电缆图片传输系统,经过大西洋传送了第一幅数字图像,它使传输时间从一个多星期减少到了3h,使人们感受到数字图像传输的威力。

图像识别技术始创于20世纪50年代后期,经过近半个世纪的发展,已经成为科研和生产中不可或缺的重要部分。

在20世纪60年代,图像识别技术在航空领域得到了应用。1964年,美国喷射推进实验室(JPL)进行了太空探测工作,当时用计算机来处理测距器7号发回的月球图片,以矫正飞船上电视摄像机中各种不同形式的固有的图像畸变,这些技术都是图像增强和复原的基础。同时,他们成功地用计算机绘制出月球表面的地图。1965年,美国喷射推进实验室(JPL)对徘徊者8号发回的几万张照片进行了较为复杂的数字图像处理,使图像质量进一步提高。

自70年代末以来,由于数字技术和微机技术的迅猛发展给数字图像处理提供了先进的技术手段,因此,“图像科学”也就从信息处理、自动控制系统理论、计算机科学、数据通信、电视技术等学科中脱颖而出,成长为旨在研究图像信息的获取、传输、存储、变换、显示、理解与综合利用的一门新学科。

图像识别技术是一门跨学科的前沿高科技,从20世纪80年代中期到20世纪90年代取得了突飞猛进的发展。

通过近20多年的发展,图像处理与识别技术的发展更为深入、广泛和迅速。现在人们已充分认识到数字图像处理和识别技术是认识世界、改造世界的重要手段。目前,图像处理和识别技术已应用于多个领域,成为影响国民经济、国家防务和世界经济的举足轻重的产业。

6.光字符识别技术发展的历史进程

1929年,德国的一位科学家率先提出了OCR的概念。20世纪50年代初,OCR技术已经进入了商业化应用阶段。到了1975年,全国零售商协会在识别商品标识、信用卡授权和库存控制等领域采用了OCR技术。在过去的几年中,由于相对低成本、高速度的计算机的出现,OCR技术有了可观的改进。近几年又出现了图像字符识别(image character recognition,ICR)和智能字符识别(intelligent character recognition,ICR)。实际上,这三种字符自动识别技术的基本原理大致相同。

我国在OCR技术方面的研究工作起步较晚,在70年代才开始对数字、英文字母及符号的识别进行研究,70年代末开始进行汉字识别的研究,到1986年,汉字识别的研究进入一个实质性的阶段,取得了较大的成果,不少研究单位相继推出了中文OCR产品。从80年代开始,OCR的研究开发就一直受到国家“863”计划的资助,我国在信息技术领域付出的努力已经有了初步的回报。目前,我们正在实现将OCR软件针对表格形式的特征设计大量的优化功能,使得识别精度更高、识别速度更快,并且为适应不同环境的使用提供了多种识别方式选项,支持单机和网络操作,极大地方便了使用,使应用范围更加广泛,能达到各种不同用户的应用要求。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈