(1)词汇选择和工作流程
在设计语音识别系统时,应该考虑所有可能的使用场景,设计一套在大部分工作环境中都能够正确使用的词汇指令,这是所有语音识别系统成功的关键。另外,简单的单音节词容易与其他单音节词或者其他声音等相混淆,从而造成错误识别,因此采用较长的短语发音,能够提高识别率,降低其他因素的干扰。
(2)合成语音提示
在语音识别产品中适当使用合成语音提示,能帮助提高用户的操作水平。这一方面使产品更加亲切自然,另一方面能够减少错误识别,提高系统可信度。
(3)语音识别特性选择
对于非特定人的语音识别系统,可以采用自适应技术对识别模型进行调整,提高识别性能。这样能够适应说话人的发声变化,从而提高语音识别精度。
(4)信号能量
如果麦克风从说话人嘴边15cm移到30cm处,语音的信号能量将减少3/4。高声说话和柔声说话之间,信号能量的差异能够相差1/4。因此,输入信号的饱和程度和大小,都会影响信号的能量,从而影响语音识别精度。
(5)噪音环境
正如人们在嘈杂环境下很难听清别人说话一样,语音识别系统也很难在有噪音的环境下正确进行语音识别。
(6)麦克风的选择
对于大多数情况,使用廉价的全向驻极体电容器麦克风就可以了,但在存在噪音和其他干扰的环境中,最好使用定向麦克风,从而降低干扰,提高识别精度。
3.语音识别系统的应用
系统通过语音识别技术进行用户身份识别,由于基于每个人的声音特征都是唯一而且几乎很少会发生变化的特性,因而可以提高交易的可靠性和安全性,降低交易系统费用和欺诈的可能性。语音识别技术广泛应用在如下的领域中:呼叫中心系统信息的查询、电话交易、保安系统以及证件防伪等。
语音识别在电话业务中一个有趣的应用,就是用语音指令的方式实现话务分配。语音识别在这个领域的应用非常成功。当来一个电话呼叫时,服务员或话务员要作出应答,然后服务员向打电话的人询问一些问题,看看他有什么反应,并根据他的反应将呼叫分配到合适的地点(或个人)。在这里,服务员的作用相当于有语音处理能力的自动系统,系统给出一系列菜单式的问题,再根据用户的反应来分配用户来电。
例如,我们打电话给电话订票公司,听到这样的应答:“欢迎你惠顾本公司。如果你想了解飞机离港时间,请说数字1;如果你想了解飞机到港时间,请说数字2;如果你想订票,请说数字3;如果你想了解机场的飞机信息,请说数字4。”在这种模式里,可以通过语音控制,把来电呼叫路由到合适的地点,并且不需要服务员的介入。
当然,在上面这个例子中,系统也可以使用由“离港”、“到港”、“订票”等指令组成的词汇表,而不是几个数字。这样对用户来讲,记住选择菜单就更容易了。
类似这样的呼叫分配系统有着大量的应用,包括旅馆、百货商店和大公司等。
2.5.3 图像识别技术
图像识别技术是指通过光学照相处理、视频信号处理和计算机处理等技术。首先对图像信息进行预处理,滤去干扰和噪声,进行几何校正和色彩校正,从而提高信噪比,然后将处理过的图像进行分类确定类别名称,接着进行图像分割,选择需要提取的特征进行测量和特征提取,最后根据测量结果进行分类的技术。
按照图像识别的流程,可以将其分为图像处理和分析以及图像理解和模式识别两个过程。
1.图像处理和分析
图像处理和分析包括以下六个过程:
(1)图像采集、获取和存储
通过扫描仪、图像采集卡等硬件获取图像信息,转换成电子信息进行存储,以便后续对其进行处理。
(2)图像变换
为了快速有效地对图像进行处理和分析,常需要将定义在图像空间的图像以某种形式转换到另一个空间,并利用该空间特有的性质进行方便的加工,最后再次转换成图像空间以得到所需的效果等。
(3)图像增强
对于信号微弱、很难识别的图像,需要进行增强,从而得到对具体使用来说视觉效果更好的图像。目前常用的图像增强技术有基于图像域和基于变换域的两种技术。
(4)图像恢复与重建
图像恢复技术就是将图像退化的过程模型化,并采取相反的过程得到原始的图像。
从广义的角度来看,图像恢复和重建包括对图像采集过程中产生的几何失真进行校正以及根据物体的多个投影进行物体图像重建两个技术。
(5)图像分割
这是将图像分成若干个有意义的区域进行处理的技术。一般做法是按照图像的某些特性,将图像分成若干个区域,每个区域内都有相同或相近的特性,而邻近区域的特性却绝不相同。
(6)图像特征的提取
图像特征是指图像的原始特性和属性,其中既包括视觉观察到的自然特性,如区域的亮度、边缘的轮廓、纹理或色彩等,又包括需要通过变换或测量才能得到的人为特征,如变换频谱、直方图、矩阵等。图像特征的提取,就是给出了某一具体图像与其他图像相区别的特性。
2.图像理解和模式识别
根据图像理解和模式识别的流程,可以将其分成以下四种识别模型:
(1)统计模型识别
这是找出反映图像特点的某些特征,应用统计方法在特定空间划分区域中对图像进行识别。
(2)结构模式识别
这是当图像十分复杂时,从结构的角度提出图像识别的语言和结构方法,把复杂的图像看成是简单子图像的集合,再把最简单的子图像称为基元,从基元的集合出发,按照一定的构图规则去描述复杂图像。
(3)模糊识别
这是模糊技术应用研究的一个重要领域。它一方面对模糊识别问题设计了相应的模糊识别系统,另一方面又对传统识别中的一些方法用模糊数学进行了很多改进。
(4)神经网络识别
这是利用计算机来实现人脑识别的功能,一方面为了实现某种功能,将之细分成若干个子功能,设计出算法来实现各个子功能;另一方面模拟人脑是由大量神经元组成的巨大的神经网络,从神经元的基本功能出发,逐步从简单到复杂形成各种神经网络,从而有效解决图像识别中的许多非线性问题。
3.图像识别技术的应用
图像识别技术广泛应用于图像遥感技术、医用图像处理和工业、军事、公安和文化等领域中。
(1)图像遥感技术
图像识别在现阶段的典型应用主要是图像遥感技术的应用。气象卫星云图的处理与遥感技术的应用可以采用飞机遥感技术和卫星遥感技术,用配备有高级计算机的图像处理系统来判读分析。从遥感卫星所获得的地球资源图片由于各种原因,图像质量总不是很好,因而必须采用图像处理技术。如IANDSAT系列陆地卫星,采用多波段扫描器(MSS),在900千米高空对地球每一个地区以18天为一周期进行扫描成像,其图像分辨率大致相当于距地面十几米或100米左右。这些图像无论在成像、存储、传输过程中,还是在判读分析中,都必须采用很多的数字图像处理方法。目前遥感技术,尤其是卫星遥感技术,已经在资源调查、城市规划、环境保护等方面取得了很好的应用效果。
(2)车牌自动识别系统的应用
汽车作为现代社会的主要交通工具之一,在人们的生产、生活各个领域得到大量使用,对它的信息自动采集和管理对于交通车辆管理、园区车辆管理、停车场管理、高速公路收费管理和城市交通车辆管理等方面有十分重要的意义,成为信息处理技术的一项重要课题。车牌自动识别系统主要由摄像头、视频采集接口、计算机和辅助照明装置组成。
利用计算机通过视频采集接口采集摄像头摄入的视频图像,对图像进行预处理以及车牌的定位、字符分割和字符的识别,经过数据判断以及信息处理最终确定车牌号。
本章小结
物流信息技术通过切入物流企业的业务流程来实现对物流企业各生产要素的合理组合与高效利用,降低经营成本,直接产生明显的经营效益。本章主要介绍物流信息的采集、识别与获取的基本技术,要求了解物流信息的识别和采集技术、物流信息的存储和处理技术,理解物流信息的获取的各种途径,掌握物流信息的传输与交换技术、物流动态跟踪与控制技术。
物流信息技术是实现物流现代化、信息化、网络化的关键支撑技术,同时也是物流信息系统实现系统化目标的重要组成部分。在学习过程中,要注意信息技术在物流领域中的实际运用。
思考题
1.什么是条形码?一维条形码和二维条形码有何不同?各有何优缺点?
2.列举出至少五个条形码技术的应用领域,并对每个领域进行说明。
3.举例说明条形码的应用案例。
4.何为射频技术?它的一般构成有哪些?
5.介绍射频技术在物流管理中的应用。
6.什么是数据仓库?它与传统数据库有什么区别与联系?
7.说明全球定位系统的原理和在物流中应用。
8.什么是地理信息系统,并简述该技术的应用。
9.简述EDI系统的工作原理。
10.简述ITS的概念和应用。
11.常用的识别技术有哪几种?