第一节 数字图像信息处理技术
传统作画的方式是在纸张上用矿物或有机颜料作画,记录在画纸上的图像是通过这些矿物或有机颜料相互组合的关系反映出来的。而电脑作画的方式不一样,它是修改文件所记载的数字信息,这些数字信息规定了特定位置的色相、明度和彩度及其数理逻辑关系。当然,电脑美术设计师不必去弄清楚电脑自身在规定这些特定位置的色相、明度和彩度及其数理逻辑关系时是如何运算和如何通过屏幕反映出来的,这些工作由计算机系统完成。我们需要的是艺术家的头脑和对这些电脑美术应用软件的驾驭能力,但是良好的驾驭能力需要首先了解以下所介绍的内容。
一、图像数字化过程
1.采样、量化、编码
照片、印刷品或录像带中的每一帧画面我们称之为模拟图像,它们不能直接用计算机进行处理,必须先转换为数字图像。模拟图像转化为数字图像的过程就是图像的数字化。
所谓图像数字化,就是将图像上每个点(又称为像素)的信息按某种规律转换成一系列二进制数据(0和1),这种用二进制数据表示的图像信息可以存储在磁盘、光盘等设备里,也可以不失真地进行通信传输,更有利于计算机进行分析处理。图像数字化的具体步骤为采样、量化、编码。
采样:将模拟图像变换成离散点的操作称为采样。采样频率(在一定面积内取多少个像素)是非常重要的,它决定转换后的数字图像的“分辨率(dpi)”。
量化编码:黑白图像的每个像素有特定的亮度信息,一般用“灰度”来表示像素的亮度层次,而彩色图像的每个像素除了有亮度信息外,还有特定的色彩信息。经采样的图像的灰度和色彩是连续变化的,把这些连续的灰度和色彩划分为多个等级的过程是量化,编码则是将每个像素的灰度和色彩根据所属的等级转换成离散的整数值。
量化过程中,量化等级是一个重要参数,是指每个像素的灰度和色彩用多少位二进制数表示。以黑白图像为例,若每个像素的灰度用8位二进制数表示,则有28=256个量化级,这256个灰度量化级均匀地分布在由全黑(0)到全白(255)的整个明暗带中,即每个像素的灰度将由一定的数值(0~255)来表示;若用16位二进制数表示,则有216=65536个量化级。当然,量化等级越少,图像层次越差,灰度分辨率低,量化等级越多,图像灰度层次越丰富,图像质量越高,但对存储空间的要求也越大。
彩色图像也是如此,图像中每个像素的颜色(或亮度)信息都量化为若干位二进制数。所占二进制的位数称为颜色深度(也称为位深度或像素深度),记作位/像素(b/p:bitsperpixel)。但色彩的记录还涉及到色彩空间模型的问题,不同的色彩模型有不同的量化。
色彩空间模型是指表示、模拟和描述图像色彩空间的方法,也称色彩模型。常用的色彩空间模型有:RGB(红/绿/蓝)模型、CMYK(青、品红、黄、黑)模型、LAB模型、HSB(色相/饱和度/亮度)等模型。
RGB色彩模型:它是根据人眼锥体接收光线的方法构造成一个模型的,由红、绿、蓝三种颜色光相互叠加可形成丰富的色彩(形成不同的色调、饱和度和亮度)。每一个像素的色彩均由红、绿、蓝三色组成,分别按一定的等级量化为若干位二进制数。例如每种颜色都用8位二进制数表示,即都有256个等级的属性定义值,颜色深度为24位,三色叠加可生成256×256×256=16M种颜色(也称加法颜色空间模型)。其他几种色彩模型量化原理相似,只是色彩的表示方式不同。
CMYK色彩模型:它使用青(Cgan)、品红(Magenta)、黄(Yellow)、黑(Black)四个色彩信道产生可以印刷或打印的色彩。RGB颜色不能直接打印出来,因为发光设备(如显示器)上色彩的显示是把各种波长的色光以不同的比例叠加起来,产生不同的颜色。而反射设备(如纸张)是通过负过程产生色彩,一张没有打印过的纸反射所有波长的光,从而呈现白色。因此彩色印刷或打印过程使用CMYK模式,吸收某些波长的光产生不同的色彩,如青色墨水吸收红色波长,打印出的图像呈蓝绿色;而品红墨水吸收绿色波长,打印出的图像呈品红色。通过四色的组合和描述,就会产生打印和印刷可见光谱中的大多数颜色。CMYK是一种减法色彩模型。(打印机驱动程序负责把色彩从RGB模式转换到CMYK模式。)
HSB色彩模型(又称HSV、HLS模型):采用色相(Hue)、饱和度(Saturation)和亮度(Brightness)来描述一个颜色(像素色),它最符合人的眼睛所看到的色调空间,是模拟人眼感知色彩的一种方法。HSB模型描述色彩比较自然,但在实际应用中需进行转换,如显示时需转换成RGB模型,打印时转换为CMYK模型。
LAB色彩模型:也称CIELAB,由国际照明委员会(CIE)于1976年制定的一个目标色调说明标准。它与设备无关,色调成分的某一值既可描述打印,又可描述显示色调。LAB的颜色光谱囊括了RGB和CMYK的颜色光谱。LAB模型由照明发光率(Luminance)和两个颜色轴通道组成。L指发光率和亮度值;A表示一根从深绿到灰、再到亮粉红颜色轴通道;B表示从蓝到黄的颜色轴通道。LAB模型能表达的色彩空间比RGB、CMYK模型所表达的颜色范围大。
YIQ色彩模型:通常被北美的电视系统采用(NTSC系统),Y表示颜色的亮度,I和Q表示色调,即描述图像色彩及饱和度的属性。与RGB的关系是:Y=0.30R+0.59G+0.11B,I=0.6R-0.28G-0.32B,Q=0.21R-0.52G+0.31B。
YUV色彩模型:被欧洲的电视系统所采用(PAL系统),其中Y指亮度,U和V也表示色调(两个色差信号),但和I与Q的表达方式不完全相同。与RGB的关系是:Y=0.30R+0.59G+0.11B,U=0.50(B-Y)=-0.15R-0.29G+0.44B,V=0.88(R-Y)=0.62R-0.52G-0.10B。
显然,无论从平面的采样还是记录数据的深度来讲,采样量化形成的图像与母本必然有一定的差距,必然丢掉了一些数据。但这个差距如果控制得相当小,以至人眼难以分辨,那么这个差距就是可以接受的。
2.位图图像与矢量图形
模拟图像数字化后是由许多像素组成的,每个像素用若干个二进制位来指定该像素的颜色、亮度和属性,这类图像我们称为点位图像,简称位图。像素是记录位图属性的基本单位,对位图进行修改就是对图像中的像素进行添加、删除或改变像素的颜色、亮度等属性。除了位图,在计算机中处理的图像还有矢量图形(Vector_based Map)。
矢量图形是指以数学方法表示出来的,通过一组程序指令集来描述构成一幅图形的所有点、线、框、圆、弧、面等几何元素的位置、维数、大小和色彩的二维或三维的图形形状。矢量图形由外部轮廓线条构成,任意缩放不会失真,也不会因为编辑和修改次数过多而降低图形质量,因此可以对图形进行反复编辑和修改。
矢量图形和位图图像各自的特点决定了它们不同的应用场合。
矢量图形主要用于轮廓不很复杂、色彩不是很丰富的对象,如:几何图形、线型的图画、美术字、统计图、工程图纸、CAD、3D造型软件等有规律的曲线所组成的图形,多以Draw程序“绘制”和“创作”的方法产生。对矢量图形编辑时,可对矢量图形及其元素独立进行移动、缩放、旋转和扭曲等变换。它的特点是占据的存储空间较小,但不适于表现较复杂的图画。
位图图像基于像素描述的特点提供了高保真度图像显示和印刷质量,主要用于表现含有大量细节(如明暗变化、场景复杂、轮廓色彩丰富)的对象,如:照片、绘图等。通过图像处理软件可进行复杂图像的处理以得到更清晰的图像或产生特殊效果。但对位图图像只能作有限范围的修改和调整,大规模地修改位图将丧失原有图像质量。这类图像多来源于“扫描”和“复制”,如由扫描仪或数码相机等设备捕捉实际的画面产生的。
3.数字图像的基本属性
(1)分辨率
分辨率是影响位图图像质量的重要因素,指图像单位面积内的像素点,常用单位是DPI(Dot Per Inch像素/英寸),有时也使用图像水平和垂直的总像素数表示。它有多种形式,如显示分辨率、打印分辨率、扫描分辨率等。
(2)图像亮度和颜色表示
黑白图像用灰度表示像素的亮度,灰度用灰度级别或比特数表示,目前多采用256级即8比特。彩色图像用颜色深度来表示像素的亮度和色彩。
真彩色指组成一幅彩色图像的每个像素值都分成R、G、B三个基色分量,每个基色分量直接决定显示设备的基色强度,这样产生的彩色可以反映原图的真实色彩,故称真彩色。目前常用的是24位真彩色,即每基色分量用8位来表示,共可记录224=16M种色彩。而平时所说的32位真彩色是在24位之外,还有一个8位的透明度(Alpha)通道,表示每个像素的256种透明度等级。
伪彩色图像指每个像素的颜色不是由每个基色分量的数值直接决定,而是来源于调色板。调色板中的颜色数取决于颜色深度。某个像素的颜色不存在时,会用相近的色彩来代替。所以,当两幅图像同时显示时,如果它们的调色板不同,就会出现颜色失真现象。
高彩色:指用16位来表示一个像素的色彩,共有65536种颜色。
(3)调色板
在生成一幅位图图像(一般指256色图像)时,图像处理软件要对图像中不同的色彩进行采样,产生包含该图像中各种颜色的颜色表,这个颜色表就是调色板。
每一个256色图像都有自己对应的调色板,如果显示这个图像时用了别的图像的调色板,图像就有可能变花。有时需要把一幅真彩色的图像文件转换为256色,这个工作很多软件都可以做,如Photoshop,既可以计算出图像所需的最佳调色板,也允许我们为图像指定一个调色板。
(4)文件的大小
图形与图像文件的大小(也称数据量)是指在磁盘上存储整幅图像的字节数(Bytes),位图图像文件的大小与分辨率和颜色深度有关。计算公式为:文件字节数=图像分辨率×颜色深度/8。
矢量图形记录方式比位图记录方式在相同大小区域内产生的数据量少得多,因此矢量图形文件要比图像文件小得多,而且画面上的图形越简单,分解成的基本几何图形就越少,相应的记录这个文件的数据量就越小。
二、压缩编码
1.基本原理
(1)压缩编码的必要性
模拟图像数字化后的数据量很大,在对其进行实时处理时,对计算机的存储容量、通信网络传输带宽和处理能力提出了很高要求,从而成为阻碍人类有效获取和使用信息的瓶颈。因此,为了更方便计算机对数字图像的处理,需要采用数据压缩技术,将那些对人眼感知图像不太重要的成分抛弃,以缩减存储、传输和处理的数据量。
(2)压缩编码的可行性
从信息论观点来看,图像是一个信源,描述信源的数据是信息量(信源熵)和信息冗余量之和。数据压缩实质上是从视觉对象、视觉生理、视觉心理三个方面入手,研究符合人类视觉规律的视觉模型,减少信息冗余量。
视觉对象(即图像本身)的信息冗余有多种,如空间冗余、时间冗余、结构冗余等,冗余量减少可以减少数据量而不减少信源的信息量。
对图像数据进行概率统计,可以发现图像数据存在大量的统计特征的重复,即统计冗余。统计冗余包括静态单帧图像数据在空间上存在的空间冗余和动态图像序列在时间上存在的时间冗余。在同一幅图像中,相对规则有序的物体或背景的表面物理特征(亮度和颜色等)具有相近或相关性,在数字图像中则表现为数据的重复,即空间冗余。在动态图像序列中,相邻的帧与帧之间在物理特征(亮度和颜色等)上存在较大的相近或相关性,在数字图像序列中表现为帧与帧之间数据的重复,便形成了时间冗余。如图像中相邻像素之间的幅度值相近,体现了图像的空间冗余。
有些图像从大面积上或整体上看存在重复出现的、相同或相近的纹理结构,即存在重复出现的数据序列,即结构冗余。
从视觉生理来说,人类视觉系统的分辨能力有限,图像中存在大量视觉系统不能感知的变化细节,因而图像数据中存在着冗余,即视觉冗余。人的眼睛对构成图像的不同成分具有不同的敏感度,如人的眼睛含有对亮度敏感的柱状细胞1.8亿个,含有对色彩敏感的椎状细胞0.08亿个,由于柱状细胞的数量远大于椎状细胞,所以眼睛对亮度的敏感程度要大于对色彩的敏感程度;人眼对低频信号的敏感程度大于对高频信号的敏感程度;人眼对图像中心信息的敏感程度大于对图像边缘信息的敏感程度等等。只要将这些冗余信息去除,如用较少的比特数表示色彩信号和高频信号,对边缘信息减少比特数,就可以达到压缩图像数据量的目的。
视觉心理是一个比较复杂的问题,但一些共性的心理现象也使图像存在冗余信息,如图像的主体部分是视觉中心,而对前景或背景我们一般不会注意到细节。某些情况下,允许图像有一定的失真,而并不妨碍图像的实际应用,那么数据量压缩的可能性就更大了。