技术 > 有损数据压缩
目录
No. 1
  有损数据压缩方法是经过压缩、解压的数据与原始数据不同但是非常接近的压缩方法。有损数据压缩又称破坏型压缩,即将次要的信息数据压缩掉,牺牲一些质量来减少数据量,使压缩比提高。这种方法经常用于因特网尤其是流媒体以及电话领域。在这篇文章中经常成为编解码。它是与无损数据压缩对应的压缩方法。根据各种格式设计的不同,有损数据压缩都会有 generation loss:压缩与解压文件都会带来渐进的质量下降。
   有损压缩的类型
  有两种基本的有损压缩机制:
  一种是有损变换编解码,首先对图像或者声音进行采样、切成小块、变换到一个新的空间、量化,然后对量化值进行熵编码。
  另外一种是预测编解码,先前的数据以及随后解码数据用来预测当前的声音采样或者或者图像帧,预测数据与实际数据之间的误差以及其它一些重现预测的信息进行量化与编码。
  有些系统中同时使用这两种技术,变换编解码用于压缩预测步骤产生的误差信号。
  有损与无损压缩比较
  有损方法的一个优点就是在有些情况下能够获得比任何已知无损方法小得多的文件大小,同时又能满足系统的需要。
  有损方法经常用于压缩声音、图像以及视频。有损视频编解码几乎总能达到比音频或者静态图像好得多的压缩率(压缩率是压缩文件与未压缩文件的比值)。音频能够在没有察觉的质量下降情况下实现 10:1 的压缩比,视频能够在稍微观察质量下降的情况下实现如 300:1 这样非常大的压缩比。有损静态图像压缩经常如音频那样能够得到原始大小的 1/10,但是质量下降更加明显,尤其是在仔细观察的时候。
  当用户得到有损压缩文件的时候,譬如为了节省下载时间,解压文件与原始文件在数据位的层面上看可能会大相径庭,但是对于多数实用目的来说,人耳或者人眼并不能分辨出二者之间的区别。
  一些方法将人体解剖方面的特质考虑进去,例如人眼只能看到一定频率的光线。心理声学模型描述的是声音如何能够在不降低声音感知质量的前提下实现最大的压缩。
  人眼或人耳能够察觉的有损压缩带来的缺陷称为压缩失真(en:compression artifact)。
有损压缩的类型
  有两种基本的有损压缩机制:
  一种是有损变换编解码,首先对图像或者声音进行采样、切成小块、变换到一个新的空间、量化,然后对量化值进行熵编码。
  另外一种是预测编解码,先前的数据以及随后解码数据用来预测当前的声音采样或者或者图像帧,预测数据与实际数据之间的误差以及其它一些重现预测的信息进行量化与编码。
  有些系统中同时使用这两种技术,变换编解码用于压缩预测步骤产生的误差信号。
有损与无损压缩比较
  有损方法的一个优点就是在有些情况下能够获得比任何已知无损方法小得多的文件大小,同时又能满足系统的需要。
  有损方法经常用于压缩声音、图像以及视频。有损视频编解码几乎总能达到比音频或者静态图像好得多的压缩率(压缩率是压缩文件与未压缩文件的比值)。音频能够在没有察觉的质量下降情况下实现 10:1 的压缩比,视频能够在稍微观察质量下降的情况下实现如 300:1 这样非常大的压缩比。有损静态图像压缩经常如音频那样能够得到原始大小的 1/10,但是质量下降更加明显,尤其是在仔细观察的时候。
  当用户得到有损压缩文件的时候,譬如为了节省下载时间,解压文件与原始文件在数据位的层面上看可能会大相径庭,但是对于多数实用目的来说,人耳或者人眼并不能分辨出二者之间的区别。
  一些方法将人体解剖方面的特质考虑进去,例如人眼只能看到一定频率的光线。心理声学模型描述的是声音如何能够在不降低声音感知质量的前提下实现最大的压缩。
  人眼或人耳能够察觉的有损压缩带来的缺陷称为压缩失真(en:compression artifact)。
有损压缩方法
  图像压缩
  分形压缩(en:Fractal compression)
  JPEG
  JPEG2000, 使用小波的 JPEG 下一代。
  小波压缩
  Cartesian Perceptual Compression: 也叫做 CPC
  DjVu
  ICER, Mars Rovers 使用: 使用小波所以与 JPEG2000 相关
  视频压缩
  Flash (也支持 JPEG sprites)
  H.261
  H.263
  H.264/MPEG-4 AVC
  MNG (支持 JPEG sprites)
  Motion JPEG
  MPEG-1 Part 2
  MPEG-2 Part 2
  MPEG-4 Part 2
  Ogg Theora (由于没有专利限制而知名)
  Sorenson video codec
  VC-1
  音乐压缩
  AAC - 苹果计算机使用
  ADPCM
  ATRAC
  Dolby AC-3
  MP2
  MP3
  Musepack
  Ogg Vorbis (由于没有专利限制而知名)
  WMA - Microsoft开发
  语音压缩
  CELP
  G.711
  G.726
  HILN
  AMR (GSM 单元载波使用,如 T-Mobile)
  Speex (由于没有专利限制而知名)
  其他类型数据
  从技术的角度来讲,去除文字元音字母也可以看作是有损数据压缩的一种方法,只有子音的情况下根据上下文通常也仍然可以阅读。研究人员也曾经半开玩笑地用字典中的短单词替换长单词或者使用生成文本技术(en:generative text techniques)进行文本压缩,尽管这种方法有时是属于相关的有损数据转换(en:Lossy data conversion)领域。