技術 > 有損數據壓縮
目錄
No. 1
  有損數據壓縮方法是經過壓縮、解壓的數據與原始數據不同但是非常接近的壓縮方法。有損數據壓縮又稱破壞型壓縮,即將次要的信息數據壓縮掉,犧牲一些質量來減少數據量,使壓縮比提高。這種方法經常用於因特網尤其是流媒體以及電話領域。在這篇文章中經常成為編解碼。它是與無損數據壓縮對應的壓縮方法。根據各種格式設計的不同,有損數據壓縮都會有 generation loss:壓縮與解壓文件都會帶來漸進的質量下降。
   有損壓縮的類型
  有兩種基本的有損壓縮機製:
  一種是有損變換編解碼,首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
  另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音采樣或者或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的信息進行量化與編碼。
  有些係統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟産生的誤差信號。
  有損與無損壓縮比較
  有損方法的一個優點就是在有些情況下能夠獲得比任何已知無損方法小得多的文件大小,同時又能滿足係統的需要。
  有損方法經常用於壓縮聲音、圖像以及視頻。有損視頻編解碼幾乎總能達到比音頻或者靜態圖像好得多的壓縮率(壓縮率是壓縮文件與未壓縮文件的比值)。音頻能夠在沒有察覺的質量下降情況下實現 10:1 的壓縮比,視頻能夠在稍微觀察質量下降的情況下實現如 300:1 這樣非常大的壓縮比。有損靜態圖像壓縮經常如音頻那樣能夠得到原始大小的 1/10,但是質量下降更加明顯,尤其是在仔細觀察的時候。
  當用戶得到有損壓縮文件的時候,譬如為了節省下載時間,解壓文件與原始文件在數據位的層面上看可能會大相徑庭,但是對於多數實用目的來說,人耳或者人眼並不能分辨出二者之間的區別。
  一些方法將人體解剖方面的特質考慮進去,例如人眼衹能看到一定頻率的光綫。心理聲學模型描述的是聲音如何能夠在不降低聲音感知質量的前提下實現最大的壓縮。
  人眼或人耳能夠察覺的有損壓縮帶來的缺陷稱為壓縮失真(en:compression artifact)。
有損壓縮的類型
  有兩種基本的有損壓縮機製:
  一種是有損變換編解碼,首先對圖像或者聲音進行采樣、切成小塊、變換到一個新的空間、量化,然後對量化值進行熵編碼。
  另外一種是預測編解碼,先前的數據以及隨後解碼數據用來預測當前的聲音采樣或者或者圖像幀,預測數據與實際數據之間的誤差以及其它一些重現預測的信息進行量化與編碼。
  有些係統中同時使用這兩種技術,變換編解碼用於壓縮預測步驟産生的誤差信號。
有損與無損壓縮比較
  有損方法的一個優點就是在有些情況下能夠獲得比任何已知無損方法小得多的文件大小,同時又能滿足係統的需要。
  有損方法經常用於壓縮聲音、圖像以及視頻。有損視頻編解碼幾乎總能達到比音頻或者靜態圖像好得多的壓縮率(壓縮率是壓縮文件與未壓縮文件的比值)。音頻能夠在沒有察覺的質量下降情況下實現 10:1 的壓縮比,視頻能夠在稍微觀察質量下降的情況下實現如 300:1 這樣非常大的壓縮比。有損靜態圖像壓縮經常如音頻那樣能夠得到原始大小的 1/10,但是質量下降更加明顯,尤其是在仔細觀察的時候。
  當用戶得到有損壓縮文件的時候,譬如為了節省下載時間,解壓文件與原始文件在數據位的層面上看可能會大相徑庭,但是對於多數實用目的來說,人耳或者人眼並不能分辨出二者之間的區別。
  一些方法將人體解剖方面的特質考慮進去,例如人眼衹能看到一定頻率的光綫。心理聲學模型描述的是聲音如何能夠在不降低聲音感知質量的前提下實現最大的壓縮。
  人眼或人耳能夠察覺的有損壓縮帶來的缺陷稱為壓縮失真(en:compression artifact)。
有損壓縮方法
  圖像壓縮
  分形壓縮(en:Fractal compression)
  JPEG
  JPEG2000, 使用小波的 JPEG 下一代。
  小波壓縮
  Cartesian Perceptual Compression: 也叫做 CPC
  DjVu
  ICER, Mars Rovers 使用: 使用小波所以與 JPEG2000 相關
  視頻壓縮
  Flash (也支持 JPEG sprites)
  H.261
  H.263
  H.264/MPEG-4 AVC
  MNG (支持 JPEG sprites)
  Motion JPEG
  MPEG-1 Part 2
  MPEG-2 Part 2
  MPEG-4 Part 2
  Ogg Theora (由於沒有專利限製而知名)
  Sorenson video codec
  VC-1
  音樂壓縮
  AAC - 蘋果計算機使用
  ADPCM
  ATRAC
  Dolby AC-3
  MP2
  MP3
  Musepack
  Ogg Vorbis (由於沒有專利限製而知名)
  WMA - Microsoft開發
  語音壓縮
  CELP
  G.711
  G.726
  HILN
  AMR (GSM 單元載波使用,如 T-Mobile)
  Speex (由於沒有專利限製而知名)
  其他類型數據
  從技術的角度來講,去除文字元音字母也可以看作是有損數據壓縮的一種方法,衹有子音的情況下根據上下文通常也仍然可以閱讀。研究人員也曾經半開玩笑地用字典中的短單詞替換長單詞或者使用生成文本技術(en:generative text techniques)進行文本壓縮,儘管這種方法有時是屬於相關的有損數據轉換(en:Lossy data conversion)領域。