技術 > 壓縮文件
目錄
No. 1
  什麽是壓縮文件
  簡單的說,就是經過壓縮軟件壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進製代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。
  ■怎麽壓縮文件
  首先要安裝壓縮軟件,現在比較流行的是winrar「一種高效快速的文件壓縮軟件(中文版)」。
  其次是建立一個壓縮包:選擇你要製作成壓縮包的文件或文件夾,當然你也可也多選,方法同資源管理器,也就是按住ctrl或shift再選擇文件(文件夾)。 選取完畢之後,就可以單擊工具欄上的“壓縮”按鈕,在這裏你可以選擇壓縮格式:rar和zip。 如果你想得到較大的壓縮率,建議選擇rar格式。
  各個選項選擇好以後,單擊確定按鈕就開始製作壓縮包了,非常方便。
  有時候大傢會遇到這個問題,就是你在一個論壇裏要上傳一些文件壓縮包,壓縮包大小有3m,但是論壇限製會員上傳大小衹有2m,怎麽辦呢?
  其實辦法很簡單,就是在你壓縮這個文件時,分成幾個帶分捲壓縮包,分捲包大小設置為2m即可,比如:原來文件名為123.rar(3m),壓縮成分捲包後為123.part1.rar(2m)與123.part2.rar(1m)兩個文件,這樣你就可以上傳了。
  具體方法如下:
  1、在要壓縮的文件上點右鍵
  2、添加到壓縮文件....
  3、選常規
  4、壓縮方式選最好
  5、批定壓縮分捲大小(按字節計算),1m = 1024k,1k = 1024字節,填寫數字即可
  當你下載了帶有分捲的壓縮包後,如何解壓文件呢?
  具體方法如下:
  1、把所有的壓縮分捲全部下載完整
  2、所有分捲必須在同一個文件夾內
  3、然後雙擊解壓第一個分捲,即可
  註:分捲解壓的文件必須是連續的,若分捲未下載完整,則解壓時自然會提示需要下一壓縮分捲
什麽是壓縮文件?
  簡單的說,就是經過壓縮軟件壓縮的文件叫壓縮文件,壓縮的原理是把文件的二進製代碼壓縮,把相鄰的0,1代碼減少,比如有000000,可以把它變成6個0 的寫法60,來減少該文件的空間。
怎麽壓縮文件?
  首先要安裝壓縮軟件,現在比較流行的是WinRAR「一種高效快速的文件壓縮軟件(中文版)」。
  其次是建立一個壓縮包:選擇你要製作成壓縮包的文件或文件夾,當然你也可也多選,方法同資源管理器,也就是按住Ctrl或Shift再選擇文件(文件夾)。 選取完畢之後,就可以單擊工具欄上的“壓縮”按鈕,在這裏你可以選擇壓縮格式:RAR和ZIP。 如果你想得到較大的壓縮率,建議選擇RAR格式。
  各個選項選擇好以後,單擊確定按鈕就開始製作壓縮包了,非常方便。
  有時候大傢會遇到這個問題,就是你在一個論壇裏要上傳一些文件壓縮包,壓縮包大小有3M,但是論壇限製會員上傳大小衹有2M,怎麽辦呢?
  其實辦法很簡單,就是在你壓縮這個文件時,分成幾個帶分捲壓縮包,分捲包大小設置為2M即可,比如:原來文件名為123.rar(3M),壓縮成分捲包後為123.part1.rar(2M)與123.part2.rar(1M)兩個文件,這樣你就可以上傳了。
  具體方法如下:
  1、在要壓縮的文件上點右鍵
  2、添加到壓縮文件....
  3、選常規
  4、壓縮方式選最好
  5、批定壓縮分捲大小(按字節計算),1M = 1024K,1K = 1024字節,填寫數字即可
  當你下載了帶有分捲的壓縮包後,如何解壓文件呢?
  具體方法如下:
  1、把所有的壓縮分捲全部下載完整
  2、所有分捲必須在同一個文件夾內
  3、然後雙擊解壓第一個分捲,即可
  註:分捲解壓的文件必須是連續的,若分捲未下載完整,則解壓時自然會提示需要下一壓縮分捲
WINRAR軟件介紹
  WinRAR,流行好用的 Windows 壓縮工具!
  WinRAR 是一個強大的壓縮文件管理工具。它能備份你的數據,減少你的 E-mail 附件的大小,解壓縮從Internet上下載的 RAR、ZIP 和其他格式的壓縮文件,並能創建 RAR 和 ZIP 格式的壓縮文件。在購買之前,你可以下載試用版本。
  WINRAR 是目前流行的壓縮工具,界面友好,使用方便,在壓縮率和速度方面都有很好的表現。其壓縮率比高,3.x 采用了更先進的壓縮算法,是現在壓縮率較大、壓縮速度較快的格式之一。 3.3 增加了掃描壓縮文件內病毒、解壓縮“增強壓縮” ZIP 壓縮文件的功能, 升級了分捲壓縮的功能等。
  主要特點
  1、 對 RAR 和 ZIP 的完全支持;
  2、 支持 ARJ、CAB、LZH、ACE、TAR、GZ、UUE、BZ2、JAR、ISO 類型文件的解壓;
  3、 多捲壓縮功能;
  4、 創建自解壓文件,可以製作簡單的安裝程序,使用方便;
  5、 壓縮文件大小可以達到 8,589,934 TB;
  6、 鎖定和強大的數據恢復記錄功能,對數據的保護無微不至,新增的恢復捲的使用功能更強大
壓縮文件的運行原理
  如果您從互聯網上下載了許多程序和文件,可能會遇到很多ZIP文件。這種壓縮機製是一種很方便的發明,尤其是對網絡用戶,因為它可以減小文件中的比特和字節總數,使文件能夠通過較慢的互聯網連接實現更快傳輸,此外還可以減少文件的磁盤占用空間。在下載了文件後,計算機可使用WinZip或Stuffit這樣的程序來展開文件,將其復原到原始大小。如果一切正常,展開的文件與壓縮前的原始文件將完全相同。
  乍一聽好像很神秘:您是怎樣減少比特和字節的數量並將它們原封不動地還原回去的呢?等一切水落石出之後,您會發現這個過程背後的基本理念其實非常簡單明了。在本文中,我們將討論這種通過簡單壓縮來明顯減小文件的方法。
  大多數計算機文件類型都包含相當多的冗餘內容——它們會反復列出一些相同的信息。文件壓縮程序就是要消除這種冗餘現象。與反復列出某一塊信息不同,文件壓縮程序衹列出該信息一次,然後當它在原始程序中出現時再重新引用它。
  以我們熟悉的信息類型——單詞——為例子。
  肯尼迪(John F. Kennedy)在1961年的就職演說中曾說過下面這段著名的話:
  Ask not what your country can do for you——ask what you can do for your country.(不要問國傢能為你做些什麽,而應該問自己能為國傢做些什麽。)
  這段話有17個單詞,包含61個字母、16個空格、1個破折號和1個句點。如果每個字母、空格或標點都占用1個內存單元,那麽文件的總大小為79個單元。為了減小文件的大小,我們需要找出冗餘的部分。
  我們立刻發現:
  如果忽略大小寫字母間的區別,這個句子幾乎有一半是冗餘的。九個單詞(ask、not、what、your、country、can、do、for、you)幾乎提供了組成整句話所需的所有東西。為了構造出另一半句子,我們衹需要拿出前半段句子中的單詞,然後加上空格和標點就行了。
  大多數壓縮程序使用基於自適應字典的LZ算法來縮小文件。“LZ”指的是此算法的發明者Lempel和Ziv,“字典”指的是對數據塊進行歸類的方法。
  排列字典的機製有很多種,它也可以像編號列表那樣簡單。在我們檢查肯尼迪這句著名講話時,可以挑出重複的單詞,並將它們放到編號索引中。然後,我們直接寫入編號而不是寫入整個單詞。
  因此,如果我們的字典是:
  ask
  what
  your
  country
  can
  do
  for
  you
  我們的句子現在就應該是這樣的:
  1 not 2 3 4 5 6 7 8-- 1 2 8 5 6 7 3 4
  如果您瞭解這種機製,那麽衹需使用該字典和編號模式即可輕鬆重新構造出原始句子。這就是在展開某個下載文件時,計算機中的解壓縮程序所做的工作。你可能還遇到過能夠自行解壓縮的壓縮文件。若要創建這種文件,編程人員需要在被壓縮的文件中設置一個簡單的解壓縮程序。在下載完畢後,它可以自動重新構造出原始文件。
  但是使用這種機製究竟能夠節省多少空間呢?“1 not 2 3 4 5 6 7 8——1 2 8 5 6 7 3 4”當然短於“Ask not what your country can do for you-- ask what you can do for your country.”,但應註意的是,我們需要隨文件一起保存這個字典。
  在實際壓縮方案中,計算出各種文件需求是一個相當復雜的過程。讓我們回過頭考慮一下上面的例子。每個字符和空格都占用1個內存單元,整個原句要占用79個單元。壓縮後的句子(包括空格)占用了37個單元,而字典(單詞和編號)也占用了37個單元。也就是說,文件的大小為74個單元,因此我們並沒有把文件大小減少很多。
  但這衹是一個句子的情況!可以想象的是,如果用該壓縮程序處理完肯尼迪講話的其餘部分,我們會發現這些單詞以及其他單詞重複了更多次。而且,正如下一節所言,為了得到盡可能高的組織效率,可以對字典進行重寫。
  在上一個的例子中,我們挑出了所有重複的單詞並將它們放在一個字典中。對於我們來說,這是最顯而易見的字典編寫方法。但是壓縮程序卻不這樣認為:它對單詞沒有概念——它衹會尋找各個模式。為了盡可能減小文件的大小,它會仔細挑選出最優模式。
  如果從這個角度處理該句子,我們最終會得到一個完全不同的字典。
  如果壓縮程序掃描肯尼迪的這句話,它遇到的第一個冗餘部分衹有幾個字母長。在ask not what your中,出現了一個重複的模式,即字母t後面跟一個空格——在not和what中。如果壓縮程序將此模式寫入字典,則每次出現“t”後面跟一個空格的情況時,它會寫入一個“1”。但是在這個短句中,此模式的出現次數不夠多,不足以將其保留為字典中的一個條目,因此程序最終會覆蓋它。
  程序接下來註意到的內容是ou,在your和country中都出現了它。如果這是一篇較長的文檔,將此模式寫入字典會節省大量空間——在英語中ou是一個十分常見的字母組合。但是在壓縮程序看完整個句子後,它立即發現了一個更好的字典條目選擇:不僅ou發生了重複,而且your和country整個單詞都發生了重複,並且它們實際上是作為一個短語your country一起發生重複的。在本例中,程序會用your country條目覆蓋掉字典中的ou條目。
  短語can do for也發生了重複,一次後面跟着your,另一次跟着you,因此我們又發現can do for you也是一種重複模式。這樣,我們可以用一個數字來代替15個字符(包含空格),而your country衹允許我們用一個數字代替13個字符(包含空格),所以程序會用r country條目覆蓋your country條目,然後再寫入一個單獨的can do for you條目。程序通過這種方式繼續工作,挑出所有重複的信息,然後計算應該將哪一種模式寫入字典。基於自適應字典的LZ算法中的“自適應”部分指的就是這種重寫字典的能力。程序執行此工作的過程實際上非常復雜。
  無論使用什麽方法,這種深入搜索機製都能比僅僅挑出單詞這種方法更有效率地對文件進行壓縮。如果使用我們上面提取出的模式,然後用“__”代替空格,最終將得到下面這個更大的字典:
  ask__
  what__­
  you
  r__country
  __can__do__for__you
  而句子則較短:
  “1not__2345__--__12354”
  句子現在占用18個內存單元,字典占用41個單元。所以,我們將文件總大小從79個單元壓縮到了59個單元!這僅僅是壓縮句子的一種方法,而且不一定是最高效的方法。(看看您能找到更好的方法嗎!)
  那麽這種機製到底有多好呢?文件壓縮率取决於多種因素,包括文件類型、文件大小和壓縮方案。
  在世界上的大多數語言中,某些字母和單詞經常以相同的模式一起出現。正是由於這種高冗餘性,而導致文本文件的壓縮率會很高。通常大小合適的文本文件的壓縮率可以達到50%或更高。大多數編程語言的冗餘度也很高,因為它們的命令相對較少,並且命令經常采用一種設定的模式。對於包含大量不重複信息的文件(例如圖像或MP3文件),則不能使用這種機製來獲得很高的壓縮率,因為它們不包含重複多次的模式。
  如果文件有大量重複模式,那麽壓縮率通常會隨着文件大小的增加而增加。從我們的例子中就可以看出這一點——如果我們摘錄的肯尼迪講話再長一些,您會發現又多次出現了我們字典中的模式,因此能夠通過每個字典條目節省更多的文件空間。此外,對於更大的文件,還可能出現具有更大普遍性的模式,從而能夠創建出效率更高的字典。
  此外,文件壓縮效率還取决於壓縮程序使用的具體算法。有些程序能夠在某些類型的文件中更好地尋找到模式,因此能更有效地壓縮這些類型的文件。其他一些壓縮程序在字典中又使用了字典,這使它們在壓縮大文件時表現很好,但是在壓縮較小的文件時效率不高。儘管這一類的所有壓縮程序都基於同一個基本理念,但是它們的執行方式卻各不相同。程序開發人員始終在嘗試建立更好的壓縮機製。
  有損壓縮和無損壓縮
  我們在上文中討論的壓縮類型稱為無損壓縮,因為您重新創建的文件與原始文件完全相同。所有無損壓縮都基於這樣一種理念:將文件變為“較小”的形式以利於傳輸或存儲,並在另一方收到它後復原以便重新使用它。
  有損壓縮則與此大不相同。這些程序直接去除“不必要”的信息,對文件進行剪裁以使它變得更小。這種類型的壓縮大量應用於減小位圖圖像的文件大小,因為位圖圖像的體積通常非常龐大。為瞭瞭解有損壓縮的工作原理,讓我們看看你的計算機如何對一張掃描的照片進行壓縮。
  對於此類文件,無損壓縮程序的壓縮率通常不高。儘管圖片的大部分看起來都是相同的——例如,整個天空都是藍色的——但是大部分像素之間都存在微小的差異。為了使圖片變得更小同時不降低其分辨率,您必須更改某些像素的顔色值。如果圖片中包含大量的藍色天空,程序會挑選一種能夠用於所有像素的藍色。然後,程序重寫該文件,所有天空像素的值都使用此信息。如果壓縮方案選擇得當,您不會註意到任何變化,但是文件大小會顯著減小。
  當然,對於有損壓縮,在文件壓縮後您無法將其復原成原始文件的樣子。您必須接受壓縮程序對原始文件的重新解釋。因此,如果需要完全重現原來的內容(例如軟件應用程序、數據庫和總統就職演說),則不應該使用這種壓縮形式。
相關詞
文件電腦壓縮軟件
包含詞
分捲壓縮文件固實壓縮文件壓縮文件夾漏洞