技術 > 數字視頻
目錄
No. 1
  英文名稱:digital video
數字視頻的概述
  數字視頻就是先用攝像機之類的視頻捕捉設備,將外界影像的顔色和亮度信息轉變為電信號,再記錄到儲存介質(如錄像帶)。播放時,視頻信號被轉變為幀信息,並以每秒約30幀的速度投影到顯示器上,使人類的眼睛認為它是連續不間斷地運動着的。電影播放的幀率大約是每秒24幀。如果用示波器(一種測試工具)來觀看,未投影的模擬電信號看起來就像腦電波的掃描圖像,由一些連續鋸齒狀的山峰和山𠔌組成。
  為了存儲視覺信息,模擬視頻信號的山峰和山𠔌必須通過數字/模擬(d/a)轉換器來轉變為數字的“0”或“1”。這個轉變過程就是我們所說的視頻捕捉(或採集過程)。如果要在電視機上觀看數字視頻,則需要一個從數字到模擬的轉換器將二進製信息解碼成模擬信號,才能進行播放。
  模擬視頻的數字化包括不少技術問題,如電視信號具有不同的製式而且采用復合的yuv信號方式,而計算機工作在rgb空間;電視機是隔行掃描,計算機顯示器大多逐行掃描;電視圖像的分辨率與顯示器的分辨率也不盡相同等等。因此,模擬視頻的數字化主要包括色彩空間的轉換、光柵掃描的轉換以及分辨率的統一。
  模擬視頻一般采用分量數字化方式,先把復合視頻信號中的亮度和色度分離,得到yuv或yiq分量,然後用三個模/數轉換器對三個分量分別進行數字化,最後再轉換成rgb空間。
數字視頻的發展
  談到數字視頻的發展歷史,不能不回顧計算機的發展歷程,它實際上是與計算機所能處理的信息類型密切相關的,自上個世紀40年代計算機誕生以來,計算機大約經歷了以下幾個發展階段: 數值計算階段。這是計算機問世後的“幼年”時期。在這個時期計算機衹能處理數值數據,主要用於解决科學與工程技術中的數學問題。實際上,世界上第一臺電子計算機eniac就是為美國國防部解决彈道計算問題和編製射擊表而研製生産的。
  數據處理階段。50年代發明了字符發生器,使計算機不但能處理數值,也能表示和處理字母及其它各種符號,從而使計算機的應用領域從單純的數值計算進入了更加廣泛的數據處理。這是由世界上第一個批量生産的商用計算機uniac—1首開先河的。
  多媒體階段。隨着電子器件的進展,尤其是各種圖形、圖像設備和語音設備的問世,計算機逐漸進入多媒體時代,信息載體擴展到文、圖、聲等多種類型,使計算機的應用領域進一步擴大。
  由於視覺,即圖形、圖像,最能直觀明了、生動形象地傳達有關對象的信息,因而在多媒體計算機中占有重要的地位。
  在多媒體階段,計算機與視頻就産生了聯姻。數字視頻的發展主要是指在個人計算機上的發展,可以大致分為初級、主流和高級幾個歷史階段。
  第—階段是初級階段,其主要特點就是在臺式計算機上增加簡單的視頻功能,利用電腦來處理活動畫面,這給人展示了一番美好的前景,但是由於設備還未能普及,都是面嚮製作視頻製作領域的專業人員。在普通pc用戶還無法奢望在自己的電腦上實現視頻功能。
  第二個階段為主流階段,在這個階段數字視頻在計算機中得到廣泛應用,成為主流。初期數字視頻的發展沒有人們期望的那麽快,原因很簡單,就是對數字視頻的處理很費力,這是因為數字視頻的數據量非常之大,1分鐘的滿屏的真彩色數字視頻需要1.5gb的存儲空間,而在早期—般臺式機配備的硬盤容量大約是幾百兆,顯然無法胜任如此大的數據量。
  雖然在當時處理數字視頻很睏難,但它所帶來的誘惑促使人們采用折衷的方法。先是用計算機捕獲單幀視頻畫面,可以捕獲一幀視頻圖像並以一定的文件格式存儲起來,可以利用圖像處理軟件進行處理,將它放進準備出版的資料中;後來,在計算機上觀看活動的視頻成為可能。雖然畫面時斷時續,但畢竟是動了起來,帶給人們無限的驚喜。
  而最有意義的突破是計算機有了捕獲活動影像的能力,將視頻捕獲到計算機中,隨時可以從硬盤上播放視頻文件。能夠捕獲視頻得益於數據壓縮方法,壓縮方法有兩種:純軟件壓縮和硬件輔助壓縮純軟件壓縮方便易行,衹用一個小窗口顯示視頻,有很多這方面的軟件。硬件壓縮花費高,但速度快。在這一過程中,雖然能夠捕獲到視頻,但是缺乏一個統一的標準,不同的計算機捕獲的視頻文件不能交換。雖然有過一個所謂的“標準”,但是它沒有得到足夠的流行,因此沒有變成真正的標準,它就是數字視頻交互(dvi)。dvi在捕獲視頻時使用硬件輔助壓縮,但在播放時卻衹使用軟件,因此在播放時不需要專門的設備。但是dvi沒有形成市場,因此沒有被廣泛的瞭解和使用。因此就難以流行。這就需要計算機與視頻再做一次結合,建立一個標準,使得每臺計算機都能播放令人心動的視頻文件。這次結合成功的關鍵是各種壓縮解壓縮codec技術的成熟。codec來自於兩個單詞compression(壓縮)和decompression(解壓),它是一種軟件或者固件(固化於用於視頻文件的壓縮和解壓的程序芯片)。壓縮使得將視頻數據存儲到硬盤上成為可能。如果幀尺寸較小幀切換速度較慢,再使用壓縮和解壓,存儲1分鐘的視頻數據衹需20mb的空間而不是1.5gb,所需存儲空間的比例是20:1500,即1:75。當然在顯示窗口看到的衹是分辨率為160×120郵票般大小的畫面,幀速率也衹有15幀/s,色彩也衹有256色,但畫面畢竟活動起來了。
  quicktime和video for windows通過建立視頻文件標準mov和avi使數字視頻的應用前景更為廣阔,使它不再是一種專用的工具,而成為每個人電腦中的必備成分。而正是數字視頻發展的這一步,為電影和電視提供了一個前所未有的工具,為影視藝術帶來了影響空前的變革。
  第三階段是高級階段,在這一階段,普通個人計算機進入了成熟的多媒體計算機時代。各種計算機外設産品日益齊備,數字影像設備爭奇鬥豔,視音頻處理硬件與軟件技術高度發達,這些都為數字視頻的流行起到了推波助瀾的作用。
數字視頻的采樣
  根據電視信號的特徵,亮度信號的帶寬是色度信號帶寬的兩倍。因此其數字化時可采用幅色采樣法,即對信號的色差分量的采樣率低於對亮度分量的采樣率。用y:u:v來表示yuv三分量的采樣比例,則數字視頻的采樣格式分別有4:1:1、4:2:2和4:4:4三種。電視圖像既是空間的函數,也是時間的函數,而且又是隔行掃描式,所以其采樣方式比掃描儀掃描圖像的方式要復雜得多。分量采樣時采到的是隔行樣本點,要把隔行樣本組合成逐行樣本,然後進行樣本點的量化,yuv到rgb色彩空間的轉換等等,最後才能得到數字視頻數據。
數字視頻的標準
  為了在pal、ntsc和 secam電視製式之間確定共同的數字化參數,國傢無綫電咨詢委員會(ccir)製定了廣播級質量的數字電視編碼標準,稱為ccir 601標準。在該標準中,對采樣頻率、采樣結構、色彩空間轉換等都作了嚴格的規定,主要有:
  1、采樣頻率為f s=13.5mhz
  2、分辨率與幀率
  3、根據f s的采樣率,在不同的采樣格式下計算出數字視頻的數據量:
  這種未壓縮的數字視頻數據量對於目前的計算機和網絡來說無論是存儲或傳輸都是不現實的,因此在多媒體中應用數字視頻的關鍵問題是數字視頻的壓縮技術。
smpte表示單位
  通常用時間碼來識別和記錄視頻數據流中的每一幀,從一段視頻的起始幀到終止幀,其間的每一幀都有一個唯一的時間碼地址。根據動畫和電視工程師協會smpte(society of motion picture and television engineers)使用的時間碼標準,其格式是:小時:分鐘:秒:幀,或 hours:minutes:seconds:frames。一段長度為00:02:31:15的視頻片段的播放時間為2分鐘31秒15幀,如果以每秒30幀的速率播放,則播放時間為2分鐘31.5秒。
  根據電影、錄像和電視工業中使用的幀率的不同,各有其對應的smpte標準。由於技術的原因ntsc製式實際使用的幀率是29.97fps而不是30fps,因此在時間碼與實際播放時間之間有0.1%的誤差。為瞭解决這個誤差問題,設計出丟幀(drop-frame)格式,也即在播放時每分鐘要丟2幀(實際上是有兩幀不顯示而不是從文件中刪除),這樣可以保證時間碼與實際播放時間的一致。與丟幀格式對應的是不丟幀(nondrop-frame)格式,它忽略時間碼與實際播放幀之間的誤差。
視頻壓縮基本概念
  視頻壓縮的目標是在盡可能保證視覺效果的前提下減少視頻數據率。視頻壓縮比一般指壓縮後的數據量與壓縮前的數據量之比。由於視頻是連續的靜態圖像,因此其壓縮編碼算法與靜態圖像的壓縮編碼算法有某些共同之處,但是運動的視頻還有其自身的特性,因此在壓縮時還應考慮其運動特性才能達到高壓縮的目標。在視頻壓縮中常需用到以下的一些基本概念:
  (一)、有損和無損壓縮:
  在視頻壓縮中有損(lossy )和無損(lossless)的概念與靜態圖像中基本類似。無損壓縮也即壓縮前和解壓縮後的數據完全一致。多數的無損壓縮都采用rle行程編碼算法。有損壓縮意味着解壓縮後的數據與壓縮前的數據不一致。在壓縮的過程中要丟失一些人眼和人耳所不敏感的圖像或音頻信息,而且丟失的信息不可恢復。幾乎所有高壓縮的算法都采用有損壓縮,這樣才能達到低數據率的目標。丟失的數據率與壓縮比有關,壓縮比越小,丟失的數據越多,解壓縮後的效果一般越差。此外,某些有損壓縮算法采用多次重複壓縮的方式,這樣還會引起額外的數據丟失。
  (二)、幀內和幀間壓縮:
  幀內(intraframe)壓縮也稱為空間壓縮(spatial compression)。當壓縮一幀圖像時,僅考慮本幀的數據而不考慮相鄰幀之間的冗餘信息,這實際上與靜態圖像壓縮類似。幀內一般采用有損壓縮算法,由於幀內壓縮時各個幀之間沒有相互關係,所以壓縮後的視頻數據仍可以以幀為單位進行編輯。幀內壓縮一般達不到很高的壓縮。
  采用幀間(interframe)壓縮是基於許多視頻或動畫的連續前後兩幀具有很大的相關性,或者說前後兩幀信息變化很小的特點。也即連續的視頻其相鄰幀之間具有冗餘信息,根據這一特性,壓縮相鄰幀之間的冗餘量就可以進一步提高壓縮量,減小壓縮比。幀間壓縮也稱為時間壓縮(temporal compression),它通過比較時間軸上不同幀之間的數據進行壓縮。幀間壓縮一般是無損的。幀差值(frame differencing)算法是一種典型的時間壓縮法,它通過比較本幀與相鄰幀之間的差異,僅記錄本幀與其相鄰幀的差值,這樣可以大大減少數據量。
  (三)、對稱和不對稱編碼:
  對稱性(symmetric)是壓縮編碼的一個關鍵特徵。對稱意味着壓縮和解壓縮占用相同的計算處理能力和時間,對稱算法適合於實時壓縮和傳送視頻,如視頻會議應用就以采用對稱的壓縮編碼算法為好。而在電子出版和其它多媒體應用中,一般是把視頻預先壓縮處理好,爾後再播放,因此可以采用不對稱(asymmetric)編碼。不對稱或非對稱意味着壓縮時需要花費大量的處理能力和時間,而解壓縮時則能較好地實時回放,也即以不同的速度進行壓縮和解壓縮。一般地說,壓縮一段視頻的時間比回放(解壓縮)該視頻的時間要多得多。例如,壓縮一段三分鐘的視頻片斷可能需要10多分鐘的時間,而該片斷實時回放時間衹有三分鐘。
  (四)數字視頻壓縮說明
  如果使用數字視頻,需要考慮的一個重要因素是文件大小,因為數字視頻文件往往會很大,這將占用大量硬盤空間。解决這些問題的方法是壓縮—讓文件變小。
  使用文本文件,大小問題就顯得不那麽重要了,因為這樣的文件充滿了“空格”,可以大幅度壓縮—一個文本文件至少可以壓縮 90%,壓縮率是相當高的(壓縮率是指已壓縮數據與未壓縮數據之比值)。其他類型的文件,如 mpeg 視頻或 jpeg 照片幾乎無法壓縮,因為它們是用非常緊密的壓縮格式製成的。
  為什麽數字視頻要壓縮?
  數字視頻之所以需要壓縮,是因為它原來的形式占用的空間大得驚人。視頻經過壓縮後,存儲時會更方便。數字視頻壓縮以後並不影響作品的最終視覺效果,因為它衹影響人的視覺不能感受到的那部分視頻。例如,有數十億種顔色,但是我們衹能辨別大約 1024 種。因為我們覺察不到一種顔色與其鄰近顔色的細微差別,所以也就沒必要將每一種顔色都保留下來。還有一個冗餘圖像的問題—如果在一個 60 秒的視頻作品中每幀圖像中都有位於同一位置的同一把椅子,有必要在每幀圖像中都保存這把椅子的數據嗎?
  壓縮視頻的過程實質上就是去掉我們感覺不到的那些東西的數據。標準的數字攝像機的壓縮率為 5 比 1,有的格式可使視頻的壓縮率達到 100 比 1。但過分壓縮也不是件好事。因為壓縮得越多,丟失的數據就越多。如果丟棄的數據太多,産生的影響就顯而易見了。過分壓縮的視頻會導致無法辨認。
  壓縮視頻的時候,請始終嘗試幾種壓縮設置。目的是盡可能將數據壓縮到最小,當數據丟失到從畫面中能夠明顯看到時,再將壓縮率稍微嚮回調一點兒。這樣就可以在文件大小和畫面質量之間達到最佳平衡。不要忘記,每個視頻作品都各不相同—有些視頻經過高度壓縮後看上去仍不錯,有些卻不是,所以您需要通過試驗才能得到最好的效果。
  位速說明
  位速是指在一個數據流中每秒鐘能通過的信息量。您可能看到過音頻文件用 “128╟kbps mp3” 或 “64╟kbps wma” 進行描述的情形。kbps 表示 “每秒千字節數”,因此數值越大表示數據越多:128╟kbps mp3 音頻文件包含的數據量是 64╟kbps wma 文件的兩倍,並占用兩倍的空間。(不過在這種情況下,這兩種文件聽起來沒什麽兩樣。原因是什麽呢?有些文件格式比其他文件能夠更有效地利用數據,64╟kbps wma 文件的音質與 128╟kbps mp3 的音質相同。)需要瞭解的重要一點是,位速越高,信息量越大,對這些信息進行解碼的處理量就越大,文件需要占用的空間也就越多。
  為項目選擇適當的位速取决於播放目標:如果您想把製作的 vcd 放在 dvd 播放器上播放,那麽視頻必須是 1150 kbps,音頻必須是 224 kbps。典型的 206 mhz pocket pc 支持的 mpeg 視頻可達到 400 kbps—超過這個限度播放時就會出現異常。
  壓縮策略
  可以用多種不同的方法和策略壓縮數字媒體文件,使之達到便於管理的大小。下面是幾種最常用的方法:
  心理聲學音頻壓縮
  心理聲學 一詞似乎很令人費解,其實很簡單,它就是指“人腦解釋聲音的方式”。壓縮音頻的所有形式都是用功能強大的算法將我們聽不到的音頻信息去掉。例如,如果我扯着嗓子喊一聲,同時輕輕地踏一下腳,您就會聽到我的喊聲,但可能聽不到我踏腳的聲音。通過去掉踏腳聲,就會減少信息量,減小文件的大小,但聽起來卻沒有區別。
  心理視覺視頻壓縮
  心理視覺視頻壓縮與和其對等的音頻壓縮相似。心理視覺模型去掉的不是我們聽不到的音頻數據,而是去掉眼睛不需要的視頻數據。假設有一個在 60 秒的時間內顯示位於同一位置的一把椅子的未經壓縮的視頻片段,在每幀圖像中,都將重複這把椅子的同一數據。如果使用了心理視覺壓縮,就會把一幀圖像中椅子的數據存儲下來,以在接下來的幀中使用。這種壓縮類型—叫做“統計數據冗餘”—是 wmv、mpeg 和其他視頻格式用於壓縮視頻並同時保持高質量的一種數學竅門。
  無損壓縮
  無損 一詞的意思是“不丟失數據”。當一個文件以無損格式壓縮時,全部數據仍然存在,這與壓縮文檔很相似—文檔文件雖然變小了,但解壓縮之後每一個字都還存在。您可以反復保存無損視頻而不會丟失任何數據—這種壓縮衹是將數據壓縮到更小的空間。無損壓縮節省的空間較少,因為在不丟失信息的前提下,衹能將數據壓縮到這一程度。
  有損壓縮
  有損壓縮丟棄一些數據,以便獲得較低的位速。心理聲學壓縮和心理視覺壓縮是有損壓縮技術,壓縮結果是文件變小,但包含的源數據也更少。每次以有損文件格式保存文件時,都會損失很多數據—即使用同一種格式保存也是如此。一條好的經驗是,衹在項目的最後階段纔使用有損壓縮。
數字視頻的格式
  mpeg-1
  用於傳輸1.5mbps數據傳輸率的數字存儲媒體運動圖像及其伴音的編碼,經過mpeg-1標準壓縮後,視頻數據壓縮率為1/100-1/2 00,音頻壓縮率為1/6.5。mpeg-1提供每秒30幀352*240分辨率的圖像,當使用合適的壓縮技術時,具有接近傢用視頻製式(vhs)錄像帶的質量。 mpeg-1允許超過70分鐘的高質量的視頻和音頻存儲在一張cd-rom盤上。vcd采用的就是mpeg-1的標準,該標準是一個面嚮家庭電視質量級的視頻、音頻壓縮標準。
  mpeg-2
  主要針對高清晰度電視(hdtv)的需要,傳輸速率為10mbps,與mpeg-1兼容,適用於1.5-60mbps甚至更高的編碼範圍。 mpeg-2有每秒30幀704*480的分辨率,是mpeg-1播放速度的四倍。它適用於高要求的廣播和娛樂應用程序,如: dss衛星廣播和dvd,mpeg-2是傢用視頻製式(vhs)錄像帶分辨率的兩倍。
  dac
  即數/模轉裝換器,一種將數字信號轉換成模擬信號的裝置。 dac的位數越高,信號失真就越小。圖像也更清晰穩定。
  avi
  avi是將語音和影像同步組合在一起的文件格式。它對視頻文件采用了一種有損壓縮方式,但壓縮比較高,因此儘管面面質量不是太好,但其應用範圍仍然非常廣泛。a vi支持256色和rle壓縮。avi信息主要應用在多媒體光盤上,用來保存電視、電影等各種影像信息。
  rgb
   對一種顔色進行編碼的方法統稱為“顔色空間”或“色域”。“顔色空間”都可定義成一個固定的數字或變量。rgb(紅、緑、藍)衹是衆多顔色空間的一種。采用這種編碼方法,每種顔色都可用三個變量來表示-紅色緑色以及藍色的強度。記錄及顯示彩色圖像時,r gb是最常見的一種方案。但是,它缺乏與早期黑白顯示係統的良好兼容性。因此,件多電子電器廠商普遍采用的做法是,將rgb轉換成yuv 顔色空同,以維持兼容,再根據需要換回rgb格式,以便在電腦顯示器上顯示彩色圖形。
  yuv
  yuv(亦稱ycrcb)是被歐洲電視係統所采用的一種顔色編碼方法(屬於pal)。yuv主要用於優化彩色視頻信號的傳輸,使其嚮後兼容老式黑白電視。與r gb視頻信號傳輸相比,它最大的優點在於衹需占用極少的帶寬(rgb要求三個獨立的視頻信號同時傳輸)。其中“y”表示明亮度(lumina nce或luma),也就是灰階值;而“u”和“v”表示的則是色度(chrominance或chroma),作用是描述影像色彩及飽和度,用於指定像素的顔色。通過r gb輸入信號來創建的,方法是將rgb信號的特定部分疊加到一起。“色度”則定義了顔色的兩個方面-色調與飽和度,分別用cr和cb來表示。其中,c r反映了gb輸入信號紅色部分與rgb信號亮度值之間的差異。而cb反映的是rgb輸入信號藍色部分與rgb信號亮度值之同的差異。
  復合視頻和s-video
  ntsc和pal彩色視頻信號是這樣構成的--首先有一個基本的黑白視頻信號,然後在每個水平同步脈衝之後,加入一個顔色脈衝和一個亮度信號。因為彩色信號是由多種數據“疊加”起來的,故稱之為“復合視頻”。s -video則是一種信號質量更高的視頻接口,它取消了信號疊加的方法,可有效避免一些無謂的質量損失。它的 功能是將rgb三原色和亮度進行分離處理。
  ntsc、pal和secam
  基帶視頻是一種簡單的模擬信號,由視頻模擬數據和視頻同步數據構成,用於接收端正確地顯示圖像。信號的細節取决於應用的視頻標準或者"製式"--ntsc(美國全國電視標準委員會,national television standards committee)、pal(逐行倒相,phase alternate line)以及secam(順序傳送與存儲彩色電視係統,法國采用的一種電視製式,sequential couleur avec memoire)。在pc領域,由於使用的製式不同,存在不兼容的情況。就拿分辨率來說,有的製式每幀有625綫(50hz),有的則每幀衹有525綫(60 hz)。後者是北美和日本采用的標準,統稱為ntsc。通常,一個視頻信號是由一個視頻源生成的,比如攝像機、vcr或者電視調諧器等。為傳輸圖像,視頻源首先要生成-個垂直同步信號(v sync)。這個信號會重設接收端設備(pc顯示器),保徵新圖像從屏幕的頂部開始顯示。發出vsync信號之後,視頻源接着掃描圖像的第一行。完成後,視頻源又生成一個水平同步信號,重設接收端,以便從屏幕左側開始顯示下一行。並針對圖像的每一行,都要發出一條掃描綫,以及一個水平同步脈衝信號。
  另外,ntsc標準還規定視頻源每秒鐘需要發送30幅完整的圖像(幀)。假如不作其它處理,閃爍現象會非常嚴重。為解决這個問題,每幀又被均分為兩部分,每部分2 62.5行。一部分全是奇數行,另一部分則全是偶數行。顯示的時候,先掃描奇數行,再掃描偶數行,就可以有效地改善圖像顯示的穩定性,減少閃爍。目前世界上彩色電視主要有三種製式,即n tsc、pal和secam製式,三種製式目前尚無法統一。我國采用的是pal-d製式。
  ultrascale
  ultra6cale是rockwell(洛剋威爾)采用的一種掃描轉換技術。可對垂直和水平方向的顯示進行任意縮 放。在電視這樣的隔行掃描設備上顯示逐行視頻時,整個過程本身就己非常麻煩。而采用 ultrascale技木,甚至還能像在電腦顯示器上那祥,迸行類似的縱橫方向自由伸縮。
數字化影視基礎
  以下是對影視數字化以及桌面電影製作的一些基本概念的概括和介紹。
  數字化(digitizing)
  模擬視頻信號(以模擬攝象機拍攝的信號或者由膠片轉換成的模擬視頻信號)必須被轉換成數字信息,也就是被數字化,才能夠在電腦中對其進行操作。
  視頻捕捉卡(the video card)
  視頻捕捉卡需要占用電腦的一個擴充槽,視頻信號通過它由放像設備被捕捉入電腦。一般來說,視頻捕捉卡都附帶一個擴展塢,上面提供用以連接放像設備的各種插口。
  數字化的視頻信號所占硬盤空間都非常大,所以很多捕捉卡在採集視頻信號的同時對信號進行壓縮,以避免在cpu、數據橋(連接捕捉卡和電腦)以及寫入硬盤時可能出現的瓶頸。所謂的瓶頸,就是指當以上之中任何一個環節來不及處理輸入的信號,最直接的後果一般就是部分視頻內容(幀)的丟失。
  當視頻流被捕捉入電腦時,它將會被存儲為一個視頻文件。你可以通過你的視頻捕捉軟件指定一個幀速度,比如15幀,視頻捕捉軟件就會通過捕捉卡以每秒種1 5幅靜止畫面的速度將輸入的視頻信號保存到緩存中,然後將視頻文件寫入硬盤。
  最容易出現瓶頸的地方是硬盤。所以,安裝一個持續吞吐量盡可能高的硬盤非常重要,要知道,硬盤要連續處理的數據甚至比你想象的還要大。那些製作廣播級影視作品的人一般都使用磁盤陣列- -通過幾個硬盤的協作獲得最大的吞吐量。
  屏幕長寬比(aspect ratio)
  在電影和電視中,屏幕長寬比指的是屏幕的寬度和屏幕的高度的比例。大多數桌面電腦、普通電視係統的長寬比都是4:3。
  avi
  audio/video interleave(音頻/視頻隔行掃描)的縮寫。avi是windows下的指定視頻文件格式,也是pc係統中使用最為廣泛的視頻文件格式,同quick time和mpeg並稱為電腦的三大主流視頻技術。簡單說,avi以隔行掃描的視頻和音頻不斷交錯的方式工作。
  分量視頻信號(component video)
  將畫面按三個顔色通道(rgb)分成紅、緑和藍(附加亮度信號)三個單獨信號通道。産生的畫面質量較高,一般在廣播級視頻設備中被采用。
  合成視頻信號(composite video)
  將彩色信號、亮度信號和同步信號混合在一個信號通道內,在傢用視頻設備中被大量采用。
  壓縮(compression)
  壓縮是製作數字電影的一個重要感念。視頻和音頻在數字化過程中都可以通過電腦進行壓縮。當聲音和畫面被壓縮後,他們可以更高效的得到c pu的處理並減少視頻及音頻文件占用的硬盤空間。壓縮也是視頻在網絡上傳播的關鍵,必須將文件大小壓縮至帶寬允許的程度纔可以被用戶下載。
  壓縮比(compression ratio)
  圖象文件原始大小和經壓縮後圖象文件大小的比例。信號編解碼器(codec) 壓縮/解壓縮的運算法則。也就是壓縮與解壓縮所使用的壓縮標準(例如jpeg或者cinepak)。一般的編碼包括將模擬視頻信號轉換到壓縮視頻文件(比如m peg)或將模擬聲音信號轉變為數字化聲音(比如realaudio)。
  cpu
  中央處理器(central processing unit)。簡單的說就是電腦的"大腦",是最重要的微處理芯片,和主板及係統內存協同工作。
  數字化(digitize)
  將模擬信號轉變為數字信號的過程。
  信號丟失(dropout)
  由於磁帶金屬磁粉掉落引起的問題,一般是因為存放時間過長或誤操作引起的。信號丟失會造成畫面噪音、拖影以及不同步等問題。
  mpeg
   moving pictures experts group(運動畫面專傢小組)的縮寫。mpeg是一種運動畫面及聲音的壓縮標準。mpeg-1標準的視頻/音頻流的數據流量是150千比特每秒,和單倍速c d-rom的傳輸率相同。它通過設定關鍵幀並衹改變臨近幀畫面中的不同區域工作。
  網絡用戶總綫是macintosh電腦內部擴展槽的標準接口(專指視頻及音頻擴展卡)。新的mac電腦均開始使用intel的超級pci標準,所以你衹能在老的m ac機種上看到網絡用戶總綫的插槽。如果你計劃購買視頻或音頻擴展卡,並有一臺老式的mac電腦,請先確認你的電腦擁有什麽樣的插槽。網絡用戶總綫是由德州儀器公司( texas instruments)設計的。
  ntsc
  國傢電視標準委員會(national television standards commitee)的縮寫。是中北美洲及日本通用的電視製式,與歐洲的pal製式和法國的secam衹是相對。他的垂直分辨率有525綫,幀速為30(2 9.97)fps。
  pal
  逐行倒相(phase alteration line)的縮寫,是中國及歐洲大多數國傢通用的電視製式。具有更高的垂直分辨率(625綫),但是幀速相對慢於ntsc(25fps)。
  pci
  外接設備連接總綫(peripheral component interconnect)的縮寫,pci是奔騰電腦係統所使用的相當優秀的內置擴展接口(現在apple公司的powerpc也使用了這一總綫)。
  secam
   順序傳送彩色與記憶製(systeme electronique pour couleur avec memoire)的縮寫。是法國、俄羅斯和部分東歐及非洲國傢采用的電視製式。它和pal製式有着相同的垂直分辨率和幀速,但是secam置是的色彩是調頻信號調製的。
模擬視頻的世界
  視頻,簡單來說,用攝像機交將已經錄好的視頻進行無綫廣播或從錄像帶進行回放,像電流一樣在外界連續錄像(模擬信號),能看見各聽見視頻的內容都包含在這個信號內,通過某種製備按照一定的標準進行解碼。最普通的設備是一臺電視機各最普通的標準是ntsc(國傢電視標準委員會)和pal(逐行倒相製式)。在北美的ntsc主要用於工業,而在一些亞洲國傢,歐洲國傢和太平洋南岸在正常情況下都按照pal標準,不同的標準說明了為什麽不能在英國的電視上看到的視頻卻在美國正好相反,原因是缺少專業對口的設備。
  標準的視頻信號定義顔色有兩個係數。亮度和色度,亮度是黑白兩種顔色,適用控製圖像的對比度和亮度。ntsc各pal標準兩者都運用亮度和色度,使他們與任何視音頻信號混合一起,這類信號被叫做復合信號.如同將視頻的各個方面結合起來一樣,中一部分就是信號類型,成分各區分亮度和度度,並且通過控製顔色的不同值來達到更好的視頻質量。
  我們看到的圖像是電視顯像管內發出的一係列連續的綫,綫數的多少决定了視頻的質量,ntsc為525綫。pal為625綫。視頻信號慢公認的,它刷新這些綫進行瀏覽,象掃描那樣完全通過,如果它反過和升級後瀏覽,在顯示器重複的結果是60次/秒為ntsc。和50次/秒為pal製。在模擬視頻世界中,視頻表現為一係列連續波動的信號。
dsp的應用技術
  dsp是數字信號處理器的簡稱,在全球的數字化浪潮中,dsp以其高性能和軟件可編程等特點,長期對數字媒體處理起到了積極的推動作用。最初dsp的應用在於專業數據通信和語音處理,各種專用調製解調器、聲碼器、數據加密機初步獲得市場。其後dsp應用擴展到廣泛的民用産品,諸如硬盤驅動器、通用調製解調器、數字答錄機、無綫通信終端。九十年代中dsp在數字gsm手機應用和無綫基站應用中都獲得了巨大的成功。與此同時,dsp開始全面拓展到新興應用,並在寬帶通信、數字控製、數字音頻、數字視頻等衆多市場全球。現在,我們就dsp在數字視頻行業中的應用進行分析。
  視頻行業的數字化,是模擬世界中數字化較晚的行業之一。原因主要是因為模擬視頻的數字化産生巨大的數據量,造成應用的實現比較睏難。隨着互聯網的速度提高,數字視頻已經開始商業化,並逐步取代原來模式視頻的地位。
  最早實現數字視頻的行業是家庭消費的vcd和dvd,在90年代初vcd問世後帶來了人們在家庭娛樂的新模式,而最早實現vcd商業化的c-cube公司,其核心的mpeg1的解碼芯片就是基於dsp實現的專用芯片。
  數字視頻的發展,是隨着數字視頻標準的發展而發展,它將經歷數字化、網絡化和智能化的步驟發展,並且由此帶來無限的商機。數字化的階段其實就是一個標準化的階段,現階段國際兩大組織分別製訂了mpeg 標準和h.26x的標準,比如mpeg1的標準帶來了vcd的興起,mpeg2的標準帶來了dvd的商機,而h.261、h.263為可視電話製訂標準並為此形成網絡化時代的新興市場,數字視頻的標準也逐步開始統一,隨着mpeg4和h.264的推出,標準的統一將勢在必行。 現階段,dsp在數字視頻中將主要在數字監控、會議電視、可視電話、家庭媒體網關和數字基頂盒等領域得到很好的應用。
  數字監控係統在中國仍是一個的市場熱點,業內專傢預計今年國內需求將突破一百萬路。幾年來數字係統已經逐步取代傳統模擬係統,而今年基於mpeg4的數字係統又全面取代mpeg1係統,國內已經有領先廠商應用dsp推出基於h.264的數字係統並投入市場。在早期的mpeg1類産品中,視頻有專用芯片,dsp衹處理語音。在mpeg4及h.264類産品中dsp全面完成視頻和語音處理工作。 相比較asic而言,數字監控行業在dsp平臺上進行視頻産品開發有以下幾方面的優勢:第一,用戶開發自由度更大,支持多種個性化開發,可以滿足市場不斷提出的新的要求,在第一時間提升産品性能,增強産品的競爭能力;第二,dsp處理能力強,可以在一個dsp上同時實現多路音視頻信號的壓縮處理,同時為了及時滿足應用的需要、還提供了很多視頻專用功能,比如視頻濾波、de-interlace處理、高分辨顯示輸出、osd功能等,甚至象網絡接口、ide接口都成為了視頻dsp的主要功能,這樣使進一步大幅度降低産品的成本成為可能(這一點很重要);第三,開發周期短,實現快速技術更新和産品換代;第四,芯片功耗低,對提高産品的穩定性提供可靠保障。
  現階段在數字視頻領域內,主要有以下一些dsp廠商:philips、equator、ti、adi、cradle等等。各傢廠商都有其特點,以下分別進行詳細的介紹:
  一、philips視頻處理dsp介紹:
  philips是最早開發視頻dsp的廠商之一,最早在1996年就推出了trimedia係列的第一款芯片tm-1000,當時主要的定位是數字電視方面的産品,隨後推出了tm-1100、tm-1300、pnx-1300(tm-1300改進版)係列。雖然在數字電視方面沒有取得很大的成功,但是pnx-1300係列芯片視頻監控産品中得到了大規模的應用,也算是無心插柳柳成蔭。隨後飛利浦推出pnx-1500係列,也同樣在視頻監控應用上面成為主流。下一步飛利浦還將推出pnx1700係列。現在主流的pnx1500主流的300m內頻,內部配有專門的媒體協處理器,在pnx1300係列的基礎上,解决了以前pnx1300係列中功耗過大的問題,增加了網絡口,ide接口,提供了開發信息化傢電和數字視頻設備的主要接口;提供led高分辨輸出、高清視頻輸出(1920x1080)視頻輸出;具有視頻濾波和de-interlace處理視頻處理單元;可以生成2d圖形加速器;內嵌看門狗並具有兩個reset 管腳。
  二、ti視頻處理dsp介紹:
  作為dsp行業的老大,隨着dsp在數字視頻行業的機會,ti的tms320dm64x係列也占據非常重要的地位。其實早在2000年,ti就推出針對數碼相機的專業圖像處理dsp:tms320dsc係列,並被一些廠商應用於motion jpeg的數字視頻算法中,隨後ti又推出tms320dm270和tms320dm320等在dsc係列改進的産品,在多媒體的便攜式播放器上有不錯的應用。而真正成為數字視頻的里程碑式的産品則是2003年ti發佈的tms320dm64x係列的視頻dsp産品,該産品以ti的c64x為核心處理器。以tms320dm642為例,它具有600m的處理能力,有3個video port,帶有pci和網絡接口,該産品功耗低,因此産品一經面世得到了數字視頻行業的強烈關註。2004年下半年tms320dm642開始批量供貨,國內一些著名的視頻監控廠商采用dm642推出更新原來采用pnx1300係列的産品。另外,ti還計劃不斷升級tms320dm64x的運算速度。預計到明年,ti還將推出內嵌arm9和c64x的數字視頻專用dsp,這將是業內非常期待的産品。
  三、adi視頻處理dsp介紹:
  作為在dsp領域內ti的最大競爭對手,2002年adi公司推出了blackfin係列dsp,其中的adsp-21535是一款合適的數字視頻應用的dsp,adsp-21535具有600mhz的核內時鐘,300mhz主頻,一個vp口,但是沒有預覽通道,接口資源也很豐富,blackfin係列的dsp采用雙mac的結構具有正交的類似risc的微處理器指令集,使單指令多數據和多媒體操作都引入單指令結構。這樣的dsp芯片結構不但易於編程,可以快速的信號處理和多媒體的處理,而且方便的擴展usb、pci i/o、uart、sport等接口。非常適合對視頻讀入,處理以及傳輸。adi最新的雙核adsp-21561也是專業視頻處理dsp領域內不容忽視的好産品。但是相比較philips和ti,adi的數字視頻dsp的劣勢在於能夠支持blackfin的第三方算法太少,這也是造成雖然blackfin的産品非常有特點,但是應用面要遠遠小於前面兩傢公司的一個主要原因。
  四、equator視頻處理dsp介紹:
  美國的equator公司,也是最早做數字視頻領域內的專業dsp廠商,equator最先推出的map-ca及隨後推出的bsp-15係列産品,在會議電視領域和數字基頂盒領域都得到很好應用,由於是專業的視頻dsp廠商,equator的産品也非常具有特點,以bsp-15為例:該芯片最高可達到400mhz的內頻,具有兩個視頻輸入口和音頻輸入口,一個視頻輸出口,但是該産品的最大缺點就是功耗太大,産品必須加散熱風扇,預計推出的bsp-16將會改變這一問題。
  另外,還有其他一些廠商也開始進入數字視頻應用dsp領域,諸如美國cradle technologies在推出ct3400後也將推出可對h.264/mpeg-4 avc格式的d1規格影像以30幀/秒進行編解碼的dsp。而lsi則另闢蹊徑,提供dsp內核的方式給專業的算法公司,這種方式也受到一些應用領域客戶的青睞。
  結束語:
  隨着數字時代的到來,視頻領域的數字化也必將到來。而dsp在數字視頻的應用發展也將起到越來越重要的作用,dsp技術的進步必將為人類帶來更多更大的便利,讓我們充滿期待的看着dsp在數字視頻領域的發展和應用。
相關詞
計算機mpeg視頻編碼微軟文件格式媒體壓縮格式解碼器
網絡IT信息論技術企業電子半導體
包含詞
數字視頻處理數字視頻監控數字視頻廣播
高清數字視頻數字視頻信號數字視頻光盤
數字視頻傳輸數字視頻錄像機數字視頻合成師
數字視頻的概述數字視頻的發展數字視頻的采樣
數字視頻的標準數字視頻的格式數字視頻特技機
數字視頻技術基礎數字視頻監控係統數字視頻監控網絡
SDI數字視頻矩陣切換器數字視頻創意設計與實現數字視頻測量應用技術
數字視頻技術及應用數字視頻策劃製作師dvd數字視頻光盤
數字視頻矩陣切換器數字視頻編解碼技術國傢工程實驗室天創恆達數字視頻技術開發(北京)有限公司
深圳雅圖數字視頻技術有限公司數字視頻(dv)策劃製作師甘肅因特數字視頻技術有限公司