|
下一代開放式多媒體應用平台(OMAP)綜述
本文概要介紹了開放式多媒體應用平台(OMAP)的軟、硬體結構,討論了OMAP的一些重要的結構特性、功能,並針對如何滿足目前和今後用戶對PDA、手機、數位相機、相機、MP3/AAC播放器等多媒體應用的需求提出了方案,同時還討論了在OMAP中整合所有這些應用的可能性,最後對三種流行多媒體處理器OMAP、Xscale和DragonBall進行了比較,指出了三者的差異和獨特性。
/ \: d, c- a, |5 F z5 h' r7 x: m' k$ m% x" |" `# `
: C" N5 t+ T0 `- z將多媒體應用整合在一個元件中,因而支援高速有線和無線通訊應用這一趨勢已越來越明顯。最新的2.5G和3G手機就是一個很好的例子,它們整合了MP3音訊和MPEG4視訊等多媒體功能。手機對多媒體應用的要求主要是由3G網路帶動的,該網路可以提供遠高於現有網路的頻寬,因而使傳輸視訊流成為可能,同時也為展開其他多媒體業務提供了機會。通常情況下,這類多媒體內容豐富的應用都需要一個微控制器來執行作業系統(OS),管理人機介面(MMI)並執行其他一些常規任務。此外,還需要一個數位訊號處理器(DSP)來完成繁重的數學處理任務,例如語音編碼、視訊解碼、音訊解碼等。因此,在大多數基於多媒體的應用中都應將這些任務分散到不同的處理器中去。 : P) M4 W6 |1 a& a" r& T
" m0 f3 e+ ]/ O) r8 E4 B, f* ]
" l$ b3 A1 p. N1 T2 ]
然而,有些半導體設計商更願意採用單處理器方案來處理這類複雜的多媒體問題。他們的方案是在一個帶內建加速器和再使用器的RSIC處理器上執行這些多媒體應用。這種處理器確實可以完成這類功能,但這並非解決多媒體問題的最佳方法。如果數據處理和訊號處理合二為一,那麼想要對數據和訊號採用不同的數學精密度或者採用不同的工具來處理就會變得很不方便。晶片也會因為要完成很多它並不擅長的功能而不得不消耗很高電能。而且,單晶片方案為將來的擴展留下的空間也很小。當元件中同時執行多項任務時,對時間要求嚴格的多媒體處理任務會被賦予最高的優先級。這樣,要在多媒體處理和響應MMI輸入這兩項任務之間切換時,就可能存在問題。因為單處理器方案必須將目前工作環境保存下來才能安排執行MMI任務,同時它還必須保證不錯過任何對即時性的要求,因此,作業系統將疲於應付多媒體應用不斷成長的需求,結果導致對MMI的響應速度變慢。
+ r0 \5 i) J2 M8 D8 H* O2 i6 M+ H1 d9 v7 B# K/ ^
0 v, Z8 L! z1 d. ?; U1 k開放式多媒體應用平台(OMAP)處理器內含一個增強型ARM處理器(ARM925)和TI公司最新研製出的低功耗定點DSP(TMS320C55x)。設計這一雙核心元件的目的就是為了有效處理多媒體應用和MMI應用。在這兩個核心中,ARM925用於執行作業系統(OS),而DSP用於處理所有多媒體應用。將兩個核心放在一個289接腳的晶片中,這樣不但節約電路板空間,而且可以降低功耗和成本。除了這兩個功能強大的核心外,OMAP元件中還備有各種各樣的片上週邊設備,使用戶能夠以一種幾乎無縫的方式與USB、UART、藍芽元件以及GSM模組等通用元件介面。下面分別討論OMAP元件的具體細節。 ! z9 x- @& G2 j. I0 ]: c
# Y+ ^! P, f/ j$ q i. O s' q
7 [& b& o, Y0 K, \% [6 EOMAP硬體結構概述
% y: U( k' @- k. `+ U; l9 R: G) c6 B8 j3 T) d
( j4 |7 ?' X5 i- d' H' JOMAP平台由一個微處理器子系統(ARM),一個DSP子系統,一個記憶體介面流量控制器、一些專用的多媒體應用週邊設備(MWA)和一個多工介面構成。OMAP中每個核心的最高執行速度都可達到150MHz,並且都可以隨作業頻率的降低而作出相應改動以節約功耗。ARM既支援32位元也支援16位元(Thumb模式)指令集。C55x DSP內有5組數據匯流排,在一個周期內允許三次讀取作業和兩次寫入作業。C55x最獨特的一點就是它具備雙MAC結構,並且其內部具有一個硬體圖形加速器。綜上所述,C55x DSP是一款高度複雜但功能強大的,專為基於多媒體的即時應用而設計低功耗元件。
9 K/ }) M% m/ n& P+ ~
1 Z/ w2 W" ^/ K8 K: f$ `5 X+ g4 j: ~/ d9 h
流量控制器(TC)用於控制對外部記憶體的存取,其最高工作頻率為75MHz。TC提供三個介面,它們分別叫做外部記憶體快速介面(EMIFF),外部記憶體慢介面(EMIFS)和內部記憶體介面(IMIF)。其中,EMIFF可與SDRAM連接,而EMIFS只能與快閃記憶體和速度稍慢的ROM連接。OMAP內還有192K的內部記憶體,由ARM和DSP共享。但只有ARM才能配置DSP中的MMU(記憶體映射單元),因而決定DSP應以怎樣的方式存取這些資源。TC可以看作儲存資源的守衛,由它內部的仲裁器來決定哪個核有權利存取這些資源,以及是否可以讓兩個核同時存取這些資源。
- b% o, ?& P0 T# w! ^) `, w0 F% o6 M i& o' O& v# y, K
+ N, w" Z- F, v* ]* S
為了加速數據存取速度以及執行外部記憶體內的代碼,C55x DSP中加入了數據和程式緩衝記憶體。ARM中有一個16KB的程式緩衝記憶體和一個8KB的數據緩衝記憶體。而DSP中只有一個24KB的程式緩衝記憶體。在OMAP中央有一個高性能的9通道系統直接記憶體存取器(DMA)。這個9通道DMA允許在不同的埠間傳送數據,而無需ARM干涉。DMA可作業的埠包括EMIFF、EMIFS、IMIF和周邊元件。在這個9通道DMA的頂端,有一個LCD控制器的專用DMA通道,它可以將數據從IMIF或EMIFF傳送到LCD埠。 $ p ^! G3 f7 s3 \4 _
5 a8 f5 }+ t6 h, k1 I" A; e; P: ~
OMAP元件中有品種豐富的片上週邊設備,這些週邊設備可分為DSP專用週邊設備、DSP公共週邊設備、MPU/DSP共享週邊設備、MPU公共週邊設備和MPU專用週邊設備,其中有些週邊設備只能用於DSP或ARM,其他的則可由二者共享。有了這些週邊設備,OMAP元件就可以和各種各樣的儲存媒介介面,例如多媒體卡、SD卡、SONY記憶卡以及各種符合串列介面標準的記憶體。此外,OMAP還能作為一個USB1.10主控器,因而基於OMAP的元件就可以直接利用印表機列印相片,而無需接一台PC機。
5 y( n0 T7 ~5 A" d6 P5 l% U& i: O/ n2 E
& k! v& s e3 }) ROMAP中的兩個核心透過幾組週邊設備匯流排存取周邊元件。注意,每一個核心都有專用的週邊設備匯流排,這些匯流排又與其他匯流排連接,以實現元件內完全互聯。核心對週邊設備的存取就是這樣控制的。例如,MPU橋和DSP專用週邊設備間就沒有週邊設備匯流排連接。有一個週邊設備很值得注意,這就是共享週邊設備組中的郵箱週邊設備。這些郵箱既可以透過MPU存取,也可以透過DSP存取。這種基本用法的目的是為了方便在處理器內進行通訊。每個核心都有專用郵箱,這些郵箱可以用來給另一個核心發送消息,也可以用來產生中斷。 " j" p6 S3 M: {5 j# J* v
6 P! c0 @6 }; v3 P& G
3 M; v9 ~3 V! k$ l
OMAP軟體概述 ( P( {) h' p" ~
8 |3 t* g( Y! b- R! ?% G6 `4 N N$ X, U* q0 D7 l# x
前面我們從整體上討論了OMAP的硬體結構和週邊設備,現在我們來討論OMAP處理器的軟體開發平台。OMAP的軟體結構是按幾種風格來設計,可以滿足從系統開發商、多媒體引擎開發商到DSP算法開發商的全方位的需要。下面我們將從一個高級系統開發商的角度來解釋該軟體結構。
5 M, X- n* H$ @7 `8 P# W. O7 Q7 Z0 o+ s. t- i0 x2 f, ^
8 c8 g7 p! x3 o" C$ L+ L& V* B# S' T
儘管OMAP是一個雙核心元件,但基於ARM的用戶並不需要知道元件中還有DSP。他們可能希望開發環境仍與單核心處理器時的開發環境相同。應用軟體開發商也會希望在一個特定的商作為業系統下開發其應用軟體。換句話說,他們希望將DSP完全抽離出來。於是,為了使元件中DSP的存在變得透明,TI導入了DSP橋和多媒體引擎(多媒體網路閘道)的概念。DSP橋為ARM和DSP設立鏈接,可將其看作同時存在於兩個核心中的軟體層。這�不詳細討論DSP橋的具體細節,但應該知道,DSP橋主要用來向ARM上執行的多媒體引擎導出一組API,以便其存取DSP資源。而多媒體引擎則向應用軟體導出一組標準API,這些API正是應用軟體開發商所熟悉的。
9 Q. I+ p3 G" E# I1 Y+ `* j. d8 _) N9 G4 W& l6 Q
# A' Y- [8 D1 v$ ^, [$ c在DSP端,DSP橋用於管理DSP資源和數據流,並向DSP算法提供介面。DSP上執行的算法可以是自行編制的,也可以是由專業算法設計商大量提供的現成算法。在大多數多媒體元件中,系統複雜度日益增大,開發日程也日漸緊縮,因此開發商更傾向於購買第三方軟體設計商提供的算法,而不願倉促地自己編寫。 , T3 b6 V2 d5 E* Z4 I3 Z4 }
. R# _! i8 X; S" G1 V# X; P
4 ~/ N: `; N( d1 f/ J' w& B對系統開發商而言,將購買的算法與自編算法整合在一起是一項非常艱巨的任務。不同的算法開發商都會有他們自己獨特的編寫算法的方式。這其中還包括對I/O介面和記憶體的不同用法。因此,在系統開發中,時間更多地被耗費在將不同廠商開發的算法整合起來,並力求使其合作順利,不出差錯。如果管理者決定為了增加產品功能而購買更多的算法,那麼情況會更糟。為了克服這一致命弱點,TI首先發起並開始領導一項算法標準定義工作,以管理DSP算法的編寫方式,並力圖使DSP算法具備類似‘即插即用’的特性。這就是eXpress DSP算法介面標準(eXpress DSP Algorithm Interface Standard),簡稱為xDAIS[2]。 6 T/ s1 r. a: g8 H5 K! j1 k* k* @
- L; d( G. [' C5 G/ d# E3 e' ~" F ]+ c% n
XDAIS相容的算法將按照一系列的規則設計,以便能夠在系統中實現無縫整合。欲了解更多更深入的xDAIS情況請參看http://dspvillage.ti.com上的白皮書。下面回到我們的討論主題,DSP端的DSP橋為xDAIS相容的DSP算法提供一個介面,我們稱其為節點。圖1中詳細描繪了OMAP的軟體結構。 . h$ I0 J! g& F( A* F' q/ @+ Q5 ]8 I
8 s, z0 \3 u* G/ l4 e
; [. j: r1 O( m2 SDSP橋內的資源管理器(RM)上存有一個資料庫,庫中存放了DSP上所有節點的資訊。當某個應用中涉及多媒體處理任務時,RM會在DSP上為其製作一個節點,然後向ARM申請記憶體。一旦主機得知該節點的存在及其提出的記憶體要求,ARM就會針對這個多媒體任務初始化該節點。接著,RM開始執行應用,於是DSP中的節點就開始執行多媒體任務。沒有數據時DSP是不會開始進行處理的,對DSP橋而言也是如此。當ARM決定停止該任務時,它會發送一個指令以釋放DSP上的任務節點,然後DSP就將釋放該節點佔用的所有記憶體資源。這就為執行其他任務留出了空間,同時也方便了動態圖像加載類系統的實現。
" i7 z# f6 O& a" O1 M% M7 e$ T3 ?/ v9 I4 \) [
E" M! h* r! C3 n在開始執行一項多媒體任務時,應用軟體開發商只需完成一個他們很熟悉的函數調用,例如PlayMp3(song.mp3),系統就會播放MP3歌曲。其他的一切都由多媒體網路閘道和DSP橋處理。OMAP中採用了一種三步型軟體模型,即製作、執行和刪除。有關網路閘道的三步型軟體模型的概要可參看圖2。 ! @) t6 c* J ~$ {
8 |5 T* j& x8 o/ [
. M0 m# u" `; i( B1 y1 y6 b
OMAP的結構將軟體開發商分為三種:應用軟體開發商、DSP算法開發商和多媒體引擎‘中介軟體’開發商。應用軟體開發商著力於設計和實現傳統的作業系統應用,而DSP算法開發商則設計和實現xDAIS相容的訊號處理演算法並完成即時DSP處理任務。最後,‘中介軟體’開發商則致力於將各種DSP算法整合在主系統╱DSP系統,並使它們成為應用軟體設計商的可用材料。
4 ~; H& O9 \8 o( S% F8 [: I, F4 u0 S0 C+ Q& }
4 b& c! a9 L' i8 w3 Y& h6 L0 E( v
OMAP和現有多媒體處理器的比較
& a6 H$ u' f7 ~/ n/ K
$ ]0 N. o& @& b' c( ^* j
) {4 p% K( ^: Y% P! D市場上還有一些處理器與OMAP有類似的功能,例如英特爾的Xscale處理器和摩托羅拉的DragonBall處理器。這三款處理器中均包含一塊ARM處理器。與具備複雜指令集算法(CISC)結構的處理器相較,這三款處理器能提供更加方便的配置以支援各種I/O需求。我們可以藉由研究這些ARM處理器的內部結構來更清楚地探討他們之間的差異。 ! O `9 }$ i( ^
5 n& J2 b2 f% q. t0 X0 `6 B. |1 B. y; A
英特爾XScale(PXA250)是一款基於高性能低功率StrongARM 2系列處理器的增強版的處理器。StrongAR 2最初由ARM和Digital Equipment公司聯合開發,如今英特爾也有此類產品。英特爾的ARM處理器Xscale屬於第五版ARM系列處理器,它是我們談到的這三款處理器中緩衝記憶體最大的一款,內有32K位元組的指令緩衝記憶體和32K位元組的數據緩衝記憶體。此外,英特爾這一款基於ARM的處理器內部還有一塊工作頻率可達400MHz的DSP。 0 k6 _1 ^4 f' }. q S
. M- ~# o5 f& V ^1 J- I0 K8 r7 ~. Q* \7 q7 z2 p) M/ `5 ]
OMAP5910處理器內有一個ARM9TDMI 3(第四版)核心,TI利用TI925T增強了其控制功能和高級OS功能,因而該處理器能提供很高的處理能力而不會犧牲電池壽命。該處理器既支援32位元指令集也支援16位元指令集(Thumb 4模式),內有一個16K位元組的指令緩衝記憶體和一個8K位元組的數據緩衝記憶體。此外,處理器內還有一個帶64通道的轉換後備緩衝器(translation look-aside buffer)和17字寫緩衝的記憶體管理單元,既可管理數據又可管理程式。 6 m6 w" q) T; r0 ^9 C
7 i; c7 E# q" f2 o6 @; P& _: V+ a' y5 @& R
摩托羅拉DragonBall(MC9328MX1)處理器則內含一個ARM920T(第四版)處理器,該處理器也是在ARM9TDMI核心的基礎上設立起來的。MC9328MX1也支援32位元和16位元兩種指令集模式(Thumb 4模式),內有一個16K位元組的指令緩衝記憶體和一個16K位元組的數據緩衝記憶體,這個數據緩衝記憶體比TI OMAP的大。同時,MC9328MX1與OMAP5910類似,也有一個記憶體管理單元。 0 U( I+ W6 ?. H* j- V0 D- m4 Y
& S8 x- l2 S, g) J6 j+ w, A0 X
1 S6 k* T. Z2 z0 k9 V" U; x: s6 q% U
TI OMAP的強項就在於他具備全面的硬體加速器,可處理視訊、圖像、音訊和語音應用。而且,OMAP中還採用一塊專用DSP以應付手持式應用中的訊號處理需求。毫無疑問,基於ARM的處理器當然也能進行快速的乘法和加法運算,但這些處理器並不具備循環緩衝、位反轉、平行移位和硬體循環等針對DSP的尋址功能,這就使其在代碼最佳化方面處於嚴重劣勢。此外,OMAP處理器C5000上可用的DSP應用軟體也比基於ARM的處理器多。
5 Y8 } s$ ^" i: J& H8 x$ D3 W6 @) a. M
$ M* J- d$ R& u. ~/ }
以上談到的這三個公司在處理器的設計上也採用了截然不同的方案:TI採用了DSP協同處理器來增強元件中DSP的功能,英特爾採用了具備增強的DSP性能的單RISC處理器,摩托羅拉則採用了多媒體加速器來加速那些基於DSP的應用的執行速度。TI在設計處理器時考慮了兩組開發者:應用軟體開發商和DSP軟體程式員。這種考慮就使得不同的軟體供應商能夠各自提供應用程式和軟體,由Code Composer Studio在這些不同的開發平台間提供橋接,因而實現應用程式及軟體之間的對接。英特爾和摩托羅拉則不同,他們依靠一個通用的開發平台來實現其應用。這種統一的開發環境有它的優點,它提供的代碼比TI的雙重編程環境簡單。但隨著Code Composer Studio(CCS)最新版本的發佈,雙平台編程方式開始變得越來越完整,而且它能夠比統一開發平台更加方便有效地區分RISC和DSP的代碼。
" I8 o& z# L( |6 b, \; ?7 c t p. J* D, B6 A, b8 D
: I9 o; \; E5 o( d$ \' ]9 Q
處理器的功能是由支援它的工具箱決定的。OMAP具備完善的DSP工具箱(包括編譯器、匯編器、鏈接器、加載器、具有高級圖形顯示和探測特性的除錯器、晶片支援庫和DSP/OS)、庫、DSP算法標準和第三方軟體網路的支援。同時,OMAP還解除了軟體開發和管理,以及利用平行除錯管理器(PDM)對應用軟體和DSP軟體進行除錯這三者之間的相互依賴性。 ; B0 E" G1 s2 X( W& p5 n
( ?& v O) {6 w
% b- X$ C, b' h# Y# U, J0 @
從傳統的硬體和軟體設計看來,在現有的處理器基礎上建構一個新的設計通常比重新去設計一個處理器更具吸引力。我們前面講到的這些元件都是在已經成功應用的處理器基礎上建構的,也就是基於ARM的元件和DSP。OMAP為將傳統的基於DSP的產品整合在嵌入式系統中提供了新的思維。C55x處理器的高MIPS、低成本和低功耗已經使其成為一款成功的並獲得廣泛應用的DSP晶片。將它與ARM925整合後又構成了一個綜合了RISC和DSP優點的開發平台,因而能夠非常有效地處理數據和訊號。 0 q5 X5 {! w. @. `% T% ^. o& Y
& u9 ]8 O# U) T* m: B- o5 [
X' u# m: [& }( ?0 ^3 s$ l6 X這三款多媒體處理器所附帶的週邊設備控制器總的來說基本類似,這主要是因為他們所採用的基於ARM的RISC處理器所提供的支援特性基本相同。但不同的是,OMAP中的C55x處理器還能提供對McBSP、DMA控制器、中斷處理器、定時器等週邊設備的獨特的支援,因而OMAP能夠支援更多的I/O元件,在今後的應用中擴展空間也更大。
) A+ e4 M' [% Z: v* _- E$ z" @7 j, `& s: s8 ]8 R
- ^6 f' \2 w2 b% vOMAP的應用前景 $ _0 m7 y1 h5 J& I% B; ]
9 n$ D) [; c. D4 U o) R
0 p3 {) g; J6 UOMAP可以用來開發和擴展手機的功能,使其包含多媒體應用功能,然而OMAP的功能決不僅限於開發手機,許多用傳統的處理器無法實現的應用都可以用OMAP來實現。OMAP的推出,使許多激動人心的應用開始浮出檯面,有待人們開發。圖4中列出了一些可以用OMAP實現的應用。這些應用不但要求強大的處理能力,同時也要求低功耗,而OMAP獨特的硬體和軟體結構恰好能夠滿足這些要求。不僅如此,OMAP的獨特性還使得這種開發具有更大的潛力。
9 S7 b# B- `8 t$ U1 j) T6 h3 U1 V) K3 j9 L! s# ~
# n# E( b# i3 H- ]9 D, ~8 O! A參考文獻
/ P/ _3 e/ r( ?
8 I: [, U% i. g% b' ?! B6 {5 }
/ x9 \' B6 I( T, @5 a' q8 W. |8 S[1] Texas Instruments, "OMAP Data Manual", Literature / _9 Z1 X' H6 h! q4 G
T% c- _/ M( z. U
Number SPRS197, June 2002
S5 K) e& X7 g' [3 r8 }0 u! A# y- z( O& l) j5 `
: Y: ^3 M6 `( d9 `! i) O[2] Texas Instruments, "The TMS320 DSP Algorithm Standard" " a: ?( F5 O2 s. N4 [( u" }, |0 X+ c
- {+ U% A) d$ P& W, m+ [! eLiterature Number SPRA 581, Nov 2000 ! S# I) Z# l( U8 G3 a
) Q, M4 p, z, i+ U7 j
5 S/ L( R% C& M9 A) w; ~致謝: 作者要感謝Kwee-Song Lim先生(德州儀器新加坡市場主任),是他鼓勵和建議作者完成本文。 + c8 b; _9 f k! N+ @& M. N. d+ j( }+ ~' n
! M" [8 N, Y% K7 G/ ~1 D0 t
# D$ P+ i2 H' [$ k5 c作者:Francis Kua % H8 l$ |5 f* W) V, b& l
8 P5 K" `% O, E8 V. P. ~) v# m0 J
" |8 A" r6 K, B( ZFAE
9 g8 F0 w5 F" @/ Z: x0 {4 b. `
; s2 F) ?: D% [5 z1 s, g
d/ P5 o1 Z4 h5 Z5 x6 Z; B* CMeng-Tong Wong
/ a6 y$ x/ P4 ^8 k& w8 U9 ~
8 {' G. p, A, t h& s" R! i$ e8 |! T, N# e
FAE經理 ; p1 I, i% q4 g/ @0 {/ h) V
# }: K4 {- O. j0 ]1 A" o6 C0 \7 _9 c, E! \ V3 k p1 [" }
德州儀器新加坡分公司 8 K* C2 V- ~. @8 x; M! v
4 g" {- B0 @7 r, y" g5 E0 P. T$ E! ] X: O# N/ d/ P9 m; m
Woon-Seng Gan
: N0 r7 ^% A' G- B& X! D% L, m; y: p0 w( J) U
9 H+ y1 N% [$ @+ v3 P( D+ E
新加坡南洋理工大學
) Y! o' E: A* F J# r; m+ `* q
5 A1 ?) [! B) D3 Z( U[ 本帖最後由 masonchung 於 2008-4-24 01:18 AM 編輯 ] |
本帖子中包含更多資源
您需要 登錄 才可以下載或查看,沒有帳號?申請會員
x
|