mp4有什么特點(diǎn)
mp4有什么特點(diǎn)
MP4是一套用于音頻、視頻信息的壓縮編碼標(biāo)準(zhǔn),那么你對MP4了解多少呢?下面就讓學(xué)習(xí)啦小編來給你科普一下什么是mp4。
mp4的分部
MPEG-4由一系列的子標(biāo)準(zhǔn)組成,被稱為部 (part)(有時(shí)也譯為卷),包括以下的部分:
第一部分(ISO/IEC 14496-1):系統(tǒng):描述視訊和音頻數(shù)據(jù)流的控制、同步以及混合方式(即混流 Multiplexing,簡寫為MUX)。
第二部分(ISO/IEC 14496-2):視訊:定義了一個(gè)對各種視覺訊息(包括自然視訊、靜止紋理、計(jì)算機(jī)合成圖形等等)的編譯碼器。(例如XviD編碼就屬于MPEG-4 Part2)
第三部分(ISO/IEC 14496-3):音訊:定義了一個(gè)對各種音頻訊號(hào)進(jìn)行編碼的編譯碼器的集合。包括高階音頻編碼(AdvancedAudio Coding,縮寫為AAC)的若干變形和其他一些音頻/語音編碼工具。
第四部分(ISO/IEC 14496-4):一致性:定義了對本標(biāo)準(zhǔn)其他的部分進(jìn)行一致性測試的程序。
第五部分(ISO/IEC 14496-5):參考軟件:提供了用于演示功能和說明本標(biāo)準(zhǔn)其他部分功能的軟件。
第六部分(ISO/IEC 14496-6):多媒體傳輸整合框架(DMIF for Delivery Multimedia IntegrationFramework)
第七部分(ISO/IEC 14496-7):優(yōu)化的參考軟件:提供了對實(shí)作進(jìn)行優(yōu)化的例子(這里的實(shí)作指的是第五部分)。
第八部分(ISO/IEC 14496-8):在IP網(wǎng)絡(luò)上傳輸:定義了在IP網(wǎng)絡(luò)上傳輸MPEG-4內(nèi)容的方式。
第九部分(ISO/IEC 14496-9):參考硬件:提供了用于演示怎樣在硬件上實(shí)作本標(biāo)準(zhǔn)其他部分功能的硬件設(shè)計(jì)方案。
第十部分(ISO/IEC 14496-10):進(jìn)階視訊編碼或稱高階視訊編碼(Advanced Video Coding,縮寫為AVC):定義了一個(gè)視訊編譯碼器(codec)。AVC和XviD都屬于MPEG-4編碼,但由于AVC屬于MPEG-4 Part10,在技術(shù)特性上比屬于MPEG-4Part2的XviD要先進(jìn)。另外,它和ITU-T H.264標(biāo)準(zhǔn)是一致的,故又稱為H.264。
第十二部分(ISO/IEC 14496-12):基于ISO的媒體文件格式:定義了一個(gè)儲(chǔ)存媒體內(nèi)容的文件格式。
第十三部分(ISO/IEC 14496-13):知識(shí)產(chǎn)權(quán)管理和保護(hù)(IPMP for Intellectual Property Management andProtection)拓展。
第十四部分(ISO/IEC 14496-14):MPEG-4文件格式:定義了基于第十二部分的用于儲(chǔ)存MPEG-4內(nèi)容的視訊文件格式。
第十五部分(ISO/IEC 14496-15):AVC文件格式:定義了基于第十二部分的用于儲(chǔ)存第十部分的視訊內(nèi)容的文件格式。
第十六部分(ISO/IEC 14496-16):動(dòng)畫框架擴(kuò)充功能(AFX : Animation Framework eXtension)。
第十七部分(ISO/IEC 14496-17):同步文字字幕格式。
第十八部分(ISO/IEC 14496-18):字型壓縮和串流傳輸(針對開放字型格式 Open Font Format)。
第十九部分(ISO/IEC 14496-19):合成材質(zhì)流(Synthesized Texture Stream)。
第二十部分(ISO/IEC 14496-20):簡單場景表示(LASeR for Lightweight Scene Representation。
第二十一部分(ISO/IEC 14496-21):用于描繪(Rendering)的MPEG-J拓展。
第二十二部分(ISO/IEC 14496-22):開放字型格式(Open Font Format)。
第二十三部分(ISO/IEC 14496-23):符號(hào)化音樂表示(Symbolic Music Representation)。
第二十四部分(ISO/IEC 14496-24):音頻與系統(tǒng)互動(dòng)作用(Audio and systems interaction)。
第二十五部分(ISO/IEC 14496-25):3D圖形壓縮模型(3D GraphicsCompression Model)。
第二十六部分(ISO/IEC 14496-26):音訊一致性檢查:定義了測試音頻數(shù)據(jù)與ISO/IEC 14496-3是否一致的方法(Audioconformance)。
第二十七部分(ISO/IEC 14496-27):3D圖形一致性檢查:定義了測試3D圖形數(shù)據(jù)與ISO/IEC14496-11:2005, ISO/IEC 14496-16:2006, ISO/IEC 14496-21:2006, 和 ISO/IEC14496-25:2009是否一致的方法(3D Graphicsconformance)。
Profiles是在每個(gè)部分內(nèi)定義的,所以對某個(gè)部分的一個(gè)實(shí)作通常不是對該部分的完整實(shí)作。
MPEG-1、MPEG-2、MPEG-7和MPEG-21是由MPEG制定的其他MPEG標(biāo)準(zhǔn)。
mp4的特點(diǎn)
(1)對于不同的對象可采用不同的編碼算法,從而進(jìn)一步提高壓縮效率;
(2)對象各自相對獨(dú)立,提高了多媒體數(shù)據(jù)的可重用性;
(3)允許用戶對單個(gè)的對象操作,提供前所未有的交互性;
(4)允許在不同的對象之間靈活分配碼率,對重要的對象可分配較多的字節(jié),對次要的對象可分配較少的字節(jié),從而能在低碼率下獲得較好的效果;
(5)可以方便的集成自然音視頻對象和合成音視頻對象。
mp4的標(biāo)準(zhǔn)構(gòu)成
MPEG-4碼流主要包括基本碼流和系統(tǒng)流,基本碼流包括音視頻和場景描述的編碼流表示,每個(gè)基本碼流只包含一種數(shù)據(jù)類型,并通過各自的解碼器解碼。系統(tǒng)流則指定了根據(jù)編碼視聽信息和相關(guān)場景描述信息產(chǎn)生交互方式的方法,并描述其交互通信系統(tǒng)。
系統(tǒng)
MPEG-4系統(tǒng)把音視頻對象及其組合復(fù)用成一個(gè)場景,提供與場景互相作用的工具,使用戶具有交互能力。
MPEG-4的數(shù)據(jù)在3個(gè)層中進(jìn)行傳輸,這3層分別是壓縮層、同步層和傳輸層。其中,壓縮層是執(zhí)行媒體解碼的系統(tǒng)組件,接收從同步層傳來的壓縮數(shù)據(jù),并完成解碼操作。同步層負(fù)責(zé)各個(gè)壓縮媒體的同步和緩沖,一方面接收來自傳輸層的同步層數(shù)據(jù)包(SL),從流中提取同步數(shù)據(jù),為以后的同步解碼和基本流解碼的合成做準(zhǔn)備;另一方面,實(shí)現(xiàn)壓縮的數(shù)據(jù)流和同步信息封裝層的同步數(shù)據(jù)包,并將它們傳輸?shù)絺鬏攲?。傳輸層完成各種傳輸協(xié)議的描述,使用DMIF應(yīng)用接口,通過接口定義數(shù)據(jù)流的傳輸接口,并定義信道建立和斷開的信號(hào)。MPEG-4的系統(tǒng)終端模型如圖所示。
音頻
與MPEG-1、MPEG-2相比,MPEG-4不僅支持自然聲音(如語音和音樂),還支持合成聲音(如MIDI)。MPEG-4音頻部分將音頻的合成編碼和自然聲音的編碼相結(jié)合,并支持音頻的對象特征。
MPEG-4研究比較了現(xiàn)有的各種音頻編碼算法,支持2~64kbit/s的自然聲音編碼。如8kHz采樣頻率的2~4kbit/s的語音編碼,以及8kHz或16kHz采樣頻率4~16kbit/s的語音編碼,一般采用參數(shù)編碼;而6~24kbit/s的語音編碼,一般采用碼激勵(lì)線性預(yù)測(CELP,CodeExcitedLinearPredictive)編碼技術(shù);而16kbit/s以上碼率的編碼.則采用視頻變換編碼技術(shù)。這些技術(shù)實(shí)質(zhì)上借鑒了G723、G728以及MPEG-1和MPEG-2等。下圖給出了
MPEG-4音頻支持2~64kbit/s信道語音編碼范圍。
MPEG-4引入兩個(gè)有力的編碼技術(shù):文本到語音編碼(TTS,Text-to-Speech)和樂譜驅(qū)動(dòng)合成語音編碼。事實(shí)上,合成語音編碼技術(shù)是一種基于知識(shí)庫的參數(shù)編碼技術(shù)。樂譜驅(qū)動(dòng)合成技術(shù)中,解碼器由一種特殊的合成語言—結(jié)構(gòu)化音頻管弦樂團(tuán)語言(SAQL,StructuredAudioOrchestraLanguage)驅(qū)動(dòng)。“管弦樂團(tuán)”由不同“樂器”組成,解碼器不具有某“樂器”時(shí),MPEG-4還允許解碼器從編碼器下載該“樂器”以恢復(fù)合成聲音。
視頻
MPEG-4支持對自然和合成視覺對象的編碼。合成視覺對象包括2D、3D動(dòng)畫和人面部表情動(dòng)畫等。對于靜止圖像,MPEG-4采用零樹小波算法,以提高壓縮比,同時(shí)還提供多達(dá)11級(jí)的空間分辨率和質(zhì)量的可伸縮性。對于運(yùn)動(dòng)視頻對象的編碼,MPEG-4的編碼結(jié)構(gòu)如下圖所示,包括形狀編碼、運(yùn)動(dòng)補(bǔ)償和文理編碼。其中的主要技術(shù)是運(yùn)動(dòng)估計(jì)補(bǔ)償、DCT變換和混合的DPCM等。
看過“mp4有什么特點(diǎn)”的人還看了: