Informatika | Grafika » Granc Róbert - MPEG

Alapadatok

Év, oldalszám:1998, 3 oldal

Nyelv:magyar

Letöltések száma:96

Feltöltve:2010. június 22.

Méret:45 KB

Intézmény:
-

Megjegyzés:

Csatolmány:-

Letöltés PDF-ben:Kérlek jelentkezz be!



Értékelések

Nincs még értékelés. Legyél Te az első!


Tartalmi kivonat

M.PEG Mi az MPEG? Az MPEG a Nemzetközi Szabványügyi Hivatal/Nemzetközi Elektrotechnikai Bizottság (International Standards Organisation/International Electrotechnical Commission (ISO/IEC)) digitális video- és audiotömörítés szabványait kidolgozó albizottságának munkacsoportja. Pontosabban, az MPEG szabályozza az alacsony sávszélességű (mozgó) kép- és hangátvitel szabványát és az ehhez alkalmazkodó dekóderek (kitömörítők/lejátszók) működését. Az MPEG nem határozza meg a tömörítés algoritmusát. Ez teszi lehetővé a tömörítőprogramok állandó fejlődését és a különleges alkalmazásokhoz való alkalmazkodását, az átvitel-szabvány határain belül. A videó- és hangtömörítés mellett az MPEG előírja az adatfolyam és a kitömörítés szabványosságát ellenőrző tesztek módszereit és nyilvánosságra hozza a technikai beszámolókat. Hogyan működik az MPEG-1 és az MPEG-2 hangtömörítés? Az MPEG hangtömörítés

"érzékelésen alapuló" hangtömörítés, nem "hullámforma-tömörítés". Az érzékelésen alapuló hangtömörítésnél a tömörítő nem próbálja pontosan megőrizni a jelet a tömörítés és kibontás folyamán, inkább az a célja, hogy az emberi hallgató számára egyformán szóljon a kimeneti jel. Az első pszichoakusztikus hatás, melyet az érzékelésen alapuló hangtömörítés alkalmaz, az ún. "hallásbeli takarás" (auditory masking), amelynél a jel egyes részei nem hallhatóak az emberi hallás működése következtében. E nem hallható részek eltávolításához a tömörítő egy pszichoakusztikus modellt alkalmaz. Ez a modell folyamatos, egymást követő időszeleteken belül elemzi a bejövő jelet és frekvencia-transzforálással minden egyes szeletre külön-külön határozza meg a bejövő jel hullámhossz szerinti összetételét. Ezekután az emberi hallásküszöböt modellezve megbecsüli a még hallható

hangszintet. A meghatározás és a tömörítés folyamatában a tömörítőegység úgy próbálja meghatározni az adatbitek számát, hogy az megfeleljen mind a sávszélesség mind a takarás követelményeinek. A bitek hullámhossz-összetétel szerinti eloszlását maga az adatfolyam tartalmazza mellékinformációként. A kibontóegység sokkal kevésbé összetett, hiszen sem a pszichoakusztikus modellezés, sem a bitmeghatározás folyamatára nincs szüksége. Egyetlen feladata az, hogy a tömörített hullámhossz-összetevők és a kapcsolt mellékinformációk alapján rekonstruálja a (hang) jelet. A fázisok Két különböző dolgot kell még megkülönböztetnünk. Először is, az MPEG fázisokban dolgozik Ezeket a fázisokat áltlában arab számokkal jelöljük (MPEG-1, MPEG-2, MPEG-4). Az első fázis, az MPEG-1 csak egycsatornás (mono)- és kétcsatornás sztereó hangok tömörítésével foglalkozott, az általában jó minőségűnek nevezett

mintavételezési frekvenciákkal (48, 44.1 és 32 kHz) A második fázis két különböző munkapontot tartalmazott. Az első az alacsonyabb mintavételezési frekvenciák támogatása, jobb hangminőséget nyújtva így nagyon alacsony sávszélesség mellett (64 kbit/s alatt egy mono csatorna számára). A második munkapont a többcsatornás hang megvalósítása. Mind az MPEG-1-nek, mind az MPEG-2-nek háromrétegű (layer) a felépítése. Ezek a rétegek a tömörítő algoritmusok egy-egy családját képviselik. A rétegeket általában római számokkal jelölik, vagyis (általános angol kifejezéssel) Layer I., Layer II és Layer III néven nevezik őket. Az MPEG-2 keretén belül dolgoznak az ún. "fejlett hangtömörítés" (Advanced Audio Coding, AAC) területén is, amely visszafelé nem kompatibilis tömörítés (Non-BackwardCompatible (NBC) coding). Ez a munka előreláthatólag 1997-ben ér véget Az AAC nem nyújt beépített "visszafelé

kompatibilis" módszert. A rétegek A különböző rétegeknek mind megvan a saját érdemük. Alapvetően az I rétegtől a III felé haladva növekszik az összetettség. Az I réteg a legkevésbé összetett és különösen olyan alkalmazásoknál megfelelő, ahol fontos szerepet játszik a tömörítő egyszerűsége. A II. réteg összetettebb tömörítőegységet igényel és valamivel összetettebb kibontóegységet is, és általában az "egy a többnek" alkalmazások felé irányul, ahol egy tömörítőegység több dekódert is kiszolgál. Az I. réteghez képest több jelfelesleget tud eltávolítani és jóval hatásosabban alkalmazza a pszichoakusztikus hallásküszöb-modellt. A III. réteg még összetettebb és az alacsonyabb sávszélességű alkalmazások felé irányul, a kibővített frekvenciaszűrőkön alapuló további jelfelesleg-eltüntetéssel. Vége az elméletnek! Alapjában véve négy mód van hangjel tömörítésére. Monofonikus

- egyetlen hangcsatorna Duál-monofonikus - két független csatorna (hasonló a sztereóhoz) Sztereó - sztereó csatornák, amelyek megosztanak biteket, de nem használják a "kapcsolt sztereó" tömörítést "Kapcsolt sztereó" (joint stereo) - kihasználja a sztereó csatornák közötti kölcsönös összefüggéseket Az algoritmus lépései: Tekercsszűrés (??? convolution filter) alkalmazása hogy az audiojelet felosszuk a 32 kritikus hullámsávot közelítő "alhullámsávokra" --> "alhullámsáv-szűrés" (sub-band filtering) A szomszédos hullámsávok általi takarás meghatározása minden egyes hullámsávra a fenti eredmények felhasználásával (ezt nevezik a pszichoakusztikus modellnek). Ha a hullámsáv hangereje a takarásküszöb alatt van, nem kell kódolni. Egyébként meghatározni az együttható képviseletéhez szükséges bitek számát, méghozzá úgy, hogy a kvantálással született zaj ne lépje túl a

takarásküszöböt. (Emlékezzünk arra, hogy egy bites kvantálás kb. 6 dB zajt szül) Az adatfolyam formázása (Keretekbe osztja az adatot, minden keret 384 mintát tartalmaz, azaz 12 mintát mind a 32 szűrt alhullámsávból.) Layer I. (I réteg): DCT típusú szűrő egy kerettel és azonos frekvenciatartománnyal hullámsávonként. A pszichoakusztikus modell csak frekvenciatakarást használ Layer II. (II réteg): Három keret használata a szűrőben (előző, jelenlegi, következő, összesen 1152 minta). Ez kis időbeli takarást is modellez Layer III. (III réteg): Jobb szűrőket használ a kritikus hullámsávokhoz (nem egyenlő frekvenciák), a pszichoakusztikus modell időbeli takarást is tartalmaz, figyelembe veszi a "sztereó-redundanciát" és Huffman-féle tömörítést használ. Néhány érdekes web-oldal, ahol több információ lelhető az MPEG-Audióról: http://www.mpegorg/MPEG/audiohtml http://www.iisfhgde/audio/

http://www.philipscom/sv/newtech/mpeg/ http://www.mpeg-empoweredcom/ ftp://ftp.fhgde/pub/layer3/ Ezen szöveg angol eredetije a "The Definitive MP3 Benchmark" oldalról származik. (Kezdőoldala : http://www.mp3benchcom/) Fordította: Granc Róbert (rgranc@freemail.c3hu), 19980313