Tíz éve még csak keveseknek adatott meg, hogy mozgóképekkel dolgozhassanak PC-n. Nagyon drágák voltak a digitális – akkor még standard vagy kis felbontású videokamerák –, és az analóg eszközök sem voltak épp olcsók. Ha utóbbi eszközzel rendelkeztünk, akkor viszont szükség volt egy viszonylag drága digitalizálóhardverre (DV-kameráknál FireWire-portra) is, no és a szoftvert sem adták még ingyen akkoriban. De ha mellékelték is az eszközhöz, sokáig csak nehézkesen lehetett szerkeszteni a felvételeket, az akkori merevlemezek kapacitása és a processzorok teljesítménye is szűkös volt a feladathoz.
Azóta már nemcsak a PC, de a videós készülékek is fejlettebbek lettek, így viszonylag olcsón juthatunk memóriakártyás és merevlemezes videorögzítő eszközökhöz. Egy korábbi cikkünkből (Mozgóképrögzítés nem videokamerával) viszont az is kiderült, hogy bizony videózni lehet egy közepes telefonnal, fényképezőgéppel és táblagéppel is, nem is mindig rossz minőségben. Az új eszközök eleve digitális formátumokban rögzítenek, de milyenekben?
Kezdetben vala az AVI?
Az első igazán elterjedt videós fájltípus PC-s berkekben az AVI (Audio Video Interleaved) volt. A Microsoft által 1992-ben bevezetett konténerformátumot azóta is sok szoftver használja. Az elnevezése arra utal, hogy szinkronban le lehet játszani a bele csomagolt hangot és képet, mivel a különféle hang- és képfolyamok kis szeletekre bontva párhuzamosan nyerhetők ki a fájlból az olvasás során.
Konténer lévén a formátum csak keretet ad a tulajdonképpeni kódolt mozgókép- és hanganyagokhoz, a lejátszóprogram dolga, hogy ismerje a fejlécben megadott kódolást és ennek megfelelően képes legyen értelmezni az anyagot. Ezt sok lejátszóprogram a Video for Windows rendszerre bízza, amely be- és kikódoló modulokat, úgynevezett kodekeket (codes=coder/decoder) bocsát a program rendelkezésére. Ha az adott jelfolyam kodekje szerepel a rendszerben, akkor egy közönséges lejátszóprogram is fel tudja dolgozni a képet, illetve hangot. Több mai sikeres lejátszó (például VLC Media Player) nem fordul a rendszerhez a kikódolásért, hanem belső rutinjaival oldja meg a feladatot, így nem kell megvásárolnunk és feltelepítenünk a rendszerkodekeket, megkímélve a Windowst egy rakás rendszerleíró adatbázis-beli bejegyzéstől.
Léteznek úgynevezett kodekcsomagok is (codec pack), ezek azonban illegálisan a rendszerből kiemelt elemek és bejegyzések gyűjteményei. Sok modult tartalmaznak, de számos esetben hibás működést eredményezhetnek, így a használatuk nem javasolt. Legális módon legtöbbször valamilyen videoszerkesztő szoftverrel egyetemben kerülnek kodekek a számítógépünkre, illetve sok megvásárolható egyesével is. Az AVI mellett más konténerformátumok lejátszásakor is igénybe vehetők a rendszer dekódoló szolgáltatásai. Ez annál is inkább örvendetes, mivel az AVI sok modern kihívásra nincs felkészülve: nem tartalmazza a kép oldalarányát (aspect ratio), a pontos időkódok – ez a műsorszóró iparban alapvető igény – az AVI módosított formátumaiban alkalmazhatók. Nem képes változó képismétlés kezelésére, valamint a mozgások tömörítésében korlátozottak a lehetőségek.
Tömörített, de mennyire?
A Lumiére testvérek óta a mozgókép – analóg és digitális formáit tekintve is – állóképek sorozatából áll. Hogy a szem folyamatos mozgásként érzékelje a képváltásokat, ahhoz legalább 24 képkockát kell befogadnia másodpercenként (a képváltás mértékegysége az fps, azaz frame per second). Ez rengeteg információt jelent, hiszen egy kép standard felbontásban (PAL-tévérendszert alkalmazó területeken) 720×576 képpontból áll. Ha egyszerűen minden képpontra három színértéket (RGB) és ezzel három bájtot szánnánk, akkor egy egyórás mozgókép-anyag (csak a kép) az említett felbontásban, 25 képismétléssel és pixelenként három bájttal 720×576×25×3×3600 = 111 974 400 000 bájtnyi, azaz majdnem 112 gigabájtnyi tárterületet igényelne.
Ez megengedhetetlenül sok az adatátviteli sebesség korlátai miatt is, így nem véletlen, hogy mind a színinformációkat, a képkockán belül a részleteket, illetve a képkockák közötti változásokat tömörítik. Veszteségmentes videokódolás tehát nincs, a kérdés, hogy mennyit vesztünk.
Ma a jobb fogyasztói kamerák is csak 1080 soros felbontással dolgoznak, de a digitális mozaikban már rendelkezésre áll a 4K-s technológia is
Az emberi látás sokkal inkább érzékeny a világosság változásaira, mint a színre, sok mindennel elboldogulunk színvakon is, ezért már az analóg videózásban is kettéválasztják a képet világosságra és színjelekre, több sávszélességet, illetve tárterületet hagyva az előbbinek. A világosságadatok (Y) mellé kiegészítőként társulnak a színkülönbség-adatok (Cr és Cb, azaz a vörös és kék), e módszer valamilyen válfaja használatos a digitális, JPEG alapú (például DV, M-JPEG és mindegyik MPEG) videokódolás során is. Általában négy képponthoz a négy világosságinformáció mellett csak kevesebb színinformáció található.
A szín-mintavételezést rendszerint a világosságjel, a horizontális és vertikális színfelbontás arányának megadásával jellemzik (például 4:1:1 a DV-kamerák esetében, 4:2:2 a DVCPRO 50-nél, 4:2:0 a HDV és AVCHD esetében és akár 4:4:4, azaz teljes színfelbontás egyes H.264 és MPEG-4 AVC variánsoknál). Az átalakítások nem éppen egyszerűek, elég, ha tudjuk, hogy minél több színinformációt tárolunk, annál kevésbé lehetnek a tömörített képeken a kontúrok mentén színszellemképek, áthallások.
A legelső mozgóképes formátumok nem tettek mást, mint egy rakás (gyakorlatilag) JPEG-kódolással készült állóképet sorakoztattak fel egymás után. A JPEG-kódolás a képen belüli ismétlődéseket kihasználja tömörítéskor és – beállítástól függően – jelentős mennyiségű részletet elhagy. Ilyenek például a DV AVI és az M-JPEG (Motion JPEG), előbbivel a Digital8 és MiniDV szalagos kamerák felvételeiként, utóbbival analóg forrásból digitalizáló régebbi rendszerek esetében találkozhatunk. A csak képkockán belüli (intraframe) tömörítés előnye, hogy nincs szükség a következő kockák előolvasására és kis számítási teljesítményű számítógéppel (akár egy 1 gigahertzes, Pentium III-alapú PC-vel) is szerkeszthetők megfelelően fürge előnézettel. Hátránya, hogy a tömörítés nem terjed ki a közeli képkockákban található hasonlóságok kihasználására, így egy óra DV-felvétel (hanggal együtt) mintegy 13 GB tárterületet igényel.
Színminta-vételezések balról jobbra javuló minőség szerint rendezve. A bal oldali minta a DV-kamerák, a jobb oldali a H.264 High profillal készült kereskedelmi anyagok minőségét tükrözi
Sokkal kevésbé pazarlók azok a formátumok, amelyek ugyanazokat a blokkokat képesek az előző vagy következő képkockákon belül más pozícióban felhasználni, azaz a mozgásokat tömöríteni. Ez nagyon erőteljes megtakarítást tesz lehetővé, hisz ugyanazok a blokkok – például egy alak, arc, felirat – akár több száz képen keresztül is megjelenik a képen, csak másutt, esetleg minimális különbségekkel. Ilyenek az MPEG-1/2/4 és hasonló formátumok, például a MOV konténerekben is használatos H.264. Valamennyinek előnye a takarékosabb tömörítés, hátrányuk viszont, hogy a lejátszás és a kódolás még inkább erőforrás-igényes. Számos alfajuk létezik – például internetes lejátszásra vagy DVB-T műsorszórásra optimalizált –, és nagyon sok múlik a mozgások visszaadásában a kódolón.
Megjegyzendő még, hogy itt is, akárcsak a hangkódolók esetén, megkülönböztetnek fix és változó bitarányú kódolást (a bitarány mutatja meg, hogy másodpercenként hány kilobit tárterületre, illetve adatátviteli teljesítményre, sávszélességre van szükség a használathoz). A fix bitarány sokszor követelmény az olyan statikus átviteli teljesítményt nyújtó rendszereknél, mint a tévés műsorszórás vagy a DV-kamerák szalagos rögzítőegysége. Fix bitarány esetén a mozgalmasabb jelenetek leképezésénél sem lépheti túl a kódoló a határt és az abszolút eseménytelen, gyakorlatilag sávszélességet alig igénylő álló témáknál sem takaríthat meg semmit. A változó bitarány viszont igen, cserébe nagyfokú előolvasás szükséges hozzá, és – hacsak erre a videofolyamot nem készítik fel megfelelően – megnehezíti a „csévélést” is.
Videoszerkesztéshez, lemezalbumokhoz
Ma már kevesen használnak szalagos analóg videokamerát, de ha mégis, akkor szükség van egy digitalizáló hardverre (erről a Digitalizáljuk analóg emlékeinket videós részében részletesen tájékozódhatnak). Ha M-JPEG kódolású AVI-t digitalizálunk, akkor még egy ma kissé elmaradtnak számító Pentium 4-es konfigurációval és egy megfelelő szoftverrel (például Ulead, Corel Video Studio vagy Pinnacle Studio) is szinte valós időben tudjuk majd szerkeszteni. Ha a végcél a jó öreg DVD-album, akkor várnunk kell egy órát az összeállítás átkódolására (a DVD MPEG-2 formátumot használ).
Megkímélhetjük magunkat ettől a plusz várakozástól, ha a gép van olyan erős, hogy röptömörítéssel rögtön DVD-kompatibilis MPEG-2 kódolással menti el a digitalizálás során a jeleneteket. Ha csak nagyon gyenge konfiguráció állna rendelkezésünkre, akkor segíthet egy MPEG-2 kódolóchipet tartalmazó digitalizáló hardver.
Hasonló a szituáció, ha Digital8- vagy MiniDV-szalagot használ a videokameránk. A DV-szalagon 25 megabites sávszélességgel rögzíti a kamera az anyagokat; ezt a mozgóképfolyamot minimális átalakítással (átkódolás nélkül) képes a rögzítőprogram a merevlemezre FireWire-porton áttölteni. Az eredmény egy DV AVI fájl, ami strukturálisan nagyon hasonló az M-JPEG-hez, csupán lényegesen több helyet foglal. Ugyanaz elmondható, mint az M-JPEG-nél: könnyen szerkeszthető és várnunk kell az átalakításra DVD-készítésnél. Szerencsére a fentebb felsorolt szoftverekben is rendelkezésre áll a rögzítés közbeni valós idejű DV-MPEG-2 átalakítás, amit érdemes elvégezni, ha erőteljesebb (legalább 2,4 GHz-es Pentium 4 vagy jobb) konfiguráción dolgozunk.
Ha kis teljesítményű gépen kell standard felbontású anyagokat készíteni, akkor ma is a DV-videókamerák vethetők be a legkisebb gépigény mellett, csak legyen elég nagy merevlemezünk
A szalag kényelmetlenségétől – csévélés, szekvenciális, játékidővel megegyező időtartamú digitalizálás, illetve áttöltés – nem kell szenvednünk, ha MiniDVD-alapú kamerát használunk. Ezek a DVD kis méretű, 8 centiméteres átmérőjű változatával dolgozó készülékek mára már nemigen találhatók a gyártók kínálatában, de a DVD-lejátszók hőskorában – néhány éve – még kényelmes alternatívát jelentettek, hiszen natív DVD-VR/+VR formátumban vagy DVD-RAM-ra vettek fel, a lemez lezárás után pedig azonnal lejátszható egy asztali DVD-lejátszóban, illetve DVD-felvevőben. Az újraírható lemezek magukban is szerkeszthetők PC-ről megfelelő szoftverrel, de kiragadhatjuk a mappastruktúrából a VRO állományt, amely a legtöbb esetben a merevlemezre másolva és MPG-re átnevezve szerkeszthető is.
Végül elérkeztünk a jelenhez, amelynek alapját a beépített mini merevlemezek, flashmemóriák, valamint flashmemória-kártyák képezik, no meg a legmodernebb tömörítő algoritmusok. Merevlemezes, memóriakártyás és beépített memóriás videokamerák és fényképezőgépek sora áll rendelkezésünkre, de ezeket is lassan kiszorítják az egészen használható kamerával ellátott okostelefonok vagy akár táblagépek.
Míg a régebbi telefonokban csak a 3GP kódolású, maszatos, kis felbontású videók készítésére volt jobbára lehetőség, a mai készülékek legalább VGA-felbontású, MPEG-4 kódolású videót rögzítenek, leggyakrabban MOV konténerben vagy rögtön AVCHD mappastruktúrában (MPEG-4 AVC, illetve H.264 kódolással). Mindkét rendszert ismerik a szerkesztőalkalmazások és ma már a videomegosztó oldalak is képesek konvertálni ezekből a formátumokból. Az AVCHD mappa egy DVD-lemezhez hasonlóan fejezetinformációkat és bélyegképeket is tartalmaz, és közvetlenül választhatók ki ezek importáláskor például a Pinnacle Studio-ban vagy más korszerű szoftverben.
A legújabb cserélhető objektíves rendszerek szinte mind biztosítanak kiváló minőségű full HD (1080p) videofelvételi lehetőséget, AVCHD, vagy M-JPEG formátumban
A memóriaalapú kamerák zömében már beállíthatunk progresszív felvételeket, így szakíthatunk az analóg televíziózás terhelő örökségével, a váltott soros (interlaced) kódolással. Az interlaced struktúrájú felvételek (ilyen származik analóg, DV- vagy DVD-alapú kamerákból) a tévéadás hagyományos leképezését követve felváltva tartalmazzák a teljes kép páros és páratlan sorszámú sorait. A két félkép között egy kis időkülönbség (1/50 másodperc) van, így ha nem katódsugárcsöves tévén játsszuk le az anyagot, akkor a kontúrok az alakok mozgásától szaggatottá válhatnak. Érdemes progresszív kódolást használni, vagy az interlaced anyagot újrakódolni egy deinterlace (kifésülő) szűrő használatával (például az ingyenes VirtualDUB vagy AVIdemux szoftverek használatával), mielőtt felküldenénk azt a YouTube-ra.
Ha szerkeszteni is kívánunk egy MPEG-4 kódolású felvételt, akkor a videokamerán vagy fényképezőgépen a lehető legjobb minőséget (legmagasabb bitarányt) állítsuk be, mert a vágás és szerkesztés minőségromlással jár. A modern, MPEG-4-alapú felvételekkel elkerülhetetlen a konverzió egy DVD készítésekor, de akkor nem biztosan, ha a cél egy AVCHD album vagy írható Blu-ray lemez. Ha az MPEG-4 szabványos változatát, valamelyik H.264 profilt alkalmazzuk és amennyiben a szoftver felismeri, illetve beállítható, akkor a felvételt átkódolás nélkül használhatjuk fel.
Érdemes felmérni a számítógépünk erejét, mielőtt full HD-felbontású és MPEG-4-alapú anyagok lejátszásába kezdenénk – fokozottan igaz ez, ha szerkeszteni is szeretnénk. Egy óvatosabb H.264 profillal készült 12 megabites bitarányú felvétel lejátszása is feladja a leckét egy kétmagos gépnek, a 24-25 megabites, 50p (50 Hz-es és progresszív) anyagok pedig már négy processzormagért és GPU-támogatást élvező lejátszó- és szerkesztőprogramért kiáltanak. Ha nincs PC-s erőművünk otthon, akkor érdemesebb inkább visszavenni a felvételi beállításokat, különben a szerkesztés során még előnézeti képet sem kapunk elfogadható csúszással a videoszerkesztő szoftverben.
A táblázat teljes méretéhez kattintson a képre!
A sorozat többi cikke:
- Digitális hangok
- Digitális képek