FMUSER Wirless lähettää videota ja ääntä helpommin!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albania
ar.fmuser.org -> arabia
hy.fmuser.org -> Armenian
az.fmuser.org -> azerbaidžanilainen
eu.fmuser.org -> baski
be.fmuser.org -> valkovenäläinen
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> katalaani
zh-CN.fmuser.org -> kiina (yksinkertaistettu)
zh-TW.fmuser.org -> Kiina (perinteinen)
hr.fmuser.org -> kroatia
cs.fmuser.org -> tšekki
da.fmuser.org -> tanska
nl.fmuser.org -> Dutch
et.fmuser.org -> viro
tl.fmuser.org -> filippiiniläinen
fi.fmuser.org -> suomi
fr.fmuser.org -> French
gl.fmuser.org -> galicialainen
ka.fmuser.org -> Georgian
de.fmuser.org -> saksa
el.fmuser.org -> Greek
ht.fmuser.org -> Haitin kreoli
iw.fmuser.org -> heprea
hi.fmuser.org -> Hindi
hu.fmuser.org -> Unkari
is.fmuser.org -> islanti
id.fmuser.org -> indonesia
ga.fmuser.org -> irlantilainen
it.fmuser.org -> Italian
ja.fmuser.org -> japani
ko.fmuser.org -> korea
lv.fmuser.org -> latvia
lt.fmuser.org -> Liettua
mk.fmuser.org -> makedonia
ms.fmuser.org -> malaiji
mt.fmuser.org -> maltalainen
no.fmuser.org -> Norja
fa.fmuser.org -> persia
pl.fmuser.org -> puola
pt.fmuser.org -> portugali
ro.fmuser.org -> Romania
ru.fmuser.org -> venäjä
sr.fmuser.org -> serbia
sk.fmuser.org -> slovakki
sl.fmuser.org -> Slovenian
es.fmuser.org -> espanja
sw.fmuser.org -> swahili
sv.fmuser.org -> ruotsi
th.fmuser.org -> Thai
tr.fmuser.org -> turkki
uk.fmuser.org -> ukraina
ur.fmuser.org -> urdu
vi.fmuser.org -> Vietnam
cy.fmuser.org -> kymri
yi.fmuser.org -> Jiddiš
(1) Videosignaalin redundanttitiedot
Ottaen esimerkkinä digitaalisen videon tallennuksen YUV-komponenttimuodon, YUV edustaa kirkkautta ja kahta värierosignaalia. Esimerkiksi nykyisessä pal-TV-järjestelmässä luminanssisignaalin näytteenottotaajuus on 13.5 MHz; kromisignaalin taajuuskaista on yleensä puolet tai vähemmän kirkkaussignaalista, joka on 6.75 MHz tai 3.375 4 MHz. Ottaen esimerkkinä näytteenottotaajuus 2: 2: 13.5, Y-signaali hyväksyy 6.75 MHz, kromisignaalit U ja V näytetään 8 MHz: llä ja näytteistyssignaali kvantisoidaan XNUMX bitillä, jolloin digitaalisen videon koodinopeus voidaan laskea seuraavasti:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216 Mbit / s
Jos näin suuri määrä dataa tallennetaan tai lähetetään suoraan, on vaikea käyttää pakkaustekniikkaa bittinopeuden vähentämiseksi. Digitaalinen videosignaali voidaan pakata kahden perusedellytyksen mukaan:
L. tietojen redundanssi. Esimerkiksi spatiaalinen redundanssi, ajan redundanssi, rakenteen redundanssi, informaation entropian redundanssi jne., Toisin sanoen kuvan pikselien välillä on voimakas korrelaatio. Näiden redundanssien poistaminen ei johda tiedon menetykseen, ja se on häviötöntä pakkaamista.
L. visuaalinen redundanssi. Jotkut ihmissilmien ominaisuudet, kuten kirkkauden erottelukynnys, visuaalinen kynnys, ovat erilaisia herkkyydelle kirkkaudelle ja kromalle, mikä tekee mahdottomaksi ottaa käyttöön asianmukaisia virheitä koodauksessa eikä niitä havaita. Ihmissilmien visuaalisia ominaisuuksia voidaan käyttää tietojen pakkaamiseen tietyillä objektiivisilla vääristymillä. Tämä puristus on häviöllistä.
Digitaalisen videosignaalin pakkaus perustuu kahteen yllä olevaan ehtoon, mikä tekee videodatasta suuresti pakatun, mikä suosii lähetystä ja tallennusta. Digitaalisen videon pakkaamisen yleisiä menetelmiä ovat sekakoodaus, joka on yhdistää muunnoskoodaus, liikkeen estimointi ja liikekompensointi sekä entropiakoodaus koodauksen pakkaamiseksi. Yleensä muunnoskoodausta käytetään kuvan kehyksen sisäisen redundanssin eliminoimiseksi, ja liikkeen estimointia ja liikkeen kompensointia käytetään kuvan kehysten välisen redundanssin poistamiseen, ja entropiakoodausta käytetään edelleen parantamaan pakkaamisen tehokkuutta. Seuraavat kolme pakkauskoodausmenetelmää esitellään lyhyesti.
(a) Pakkauskoodausmenetelmä
(b) Muunnoskoodaus
Muunnoskoodauksen tehtävänä on muuntaa avaruusalueella kuvattu kuvasignaali taajuusalueeksi ja koodata sitten muunnetut kertoimet. Yleisesti ottaen kuvalla on voimakas korrelaatio avaruudessa, ja muunnos taajuusalueeksi voi toteuttaa dekorrelaation ja energiakonsentraation. Yleinen ortogonaalimuunnos sisältää diskreetin Fourier-muunnoksen, diskreetin kosinimuunnoksen ja niin edelleen. Diskreettiä kosinimuunnosta käytetään laajalti digitaalisessa videopakkauksessa.
Diskreettiin kosinimuunnokseen viitataan DCT-muunnoksena. Se voi muuttaa L * l: n kuvalohkon avaruusalueesta taajuusalueeksi. Siksi DCT: hen perustuvan kuvan pakkaamisen ja koodauksen aikana kuva on jaettava päällekkäisiin kuvalohkoihin. Oletetaan, että kuvan koko on 1280 * 720, se on jaettu 160 * 90 kuvalohkoon, joiden koko on 8 * 8 ilman päällekkäisyyttä ruudukon muodossa. Sitten DCT-muunnos voidaan suorittaa jokaiselle kuvalohkolle.
Kun lohko on jaettu, kukin 8 * 8 pisteen kuvalohko lähetetään DCT-kooderiin, ja 8 * 8 kuvalohko muunnetaan spatiaalisesta alueesta taajuusalueeseen. Alla olevassa kuvassa on esimerkki kuvalohkosta, jonka koko on 8 * 8 ja jossa luku edustaa kunkin pikselin kirkkausarvoa. Kuviosta voidaan nähdä, että tämän kuvalohkon jokaisen pikselin kirkkausarvot ovat suhteellisen tasaiset, varsinkin vierekkäisten pikselien kirkkausarvo ei ole kovin suuri, mikä osoittaa, että kuvasignaalilla on vahva korrelaatio.
Varsinainen 8 * 8-kuvalohko
Seuraava kuva esittää edellisen kuvan kuvalohkon DCT-muunnoksen tuloksia. Kuviosta voidaan nähdä, että DCT-muunnoksen jälkeen vasemmassa yläkulmassa oleva matalataajuuskerroin keskittyy paljon energiaa, kun taas oikean alakulman korkean taajuuskertoimen energia on hyvin pieni.
Kuvalohkon kertoimet DCT-muunnoksen jälkeen
Signaali on kvantifioitava DCT-muunnoksen jälkeen. Koska ihmissilmät ovat herkkiä kuvien matalataajuuksisille ominaisuuksille, kuten esineiden kokonaiskirkkaudelle, eivät kuvan suuritaajuisille yksityiskohdille, joten lähetysprosessissa suurtaajuista tietoa voidaan lähettää vain vähemmän tai vähemmän, vain matalataajuinen osa. Kvantisointiprosessi vähentää tiedonsiirtoa kvantifioimalla matalataajuisen alueen kertoimet ja karkean kvantisoinnin suurtaajuusalueella, mikä poistaa korkean taajuuden informaation, joka ei ole herkkä ihmisen silmille. Siksi kvantisointi on häviöllinen pakkausprosessi ja tärkein syy videopakkauskoodauksen laatuvaurioihin.
Kvantifiointiprosessi voidaan ilmaista seuraavalla kaavalla:
Niistä FQ (U, V) edustaa DCT-kerrointa kvantisoinnin jälkeen; f (U, V) edustaa DCT-kerrointa ennen kvantisointia; Q (U, V) edustaa kvantisointipainotettua matriisia; q on kvantisointivaihe; kierros viittaa konsolidointiin, ja tuotettava arvo on lähin kokonaislukuarvo.
Valitse kvantisointikerroin kohtuullisesti, ja tulos muunnetun kuvalohkon kvantisoinnin jälkeen näkyy kuvassa.
DCT-kerroin kvantifioinnin jälkeen
Suurin osa DCT-kertoimista muutetaan arvoon 0 kvantisoinnin jälkeen, kun taas vain harvat kertoimet eivät ole nollan arvoja. Tällä hetkellä vain nämä nollasta poikkeavat arvot on pakattava ja koodattava.
(b) Entropiakoodaus
Entropiakoodaus on nimetty, koska keskimääräinen koodin pituus koodauksen jälkeen on lähellä lähteen entropia-arvoa. Entropiakoodaus toteutetaan VLC: llä (vaihtelevan pituinen koodaus). Perusperiaate on antaa lyhyt koodi symbolille suurella todennäköisyydellä lähteessä ja antaa pitkä koodi symbolille pienellä todennäköisyydellä, jotta saadaan lyhyempi keskimääräinen koodin pituus tilastollisesti. Vaihtelevan pituinen koodaus sisältää yleensä Hoffman-koodin, aritmeettisen koodin, ajokoodin jne. Ajon pituuden koodaus on hyvin yksinkertainen pakkausmenetelmä, sen pakkaustehokkuus ei ole korkea, mutta koodaus- ja dekoodausnopeus on nopea, ja sitä käytetään edelleen laajalti, erityisesti koodauksen muunnoksen jälkeen ajonopeuden koodauksella on hyvä vaikutus.
Ensinnäkin välittömästi kvantisoijan lähtö DC-kerrointa seuraava AC-kerroin on skannattava Z-tyypillä (kuten nuolirivillä on esitetty). Z-skannaus muuntaa kaksiulotteisen kvantisointikertoimen yksiulotteiseksi sekvenssiksi ja jatkaa sitten ajon pituuden koodausta. Lopuksi toista muuttuvan pituista koodia käytetään tietojen koodaamiseen ajon koodauksen jälkeen, kuten Hoffman-koodaus. Tällaisen vaihtelevan pituisen koodauksen avulla koodauksen tehokkuutta parannetaan edelleen.
(c) Liikkeen arviointi ja liikkeen kompensointi
Liikkeen estimointi ja liikkeen kompensointi ovat tehokkaita menetelmiä kuvasekvenssien aikasuunnan korrelaation eliminoimiseksi. Edellä kuvatut DCT-muunnos-, kvantisointi- ja entropiakoodausmenetelmät perustuvat yhteen kehyskuvaan. Näiden menetelmien avulla kuvan pikselien välinen spatiaalinen korrelaatio voidaan eliminoida. Itse asiassa spatiaalisen korrelaation lisäksi kuvasignaalilla on ajallinen korrelaatio. Esimerkiksi digitaalista videota varten, jossa on staattinen tausta, kuten uutislähetys ja pieni kuvan pääosan liike, kunkin kuvan välinen ero on hyvin pieni ja kuvien välinen korrelaatio on hyvin suuri. Tässä tapauksessa meidän ei tarvitse koodata kutakin kehyskuvaa erikseen, vaan voimme koodata vain vierekkäisten videokehysten muuttuneet osat datamäärän pienentämiseksi edelleen. Tämä työ toteutetaan liikeestimoinnilla ja liikkeen kompensoinnilla.
Liikkeen estimointitekniikka jakaa nykyisen tulokuvan yleensä useisiin pieniin kuvan alilohkoihin, jotka eivät ole päällekkäisiä, esimerkiksi kehyskuvan koko on 1280 * 720. Ensinnäkin se on jaettu 40 * 45 kuvalohkoon, joissa on 16 * 16 kokoa, jotka eivät ole päällekkäin ruudukon muodossa, ja etsi sitten edellisen kuvan tai jälkimmäisen kuvan hakuikkunasta lohko kullekin kuvalohkolle löytääksesi yhden kuvalohkon hakuikkuna Samankaltaisin kuvalohko Hakuprosessia kutsutaan liikkeen estimoinniksi. Laskemalla sijaintitiedot samanlaisimman kuvalohkon ja kuvalohkon välillä voidaan saada liikevektori. Tällä tavalla nykyinen kuvalohko voidaan vähentää vertailukuvan liikevektorin osoittamasta samanlaisimmasta kuvalohkosta ja saada jäännöskuvalohko. Koska jäännöskuvalohkon kukin pikseliarvo on hyvin pieni, pakkauskoodauksessa voidaan saavuttaa suurempi pakkaussuhde. Tätä vähennysprosessia kutsutaan liikkeen kompensoinniksi.
Koska referenssikuvaa tarvitaan liikkeen estimointiin ja liikkeen kompensointiin koodausprosessissa, on erittäin tärkeää valita vertailukuva. Yleensä kooderi jakaa jokaisen kehyskuvan syötteen kolmeen eri tyyppiin eri vertailukuvien mukaan: I (sisäinen) kehys, B (ohjauksen ennustus) kehys ja P (ennustus) kehys. Kuten kuvassa on esitetty.
Tyypillinen I, B, P-kehysrakennesekvenssi
Kuten kuvasta näkyy, I-kehys käyttää vain kehyksessä olevaa dataa koodaamiseen, eikä se tarvitse liikkeen estimointia ja liikekorjausta koodausprosessin aikana. On selvää, että koska I-kehys ei poista aikasuunnan korrelaatiota, pakkaussuhde on suhteellisen pieni. Koodaamisprosessissa P-kehys käyttää I-etukehystä tai P-kehystä liikekompensoinnin viitekuvana, itse asiassa se koodaa nykyisen kuvan ja vertailukuvan välisen eron. B-kehyksen koodausmoodi on samanlainen kuin P-kehys, ainoa ero on, että sen on käytettävä etu- I-kehystä tai P-kehystä ja myöhemmin I-kehystä tai P-kehystä ennustamaan koodausprosessin aikana. Täten jokaisen P-kehyksen koodauksen on käytettävä yhtä kehyskuvaa referenssikuvana, kun taas kehys B tarvitsee kaksi kehystä referenssinä. Sitä vastoin B-kehyksellä on suurempi pakkaussuhde kuin P-kehyksellä.
(d) Sekakoodaus
Artikkeli esittelee useita tärkeitä menetelmiä videon pakkaamiseen ja koodaamiseen. Käytännössä näitä menetelmiä ei eroteta toisistaan, ja ne yleensä yhdistetään parhaan puristusvaikutuksen saavuttamiseksi. Seuraava kuva esittää hybridikoodauksen mallia (ts. Muunnoskoodaus + liikkeen estimointi ja liikkeen kompensointi + entropiakoodaus). Mallia käytetään laajalti MPEG1-, MPEG2-, H.264- ja muissa standardeissa. Kuviosta voidaan nähdä, että nykyinen tulokuva on ensin jaettava lohkoihin, lohkolla saadun kuvan lohko vähennetään ennustettu kuva liikkeen kompensoinnin jälkeen erotuskuvan x saamiseksi ja sitten DCT-muunnos ja kvantisointi suoritetaan erotuskuvalohkolle. Kvantisoidulla lähtödatalla on kaksi erilaista paikkaa: yksi on lähettää se entropiakooderille koodausta varten, ja koodattu koodivirta lähetetään välimuistiin Tallenna laitteeseen ja odota lähetystä. Toinen sovellus on laskea kvantifiointi ja peruuttaa muutos signaaliin x ', joka lisää kuvalohkolähdön liikekompensoinnilla uuden ennustekuvasignaalin saamiseksi ja lähettää uuden ennustekuvalohkon kehysmuistiin.
|
Kirjoita sähköpostiosoite saadaksesi yllätyksen
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albania
ar.fmuser.org -> arabia
hy.fmuser.org -> Armenian
az.fmuser.org -> azerbaidžanilainen
eu.fmuser.org -> baski
be.fmuser.org -> valkovenäläinen
bg.fmuser.org -> Bulgaria
ca.fmuser.org -> katalaani
zh-CN.fmuser.org -> kiina (yksinkertaistettu)
zh-TW.fmuser.org -> Kiina (perinteinen)
hr.fmuser.org -> kroatia
cs.fmuser.org -> tšekki
da.fmuser.org -> tanska
nl.fmuser.org -> Dutch
et.fmuser.org -> viro
tl.fmuser.org -> filippiiniläinen
fi.fmuser.org -> suomi
fr.fmuser.org -> French
gl.fmuser.org -> galicialainen
ka.fmuser.org -> Georgian
de.fmuser.org -> saksa
el.fmuser.org -> Greek
ht.fmuser.org -> Haitin kreoli
iw.fmuser.org -> heprea
hi.fmuser.org -> Hindi
hu.fmuser.org -> Unkari
is.fmuser.org -> islanti
id.fmuser.org -> indonesia
ga.fmuser.org -> irlantilainen
it.fmuser.org -> Italian
ja.fmuser.org -> japani
ko.fmuser.org -> korea
lv.fmuser.org -> latvia
lt.fmuser.org -> Liettua
mk.fmuser.org -> makedonia
ms.fmuser.org -> malaiji
mt.fmuser.org -> maltalainen
no.fmuser.org -> Norja
fa.fmuser.org -> persia
pl.fmuser.org -> puola
pt.fmuser.org -> portugali
ro.fmuser.org -> Romania
ru.fmuser.org -> venäjä
sr.fmuser.org -> serbia
sk.fmuser.org -> slovakki
sl.fmuser.org -> Slovenian
es.fmuser.org -> espanja
sw.fmuser.org -> swahili
sv.fmuser.org -> ruotsi
th.fmuser.org -> Thai
tr.fmuser.org -> turkki
uk.fmuser.org -> ukraina
ur.fmuser.org -> urdu
vi.fmuser.org -> Vietnam
cy.fmuser.org -> kymri
yi.fmuser.org -> Jiddiš
FMUSER Wirless lähettää videota ja ääntä helpommin!
Ota yhteyttä
Osoite:
Nro 305 huone HuiLan-rakennus nro 273 Huanpu Road Guangzhou Kiina 510620
Kategoriat
Uutiskirje