Sei sulla pagina 1di 4

Capitolo 12

Compressione e standard Video


12.1 Introduzione
Un informazione video, o un video in generale, pu essere visto come una sequezna di fotogrammi. Dunque possiamo facilmente intuire che la compressione video una compressione basata sulla compressione dei precedenti fotogrammi, rispetto a un fotogramma al tempo attuale. E dunque una tecnica a sottrazione dimmagine, e lerrore viene successivamente codificato. Dallanalisi di un video come una sequenza di fotogrammi capiamo bene che un video presenta una certa ridondanza temporale: non tutti i fotogrammi sono diversi per cui non devono essere codificati tutti come nuove immagini. Ci un aspetto positivo, in quanto andremo a codificare solo lerrore tra fotogrammi successivi, a vantaggio del rateo di compressione. La tecnica di compressione una tecnica chiamata Motion Compensation (MC) che si basa su alcuni stemp molto importanti: Stima del movimento con estrazione del vettore di movimento MV; Predizione MC based Stima dellerrore di predizione

Motion Compensation e ricerca del vettore di movimento MV Ogni fotogramma viene diviso in macroblocchi di dimensione N x N dove per immagini di luminanza N = 16 , mentre N = 8 per immagini di Crominanza. Il meccanismo di ricerca avviene a livello di macroblocchi. Il frame al tempo corrente detto Target Frame e la ricerca avviene considerando la similarit tra i macroblocchi dei frame antecedenti o successivi al macroblocco del Target Frame. Una volta identificata una corrispondenza il vettore che unisce i due macroblocchi detto vettore di movimento.

Solitamente il vettore di movimento nellintorno di una finestra quadrata tra [-p;p], per cui si prevede che la ricerca debba essere fatta in una finestra piu grande, di dimensioni 2p + 1 x 2p + 1. FASE OPERATIVA DI RICERCA La differenza tra i macroblocchi misurato con la differenza media asoluta. Lobiettivo principale quello di trovare un vettore di cordinate (i,j) simile al vettore di movimento MV = (u,v), ossia sia minima la distanza media assoluta.

12.2 Meccanismi di ricerca


I meccanismi di ricerca sono molteplici Ricerca lineare Ricerca Logaritmica Ricerca gerarchica

Ricerca Lineare Nel caso della ricerca lineare si considerano finestre di ricerca di dimensioni 2p + 1 x 2p + 1 e si effettua: 1. confronto tra macroblocchi pixel a pixel nelle vicinanze di un macroblocco di un frame target, ricordanco che il macroblocco il blocco centrale della finestra. 2. Si calcola poi la distanza media assoluta e la minore definisce il vettore di movimento MV Il meccanismo di ricerca per molto dispendioso in quanto la ricerca si definisce con 3 operazioni per ogni pixel, e ricordando che il numero di pixel ((2p + 1 x 2p + 1)* N*N), allora la complessit dellordine . Ricerca Logaritmica Il meccanismo di ricerca logaritmica meno dispendioso ma anche meno efficiente del precedente. Non tutti i macroblocchi vengono subito comparati, ma ne vengono comparati solo 9, contrassegnati da un 1. Quello a minore MAD diventa il macroblocco centrale, e ne vengono comparati altri 9 nelle vicinanze del centrale, contrassegnandoli con un 2. Il metodo procede iterativamente fino alla minore MAD che definisce leffettivo MV. Ricerca Gerarchica La ricerca gerarchica si avvale della struttura gerarchica del ridimensionamento delle immagini. Il metodo infatti permete la valutazione del vettore di movimento considerando immagini riscalate in risoluzione, che definiscono opportuni livelli a partire dal Livello 0 dellimmagine originale.

12.3 Primi standard Video


H.261
LH.261 uno dei primi standard video. Inizialmente realizzato per i cellulari, stato poi utilizzato per le videoconferenze attraverso lISDN. Utilizza un meccanismo di compressione del tipo Motion Compensation. Analizziamo la sequenza di frame che compongono un video in H.261.

I frame possono essere di due tipi: I Frame: detto anche frame indipendente o Intra Frame utilizza una codifica di trasformazione ti tipo DCT; P Frame: detto frame dipendente e utilizza una codifica di tipo predittivo

Per quanto riguarda lI- Frame si implementano caratteristiche per la rimozione di ridondanze temporali, mentre per i P Frame ridondanze spaziali.

La struttura di un I Frame la seguente: 4 macroblocchi di 16 x 16 pixel Un macroblocco 8 x 8 Cb Un macroblocco 8 x 8 Cr

I blocchi 8 x 8 sono processati con DCT, quantizzati, scanditi con tecnica zigzag e ne viene calcolata in fine lentropia. Per i P Frame invece dobbiamo ricavare la differenza tra frame target e riferimento, considerando pre ogni macroblocco, la differenza tra taget e riferimento, infine il vettore di movimento considerando le tecniche di ricerca precedentemente prese in cosiderazione. Il risultato un insieme di macroblocchi che sono di struttura simile agli I Frame.

Potrebbero piacerti anche