Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Il segnale televisivo
Questo capitolo, che serve come introduzione alle dispense, contiene la descrizione del segnale
televisivo composito, primo esempio in grande scala di trasmissione di immagini. In più, tanto
per entrare nel tema di immagini ed elaboratori, vengono presentate le più semplici architetture
per grafica ed elaborazione di immagini. Il motivo per cui ho deciso di inserire la parte sul segnale
televisivo, nonostante sia argomento di corsi precedenti, è duplice: da un lato penso che conoscerne la
struttura sia molto utile per una corretta comprensione del seguito e dall’altro, che io sappia, non c’è
un testo in cui sia presentato in modo decente, ovvero in maniera esauriente ma non eccessivamente
prolissa. Ad esempio, il segnale televisivo è descritto su [Car86] in modo troppo schematico e su
[Gul80] troppo in dettaglio (sono oltre 700 pagine). Se, dopo aver letto questo capitolo, pensate che
anche qui non è presentato in modo decente fatemelo sapere (magari dopo aver passato l’esame, dato
che sono piuttosto permaloso).
3
4 CAPITOLO 1. IL SEGNALE TELEVISIVO
nero o a colori) è in genere modificabile mediante programmazione, anche se esistono sistemi in cui
tale corrispondenza è fissata una volta per tutte dal costruttore. Nei sistemi in cui è modificabile
esiste una memoria molto veloce, detta tabella di Look-up, che contiene i valori di conversione ed è,
in un qualche modo, accessibile da programma.
Memoria di massa
Host Computer Periferiche
Keyboard
RAM Mouse
Frame Buffer
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
Controllore
0000000000000111111111111111111111000000000000000000000000
Video
0000000000000111111111111111111111000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
In Fig. 1.1 viene presentato uno schema generale di sistema raster semplice. La memoria di
immagine (Frame Buffer) viene scandita svariate volte al secondo dal controllore video (Video
Controller), che si occupa anche di generare il segnale televisivo adatto a pilotare il monitor di uscita.
La memoria video ed il video controller sono i soli due elementi che devono essere presenti, insieme
con i circuiti che permettono l’accesso alla memoria video da parte di un calcolatore. Nei sistemi
più semplici di fatto non c’è quasi altro: le varie schede grafiche dei personal computer (Hercules,
CGA, EGA) sono fatte cosı̀. Il calcolatore ospite si occupa di gestire le operazioni di scrittura e, in
genere, lettura dalla memoria video, nel tempo lasciato libero dal controllore video. Da notare che
per generare il segnale di uscita è necessario scandire la memoria continuamente: questo può lasciare
molto poco tempo libero per l’accesso da parte del calcolatore.
Keyboard
Mouse
Memoria di massa
Host Computer Periferiche
RAM
Frame Buffer
Display Controller
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
0000000000000111111111111111111111000000000000000000000000
Controllore
0000000000000111111111111111111111000000000000000000000000
0000000000000000000000000000000000000000000000000000000000 Video
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
0000000000000000000000000000000000000000000000000000000000
Un ulteriore componente dei sistemi grafici può essere il Display Controller (vedi Fig. 1.2): questo
è di fatto un processore più o meno specializzato, a volte anche programmabile, che esegue i comandi
che provengono dal calcolatore ospite. I tipi più semplici si occupano della gestione dei caratteri
alfanumerici, dello spostamento di regioni rettangolari di immagini, della gestione delle tabelle di
look-up eccetera. Quelli più sofisticati generano segmenti, poligoni, primitive grafiche in genere e
possono anche gestire prospettiva, illuminazione ed altro: si arriva facilmente, specie nei PC, ad
avere display controllers con potenza di calcolo (e prezzo) maggiore di quella del calcolatore ospite.
Spesso la memoria video può contenere immagini più grandi di quelle visualizzate (o più immagini,
che è lo stesso) per velocizzare le operazioni o gestire animazioni.
I dispositivi per elaborazione di immagini hanno in genere la possibilità di acquisire immagini
1.1. DISPOSITIVI PER LA VISUALIZZAZIONE DELLE IMMAGINI 5
in tempo reale da un segnale video composito. Per poter fare questo è necessario un campionatore
veloce (da 8 a 13 MHz, per un segnale televisivo standard) e la circuiteria adatta ad interpretare i
vari impulsi di sincronismo (vedi più avanti nel capitolo) e a scrivere sulla memoria di immagine. Nei
sistemi più costosi sono in genere presenti processori specializzati per eseguire operazioni comuni,
quali ad esempio la convoluzione con maschere.
Il motivo per cui sono presenti dei processori dedicati è che la quantità di operazioni richiesta per
generare od elaborare una immagine è molto alta e che, almeno sui calcolatori economici, la velocità
di trasferimento dei dati sul BUS interno (ovvero fra unità centrale e dispositivo grafico) è troppo
lenta.
Controllore Video
R
Tabella di Look-Up D/A
8
0 : r0 g0 b0
Frame Buffer G
ADDR 1 : r1 g1 b1
8 BIT D/A
2 : r2 g2 b2 8
..................... B
D/A
255: r255 g255 b255 8
Figura 1.3 Schema di funzionamento di una tabella di Look–Up per un ipotetico sistema con 256
colori selezionabili fra 224 = 16777216.
Le quantità dei tre colori primari RGB vengono definite mediante tre tensioni continue generate,
all’interno del controllore video, da tre convertitori numerico–analogici (D/A, o Digitale/Analogico)
a partire da tre numeri interi. Nei sistemi di fascia alta la memoria di immagine contiene tre numeri
per ogni punto, in genere tre bytes, ciascuno dei quali rappresenta la quantità di uno dei tre colori
primari (con 3 bytes si possono rappresentare 224 = 16777216 colori diversi, anche se su di un monitor
se ne distinge un numero inferiore).
Nei sistemi più economici c’è un solo numero per punto, spesso fra 0 e 255 (un byte). In questi
sistemi è possibile associare liberamente un colore a ciascun numero per mezzo di una tabella di
Look–Up. Questa non è altro che una memoria che contiene, in ogni locazione, i tre numeri che
determinano i valori di RGB: il numero che proviene dalla memoria di immagine viene usato come
indirizzo per selezionare il colore corrispondente (vedi Fig. 1.3). Se arriva un byte e la tabella di
Look–Up contiene tre bytes per locazione allora sullo schermo si possono avere contemporameamente
256 colori diversi, ciascuno scelto fra i 16777216 disponibili. Su di una VGA (scheda grafica per
personal computer, piuttosto comune) funzionante in uno dei modi grafici che prevedono 8 bit per
punto, la tabella di Look–Up contiene solo 6 bit per ciascun colore primario RGB: si possono quindi
visualizzare 256 colori scelti fra 218 = 262144 = 256K (K vale qui 1024) possibili. In questo caso le
immagini in bianco e nero possono essere visualizzate con un massimo di 64 gradazioni di grigio (il
grigio si ottiene quando i valori di R, G e B sono uguali).
Basta riscrivere il contenuto della tabella per cambiare assegnazione: siccome le locazioni da
scivere sono poche (qualche centinaio, contro le centinaia di migliaia di punti di una immagine)
l’operazione è praticamente istantanea. Naturalmente la tabella di Look–Up deve essere inserita
in una memoria molto veloce, dato che il flusso dei punti da visualizzare è estremamente rapido:
per una immagine 1024 × 1024 visualizzata 60 volte al secondo arriva un nuovo punto in media
ogni 15.9 nanosecondi. Nei sistemi con tre bytes per punto in memoria di immagine (detti a colore
6 CAPITOLO 1. IL SEGNALE TELEVISIVO
vero) non è possibile inserire la tabella di Look–Up; il costo di una memoria molto veloce con 2 24
locazioni sarebbe astronomico, e comunque si fa prima a riscrivere l’immagine (che ha un numero
di punti nell’ordine di 220). In questi sistemi esistono spesso tre tabelle separate, una per ogni
colore primario (trasformano Rin in Rout, Gin in Gout e Bin in Bout ), utili essenzialmente per il
bilanciamento cromatico e la linearizzazione della scala di luminosità (vedi Fig. 1.4).
Controllore Video
Tabella del rosso
R R
Frame Buffer 0 : r0 D/A
1 : r1
ADDR 8
24 bit per punto .....................
255: r255
G
( 8 per colore )
G
D/A
Tabella del verde
B 8
B
Tabella del blu D/A
8
Figura 1.4 Schema di funzionamento delle tabelle di Look–Up per un ipotetico sistema a colore
vero.
Continuità delle immagini. Le immagini vengono costruite sullo schermo del televisore mediante
un procedimento (detto scanning process o scansione) sequenziale studiato in modo da creare una
illusione di continuità fra le varie immagini. In realtà sullo schermo, ad ogni istante, è presente solo
una piccola parte di una immagine: il sistema visivo umano ha però una persistenza tale per cui
lo stimolo luminoso resta presente per circa 1/16 di secondo dopo la scomparsa dello stimolo fisico.
E’ quindi sufficiente che vi siano più di sedici immagini al secondo per permettere l’illusione della
continuità. Nel sistema PAL vi sono 25 immagini complete al secondo (30 nell’NTSC), costruite riga
per riga dal sistema di scansione.
Numero di linee di scansione. La stima del numero di linee necessarie per una buona visione
del segnale televisivo può essere fatta come segue: fissando una distanza minima dell’osservatore
dallo schermo pari a quattro volte l’altezza dello stesso (più o meno ragionevole, comunque hanno
scelto questa) e considerando che l’occhio risolve particolari che distano fra loro non meno di 1/60 di
grado, un semplice calcolo indica in circa 860 il numero di linee necessario per uguagliare il potere
di risoluzione del sistema visivo. In pratica, anche a causa del fatto che le immagini sono presentate
in rapida successione, sono sufficienti fra 500 e 600 linee per raggiungere una risoluzione accettabile
(cioè tale per cui ogni aumento di risoluzione risulta quasi impercettibile).
310
622
311
623
312
624
313
625
Figura 1.5 Principio di scansione interallacciata. Le righe sono numerate in sequenza temporale
(come arrivano).
In Fig. 1.5, per semplicità, sono ignorate le linee spese durante la ritraccia verticale (venti per
semiquadro): nel seguito si precisa meglio.
Traccia
Ritraccia
t
52 µ s 64 µ s
12 µ s
Deflessione verticale f = 50 Hz
Traccia Ritraccia
18.720 ms 20 ms
1.280 ms
Figura 1.6 Forme d’onda per la deflessione. I due grafici hanno scala temporale diversa.
Scansione orizzontale e verticale Il sistema per produrre l’immagine sullo schermo del televisore
è quello di generare due forme d’onda triangolari per pilotare i circuiti di scansione del tubo catodico
(orizzontale e verticale). Ovviamente lo stesso meccanismo è usato nelle telecamere a tubo per
“leggere” le immagini, mentre nelle telecamere a stato solido viene simulato da circuiti numerici.
In Fig. 1.6 sono mostrate le forme d’onda necessarie a pilotare entrambi i circuiti di scansione.
Il tempo dedicato alla ritraccia è necessario per vincere le inerzie (elettromagnetiche) del sistema di
scansione e non può essere usato per la trasmissione delle immagini. Nel tempo di ritraccia verticale
vengono invero trasmesse le informazioni di televideo (e ci starebbe ancora parecchia roba), ma
questo è un altro discorso...
La durata nominale della linea orizzontale, illustrata nel grafico in alto di Fig. 1.6 è di 64 µs
1
( 15625 s) di cui 52 µs sono di periodo attivo e 12 µs di periodo di ritorno di linea: il raggio ritorna,
durante questo intervallo, al lato sinistro del quadro per ripartire a tracciare la linea successiva.
Analogamente, essendo la frequenza di semiquadro 50Hz, la durata nominale della traccia verticale
1.3. STRUTTURA GENERALE 9
1
è di 20 ms ( 50 s): di questi, 18.720 ms sono usati per portare il raggio dall’alto al basso e i
rimanenti 1.280 ms sono usati dal raggio per ritornare in alto e cominciare il semiquadro successivo.
Dal momento che gli oscillatori di movimento orizzontale e verticale operano continuamente (non
possono fare altro), 20 linee orizzontali ( 1280
64
) vengono tracciate durante ciascun intervallo di ritraccia
verticale: ovviamente il fascio di elettroni è spento durante la ritraccia verticale, per cui le 20 linee
non si vedono. In questo modo si perdono 40 linee di scansione per immagine durante l’intervallo di
ritraccia dei 2 semiquadri e quindi il numero effettivo di linee utilizzate per la scansione dell’immagine
è uguale a 585 (delle 625 nominali).
La geometria completa del modello di scansione interallacciata è illustrata in Fig. 1.7. Si noti
che le linee sono numerate nella sequenza in cui sono effettivamente scandite. Durante la prima
traccia verticale vengono scandite 292.5 linee. Il raggio parte da A e si muove attraverso il quadro
con velocità uniforme per disegnare la prima linea orizzontale. Alla fine di questa traccia il raggio
ritorna rapidamente al lato sinistro del quadro, come mostrato dalla linea tratteggiata in figura, per
cominciare la successiva linea orizzontale. Le linee orizzontali tendono a scendere nella direzione di
scansione perchè il circuito di deflessione verticale produce un movimento verticale continuo, peraltro
molto lento rispetto a quello orizzontale. L’abbassamento della traccia orizzontale da sinistra a destra
è maggiore che durante la ritraccia da destra a sinistra di un rapporto 52/12.
Il processo continua fino a quando non si arriva alla metà dell’ultima linea del primo semiquadro,
cioè nel punto B, quando sono state disegnate 292.5 linee. Ora il raggio viene spento ed impiega il
tempo equivalente a 20 linee per tornare in alto (nel punto C). Da notare che è la partenza a metà
della prima linea che permette alle linee del secondo semiquadro di essere posizionate sfalsate (a
mezza via) rispetto a quelle del primo semiquadro lasciando invariate le temporizzazioni in verticale
(questo spiega il perchè il numero di linee per immagine sia, in tutti i sistemi, dispari). Ora viene
scandito il secondo semiquadro, fino al completamento della ritraccia della linea 605 (punto D). Le
20 linee necessarie per riposizionare il raggio in A portano infine il numero complessivo di linee a
625.
C C
A A
B B D D
primo semiquadro ritraccia verticale secondo semiquadro seconda ritraccia verticale
( 292.5 linee ) ( 20 linee ) ( 292.5 linee ) ( 20 linee )
Figura 1.7 Scansione interallacciata: viene mostrato un quadro completo pari a 625 linee in 1/25
di secondo. L’inclinazione delle righe è esagerata.
dal fatto che le immagini sono in presentate in rapida successione e che quella che conta è la risoluzione visibile, non
quella teorica
10 CAPITOLO 1. IL SEGNALE TELEVISIVO
anche i sincronismi, l’audio, la banda vestigiale ed i margini di guardia). Il valore di 5 MHz si ricava
notando che per risolvere 533 colonne è all’incirca necessario che la banda sia sufficiente a contenere
una sinusoide con 533/2 cicli completi in un periodo attivo di linea (52µs), da cui:
533 1 533 106 1
= = 5.1M Hz
2 52µs 2 52 s
Per il sistema NTSC (a 525 linee) lo stesso calcolo porta a VrN T SC = 485 × 0.69 = 335 e ad una
banda di 4 MHz ( 34 335 1
2 57µs = 3.9M Hz), mentre quella allocata è di 6 MHz. Il sistema francese con
819 linee ha una richiesta di banda di 10.4 Mhz ed una allocazione pari a 14 MHz.
0.2
60 altezza
altezza Ped.
Ped.
Segnale Video Composito
0.4
Livello del altezza
P
40 nero Ped.
dettagli
immagine 0.6
Livello D.C.
Livello di
20 picco del bianco Livello D.C. 0.8
Livello D.C.
12.5 1.0
Figura 1.8 Dettagli di tre linee scandite con differenti livelli di luminosità media. Il rapporto fra le
ampiezze dedicate alla informazione di luminanza (Picture) e ai Sincronismi è P/S = 10/4. Le linee
sono di tre quadri diversi (vedi testo).
In Fig. 1.8 sono visualizzate tre linee di una immagine insieme agli impulsi che formano il
segnale video composito. Le tre linee sono ad altezze diverse perchè corrispondono a diversi livelli di
luminosità della scena. La figura mostra come vi sia una separazione sia temporale che di livello fra
il segnale di luminanza delle righe e gli impulsi di sincronismo e cancellazione. Il segnale composito
illustrato è con sincronismo positivo, se si ribalta alto–basso si ottiene l’equivalente con sincronismo
negativo. La separazione sulle ampiezze si realizza nel modo seguente: l’intervallo fra il 10–12
percento del valore massimo (livello del bianco di picco, cioè il bianco più bianco da trasmettere) e
il 72 percento circa (valore del nero) è dedicato alle informazioni di luminanza delle righe, trasmesse
nei 52 µs di competenza. I livelli oltre il 72 %, più neri del nero, sono riservati ai sincronismi:
attorno al 75 % vengono trasmessi gli impulsi di cancellazione (così si è sicuri di spegnere il pennello
elettronico) mentre l’intervallo che resta (dal 75 al 100 %) è dedicato agli impulsi di sincronizzazione
veri e propri.
Da notare che il 10–12 % basso dell’intervallo sulle ampiezze non viene usato al fine di ridurre
l’effetto del rumore e di permettere sporadici picchi di super–bianco senza avere distorsioni di
modulazione. Ovviamente i ricevitori sono fatti in modo da assegnare il bianco al 10–12 % ed il
nero al 72–75 % del livello massimo ricevuto: poi ci sono i comandi di luminosità e contrasto per
variare il tutto.
1.4. SEGNALE VIDEO COMPOSITO 11
Componente continua del segnale video. Il ricevitore ha bisogno di conoscere il livello di grigio
medio della immagine che deve visualizzare. Questa informazione è contenuta nella componente
continua (D.C. level) delle linee, come evidenziato in Fig. 1.8. Da notare che l’informazione sulla
luminanza media riguarda un intero quadro, non le singole righe; infatti, in figura, le tre linee
appartengono a quadri diversi, ciascuno con il suo valore medio (i solutori più che abili lo avranno
già capito osservando le piccole interruzioni fra una riga e l’altra).
La distanza fra il livello di Pedestal (che è il livello di cancellazione) ed il livello della componente
continua è detto Pedestal height ed indica la luminosità media dell’immagine. Conviene usare questo,
anzichè il valore assoluto della componente continua, perchè si mantiene anche quando il segnale perde
il riferimento assoluto di ampiezza, come succede ad esempio se passa attraverso un condensatore di
disaccoppiamento.
AMPIEZZA %
100
80
72 % 75
70
livello
60 64µ s
del
nero Cancellazione verticale
Impulsi di
50
cancellazione ( nessuna informazione sulla Luminosita‘
orizzontale di una riga
40 immagine durante questo
intervallo )
30
20
12.5 %
10
Livello di picco del bianco
t
Figura 1.9 Impulsi di cancellazione orizzontale e verticale nel segnale video. Gli impulsi di
sincronizzazione sono aggiunti sopra il livello di cancellazione.
Impulsi di cancellazione. Il segnale video composito contiene impulsi di cancellazione per rendere
invisibili le linee di ritraccia; per fare questo è sufficiente tenere l’ampiezza del segnale appena
sopra il livello del nero (75%) durante il tempo in cui i circuiti di scansione generano le ritracce.
In Fig. 1.9 si possono notare gli impulsi di cancellazione orizzontale e verticale per cancellare
i corrispondenti intervalli di ritraccia. La frequenza di ripetizione dell’impulso di cancellazione
orizzontale è ovviamente uguale alla frequenza di scansione della linea, cioè di 15625Hz, mentre la
frequenza degli impulsi di cancellazione verticale è di 50Hz. Da notare che gli impulsi di cancellazione
non sono usati per la sincronizzazione in quanto il loro livello è troppo simile a quello della luminanza
(basterebbe una zona nera–nera per desincronizzare tutto).
Impulsi di sincronizzazione. Per ottenere una corretta sincronizzazione si usano degli impulsi
situati nel 25 % più alto del segnale composito, abbastanza lontano dai valori usati per trasmettere
l’informazione di luminanza. Di fatto il 65 % dell’ampiezza disponibile viene dedicata al segnale video
vero e proprio, mentre il 25 % alle informazioni di sincronismo. Il rapporto è quindi pari a 10 4 (come
mostrato in Fig. 1.8). Questo valore è stato scelto come compromesso. Al diminuire del rapporto
S/N succedono due cose: la qualità dell’immagine visualizzata diminuisce in modo circa continuo e
gli impulsi di sincronizzazione diventano sempre più deboli fino al punto in cui gli oscillatori perdono
il sincronismo (effetto discreto a soglia). Il rapporto 10/4 è stato scelto in modo che si perdano i
sincronismi all’incirca quando la qualità dell’immagine non è più sufficiente per la comprensione.
Immagine visualizzata
40
20
12.5
t
Inizio della
ritraccia Fine della
cancellazione
Figura 1.10 Dettaglio della scansione di una linea e dei relativi impulsi di sincronismo e
cancellazione.
corrisponde al periodo di ritraccia vero e proprio. Rimangono due intervalli cancellati, detti back
porch e front porch, di durata diseguale. Alla fine della linea si trova il front porch, di durata 1.5 µs,
che serve al circuito video del ricevitore per tornare al livello del nero prima dell’arrivo dell’impulso
di sincronismo (anche se a volte non è sufficiente se la linea termina con un bianco molto intenso,
col che c’è un errore nel determinare l’inizio del sincronismo e la riga seguente appare leggermente
spostata a sinistra). All’inizio di ogni linea si trova il back porch, 5.8 µs, che serve per lasciare
il tempo al circuito che genera il dente di sega della scansione di invertire la corrente ed arrivare
al tratto lineare e per fornire il corretto riferimento di ampiezza utile al calcolo della componente
continua.
Le durate indicate sono nominali, è ammesso un certo intervallo di variazione pari a:
durata nominale di una linea 64 µs,
periodo attivo di una linea 52 µs,
impulso di cancellazione orizzontale 12 ± 0.3 µs,
impulso di sincronismo orizzontale 4.7 ± 0.2 µs,
front porch 1.5 ± 0.3 µs,
back porch 5.8 ± 0.3 µs.
(a)
((
Sincronismo
verticale
(b) 2.5 H
(160 µs) ((
20 linee = ( 20 x 64 µ s = 1280 µ s )
Figura 1.11 Forme d’onda del segnale video composito alla fine dei due semiquadri pari e dispari.
La lunghezza degli impulsi di cancellazione e sincronismo è esagerata per chiarezza.
rispetto alle righe permette ai due semiquadri di interallacciarsi, ovvero posiziona le righe del secondo
semiquadro in posizione intermedia rispetto a quelle del primo. Da notare che la cadenza degli impulsi
di sincronismo orizzontale segue comunque la temporizzazione di 64µs esatti.
L’informazione sulla posizione degli impulsi di sincronismo orizzontale viene estratta dal segnale
video composito mediante differenziazione, cioè usando un filtro passa–alto. Gli impulsi diferenziati
che corrispondono al fronte di salita dei sincronismi sono usati per sincronizzare l’oscillatore
orizzontale (vedi Fig. 1.12), mentre quelli che corrispondono ai fronti di discesa (negativi) sono
tagliati via da un diodo.
Il problema è che mancano gli impulsi differenziati durante le due linee e mezzo in cui è presente
l’impulso di sincronizzazione verticale: l’oscillatore orizzontale tende a perdere il ritmo durante questo
intervallo, senza contare che spesso tutto è comandato da un monostabile che richiede comunque gli
impulsi. Da notare che alle fine del primo semiquadro la situazione è ancora peggiore, in quanto il
fronte di salita dell’impulso di sincronizzazione verticale cade a metà di una riga, ovvero nel posto
sbagliato.
R1
Segnale video
Separatore dei
C1
L.P.F. Uscita dall’integratore
composito (1) sincronismi (2)
(2)
(3)
Figura 1.12 Separazione dei sincronismi e generazione degli impulsi di sincronizzazione alla fine
del primo semiquadro.
La soluzione adottata è quella di ritagliare degli impulsi di riga negativi durante il sincronismo
verticale, fatti in modo che il fronte di salita sia nel posto giusto (vedi Fig. 1.13). Durante il
sincronismo verticale il segnale viene riportato al livello di cancellazione 4.7µs prima del posto dove
serve l’impulso orizzontale, e riportato al massimo livello nell’istante giusto. Da notare che l’impulso
integrato che fornisce la sincronizzazione verticale non viene praticamente influenzato da queste
tacche, in quanto sono molto brevi.
In questo modo esiste sempre un impulso orizzontale ogni 64µs: il fatto che ne esistano ogni tanto
a metà strada non è importante (basta che i progettisti di televisori lo sappiano). Da notare che gli
14 CAPITOLO 1. IL SEGNALE TELEVISIVO
impulsi negativi aggiunti sono gli stessi alla fine di entrambi i semiquadri: quelli non usati alla fine
del primo sono usati alla fine del secondo e viceversa.
1 2 3 4 5
4.7 µ s 27.3 µ s
1 2 3 4 5
Figura 1.13 Forme d’onda differenziate alla fine del secondo e del primo semiquadro. Gli impulsi
utilizzati per la sincronizzazione sono solo quelli numerati.
Livello di soglia
Alla fine del primo
semiquadro
Figura 1.14 Forme d’onda integrate alla fine dei due semiquadri. Si può notare l’errore di
temporizzazione. Ovviamente mancano gli impulsi equalizzatori.
Livello di soglia
Figura 1.15 Impulsi di equalizzazione di post– e pre–sincronismo e loro effetto dopo il L.P.F.
16 CAPITOLO 1. IL SEGNALE TELEVISIVO
di 10 MHz. A questi vanno aggiunti 0.5 MHz di banda di guardia prima e dopo il segnale per
tener conto delle caratteristiche non ideali dei filtri reali: in totale quindi 1 MHz in più. Inoltre
si deve aggiungere il segnale del sonoro modulato in frequenza (FM): la sua portante viene posta
immediatamente dopo la fine del segnale video (alla massima frequenza), cioè 5.5 MHz più in alto
della portante video. Considerando la larghezza del segnale audio FM ed un’altra piccola zona di
sicurezza il sonoro aggiunge 0.25 MHz alla banda totale, che quindi diventa pari a 11.25 MHz (vedi
Fig. 1.16).
P S
Portante audio
Lower sideband (LSB) Upper sideband (USB)
f (MHz)
5.5 5 4 3 2 1 0 1 2 3 4 5 5.5
5.75
Frequenze relative alla portante dell’immagine
Figura 1.16 Larghezza di banda totale del canale TV se si usasse una modulazione AM. P è la
portante dell’immagine ed S la portante audio.
P S
VLSB
f (MHz)
5.5 5 4 2 1 0 2 4 5.5
1.25 5.75
Figura 1.17 Larghezza di banda totale del canale televisivo trasmesso mediante VSB. In totale
sono 7 MHz.
Questa larghezza di banda è eccessiva e se fosse usata limiterebbe troppo il numero di canali
televisivi disponibili. Si potrebbe usare una modulazione SSB (Single SideBand), con il vantaggio
di eliminare una delle due bande laterali risparmiando 5 MHz. Questo non può essere fatto per
diversi motivi: il principale è che il segnale video ha una notevole energia alle frequenze molto
basse, che verrebbero inevitabilmente tagliate dei filtri (reali) usati per eliminare una banda. Inoltre
l’eliminazione della portante video complicherebbe notevolmente i ricevitori.
La soluzione adottata è quella di trasmettere la banda laterale superiore (USSB, Upper SSB)
intera più parte della portante più le basse frequenze della banda laterale bassa, eliminando il
resto. Questo tipo di trasmissione si chiama in generale a banda laterale vestigiale ( VSB, Vestigial
SideBand), quella usata per modulare il segnale video composito è detta in particolare trasmissione
A5C. Nei sistemi a 625 linee (escluso l’inglese) si lasciano i primi 0.75 MHz della banda laterale
inferiore e si taglia il resto, lasciando sempre 0.5 MHz di banda di guardia (vedi Fig. 1.17).
Il segnale audio, modulato in FM, occupa circa 75 KHz per lato (150KHz totali) attorno alla
portante audio: considerando anche le bande di guardia si ottiene una occupazione totale effettiva
di 7 MHz. In Fig. 1.18 si vede lo spettro completo di un canale CCIR 625 linee indiano o europeo (il
sistema inglese lascia 1.25 MHz di banda vestigiale, anzichè 0.75, ed ha una larghezza video di 5.5
MHz, anzichè 5, occupando quindi 8 MHz in totale). Anche il sistema americano NTSC è simile, ma
ha 3.58 MHz di banda video e occupa 6 MHz totali.
1.6. TRASMISSIONE DEL COLORE 17
5.5MHz
P C S
4.433MHz 0.25MHz
Sottoportante colore
150 KHz
USB
1.25 5 MHz 0.75
Figura 1.18 Spettro di un canale televisivo CCIR 625 linee (usato in India ed in Europa, esclusa
la GranBretagna). C è la sottoportante colore.
La Fig. 1.19 mostra come sono posizionati due canali adiacenti (CCIR 625 linee) nella banda
VHF–1.
P=55.25 S=60.75 P=62.25 S=67.75
MHz MHz MHz MHz
5.5MHz 5.5MHz
BANDA 1 BANDA 1
CANALE 3 CANALE 4
54 55 56 57 58 59 60 61 62 63 64 65 66 67 68 f (MHz)
54 - 61 61 - 68
( 7 MHz ) ( 7 MHz )
3. Il segnale colore deve avere la stessa informazione di luminanza (luminosità) che avrebbe un
segnale B/N della stessa immagine.
5. L’informazione di colore deve essere tale che un televisore in B/N non si accorga della sua
presenza (cioè visualizzi l’immagine in B/N senza alcun artefatto).
6. Il nuovo segnale deve avere le stesse frequenze di deflessione orizzontale e verticale e gli stessi
segnali di sincronismo del segnale B/N.
3 Fine del ringraziamento a Luisa Cotta, Marilena De Ceglia ed Eduardo Ruiz Calatayud
18 CAPITOLO 1. IL SEGNALE TELEVISIVO
In pratica bisogna codificare l’informazione colore in modo da trasmetterla nello stesso canale del
segnale B/N e senza disturbare i segnali di luminanza e audio.
Il primo passo per fare questo è quello di convertire l’informazione sul colore, specificata mediante
le tre coordinate R,G,B, in modo da avere una componente di luminanza (detta Y) e due di
crominanza. La Y deve essere tale da coincidere con la luminanza che avrebbe un segnale B/N
della stessa scena. Senza entrare nei dettagli (riprenderemo l’argomento nel capitolo sul colore), il
segnale di luminanza, cioè Y, si ottiene da R,G e B mediante
Almeno intuitivamente dovrebbe essere evidente come la componente verde (G) debba pesare di più
di quella blu, siccome l’occhio risponde molto meglio alla prima che alla seconda (questo è ovviamente
conseguenza del fatto che lo spettro della luce solare ha i valori massimi sulle frequenze del giallo–
verde). Da notare che un grigio, per cui R = B = G = α, ha Y = α e che se RGB sono tutte fra
0 e 1 anche Y lo è. Il segnale Y viene quindi trasmesso come il segnale monocromatico nella TV in
bianco e nero. Per inviare l’informazione sui colori si scelgono i segnali differenza fra RGB ed Y. Si
potevano trasmettere direttamente due a scelta fra R, G e B, ma i segnali differenza hanno alcuni
vantaggi, il principale dei quali è che valgono zero per una immagine in bianco e nero. Si trasmettono
quindi (R − Y ) e (B − Y ), mentre si trascura (G − Y ), dato che ne bastano solo due. I motivi per
cui non si trasmette proprio (G − Y ) sono:
1) il fatto che (G − Y ) si ricava dagli altri due mediante (G − Y ) = − 0.51(R − Y ) − 0.186(B − Y )
e poichè i coefficienti sono minori di uno bastano due resistenze, mentre per ricavare gli altri due
usando (G − Y ) sono necessari coefficienti maggiori di uno, cioè degli amplificatori (che costano di
più). Infatti (R − Y ) = − 1.97(G − Y ) − 0.37(B − Y ) e (B − Y ) = − 5.4(G − Y ) − 2.7(R − Y ).
2) Siccome la proporzione di G in Y è grande, l’ampiezza di (G − Y ) è, nella maggior parte delle
immagini, piuttosto piccola. Comunque si dimostra facilmente che o è la componente minore delle
tre o è uguale alla più piccola delle altre due. Questo, sommato al fatto che deve essere amplificata,
può provocare problemi in caso di basso rapporto S/N.
In sintesi l’informazione necessaria per trasmettere una immagine a colori viene convertita dalle
tre coordinate RGB, che sono quelle che escono, ad esempio, da una telecamera, ad altre tre
coordinate, la luminanza Y, pari all’informazione in bianco e nero, e le due coordiante di crominanza
(R − Y ) e (B − Y ). Queste ultime due non possono ovviamente essere trasmesse cosı̀ come sono,
visto che manca la banda necessaria ed il segnale risultante non sarebbe compatibile con quello
monocromatico, ma il modo di trasmetterle dipende dallo standard specifico. Di per se la conversione
da RGB alle altre tre coordiante non causa ovviamente alcuna perdita di informazione ma la nuova
rappresentazione permette di ottenere una forte compressione di banda senza degradare troppo la
qualità percepita.
I diversi standard in uso sono l’americano NTSC (National Television Systems Committee), il
tedesco PAL (Phase Alteration by Line) ed il francese SECAM (SEquential Couleures A Memoire).
Esistono poi sottovarianti: ad esempio lo standard in bianco e nero a 625 linee CCIR (detto standard
B) è compatibile con il sistema PAL–G, mentre non lo è con il PAL–I, che ha la portante audio 6
Mhz dopo quella video e larghezza di canale pari a 8 Mhz. Le tecniche impiegate per NTSC e PAL
sono in molte parti simili, e quindi la trattazione sarà in parte comune. Il SECAM è invece molto
diverso e necessita di una trattazione separata (lo vedremo senza scendere troppo in dettaglio).
50 Hz
C
Figura 1.20 Spettro del segnale video di luminanza (Y). fH vale 15625 Hz (standard europeo a
625 linee, 50 Hz).
spazi vuoti, a partire da una frequenza (sottoportante colore) che sia esattamente a metà strada fra
due armoniche di fH (vedi Fig. 1.21). Nel tempo si può notare come il segnale colore produca delle
piccole variazioni sinusoidali sul segnale di luminanza: siccome tutte le sinusoidi sono multiple di
mezza frequenza di linea invertono la loro fase da una riga alla successiva e da un semiquadro all’altro.
Questo effetto viene facilmente mediato via dall’osservatore, col che si è ottenuta la compatibilità
con il segnale monocromatico.
C = 4.43 MHz
Figura 1.21 Spettro del segnale video di luminanza (Y, linee continue) e del segnale colore PAL
(tratteggiato).
Nel sistema PAL la sottoportante colore è situata fra le armoniche 283 e 284, ovvero in f scP AL =
283.5 × fH = 283.5 × 15625 = 4.43M Hz circa. Nell’NTSC, che ha minore banda per canale, la
sottoportante colore è dopo l’armonica 227, ovvero in fscN T SC = 227.5 × 15750 = 3.58M Hz.
Il segnale monocromatico di luminanza Y viene trasmesso a piena banda, cioè 5 MHz, per non
perdere dettagli di immagine. Il segnale colore non necessita di una banda cosı̀ larga, in quanto
l’occhio umano distingue il colore solo per aree piuttosto grosse. Da studi effettuati pare che l’occhio
distingua bene i colori per aree di larghezza maggiore o uguale ad un venticinquesimo della larghezza
dello schermo4 : aree cosı̀ grosse hanno componenti spettrali solo fino a circa 0.5 MHz. Inoltre, per
aree di dimensione media, con componenti spettrali fra 0.5 e 1.5 MHz, la visione del colore è ridotta
in modo tale che un solo segnale di crominanza è sufficiente a portare l’intera informazione visibile.
Infatti, per tali aree, l’occhio non distingue le tinte magenta e verde–giallo dal grigio, e per aree
ancora minori anche il rosso si perde nel grigio. In totale si può asserire che le frequenze fra 1.5 e
5 MHz sulle componenti di crominanza non portano informazione che possa essere riconosciuta dal
sistema visivo umano e che, quindi, la banda necessaria per trasmettere il segnale di colore è circa
di 3 MHz (± 1.5 MHz attorno alla portante colore) per ciascuno dei due segnali di crominanza.
I due segnali (R − Y ) e (B − Y ) vengono trasmessi simultaneamente sulla stessa portante usando
una modulazione QAM. In pratica vengono entrambi modulati con la stessa frequenza portante, ma
con una differenza di fase di 90 gradi (se non ricordate la QAM rileggetevi [Car86]). In questo modo
i due segnali sono in quadratura sulla stessa portante e possono essere demodulati separatamente
senza interferenze (purchè il ricevitore sia in grado di ricostruire frequenza e fase della portante).
Chiamando C il segnale ottenuto combinando insieme (R−Y ) e (B−Y ) si può notare come l’ampiezza
(cioè il modulo) di C, il cui valore istantaneo corrisponde alla differenza fra (R − Y ) e (B − Y ), non
sia altro che la saturazione istantanea, mentre sua fase porta l’informazione di tinta (hue). La
rappresentazione dei colori in termini di luminanza, saturazione e tinta viene descitta in dettaglio
nel capitolo sul colore.
4 Dipende ovviamente dalla distanza dell’osservatore: i valori indicati sono per la solita distanza (4 volte l’altezza
dello schermo).
20 CAPITOLO 1. IL SEGNALE TELEVISIVO
Colore R G B Y (R - Y) (B - Y) |C| θc
bianco 1 1 1 1 0 0 0 –
grigio 0.5 0.5 0.5 0.5 0 0 0 –
nero 0 0 0 0 0 0 0 –
rosso 1 0 0 0.3 0.7 -0.3 0.76 113.2o
rosa 1 0.5 0.5 0.65 0.35 -0.15 0.38 113.2o
verde 0 1 0 0.59 -0.59 -0.59 0.83 225o
verdino 0.5 1 0.5 0.795 -0.295 -0.295 0.417 225o
blu 0 0 1 0.11 -0.11 0.89 0.897 353o
azzurro 0.5 0.5 1 0.55 -0.055 0.445 0.448 353o
giallo 1 1 0 0.89 0.11 -0.89 0.897 173o
marrone 0.5 0.5 0 0.445 0.055 -0.445 0.448 173o
Da notare come i tre colori primari RGB siano separati di 120 gradi e come blu e giallo, colori
complementari, siano opposti, ossia separati da 180 gradi. Inoltre i colori completamente desaturi
(bianco, grigi e nero) hanno modulo di C pari a zero: in questo caso la tinta (fase) non ha ovviamente
importanza alcuna e la parte di segnale che porta l’informazione sul colore (C) svanisce.
Le tre componenti del segnale televisivo a colori possono essere ricavate dalla rappresentazione
RGB mediante:
V = 0.877 × (R − Y )
U = 0.493 × (B − Y )
sono quelli che formano il cosiddetto spazio colore YUV. Vi lascio come esercizio esprimere YUV in
funzione di RGB.
Il segnale colore CP AL (pari a C pesato) si ottiene quindi da U e V mediante:
essendo tan θ(t) = V (t)/U (t) e fscP AL la frequenza della sottoportante colore, pari esattamente a
4.43361875 MHz. Questo valore si ottiene come segue: nel sistema PAL se si sceglie una frequenza pari
ad un multiplo dispari della metà della frequenza di riga succede che, per certe tinte, compaiono dei
puntini allineati in verticale. Per evitarli si sceglie una frequenza che corrisponde ad una armonica di
quella di riga meno un quarto, lievemente modificata aggiungendo 25 Hz (pari a metà della frequenza
1.6. TRASMISSIONE DEL COLORE 21
di quadro) per ottenere una inversione di fase ad ogni semiquadro (avranno avuto i loro motivi...).
Quindi
1 fv
fscP AL = fh (284 − ) + = 283.75 × 15625 + 25 = 4433618.75Hz
4 2
Naturalmente i due segnali U(t) e V(t) devono essere filtrati prima di essere uniti a formare
CP AL : in base alle considerazioni viste sulla risposta al colore del sistema visivo umano si sono scelti
due filtri uguali passa basso che tagliano a circa 1.3 MHz.
Il segno “±” nelle due equazioni 1.1 e 1.2 c’è perchè la fase della sottoportante del modulatore
della V(t) viene rovesciata di 180 gradi ad ogni linea, saltellando quindi fra + 90 e - 90 gradi rispetto
a U(t) (ecco spiegato il ”Phase Alteration by Line“ !). In questo modo vengono cancellati gli errori
di tinta (hue) che risultano da variazioni di fase nel segnale trasmesso (nell’NTSC tali errori non sono
compensati). Infatti uno spostamento di fase di CP AL rispetto al riferimento, cosa che può avvenire
sia in trasmissione che durante la propagazione, provoca chiaramente una variazione di tinta nel
colore visualizzato. Se però, come spesso accade, due linee vicine hanno colori simili allora il fatto
di invertire la fase di 180 gradi ad ogni linea fa in modo che l’errore di colore della seconda linea sia
opposto a quello della prima: il sistema visivo umano, che integra il colore su aree piuttosto grosse,
media allora le due tinte ottenendo il colore giusto.
In realtà questo succede solo per variazioni di fase piuttosto limitate. Per ottenere un risultato
buono in ogni caso è stata sviluppata una variante, detta PAL–D, che memorizza, in una linea
di ritardo da 64µs, la riga precedente ed esegue la media dei segnali di crominanza prima della
presentazione. Gli errori di tinta sono eliminati ma naturalmente la risoluzione verticale del colore è
la metà.
Per finire resta da spiegare come il ricevitore possa conoscere frequenza e fase della sottoportante
colore con precisione sufficiente per demodulare correttamente la QAM, considerando che, per
risparmiare potenza ed evitare interferenze con il segnale di luminanza, il segnale colore viene
modulato DSB, cioè a doppia banda laterale con portante soppressa.
L’informazione sulla portante viene fornita al ricevitore inserendo alcuni cicli di essa (fra 8 e
11 in generale, 10 nel PAL) insieme ai sincronismi. Questo esempio di portante, detto Colour
Burst Signal, è posizionato nella parte finale o Back Porch di ciascun sincronismo di linea e
non interferisce con i sincronismi perchè è di ampiezza inferiore e posizionato dopo l’impulso di
sincronismo orizzontale vero e proprio (vedi Fig. 1.22). La fase del Colour Burst varia di 90 (±45)
gradi fra una linea e la successiva, fornendo quindi sempre il riferimento corretto per la decodifica.
Tale fase è quella del vettore −(B − Y ) ± (R − Y ).
20
12.5
t
Figura 1.22 Posizione del Colour Burst (fra 8 e 11 cicli della sottoportante colore) nel Back Porch
di ciascun impulso di sincronismo orizzontale.
0.877 (R - Y) = V 0.877 (R - Y)
+I
0.63 rosso 0.59 magenta
o 33 o +Q
o
119
76.5 o
57
0.44 giallo
13 o 0.493 (B - Y) = U
-Q
0.59 verde 0.63 ciano
-I
- 0.877 (R - Y) - 0.877 (R - Y)
Figura 1.23 Sinistra: ampiezza e fase dei colori primari e complementari dopo lo scalamento di
(R- Y) e (B - Y). Destra: posizione degli assi I e Q del sistema NTSC.
al colore. Questi segnali sono generati ruotando di 33 gradi in senso antiorario gli assi U e V:
e la combina con l’informazione della riga precedente per ottenere i colori. Il nome, sequential a
memorie, deriva appunto da questo meccanismo di trasmissione. Se una riga porta l’informazione
su (R - Y) nella successiva c’è (B - Y): poichè il numero di linee per immagine è dispari, se la riga
n di un quadro contiene (R - Y) la riga n del quadro dopo contiene (B - Y). E’ quindi necessario un
impulso di identificazione che permetta al ricevitore di associare la componente colore giusta ad ogni
riga: questo impulso viene trasmesso durante la ritraccia verticale.
Le componenti di crominanza, opportunamente filtrate, vengono alternativamente trasmesse
mediante una modulazione di frequenza con preenfasi. Vi sono stati diversi sistemi SECAM, anche
incompatibili fra loro (certi con 819 linee ed altri con 625). Il sistema SECAM–III prevede 625 linee
a 50 Hz con un canale di larghezza di banda 8 MHz: le sottoportanti colore sono due, una per (R -
Y) posta in 282fh = 4.40625 MHz ed una per (B - Y) in 272fh = 4.250 MHz (questo minimizza
le interferenze con il segnale monocromatico). Le due componenti di crominanza sono filtrate a 1.5
MHz e pesate in modo da ottenere
DR = − 1.9(R − Y ), DB = 1.5(B − Y ).
La trasmissione FM prevede una deviazione di 280 DR KHz e 230 DB KHz per i due segnali, con una
deviazione massima ammessa di 500 KHz verso il basso e 350 KHz verso le alte frequenze. In questo
modo certi colori sono meglio definiti di altri: la scelta di DR e DB ne tiene ovviamente conto.