Sei sulla pagina 1di 2

IMAGEM DIGITAL adjacentes com correlação elevada; 3.

DC codificado como a diferença face ao DC do


>>>> Imagens vectoriais vs bitmaps: a) vantagens das imagens vectoriais: tempo bloco anterior; 4.Gama de valores reduzida; 5b) Codificação entropica dos restantes 63 /// CODECS N DESTRUTIVOS
coeficientes: converter a matriz para vector, lendo em zig-zag – para que os primeiros /// Pulse Code Modulation (PCM) a) Padrão básico de representação digital de sinais
de renderização menor, excepto quando o número de objectos é muito elevado; es-
valores a serem lidos sejam diferentes de zero (quando começam a aparecer os analógicos em dispositivos digitais: a amplitude do sinal é amostrada a intervalos de tmp
paço em disco menor; tempo de transferência via Web menor; mudança de escala não
uniformes e quantizada para um conjunto de valores num código digital; b) sem compressão;
altera a qualidade da imagem; mais manipuláveis: cada elemento pode ser controlado zeros ignora-se a leitura); 5c) Codificação entropica e repetições: 1.RLE : tira partido
c) dimensão: ficheiros mt grandes (mt espaço em disco e inadequado para transmissão Web);
individualmente; b) limitações: impossível visualizar imagens foto-realisticas; tempo dos muitos zeros nas altas frequências; 2.Huffman ou aritmética: menos bits para d) Qualidade: depende da frequência de amostragem, do nº de bits de quantização e do nºde
de renderização elevado se forem muitos objectos; c) Vectorial para bitmap: fácil; representar os símbolos mais frequentes – diminuir a quantidade de bits necessários canais – qualidade de CD: 44.1 kHz, 16 bits
na prática, uma imagem vectorial é renderizada no ecrã como um bitmap, e basta para representar o resultado da quantização. /// Differencial PCM (DPCM) a) são codificadas as diferenças entre amostras reais e os va-
fazer o grabbing da imagem no ecrã – software de dição permite guardar em formatos lores previstos segundo um modelo de previsão: são codificados resíduos (erros de previsão);
bitmap; d) Bitmap para vectorial: difícil; software de auto-tracing detecta formas /// GIF (n destrutivo) -era preciso diminuir o tamanho dos ficheiros p transmitir p/linhas b) baseado na elevada correlação entre amostras sucessivas; c) taxa de compressão de cerca
básicas no bitmap com base em regiões de cor homogénea e aproxima essas formas telefónicas; >> Modelo de Cor: Palete de 256 cores; >> Compressão: Entrópica não de 25% + q PCM – depende do modelo de previsão.
por polígonos. destrutiva c/base no LZW (baseado em dicionários dinâmicos), q comprime o conj. d /// Adaptive DPCM (ADPCM) a) varia o tamanho do passo de quantização de forma adaptativa:
índices da img – só elimina redundâncias; >> Dimensão: Ficheiros pequenos – taxa quando as diferenças são baixas, reduz o numero de bits; b) compressão na ordem dos 50%
>>>> PALETES DE COR ou mapas de cores – tabelas matemáticas que definem ma-
de compressão depende da img original; >> Qualidade: Limitações em fotografias – mas com alguma perda de qualidade – usada em Voice Over IP
peamentos de cores; cada uma das cores a utilizar é representada por um índice; a)
/// u-law PCM e a-law PCM a) transmissão de sinais de voz; b) reduz a gama dinâmica do
Vantagens – visualização em sistemas com poucos recursos gráficos; compressão; b) 256 cores; >> Possibilidades: 1. Transparência: pixéis identificados por 1índice na
sinal PCM –reduz o nº de bits por amostra, c/alguma perda de qualidade (13 bits em PCM,
Desvantagens: perdas cromáticas, que podem ser minoradas com paletes adaptativas paleta, n é transp.alpha; 2. Suporta formas simples de animação – mts imagens no mm aqui são 8)
(quantetização da cor) + dithering – processo que cria a ilusão de cores inexistentes stream; 3. Progressivo ou Entrelaça/ - a img n é armazenada em linhas sucessivas, m
/// FLAC (não destrutivo) (livre) 1 >> Compressão: a) Compressão middle/ side
numa dada palete pela difusão das cores existentes na palete em causa (sistema de maneira entrelaçada;tem-se noção da figura inteira que será apresentada e que vai
(mid: x = (L+R) /2 e side: y = L-R); b) Modelos de predição linear - erro de predição
visual humano mistura as cores se os pontos estiverem suficientemente próximos; se definindo até se completar totalmente.
codificado: valores pequenos – os resíduos; menos bits necessários; c) resíduos
diferentes algoritmos de dithering produzem diferentes resultados; limitações dither- >> LZW: 1.Utilizado em imgs em q n se pode perder a definição original; 2.Imgs c
codificados pelo algoritmo de Golomb-Rice (alfabeto de resíduos segue uma
ing: imagens aparentam ter grão); padrões bem definidos(c/grd blocos de cor contínua ou repetidas de cores) podem re-
distribuição qs geométrica e os resíduos baixos são + frequentes que os altos –
>> tipos de paletes: a) estáticas: paletes universais, que representam com qualidade duzir para 1/10 o tamanho original do arquivo (m o normal é 1/3, ou 1/4); 3. Problemas:
menos bits; d) RLE utilizado em blocos com valores idênticos, como o silencio; 2 >>
razoável imagens de qualquer tipo; deve abarcar todo o espaço RGB, ainda que memoria necessária – qts + dados, + sequências; espaço de endereça/ – códigos das
Dimensão: a) Ficheiros resultantes a cerca de 40, 50 %; b) Maior compressão para
com pouca definição; Exemplo: paletes de sistema (Windows System Palete) – cores entradas tb crescem co dicionário; 4. Algoritmo: Dicionário contém entradas para tds os
símbolos do alfabeto; P = {} // C = próximo carácter // P + C existe? // Se sim, P=P+C
fala; 3 >> Possibilidades: a) Streaming; b) Tagging; c) Imagens associadas; d) open
aceitáveis para a maior parte dos programas; útil em ícones em sistemas com pouca
// Se não: SC = SC + índice (P) ; Adiciona P+C ao dicionário; P = C // Enquanto houver source; 4 >> Limitações : a) Suporte para dispositivos moveis limitado
profundidade de cor e palete Web – utilizada pelos Web browsers; b) Adaptativas:
mais caracteres, volta a 2; no fim SC = SC + índice(ultimoLido). /// ALAC (não destrutivo) (proprietário) 1 >> Compressão: a) Baseado no FLAC,
Evitam uma elevada distorção cromática, porque a indexação de cores é definida
///////////////////////////////////////////// CONVERSÃO GIF - JPEG com melhor desempenho na descodificação; 2 >> Dimensão: 1:1.67 a 1:1.25; 3 >>
adequadamente em relação à imagem em causa; Palete contem as cores estatistica-
1. Converter imagem indexada para RGB: JPEG precisa de RGB. Ao converter de GIF possibilidades: a) DRM – N suporta, embora seja possível devido ao contentor;
mente mais relevantes, obtidas através de um algoritmo de quantetização de cores
para RGB é necessário descompactar a sequencia LZW, obtendo-se assim uma matriz b) Armazenamento num contentor MPEG 4; 4 >> Vantagens: a) Descodificação
adequado; Exemplo: imagem RGB sem canal B – palete de 16 cores; ideia é encontrar
de cores indexadas. Não é esta matriz que vai servir de base ao JPEG (se assim rápida (argumenta-se que é mais leve que o FLAC); b) Utilizável em iPods; c) Codec
o centroide de cada região.
>>Vantagem das paletes adaptativas: escolher as cores, não de forma estática, mas fosse, este assumia uma imagem em tons de cinza). É necessário converter os índices crackado (????); d) Tags ID
de forma optimizada contendo aquelas estatisticamente mais relevantes, ou seja, as para cor RGB (resultando 3 matrizes); 2. Lidar com dithering: O JPEG interpreta os /// Monkey’s Áudio (não destrutiva) (proprietário) 1 >> Compressão: a)
mais frequentes, na imagem original. Por exemplo, se uma imagem apenas contém pixéis utilizados no processo de dithering do GIF como transições de alta frequência Codificação middle / side; b) Modelo de predicção linear; c) Codificação do erro com
apenas, tonalidades de azul, defini-se uma palete optimizada com os 256 tons de azul (abruptas). Deste modo, todas as cores perceptuais formadas a partir de dithering Golomb-rice; 2 >> Dimensão: 1:2 a 1:4; 3 >> Limitações: a) Descodificação mais
mais relavantes (não faz sentido usar uma palete com tons de vermelho: estaríamos resultarão em ruído. É importante, então, converter esses pixéis para a cor desejada, lenta que FLAC; b) Limitado fora de Windows
a desperdiçar cores) antes de converter para JPEG. Este processo nem sempre é trivial. Existem diversos /// MPEG-4 (não destrutivo) 1 >> Compressão: semelhante a FLAC; 2 >> Pos-
>> Vantagem do dithering: criar a ilusão de cores inexistentes na palete pela algoritmos, com diferente desempenho. sibilidades: a) até 32 bits de quantização; b) frequências de amostragem arbitrárias;
difusão de cores da palete, i.e., pela combinação de duas ou mais cores. Como a dis- /// PNG (n destrutivo)- surge na sequencia do GIF; >> Modelo de cor: RGB com c) Streaming
tância entre os pixeis é muito pequena, o cérebro humano interpola as cores presentes canal alpha (8 ou 16 bits por canal); Níveis de cinza com alpha; RGB sem alpha / cinza /////////////////////////// CODECS DESTRUTIVOS
numa dada área, criando a ilusão de uma nova cor. É esse o mecanismo de formação sem alpha; Palete;Nº de bits por canal ou palete pode variar (?); >> Compressão: >> Codificação perceptual: a) base dos codecs áudio destrutivos; b) banda-crítica:
de cores nos ecrãs apenas com pontos vermelhos, verdes e azuis. a) Compressão entrópica de resíduos com base em modelos de previsão – visam ouvido humano comporta-se como detector de frequências em que células dife-
eliminar a redundância de informação entre pixéis vizinhos, sendo q o valor de cada rentes respondem a frequências de formas diferentes, sendo que cada célula tem
>>>> ASPECTOS A CONSIDERAR NA COMPRESSÃO: a) características do sinal: pixel pode ser predito pela sua vizinhança; codifica só a diferença ou o resíduo entre uma gama de frequências à qual responde – a banda critica. O ouvido nao distingue
diferentes algoritmos para diferentes tipos de dados; b) técnicas de compressão e o valor original e o previsto para esse pixel – Codificação DPCM de resíduos: erro tão bem sons na mesma banda critica, o que é a base das mascaragem de sons
descompressão: têm de ser adequadas ao tipo de sinal, eficientes computacional- (resíduo) = valor original – valor previsto; os dados são pré-comprimidos por um c) tira partido das limitações da audição descartando informação não perceptível;
mente...; c) taxa de compressão atingida / a atingir: algoritmo, grau de redundância; modelo de previsão: é usado um filtro (p td a img) e para cada linha da img é escolhido >> Mascaragem de sons: a) mascaragem simultânea (frequência) – um som de
d) qualidade do sinal descompactado: compressão destrutiva ou não destrutiva?; um tipo de filtro (baseia-se no px à esq, ou à drt, etc) q transforma os dados de forma amplitude elevada tende a mascarar um som de menor intensidade na mesma gama
e) Complexidade de custo computacional: tempo real? Utilizável em dispositivos a que sejam + fácil/comprimidos. O filtro prevê o valor de cada px baseando-se nos de frequências; sempre que um som é mais forte, mascara outros mais baixos.
moveis? Tempo e custo de compressão semelhante ao de descompressão? Hardware vizinhos, e subtrai a cor prevista ao valor real: cada byte é previsto com base nos Quando uma forte batida do prato em uma música executada por uma orquestra
especifico requerido? Facilidade de implementação? valores de bytes anteriores (explora correlação entre amostras consecutivas); gama de nos chega ao ouvido, por um momento, apenas esse som é percebido, mascarando
>> resultados de compressão diferentes para o mesmo codec? em geral, apenas valores diminui; melhores possibilidades de compactação (probabilidade de uma linha o som dos demais instrumentos. Esse princípio fundamenta a eliminação de todos
o processo de descodificação é especificado com detalhe, de forma a possibilitar ser idêntica a outra adjacente aumenta); b) Compressão entrópica não destrutiva dos os sons mascarados em um determinado arquivo; b) mascaragem temporal – um
interoperabilidade; a) processo de codificação não é habitualmente especificado: resíduos: algoritmo Deflate, baseado em dicionários Dinâmicos; >> Dimensão e Quali- som de amplitude elevada tende a mascarar durante um período temporal sons com
implementadores têm liberdade de desenvolver o codificador da forma que considerem dade: Possibilidade de imagens foto-realisticas; Para a mesma qualidade, ficheiro amplitude inferior numa região vizinha de frequências.
melhor, desde que o sinal possa ser descodificado em conformidade com o standard. menores que GIF (10 a 50%) e muito maiores de JPEG; >> Possibilidades: Uma cor /// MP3 (destrutivo) 1 >> Compressão: 1. Compressão perceptual: redução da
Por exemplo, em imagens indexadas, escolhem os algoritmos de quantização de cor e transparente; Transparência alpha (imagens indexadas); Não permite animação – é redundância perceptual; 2. Modelos psicoacústicos p identificar os sons menos
o dithering; b) a qualidade do sinal descodificado e a dimensão do ficheiro comprimido formato de imagem única (alternativa: MNG, extensão do PNG); Entrelaçamento; >> relevantes: 2.1 componentes de alta frequência (ouvido só distingue sons muito
poderão diferir notoriamente de algoritmo para algoritmo dentro do mesmo codec. Suporte de Software: Generalizado, mas algumas aplicações não implementam todas intensos); 2.2 sons mascarados por outros de maior intensidade; 2.3 conversão para
>>>> CLASSIFICAÇÃO DE CODECS: lossless (não destrutivos): vantagem: sinal re- as funcionalidades do compressor; >> Suporte Web: Adopção lenta – GIF continua a sinal mono durante os períodos em que pelas características do som o ouvido não
construído é matematicamente equivalente ao original; limitação: taxa de compressão prevalecer (só Opera, FireFox e Safari apresentam compatibilidade total) e browsers consegue perceber a direcção de onde provém; 3. Quantização adaptativa – os sons
mais baixas; Lossy (destrutivos): Vantagem: taxas de compressão mais elevadas; Des- antigos nem sequer suportam PNG
menos relevantes são descartados ou codificados com menor precisão, o que reduz
vantagem: sinal reconstruído apresenta alguma degradação de qualidade (técnicas // JPEG Lossless (n destrutivo)- semelhante ao PNG: compressão não destrutiva
o número de bits necessários para os representar – principal operação destrutiva!;
são irreversíveis), o que idealmente não é perceptível; Objectivo: maximizar o grau de baseada em previsão e compressão de resíduos – filtros; >> Compressão: Cálculo de
4.Semelhante aos princípios utilizados no JPEG;
compressão mantendo a qualidade da imagem virtualmente “lossless” resíduos (erros de previsão) e compressão entropica (Huffman ou aritmética); >> Di-
2 >> Dimensão: A) mt + pequenos q PCM c/qualidade de CD (1:8 a 1:12); B)
////// CODECS >> BMP : Windows Bitmap - sistema padrão do Windows; 1 >> Mod- mensão e qualidade: Taxa de compressão inferior a PNG; >> Suporte: Actualmente,
Depende da bit rate: se for alta tem pouca compressão logo tem dimensão elevada,
elo de cor: RGB com 24 bits (cor final depende do color profile); 2 >> Compressão: obsoleto; Poucas aplicações o suportaram – nunca foi popular por PNG ser melhor
mas existem várias possibilidade – CBR, VBR, ABR; C) Frequência de amostragem:
a) Tipicamente sem compressão; b) Representação de dados segundo o padrão PCM // TIFF (n destrutivo) - projectado para ser um formato universal de bitmaps, flexível
16 a 48 kHz; 3 >> Qualidade: A) Em termos perceptuais será qualidade de CD (mé-
(Pulse-Code Modulation); 3 >> Dimensão: Ficheiros muito grandes: muito espaço e extensível; - tags possibilitam extensibilidade; - mesmo formato pode ter várias
imagens; - funciona como um contentor: pode ter imagens comprimidas por codecs
todos de compressão pensados para música); B) Tipicamente, 128 kbps aceitável,
em disco, inadequado para transmissão via internet; 4 >> Qualidade: True Color :
diferentes e conter gráficos vectoriais; >>Modelo de cor: RGB com 24 bits; >> m + comum é 192 pelo aumento de espaço em disco, e o máximo é 320 kpbs (a
Qualidade foto-realística; Não há destruição da imagem; 5 >> Variantes: a) BMP
Compressão: várias possibilidades de compressão nao destrutiva (RLE, LZW – pouco partir daí é lossless); C) Distorções podem ser captadas: c1) componentes de alta
com compressão Run-Lenght Encoding (RLE); b)BMP com especificação do número
utilizado por causa da patente); >> Dimensão e qualidade: imagens foto-realisticas; frequência; c2)ruído de quantização;c3)sons sibilantes; c4)clips com ataques abrup-
de cores.
muito maior que JPEG e um pouco que PNG (com a mesma qualidade); maior que tos – pré-eco; c5) Bit rate: alta > pouca compressão destrutiva > qualidade elevada;
/// JPEG>>Algoritmos de compressão perceptual (destrutiva): tira partido das
GIF (profundidade de cor é muito diferente); >> Possibilidades: Suporte multi-página: c51) CBR – simples e mais rápida, mas menos flexível; c52) VBR – tira partido
limitações da visão humana, descartando informação não perceptível >> Algoritmos
várias imagens no mesmo ficheiro (ex. Digitalização de várias páginas num só ficheiro); do dinamismo do som: bit rates mais altas em regiões mais complexas, qualidade
de compressão entrópica (não destrutiva); n suporta transparência pq é um codec
destrutivo: a reconstrucao n é perfeita e uma cor definida cm transparente aparece >> Suporte Web: em geral não é suportado pelos browsers global aumenta; c53) AVR; D) Encoder: liberdade de implementação desde que em
sem o ser; Compressao JPEG deve ser o ultimo passo, pq os efeitos da compressao FORMATOS // SVG- vectorial aberto, baseado em XML; - suporta imagens vectoriais, conformidade com a especificação (o resultado deve ser interpretável por qualquer
sao acumulativos; de cd x q se salva comprime-se +; 1. Modelo de Cor >> YCbCr bitmaps e texto; >> Compressão: XML – muitos fragmentos de texto repetidos – descodificador) de velocidades e qualidades diferentes; alguns são optimizados para
(tipica/ obtido a partir de imagem RGB com 24 bits); 2. Dimensão >> 2. 1. Ficheiros Deflate; >> Suporte Web: dificuldades na adopção: utilização geral de formatos bitmap bit rates elevadas, outros para baixas; 4 >> DRM: a) Dados encriptados; b) escuta
significativamente mais pequenos que BMP (10:1); 2.2) Depende do factor de quali- ou outros; suporte de browsers não é generalizado; apenas possível nos computadores autorizados; 5 >> Algoritmo: 1. sinal dividido em
dade (Q) especificado: Alto = pouca compressão = dimensão elevada; Baixo = muita // Adobe Flash - formato proprietário, mas utilização esmagadora na Web (Plug-in frames de curta duração passa por um banco de filtros q o divide em 32 bandas de
compressão = dimensão baixa (possível compressões de 100:1); 3. Qualidade >> incorporado de raiz na maioria dos browsers; frequência dentro do espectro audível, o q aumenta a probabilidade de remoção de
em termos perceptuais será qualidade foto-realística: utiliza métodos de compressão >>>>IMAGENS E INTERNET: a) Diversidade de computadores na Web – cuidados sons redundantes; 2. ao mesmo tempo o sinal passa por um modelo psicoacústico
pensados para img fotográficas, funcionando particular/ bem em img c/transições com a profundidade de cor; b) Limitações de largura de banda – 1. tempos de que determina o SMR (Signal to Mask Ratio) para cada banda; 2.1 Através de uma
suaves entre as cores; 3.1) depende do factor de qualidade especificado: alto = transmissão dentro de limites aceitáveis (limitar o tamanho das paginas); 2. Tamanho transformação MDCT cada frame é convertida para o domínio da frequência, o que
qualidade elevada; baixo = qualidade baixa; 3.2) apresenta piores resultados em das imagens tem que ser baixo – utilização de formatos comprimidos (GIF, PNG ou permite maior precisão no cálculo dos limiares de mascaragem; 2.2 Depois deter-
elementos do tipo gráficos vectoriais porque: incluem geralmente transições abruptas JPEG); c) Preparação de imagens para a Web: 1. Trabalhar com imagens grandes e mina o limiar de mascaragem (L) para cada banda, o que é equivalente às bandas
entre cores; tende a introduzir algum ruído nas zonas de transição; 4. Utilizações: >> de elevada profundidade de cor (quanto estiverem prontas reduzir ambas); 2. paletes criticas; 2.3 Então determina o SMR (S/L) e o noise-to-mask ratio (S/N – necessário
utilizado na compressão de imagens em ficheiros pdf e padrão para compressão de – usar 256 cores e preferencialmente padrão; 3. tamanhos de imagem de 320 x 240 porque existe sempre ruído de quantização já que o sinal original passa a ser
imagens fotográficas; 5. Modos de operação >> 5.1.) Sequencial: img codificada (?); 4. numero de imagens em cada página não deve ser muito elevado; Qualidade da representado por um conjunto de valores discretos). Se o ruído for mantido abaixo
n1passagem (esq, drt, cima, baixo); 5.2.) Progressivo: img codificada por varrimentos imagem deve ser elevada, com baixo espaço de armazenamento: profundidade de cor, de L de cada sub-banda, o resultado da compressão não deve ser distinguido do
múltiplos,c/detalhe progressivamente mais elevado; exemplo: primeira passagem taxa de compressão, imagens vectoriais (se possível) original; 2.4. depois junta os dois canais num só quando não forem precisos os dois,
descodifica apenas o coeficiente DC do bloco. Vantagens: apresentação em browsers >>>> COMPARAÇOES - PNG suporta vários níveis de transparência (GIF só transpar- através de codificação middle / side (se as diferenças forem baixas) ou L/R se forem
de imgs com menor detalhe em ligações de rede lentas; visão prévia razoável antes ência binária); - PNG integra informações sobre a gama da imagem que permite altas – joint stereo, que é aplicado a todas as bandas ou a nenhuma; 3. Alocação
da chegada da totalidade dos dados; Desvantagem: suporte não é genérico (?); 5.3) corrigir diferenças entre o brilho da imagem em monitores de diferentes plataformas; de bits: quantização dos coeficientes da MDCT (que vão ser depois codificados com
Hierárquico: Imagem codificada a várias resoluções. - em imgs pequenas, GIF pode conseguir + compressão q PNG (tem q ver c/ GIF usar Huffman), em função do NMR (se este for baixo utiliza mais bits de quantização;
Algoritmo >> 1.) Converter imagem RGB para o espaço de cor YCbCr: o modelo de LZW e PNG Deflate + filtro; - PNG tem + opções de transparência e de profundidade só atribui os necessários para que o ruído de quantização não seja audível) e usa
cor YCbCr separa a imagem nas suas componentes de luma (Y) e crominância (Cb e de cor; - JPEG: imgs + pequenas se fotográficas q c/PNG; - PNG melhor se img menos bits para informação menos relevante; para alem disto, o nº de bits tem por
Cr). Como olho humano é menos sensível à crominância, o detalhe nesses dois canais contiver texto ou imgs c/transições abruptas; - PNG suporta trueColor, greyscale e base a bit rate definida; 4. Outros mecanismos: – reserva de bits: como algumas
poderá ser reduzido (através de sub-amostragem) – compressão perceptual inicial da paleta; GIF apenas paleta e JPEG trueColor e greyscale; - PNG e JPEG: + precisão frames são muito simples, não é preciso usar todos os bits, reservando-os para
imagem. No modelo RGB, a correlação entre os 3 canais é elevada (nomedamente de cor q GIF; - PNG + fácil de implementar q GIF; - JPEG: + tmp de computação; - frames mais complexas. Quando a reserva é nula existe uma notória degradação da
no que toca a luminância). Convertendo para o modelo YCbCr a redundância em PNG pouco divulgado e suportado; - GIF é único q suporta animação; - JPEG perde qualidade em zonas complexas; 6 >> Limitações: A) Dimensão das frames pouco
cada canal diminui, de modo que a entropia em cada um deles também diminui. Isto qualidade aqd alterado; - PNG melhor q GIF: melhores técnicas de compressão - PNG flexível – pré-eco: erro na MDCT propaga-se por toda a janela temporal e existe
possibilita melhor compressão entrópica. No entanto, a compressão entrópica é só pode ser mt maior q GIF se imgs forem criadas c/alta qualidade, pq PNG armazena + ruído antes do próprio sinal: o ruído de quantização é imposto sobre um coeficiente
aplicada sobre os coeficientes da DCT e não directamente sobre os canais Y, Cb e Cr. inf de profundidade de cor e transparência; p imgs de 8bits, PNG é típica/+pequeno pq de componente de frequência. No domínio do tempo, este erro está espalhado sobre
A vantagem da separação é reduzir-se detalhe na crominância; 2.) Sub-amostragem usa técnicas de compressão + eficientes (Deflate combina LZ77 c/Huffman, o q é 10
todo o frame em causa. Assim, e especialmente no caso de transições temporais
(downsampling espacial): 2.1) olho humano mais sensível a variações de luma do a 30% + eficiente q LZW); - JPEG é a mlh escolha p fotos, m em monitores de 8-bits
súbitas pode-se ouvir ruído significativo mesmo antes do evento que o causa. Como
que de crominancia: baixa a resolução em Cb e Cr (reduz a taxa de amostragem); há uma conversão forçada p um paleta de 8bits; a compressão JPEG é para dados de
forma de evitar este efeito, a MDCT pode utilizar janelas de 6 ou de 18 pontos. A
2.2) diversas variantes: 4:4 (sem downsampling); 4:2:2: taxa de amostragem de Cr e 24bits, independente/das cores na img original. Assim, ao reduzir uma img de 24 p 8 a
janela de 6 pontos sacrifica resolução de frequência para ganhar resolução temporal
Cb reduzida para metade na direcção horizontal; 4:2:0: taxa de amostragem reduzida qualidade será pior; - JPEG introduz ruído em áreas de cores solidas
e deve ser utilizada quando o modelo perceptual detecta a possibilidade de pré-eco;
para metade em ambas as direcções; 2.3) A partir deste ponto o brilho e a cor são
processados separada/e de maneira mt similar. A sub-amostragem da cor diminui
/// AUDIO DIGITAL B) Joint Stereo em todas as bandas; C) Esquema híbrido de transformação: filtragem
1 >> AMOSTRAGEM: um computador n é capaz de representar directa/1onda sonora: sinal passa-banda + MDCT: compatibilidade com mp1 e mp2 (filtragem inversa com
de 33% a 50 % do espaço ocupado pela imagem; A DCT é então aplicada sobre os tem de ser amostrado e cada amostra representada digital/ - amostragem; a freq a que a onda reconstrução imperfeita); codecs agora usam MDCT directamente.
dados obtidos do downsampling; 3) Aplicação da DCT: cada canal separado em é amostrada é freq de amostragem – teorema de Nyquist (sinal com freq max.de 5 kHz deve /// Mp3PRO: MP3 + spectral band replication (SBR) – descarta componentes de
blocos 8x8 (permite uma execução mais eficiente do DCT): 3.1) Na compressão JPEG ser amostrado c/freq> q 10kHz); alternativa/poderá aplicar-se um filtro passa-baixo e amostrar
alta frequência, mas essas componentes têm que ser reconstruídos durante a
a img da entrada é decomposta em blocos e após isso estes são transformados para a 1 freq + baixa.
2 >> QUANTIZAÇÃO: Cd amostra é representada por 1 valor digital: o nº de valores pos-
descodificação, o que é uma tarefa algo exigente em termos computacionais. Qd
o domínio da frequência, através da DCT. A DCT separa as componentes de alta e
sível de representar depende do nºde bits empregue na sua representação – qt > + fiel é a os recursos em termos de capacidade de processamento são limitados (CPU,
baixa frequência da img, sendo que as de alta frequência podem ser seleccionados
representação; a) valor de cada amostra é arredondado para o valor digital + próximo; b) Ruído energia, memória) é dificil/impossível a utilização do mp3PRO dada a complexidade
e suprimidas, dependendo da qualidade a ser alcançada no processo; 3.2) baixas
de quantização: diferença entre os valores quantizados e os reais; 3 >> CANAIS: a) Sinal do descodificador.
frequências no canto superior esquerdo da matriz e altas frequências no canto inferior
direito; 3.3) propriedades de compactação de energia: imagem suave – maior parte da
estereofónico – 2 canais, semelhante aos ouvidos humanos e cada canal pode ter elementos /// AAC (destrutivo): Sucessor do mp3 – também é destrutivo e também se baseia
áudios distintos; b) Sinal monoaural – 1 canal, menos realista e mais amorfo que o stereo; 4 >> em compressão perceptual; 1 >> Melhoria face ao mp3: a) Melhor qualidade
energia nas baixas frequências: poucas células de frequência contêm a maior parta QUALIDADE DO SOM: depende do equipa/, sujeito, parâmetros utilizados na gravação original
da energia da imagem (nas baixas frequências); 3.4) Coeficientes típicos da DCT: média para a mesma bit rate; b) Usa directamente MDCT, sem banco de filtros,
e tipo de compressão; 5 >> QUALIDADE DE CD: padrão projectado com o obj.de possibilitar
Valores negativos porque os valores de cada bloco são centrados em zero, antes do o que resulta numa inversão perfeita; c) Bit rates arbitrárias e janelas de duração
a reprodução de tds os sons q o humano consegue ouvir; a) freq de amostragem necessária é
cálculo da DCT; DCT aumenta o número de bits por pixel, temporariamente, devido 44.1 Khz (cm o ouvido só capta até 20Khz 1 freq superior era inútil); b) quantização – 16 bits;
mais pequenas em zonas transitórias e maiores em zonas estacionárias; d) Maior
aos cálculos necessários; Nos diferentes blocos é aplicado o algoritmo DCT que gera c) 2 canais; 6>> STREAMING: permite começar a reprodução do ficheiro pc dp do inicio da frequência de amostragem; e) Até 48 canais; f) Joint Stereo mais flexível – por
as matrizes Coeficientes de DCT, que têm muitos valores próximos de 0. O valor médio transmissão – a) download de buffer inicial; b) inicio da escuta enqt continua o download; c) tmp bandas de frequência; g) Temporal Noise Shaping (TNS): objectivo de melhorar o
da matriz está no canto superior esquerdo e representa a cor fundamental desses 64 de espera até que o buffer encha depende da velocidade da ligação; d) baseado em protocolos tratamento de transitórios muito rápidos, controlando o pré-eco; obtém modelo do
px – é a componente DC; 3.5) Só a DCT não faz grande compressão, porque a matriz específicos, assentes em UDP (RTP e RTCP ) ou nao; e) aplicações – rádios online; f) formatos ruído de quantização através de uma abordagem preditiva no domínio da frequência
ficheiros típicos: MP3 e variantes, ASF, real áudio (destrutivos ou não). – a forma do sinal de ruído será semelhante à do sinal original h) Perceptual Noise
resultante têm o mesmo tamanho que a original e poucos valores a zero – só possibili-
ta a quantização; a compactação acontece na quantetização; Este tipo de compressão Substitution (PNS): bandas de frequência em que o sinal seja tipo ruído usa o mod-
/// MIDI: a) protocolo p descrição detalhada dos elementos musicais: objectos sonoros
é recomendada apenas para imagens fotográficas, uma vez que as imagens de elo de ruído; a vantagem é que são codificados os parâmetros do modelo em vez de
representáveis de forma pseudo-simbólica (não correspondem a áudio digitalizado m a factos
desenhos são ricas em regiões de alta freq, que ficam distorcidas com a aplicação da musicais q fornecem 1 descrição do som a reproduzir); b) ficheiros consistem numa lista de
todos os da MDCT; i)Long-Term Prediction (LTP): i1) modelos de previsão conduz
compressão JPEG; 4) Quantetização: 4.1. olho humano não tem tanta sensibilidade comandos que inclui a especificação do instrumento, o volume, a frequência básica, etc; inclui a maior eficiência de codificação, principalmente para sinais estacionários; i2) reduz
para distinguir a intensidade exacta da variação em componentes de alta frequência 16 canais, cada um podendo tratar um instrumento (identifica 128 instrumentos); 1 >> MIDI redundância em frames sucessivas; i3) armazenam-se os coeficientes do modelo de
(transições abruptas): usar menos bits na sua representação – maior operação vs aúdio digital: 1. Vantagens Midi: a) Espaço em disco <: 200 a 1000 xs + pequenos que previsão em vez do sinal; 2 >> Possibilidades: suporte de DRM
destrutiva do processo; 4.2. Representar coeficientes da DCT com mais ou menos bits, ficheiros digitais c/qualidade de CD e 20 a 100 q mp3; b) Tmp de transferência via Web menor; /// WMA (destrutivo ou não) - codec perceptual para competir com mp3;
consoante a sua frequência: Altas frequências quantetizadas mais fortemente (menos c) + manipuláveis (cada elemento pode ser manipulado individual/); Limitações: a) Som - não é muito popular, embora usado em site devido a possibilidade de DRM
bits); Resultado: muitos valores de altas frequências representados com valor zero; 4.3. artificial; b) Áudio gerado depende do dispositivo; c) Difícil a síntese de voz: dispositivos MIDI >> Possibilidades: a) CBR e VBR; b) Compressão não destrutiva; >>Qualidade:
podem sintetizar voz mas a qualidade de som é baixa; d) Utilização requer conhecimentos
Aqui entra o factor de qualidade; 4.4. Operação de quantetização típica: Dividir cada Semelhante a mp3 mas melhor em bit rates até 64 kbps e inferior a AAC
de teoria musical; 2 >> Conversão MIDI – digital: Fácil, porque na prática um ficheiro MIDI é
coeficiente da DCT por uma constante (especifica para esse coeficiente) e arredondar
renderizado cm áudio digital; Conversão digital – MIDI: Software de transcrição automática
/// FORMATOS /// WAVE: a) Armazenamento de dados em blocos etiquetados; actua
para o inteiro mais próximo. Esta operação força os valores a aproximarem-se de zero procura detectar elementos básicos no sinal digital (notas, instrumentos), m os resultados são como wrapper de diversos codecs; b) 1ª parte do ficheiro contém informação de
– como a divisão é inteira, existem perdas; 5.a) Codificação diferencial do Coeficiente satisfatórios apenas em sinais monofónicos (e mesmo assim mudanças de timbre poderão formatação (id.do codec, nºde canais, freq.de amostragem, tamanho dos blocos);
DC: 1.coeficiente no canto superior esq: média dos bits do bloco 8x8; 2.img em blocos ser notórias). c) 2ª parte: inf.dependente do codec – em PCM é só o nºde bits de quantização;
pode ser incluído um conj.de marcas, a def.de 1ordem de execução à custa dessas relativa ao áudio (em WAVE) é entrelaçada c/a do vídeo – entre a inf a cada 2 p esclareci/: definir modelo de comunicação adequado c/cliente e equipa: definir modelos de ciclos de
marcas e inf.relativa a cada marca; valores de amostragem. frames aparece a relativa ao áudio; c) multi plataforma aprovação e mecanismo de alterações; incluir aprovação formal de tarefas já terminadas; 1.2. monitor-
///ASF – encapsula dados codificados com WMA possibilitando DRM e streaming //QuickTime a) igual a AVI mas no entrelaça/ usa espaços maiores (inf áudio a ização permanente do evoluir da produção: manter organização e n deixar o prazo e custo
escorregarem – gestor de projecto tem de definir milestones do proj e para cada elemento; 1.3.
cada segundo ou ½ seg); b) versões + recentes suportam streaming
verificar motores antes do inicio da corrida: Organização administrativa e de recursos humanos
>>>>Motivação para a utilização de modelos de predição linear em codecs áudio ok? hardware e software de desenvolvi/ ok? Rede em funcionamento, computadores e monitores,
não destrutivos: Codificar apenas os erros de predição (valor real – valor previsto, VIDEO E INTERNET a) mpeg e variantes; b) streaming: codecs baseados nos adequados, versões actualizadas de software?; Múltiplos monitores e de dimensão adequada? a)
i.e, resíduos), os quais apresentam uma gama de valores mais reduzida. Assumindo ITU-T q define normas de codificação – 1) base no protocolo RTP (q assenta Sistemas autor multimédia (e.g., Director, Flash) contêm várias janelas que, idealmente, deverão ser
um intervalo de quantização fixo, são precisos menos códigos para representar em UDP); 2) formatos típicos – ASF, RealVideo, mpeg-4; c) codificação visíveis em simultâneo; b) Edição de conteúdos requer a utilização de várias janelas em simultâneo
valores entre -0.1 e 0.1 do que entre -10 e 10, por exemplo. Porque motivo resulta de vídeo p aplicações em tmp real; VIDEO EM PROJ - quais os custos de (e.g., diferentes resultados de edição de imagem no Photoshop); c) Produtividade aumenta: menos
bem na prática: Só faz sentido codificar os resíduos se estes forem pequenos. Isso produção e armazena/? ; quais os benefícios p transmissão da msg?; custos tempo a minimizar e maximizar janelas, conteúdos visíveis em simultâneo, etc; 1.4. Análise de risco:
só acontece se for simples prever a sequência de valores numa onda sonora. Ora, justificam-se? Ter alternativas planeadas, em caso de impacto negativo; 1.5. Orientações gerais: n gastar +
recursos q necessários; 2. Desenvolvimento alpha >> produto corresponde à primeira versão
em sinais áudio, amostras consecutivas apresentam valores semelhantes (em geral Programas de edição >> Windows movie maker: conj. De funcionalidades
preliminar do projecto – Poderá conter erros e imprecisões no design e comportamentos
não há transições abruptas), pelo que modelos de predição funcionam bem. Deste restrito: captura, montagens simples na timeline, cortar, colar, transições e implementados; Tipicamente disponível apenas para circulação interna; >> definição detalhada do
modo, as diferenças entre amostras consecutivas apresentarão valores baixos. efeitos simples, gravação em wmv; >>Adobe Premiere – vasta gama de storyboard e mapas de navegação; >> finalização de scripting; >> definição de uma politica de controlo
Seria possível usar apenas as diferenças entre amostras. Porém, calculando-se os possibilidades de versoes (Para restauração de alterações realizadas sem sucesso, mudança de ideias, recuperação
resíduos, consegue-se uma gama de valores a codificar ainda mais baixa. Edição de Áudio - captura de vídeo; edição de vídeo (simples cm cortar, de erros, etc); >> produção audio: a) finalidade: criação de contexto emocional - efeitos especiais, som
>>>> Vinil: som analógico, i.e., a onda sonora real, contínua, é impressa no disco de copiar, colar); efeitos especiais e títulos; mistura e sincronização de bandas ambiente, narrações; cuidados na adição de som/video aos projectos: finalidad, qualidade, questoes
vinil. Com equipamento adequado (boa gama de frequências, ressonâncias, satura- sonores; efeitos de remapea/ (cm slow motion); melhorar qualidade (cor, tecnicas (formato, compressao, sincronização – cue points); b) tarefas: contratar estudio e artista;
ções, disco em bom estado) a experiência de som será próxima do ideal (assumindo luminosidade, filtros áudio); gravação em diferentes formatos assegurar-se que os guiões estão prontos na data combinada ; Assegurar-se que a sessão de
gravação decorre sem problemas; Verificar que o material é produzido de acordo com as
que os meios de gravação também foram os mais adequados), uma vez que não
especificações ; adquirir e tratar audio conforme necessario: normalização de volume, filtragem; >> [
há grande perda de detalhe. CD: som digital, i.e., a onda analógica é amostrada e >>Frames I_são os maiores e têm a informação completa; devem aparecer produçao de video: a) finalidade:ferramenta poderosa p aproximar utilizadores do mundo real; metodo
quantizada. Em qualidade de CD, a frequência de amostragem é de 44100 Hz, o que em intervalos regulares com frequência alta para evitar grandes perdas se um eficinte p apresentação de 1msg a uma audiencia habituada à TV (elemento multimedia c/elevado
permite som com frequência máxima de 22050 Hz (Teorema de Nyquist). Quanto à for perdido.; >>Frames P_baseiam-se na anterior; numero de Ps entre cada poder de imersao – msg passada de forma + eficiente; menos q realidade virtual); aumento da
quantização, com 16 bits o ruído de quantização é baixo mas existe. A população par I limitado para evitar propagação de erros;>>Frames B_nc são usadas capacidade de retençao; b) dificuldades: caso n seja bem planeado, poderá ter um efeito negativo
audiófila “exige” som perto da perfeição. Como há sujeitos, mesmo com mais idade, como referência pq têm mt pc informação e não propagam erros pq não estão (fraca resolução ou frame rate); requisitos de desempenho + elevados (CPU e memoria): espaço de
com acuidade auditiva suficiente para discernir componentes de frequência acima envolvidos na descodificação de outras; armazena/ elevado e numa maquina lenta rendering pode demorar horas; ponderar bem os custos e
de 22050 Hz, assim como o ruído de quantização, conseguem uma experiência de >>>> Codec MPEG: frames I (keyframes) são responsáveis pelo acesso benefícios; c) Tarefas: Contratar equipas de produção, artistas, entrevistados, etc; Explicar aos clientes
as limitações de utilização do vídeo; Assegurar-se que as sessões de filmagens decorrem sem
audição mais pura em vinil, se usarem em equipamentos de qualidade superior. aleatório (vídeo pode ser apenas reposicionado nos locais onde haja
problemas; Verificar que o filme resultante é editado de acordo com as necessidades; Adquirir e tratar
>>>> Freq e num bits = qualidade: Frequência de amostragem (fs): - Qualidade: keyframes) . No caso do DayliMotion, as frames I estão intervaladas mais de vídeos conforme necessário (dimensão, cor, som); Escolher o método de compressão mais adequado
pelo teorema de Nyquist, a fs deve ser pelo menos o dobro da frequência máxima no 10 segundos (ao contrario dos 0.4-0.5seg recomendados, i.e., 10 a 15 frames). para a aplicação]; >> [ produção de arte gráfica: [finalidade: Impacto visual é fundamental num produto
sinal. Assim, se a fs aumenta, a frequência máxima que o sinal pode conter também A DailyMotion tomou essa decisão para diminuir o tamanho dos ficheiros, de multimédia; Ícones intuitivos guiam o utilizar de forma imediata; Imagens são uma ferramenta
aumenta. Se o sinal analógico original tiver frequências muito altas, o aumento da modo a diminuir-se a largura de banda necessária para transferir os ficheiros e importante na imersão do utilizador (80% do conhecimento humano é através da visao);]; Qualidade
fs leva a uma melhoria da qualidade do sinal digitalizado (particularmente relevante o espaço em disco necessário para os armazenar. Como as frames I são as de deve ser elevada, com baixo espaço de armazenamento: profundidade de cor, taxa de compressão,
para ouvidos apurados). - Dimensão do ficheiro: aumentando-se a frequência de maior dimensão, optou-se por reduzir o seu número, aumentando o número de imagens vectoriais (se possível); [tarefas: Formar equipa gráfica; Verificar se a especificação de
amostragem, aumenta o número de amostras por segundo. Logo, a dimensão do frames P e B cujas taxas de compressão são bastante mais elevadas. necessidades é correctamente transmitida à equipa ; Efectuar a ligação entre a equipa gráfica e o
cliente, relativamente a alterações ou outros problemas; Criar componentes necessários; Fotos, desen-
ficheiro aumenta; Nr. de bits de quantização (nb): - Qualidade: aumentando-se nb, o >>>>MPEG-4, 2 seg: Frames P: No intervalo de tempo em que uma imagem é
hos, ícones; Adquirir e tratar imagens conforme necessário; Melhoria de contraste, cor, filtragem, etc;
valor digital de cada amostra recolhida fica mais próximo do original analógico, i..e, apresentada, todas as frames são exactamente iguais. Assim sendo, após uma Arquivar os ficheiros gráficos num formato de alta qualidade]; Produção de texto: Assegurar-se que o
o erro de quantização diminui. Como tal, a qualidade do sinal melhora - Dimensão dada keyframe, ao codificar-se uma frame P, todos os n vectores de movimento texto existente é verificado - Erros de typeset, OCR, consistência na formatação, etc; Utilização de
do ficheiro: com mais bits para representar cada amostra, a dimensão do ficheiro serão nulos. Neste caso, todos os macro-blocos são marcados como skipped fontes adequadas ao contexto; Texto legível - Fonte, dimensão, cor, contraste ; Propriedade intelectual:
aumenta macro-block, pelo que os resíduos não precisam de ser calculados. Temos Assegurar-se que existe permissão de utilização de todos os meios utilizados no projecto. Em caso de
então n vectores de movimento nulos a codificar via DPCM. Como são necessidade, consultar especialistas na matéria; [Integração: Formar equipa de software; Assegurar-se
constantes e iguais a zero, os erros de predição são nulos. Essa sequência que a especificação é correctamente entendida pela equipa; Controlar o desenvolvimento da aplicação
/// VIDEO DIGITAL de erros é depois representada por meio de um codificador entrópico (e.g., e efectuar a ligação com o cliente; Definir questões de copyright de código em cada ficheiro e incluir
>> Possibilidade de fluxo variável – CBR (vídeo em tmp real, sem buffer); VBR (+ bits nota no início – entrega de codigo fonte ou apenas executavel? Quais os direitos do cliente na sua
Huffman). Como há apenas um símbolo, será representado apenas por um
em cenas de transição rápida e – em variações lentas) manipulação;]; Teste do protótipo functional - Verificação do cumprimento dos objectivos do cliente
bit, tipicamente com o valor 0. Temos agora uma sequência de n bits a zero. (operacionais, estéticos, usabilidade, desempenho, ...)]; 3. desenvolvimento beta: 3.1. Ideia - Produto
>> Método geral: reduzir redundância a) espacial (correlação entre px vizinhos
Esta sequência é representada via RLE com recurso a apenas um símbolo do próximo da versão final do projecto - Poderá conter alguns bugs, mas não erros de fundo (requisitos,
– compressão intra-frame); b) espectral (freq as quais o olho é – sensível; com-
género <0, n>, em que 0 representa o código e n o comprimento da sequência. design); 3.2. Circulação externa restrita (Distribuição a um conjunto restrito de testers externos;
pressão intra-frame); c) temporal (correlação entre frames vizinhas – compressão
>>>> MPEG-4, a 24fps durante 30seg: Frames I: A 1ª frame terá que ser Cuidados redobrados: reputação externa começa a ser criada); 3.3. Teste da versão beta; 3.4.
inter-frame: codifica c/base nas diferenças entre frames) Preparação da documentação para utilizadores; 3.5. Preparação do pacote final; 3.6. Publicidade
sempre I, para servir de referencia ao futuro. Além disso, para acesso aleatório
>> Codecs Lossless (2:1 e 5:1) >> 1. compressão intra-frame, c/base em algorit- (imprensa, listas de distribuição, ...) /// Notas finais: 1. A fase de produção é habitualmente alvo de
é importante adicionar uma frame I a cada 10-15 frames. Para simplificar
mos n destrutivos de img; >> 2. utilidade: arquiva/ e tmp real feedback e modificações : 1.1. Projectos que “congelam” o design demasiado cedo tornam-se frágeis
os cálculos, podemos considerar uma frame I a cada 12 frames (considerei
>> Codecs Lossy (100:1 / 30:1 a 40:1) >> 1.compressão intra-frame, c/base em porque desperdiçam a oportunidade de melhorias incrementais: O design e a produção vão,
correcto qualquer outro valor). Resultado: 2 frames I / segundo x 30 segundos
algoritmos destrutivos de img; >>2. compressão inter-frame; >> 3. utilidade: difusão habitualmente, de mãos dadas - processo iterativo aberto e não estanque; 1.2. Mas... Equilíbrio
= 60; Frames B: Como o vídeo é estático, a utilização de frames B não traz necessário! - Demasiadas modificações geram instabilidade, o que pode conduzir ao fracasso do
de TV, home cinema
qualquer; compressão adicional face às frames P (nas frames P, todos os mac- projecto (custo temporal e monetário dispara; balanceamento “modificação vs custo” ); 2. Metodologias
/// MPEG - requisitos: a) compressão elevada (intra-frame não chega); b) acesso
ro-blocos serão marcados como skipped, pelo que o seu custo será próximo híbridas: clássicas vs ágeis; 3. Designers e implementadores devem trabalhar de forma próxima - Ide-
aleatório a frames; c) fforward e freverse; d) reverse playback; e) editabilidade do bit
de zero). Como a análise levada a cabo nas frames B é mais complexa que ias dos designers são exequíveis na prática? Implementadores devem ser fiéis às ideias dos
stream comprimido.
nas frames P, as frames B não são utilizadas. Resultado: 0; Frames P: Todas as designers;
- Codificação intra-frame: Frames I: codificadas de forma semelhante a JPEG; TESTE: 1. Definição dos testes a serem efectuados e supervisão do processo (Funcionais, estéticos,
restantes. Total de frames = 24 x 30 = 720. Resultado: 720 –60 = 660
keyframes; Codificação inter-frame: a) Frames P – compensação de movi/ relativa/ usabilidade, desempenho); 2. Constituição da equipa de teste: deve ser exigente e “agressiva”: todos
a frames P ou I; b) Frames B – compressão máxima; c) explora redundância tempo- os aspectos do trabalho deverão ser postos em causa para que a qualidade do produto final seja a
ral (diferenças entre frames e compensação de movi/); Downsampling temporal: PROJECTO // Etapas // 1. Planeamento: 1. a ideia >> recolha da ideia do cliente melhor – Aspectos positivos reforçados; negativos melhorados; tarefa requer personalidade muito
– definição da big Picture (rsp às questões o quê, pq, como e perceber se vale a pena específica: indivíduos com capacidade acima da média de olhar para o detalhe, minuciosos, rigorosos
redução do nº de fps;
avançar) >> compreender o cliente e a sua cultura; >> clarificar informação menos clara; e pacientes ; Beta testing : Não deverá envolver pessoas envolvidas na produção do projecto (ideias
/// MPEG-1 a) aplicações multimédia em CD-ROM; b) bit rate: 1.5 Mbps; c) com- >> recolher inf.suficiente p escrever 1proposta >> explicar questões q o cliente possa ter; pré-concebidas são prejudiciais); 3. Resposta a relatórios de erros - Formulários devem permitir a
pressão: 50:1 a 100:1; d) qualidade: semelhante a VHS; e) eficiência computacional: >> analise do mercado – publico alvo; >> formulários para recolher td a informação
replicação exacta das condições de erro, para a sua análise e correcção: Plataforma de software e
descompactação – requisitos satisfeitos (só reordenar frames) ; compactação mt relevante >> Request For Proposal (RFP) – proposta + formal, c/ documentos detalhados hardware, Passos executados, Comentários e sugestões; 4. Demonstração junto do cliente - Testes
lenta por software – problemas em tmp real; f) áudio: mp3; g) vantagens: ficheiros típica/ por empresas q fzm outsourcing do desenvolvi/ multimédia; conteúdo habitual: exaustivos concluídos antes da demonstração: poderá ser difícil recuperar de uma situação de perda
pequenos e baixos custos de produção; h) desvantagens: qualidade relativa/ baixa descrição do prob, objectivos e motivações; audiência; modelo de comunicação – qual a de reputação por apresentação prematura - preferível negociar adiamento, se necessário e possível; 5.
para aplicações HD; Algoritmo >> a) compensação de movi/ entre frames consecu- msg a passar e como; 2. determinação das tarefas essenciais: >> estratégia do tipo Entrega: 5.1. Escolha do meio de distribuição - CD, net,... ; 5.2. Preparação do programa de instalação
tivas: dado um MC (16x16), procura correspondência numa frame passada ou futura; divide & conquer: big Picture; fases de produção; definição de tarefas e itens + (e seu teste...) - Documentação de instalação e requisitos da plataforma: ficheiro README.txt (CPU,
específicos; varias iterações típica/ necessárias; 3. definição dos conteúdos >> ideia memória, resolução gráfica, disco, software (e.g., codecs de vídeo, Flash Player, e como os obter em
b) DCT para representar blocos c/ dados reais (frames I e diferenças entre frames);
geral do ambiente sonoro, visual e textual – q tipo de componentes áudio, vídeo, caso de necessidade)); 5.3. “Packaging”: a) Efeito psicológico: tal como num livro, o aspecto da capa
c) DPCM para codificar componente DC dos coeficientes da DCT e vectores de animações?; >> selecção de meios: definir condicionantes à utilização de meios e é importante - 1ª impressão é sempre importante: Volume da caixa do CD, aparência do site do jogo,
movi/; - cada MC é dividido em luminância e crominância (YUV); - Compressão das técnicas; compreender e tirar partido das virtudes e limitações de cada meio; envolver
estilo, peso, etc., influenciam a percepção de valor pelos utilizadores - Utilizadores e ambiente pagam
Frames I: codificação intra-frame; DCT em blocos 8x8; quantização dos coeficientes especialistas de cada meio (se o orça/ der); manter como parâmetro principal as necessi- custos de aparência, Actualmente, custos ambientais com mais impacto; Manual de instalação e
da DCT ([] de valores + reduzido e mt valores=0); zig-zag; codificação entropica dades do utilizador; 4.definição da plataforma >> plataforma do utilizador final e utilização; b) Marketing ((Resultados no topo no Google; Título deve ser bem visível numa estante));
(Huffman e RLE); - Compressão das Frames P: baseia-se na estimação de movi/ plataforma de desenvolvimento: discutir c/cliente as plataformas de desenvolvi/ e 5.4. Preparação do apoio técnico (Web site com páginas de apoio técnico (FAQs, resolução de bugs,
entre frame N e N-1 (do tipo I ou P); se tds os elementos sofrerem um desloca/ utilização; aconselhar sobre meios de distribuição; compreender e explicar as upgrades e relatórios de alterações)); 5.5. Criação de uma equipa de vendas; 5.6.  Pagamento de
semelhante, as frames podem ser descritas por vectores de movi/ - para estimar implicações da escolha de plataforma; >> analise da distribuição – de q forma será prémios e bónus; 5.7. Festa de lançamento (FIM) /////////////////////////////////// 1. Gestão da equipa; 1.1.
entregue o produto final? >> que ferramentas para edição de som, vídeo, etc? Estão Negociar em nome da equipa; 1.2. Motivar e dirigir a equipa; 1.3. Criar bons meios de comunicação
o vector procura um bloco (algoritmo de pesquisa); regiões estáticas = matching
disponíveis? >> ferramentas de apoio à gestão de projectos, design colaborativo, entre os membros da equipa; 1.4. Utilizar estilos de gestão adequados a cada momento e à equipa:
perfeito; p regiões dinâmicas a predição n é perfeita, pq os vectores podem n pré-authoring; 5. selecção da equipa >> listar o pessoal necessário em função das Directivo, Consultivo, Colaborativo, Descentralizador; 1.5. Identificar e corrigir dificuldades no funcio-
corresponder ao desloca/ efectivo – solução é guardar resíduos (imgs c/erros de caractristicas do proj; >> verificar os recursos disponíveis e os q será necessário namento da equipa (funcionais, de decisão e de relacionamento); 1.6 Identificar e resolver problemas
previsão); - Comp.d Frames B: usa vector backward, forward e codificam erro c/ contratar; >> seleccionar os elementos >> definir as funções e responsabilidades de externos que afectem a equipa.
base em interpolação( substrair ao bloco a média do passado e futuro) – dp DCT, cada membro; >> inteirar os elementos das suas funções no proj; 6. escalona/ temporal
Quant, RLE; Compensação de Movimento // Tipos de blocos Codifica-se imgs de das tarefas e atribuição de funçoes >> qual a disponibilidade de tempo? >> diagrama
resíduos e vectores de movi/ c/ DCT, Q, RLE. (vectores de movi/ é Huffman!) .. em de gantt: fluxo temporal das tarefas - algumas tem q esperar o término de tarefas Há dois tipos fundamentais de transparência em imagens: por definição de cor transparente (e.g., GIF)
MB q podem ser de 3 tipos: a) Skipped MB (variação inferior a limiar – assume-se pré-requeridas; algumas etapas podem começar antes do fim das etapas anteriores; ou por utilizar de um canal alpha (e.g., PNG).
pré-requisitos de cada tarefa; estimação da duração de cada tarefa e seus responsáveis; Cor transparente: o JPEG não a suporta por ser um codec destrutivo, o qual não garante que a cor
q bloco n sofreu alterações e p/isso n precisa ser codificado (zero motion vector));
7. analise de risco: >> quais os riscos de cada tarefa e quais os planos de contingência; original se mantenha inalterada.
b) Inter MB (bloco codificado c/compensação de movi/); c) Intra MB – erro elevado: 8. elaboração da proposta >> 8.1. orientações gerais >> elaborar uma proposta realista Canal alpha: Nos canais alfa temos, tipicamente, valores máximos ou mínimos para cada pixel (i.e., va-
codifica-se sem previsão, cm nas frames I. Se houver mts intraMB codifica-se a e justa, tt p o cliente cm p a equipa de desenvolvi/: a) custos: (estimação geral dos custos lores 0 ou 255). Assim sendo, a matriz correspondente ao canal alpha conterá transições abruptas, as
frame como I; - DPCM: componente DC e vectores de movi/ codificados via DPCM envolvidos: recursos humanos, hardware, software;qual a verba necessária? Compatível quais apresentam as dificuldades conhecidas: Q alto  pouca compressão; Q baixo  muita distorção.
(codifica as diferenças); Codificação entrópica: coeficientes da DCT, resíduos e com as restrições orçamentais?); b) tempo de desenvolvi/; >> nao fzr promessas difíceis Pelos motivos enunciados, a especificação do JPEG não suporta nenhum tipo de tranparência.
parâmetros de quantização – Huffman e RLE /// RESUMO: 1. conversão RGB – de cumprir: por vezes sabe-se q a proposta estará em competição c/outras, o q cria
YUV; 2. Downsampling: Y na totalidade, U e V em metade em ambas as direcções; 3. pressão p + do q o razoável – riscos p o desenvolvi/; balancea/: necessário reajustar Frequência de amostragem (fs):
1ª frame: tipo I; 4. Frames seguintes – analise dos MB e codificação no tipo de frame objectivos em função dos recursos disponíveis – reavaliação; >> tomar decisões - Qualidade: pelo teorema de Nyquist, a fs deve ser pelo menos o dobro da frequência máxima no
baseado em factos e no julga/ de riscos; >> propor alternativas ao cliente; 8.2. conteúdo sinal. Assim, se a fs aumenta, a frequência máxima que o sinal pode conter também aumenta. Se o si-
+ adequado (qd é mt variação ou é preciso keyframe é I; compensação de movi/
genérico da proposta: >> sumariar as decisões de desenvolvi/, tendo por base: nal analógico original tiver frequências muito altas, o aumento da fs leva a uma melhoria da qualidade
backward é P; compensação de movi/ backward / forward é B); 5. DCT: blocos 8x8 informação recebida do cliente; experiencia do gestor de projectos; discussões c/ do sinal digitalizado (particularmente relevante para ouvidos apurados).
nas frames I (Y,U e V) e blocos 8x8 nas imgs de resíduos (P e B) 6. Quantização dos membros da equipa; alternativas de desenvolvi/ 8.3. conteúdo especifico da proposta:
- Dimensão do ficheiro: aumentando-se a frequência de amostragem, aumenta o número de amostras
coeficientes da DCT; 7. DPCM aplicada aos vectores de movi/ e componentes DC; 8. introdução geral; indicação do q o cliente quer; indicação das necessidades do utilizador; por segundo. Logo, a dimensão do ficheiro aumenta Nr. de bits de quantização (nb):
Codificação Huffman e RLE aos coeficientes da DCT quantizados e aos da DPCM; descrição geral do q se propõe; variações possíveis; diagrama da estrutura proposta; - Qualidade: aumentando-se nb, o valor digital de cada amostra recolhida fica mais próximo do original
///MPEG-2 a) aplicações para difusão de TV digital, DVD; b) melhor resolução e descrição dos recursos humanos envolvidos; divisão do trabalho e calendarização; analógico, i..e, o erro de quantização diminui. Como tal, a qualidade do sinal melhora
qualidade nas imgs q MPEG-1; c) suporta vídeo entrelaçado (adequado ao sinal da estrutura de custos e pagamentos; indicação das limitações da proposta;9. definição de - Dimensão do ficheiro: com mais bits para representar cada amostra, a dimensão do ficheiro aumenta
TV); d) bit rate mt superior a de MPEG-1; e) taxa de compressão: 50:1 a 100:1 questões contatuais >> detalhar os custos do projecto de modo a facilitar o seu
controlo; >> definir responsabilidades (fornecedor de serviço; cliente);>> definir c/cliente a) Imagem true color = 24 bits (e não 32 bits porque o canal alpha, i.e.,
>>Melhorias face MPEG-1 a) + precisão nos vectores de movi/; b) precisão selec-
formas de trabalho em comum; >> clarificar questões legais (politica qt a licenças de transparência, não é utilizado em vídeo)
cionável na DCT (até 10 bits de quantização); c) escalabilidade: Scalable Vídeo terceiros; drt a apresentar créditos pelo desenvolvi/; exclusividade; copyright – proprie- TF = Tamanho de cada frame = 300x200x3 bytes = 180000 bytes = 180 KB
Coding (permite adequar-se a ≠ receptores) dade sobre o código fonte, politica de reutilização); 2. Design >> 1. pré-testes >> TS = Tamanho por segundo = TFx25 fps = 180 KB x 25 fps = 4500 KBps =
>>Profiles e Levels a) implementação total é mt complexa e p/isso usam-se profiles definição detalhada dos objectivos; definição detalhadas das competências necessárias = 4.5 MBps
– subconj da implementação total orientados p aplicações específicas; b) levels: definição dos conteúdos; criação de um protótipo simples; analise da estragia de Dimensão do ficheiro = 4.5 MBs * 120s = 540 MB
gama de parâmetros suportados (p.ex p TV digital n é escalável) marketing e vendas; 2. definição de conteudos >> 2.1. orientações gerais: Bit rate = 4.5 MBps = 4.5 x 8 bits = 36 Mbps
>> Organização – Parts a) Part 2: Vídeo; b) Part 3: Áudio – mp3 c/+ q 2canais, assegurar-se q os conteúdos são adequados p a msg e p a audiência; definir limites p a b) bitrate = 36 Mbps / 100 = 0.36 Mbps = 360 kbps
outras taxas de amostragem e bit rates; c) Part 7: AAC pesquisa de conteúdos; influenciar a selecção de conteúdos feita pelo cliente; manter c) O codec MPEG explora redundância espacial, espectral e temporal, com base em três tipos de
uma visão global do projecto, mm enqt se trabalham os detalhes;guiar o cliente na frames utilizadas:
>>MPEG-3 integrou-se em MPEG-2 através de novos profiles e levels;
avaliação de conteúdos; acordar tmps de analise nºde revisões; providenciar q sjm · Frames I: compressão intra-frame
///MPEG-4 a) extensão p suporte de obj.audio e vídeo, conteúdo 3D, DRM, stream- assinados acordos de conteúdos; 2.2. definição de conteúdos: scripting: tomar o Exploram redundância espectral e espacial, de forma semelhante ao JPEG, i.e., eliminação de
ing de vídeo, representação simbólica de música; b) pouco aceite pq tem melhorias decisões sobre os materiais adequados ao propósito do proj (áudio, vídeo, animações);
informação com menor relevância perceptual (presente na crominância, Cb e Cr), quantização dos
pc notórias em relação aos custos de desenvolvi/ e tmp computacional estudar impacto das escolhas dos utilizadores na estrutura do proj; comunicar c/ resultados da DCT e codificação entrópica (RLE, Huffman)
MPEG-4 Part 2 // Melhorias face MPEG-2 (m c/efeito negativo na velocidade) programador; organizar material num doc.de especificação q possa ser entendido pela · Frames P e B: compressão inter-frame o Exploram redundância temporal o Compressão adicional
a) global motion compensation: estimação do movi/ global através de um modelo equipa; 3. prototipagem >> 3.1. objectivo: estudo de conceito ou prova de adequação pela utilização de mecanismos de previsão e não apenas pela detecção das diferenças entre blocos
paramétrico; b) Qpel – vectores de movi/ + precisos (precisa + bits) (experimentação c/≠ abordagens, formas de navegação); 3.2. diagrama de navegação em frames consecutivas compensação de movimento
MPEG-4 Part 10 >> 50% de ganho em bit rate sobre o Part 2, sem complexidade – esquema geral das ligações entre unidades, p dar coesão ao projecto: esquema geral
das ligações entre as varias unidades da aplicação; ajudam a organizar o conteúdo e as
excessiva: a) compensação de movi/ até 16 frames de referencia; b) blocos de
interacções; >> metodologias: linear – navegação sequencial entre ecrãs; hierárquica “Nokia 5300 Xpress Music” possibilita som com qualidade de CD no formato AAC a 128 kbps. V ou F?
dimensão variável; c) vários vectores por MB (tem várias imgs de ref); d) Qpel; e) – navegação ao longo dos ramos de uma arvore, atendendo à natureza lógica co · Em termos estritamente objectivos e quantitativos, a afirmação é falsa:
Frames B podem servir de referencia conteúdo; nao-linear – navegação livre, sem restrições de sequencia: importante p os o Bit rate da qualidade de CD:
utilizadores (escolha); composta – navegação livre mas, ocasional/, restrição a Frequência de amostragem = 44100 Hz
/// Outros ///DivX - ≠ implementação da MPEG-4 Part 2 ///WMV - ≠ implementação navegação linear; >> estrutura: a) profundidade: mapa de navegação completo e Quantização = 16 bits
da MPEG-4 Part 2; utilizado como wrapper do ASF; para DRM e streaming; explícito, c/ tds as ligações entre unidades; b) superfície: navegação real pelo utilizador Nº de canais = 2 (stereo)
/// MJPEG >> cada frame é codificada separada/ cm JPEG; n usa inter-frame – (utilidade: olhar p o produto segundo a óptica do utilizador; empresas de marketing Bit rate = 44100 x 16 x 2 = 1411200 bps ~ 1411 kbps, o que émuito superior a 128 kps!
menos capacidade de compressão mas + facilidade de edição de vídeo usam-nas no estudo do comporta/ de utilizadores através de Web site, de forma a o AAC elimina, de forma irreversível, informação contida no sinal original, pelo que o sinal áudio nunca
analisar os seus perfis, avaliar a eficácia do design e conduzir o utilizador para um dado será igual ao sinal obedecendo aos requisitos referidos de qualidade de CD
Possibilidades: a) taxa de compressão entre 2:1 e 12:1; b) vídeo de alta qualidade
percurso); 3.3. storyboard – versão do diagrama de navegação, organizado sequencial/, · Subjectiva e qualititativamente, a afirmação poderá ser verdadeira:
= ficheiros mt grandes; c) codec simétrico; d) utilização: câmaras de vigilância ecrã a ecrã, em cada ecrã contem layout genérico e notas de design; 3.4. design de o O AAC é um codec perceptual, de modo que a informação eliminada é, em geral, imperceptível ao
///DVI >> quantização vectorial: a) + flexível q a escalar; b) utiliza dicionário q interface – mecanismos de interactividade; a) conhecer vários tipos de interfaces e a “comum dos mortais” (componentes de alta frequência, sons mascarados no tempo ou no espectro),
permite > compressão; >> compressão inter-frame pela quantização da magnitude sua adequação a diversos tipos de aplicações; b) compreender os vários componentes como o confirmam testes de audição realizados em vários indivíduos o Porém:
e direcção de movi/ de cd pixel; >> DCT, RLE...; Possibilidades Compressões 80:1 de uma interface e o seu significado p os utilizadores (ex.codigo de cores); c) em mapas As perdas poderão ser detectadas por indivíduos com maior acuidade auditiva
mas qualidade n mt elevada; /// Indeo Vídeo codec assimétrico (compressão mt de navegação n-lineares há demasiada liberdade q pode originar perda de unidade e A detecção de perdas é também influenciada pela qualidade do equipamento de reprodução de som
superior a descompressão); ///IVI >> a) evolução do Indeo: suporta transparências; coesão: guiar utilizador, dando indicações relativas a importância, ênfase e direcção · Assim sendo, a afirmação, sendo objectivamente falsa, é aceitável do ponto de vista subjectivo
b) descodificação localizada permite descodificar só uma parte; c) escalabilidade (variação de fontes, cores, indentação) e definir ancoras seguras – botões q levem a
locais de referencia (menu principal, help); d) minimizar a curva de aprendizagem:
q evita perda de frames se o poder computacional é insuficiente; d) ajuste de
botões c/sentido, ícones intuitivos, dicas textuais; botões interactivos (realçados qd rato
parâmetros (brilho, contraste) durante execução; e) codec assimétrico se > taxa de se sobrepõe); consistência ao longo da aplicação; manter metáforas de sucesso
compressão e simétrico se menor taxa de compressão (pode-se utilizar em tmp real) (ampulheta para pausas); formas alternativas de navegação – mapas cronológicos,
///Cinepak >> a) quantização vectorial e compressão inter-frame; b) qualidade média QTVR c/hotspots clicáveis; e) interface áudio – musica de fundo com sentido, on/off; f)
(bom p CD-ROM?); c) codec assimétrico (comp = 300*descomp); d) utilização: texto – fonte adequada ao contexto; g) analisar interface à luz do publico alvo, tendo em
vídeos com mt movimento; e) em relação ao Indeo: vantagens – 1) sequencias c/ vista identificar possíveis problemas de interpretação – testas a interface c/
elevado dinamismo; 2) reprodução de vídeo com prof.de cor de 16 ou 24 bits; representantes do publico alvo; 3.5. desenvolvi/ das msgs – textos, animações, vídeo;
desvantagens – sequencias c/movi/ lento. 3.6. teste do protótipo – tecnologia, custo, mercado; selecção de um grupo de teste:
utilizadores potenciais; 3. Produção >> 1. aspectos gerais a considerar: 1.1. tarefas
contínuas de re-organização - imprevistos devem ser considerados parte do plano:
FORMATOS /// AVI a) arquitectura aberta q permite vários codecs; b) informação avaria de disco, etc; 1.2. questões de design n contempladas – voltar a reunir c/cliente

Potrebbero piacerti anche