Esta dissertação descreve o trabalho realizado sobre técnicas de codificação e processamento de informação visual, para aplicações multimédia, no domínio do ensino à distância (e-learning). Após uma breve introdução onde se estabelece o contexto e a motivação, são descritos os principais algoritmos que actualmente se usam na codificação de informação visual. É dada especial ênfase às normas de codificação MPEG-2 e MPEG-4, por serem as utilizadas no âmbito deste trabalho. Seguidamente faz-se uma abordagem a técnicas de segmentação de vídeo para identificação de objectos visuais. Também neste caso, limita-se a descrição aos casos com interesse directo no trabalho desenvolvido.

Em termos de realização prática, no âmbito desta dissertação, foram desenvolvidos dois algoritmos de segmentação de vídeo digital, para extracção de dois objectos visuais a partir de vídeo comprimido em MPEG-2. O tipo de informação visual, assim como os algoritmos implementados para o seu processamento, estão relacionados com o contexto da aplicação. O primeiro algoritmo opera no domínio comprimido MPEG-2 para produzir máscaras binárias que definem os objectos visuais segundo a norma MPEG-4. O segundo, para além de fazer uso de informação comprimida na obtenção de uma primeira aproximação das máscaras de segmentação, recorre a informação espacial da sequência com vista à sua optimização.

Os resultados mostram que se consegue obter uma melhoria na eficiência de codificação, quando se faz uso das funcionalidades disponibilizadas pela norma MPEG-4 para objectos visuais. Em comparação com a codificação de um sinal vídeo tratado como uma série de matrizes de pontos, o sistema implementado mostra que é possível flexibilizar o acesso a conteúdos multimédia em ambientes de comunicação heterogéneos.

Figura 1: Resultado da segmentação efectuada directamente no bitstream de vídeo comprimido em MPEG-2

Figura 1: Resultado da segmentação efectuada directamente no bitstream de vídeo comprimido em MPEG-2