A digitalização de documentos em papel gera imagens que têm zonas de texto, bem como zona suaves. Estas imagens, genericamente denominadas de imagens compostas, têm características específicas que tornam a sua compressão num problema interessante. As vantagens da utilização destes métodos de compressão são notórias e prendem-se com a disseminação das ferramentas de digitalização e dos meios digitais de arquivo, transmissão e visualização de documentos.

O objectivo do Projecto SCODE é a utilização de um novo paradigma de codificação de imagens na compressão de documentos digitais. O algoritmo “Multidimensional Multiscale Parser”, ou MMP, foi proposto como um método genérico para compressão de dados multidimensionais. O MMP utiliza um dicionário adaptativo de padrões a diferentes escalas para aproximar blocos de diferentes dimensões, resultantes da divisão da imagem de entrada em blocos. Esta aproximação utiliza uma transformação de escala, que adapta blocos de diferentes dimensões antes do algoritmo tentar fazer a correspondência. Recentemente, esta equipa de investigação esteve envolvida no desenvolvimento de um novo método baseado no MMP, denominado MMP-Intra, capaz de obter resultados para a codificação de imagens que estão bem acima dos obtidos pelos melhores métodos tradicionais para imagens não suaves, como imagens de texto, compostas e de texturas.

Com este projecto pretende-se desenvolver um novo algoritmo de codificação de imagens compostas, resultantes da digitalização de documentos, baseado num algoritmo semelhante ao MMP. Dado o desempenho deste algoritmo, demonstrado em trabalhos anteriores, um algoritmo baseado no paradigma do MMP e desenvolvido de raiz para a codificação de imagens compostas tem potencial para atingir níveis de desempenho bem acima dos obtidos pelos melhores métodos de codificação de documentos digitalizados propostos na literatura actual.

Figura 1: Resultados da compressão de um documento composto

Figura 1: Resultados da compressão de um documento composto

Figura 2: Interface com o utilizador do codificador SCODE

Figura 2: Interface com o utilizador do codificador SCODE