portal da UFRGS
Faculdade de Medicina - UFRGS
Informática em Saúde
portal da FAMED

Gráficos
Professor Paul Fisher Última atualização: 2007-08-13

Tipos de Imagem Digital
Imagens Matriciais (Bitmap) ou Imagem de Rastreio (Raster)

Dados matriciais ou bitmap são formados por um conjunto de valores numéricos que especificam as cores de elementos individuais da tela ou dispositivo de saída. Os arquivos matriciais ou bitmap variam em seus detalhes, mas todos possuem a mesma estrutura geral: a) um cabeçalho com as dimensões espaciais e de contraste e a paleta de cores, b) o corbo de dados do bitmap e c) algumas outras informações.

Para editar ou modificar estas imagens de bitmap, você usa um programa de pintura. Imagens de Bitmap são extensamente usadas mas elas sofrem de alguns problemas inevitáveis. Elas devem ser impressas ou devem ser exibidas na tela em um tamanho determinado pelo número de pixels na imagem. Imprimindo ou exibindo em qualquer outro tamanho pode criar efeitos não desejados na imagem. Imagens de Bitmap também têm tamanhos de arquivo grandes que são determinado pelas dimensões da imagem em pixels e sua fidelidade de cor. Para reduzir este problema, são usados alguns formatos gráficos como GIF e JPEG, para armazenar imagens em formato comprimido.

Estes arquivos possuem as seguintes qualidades:

  • Podem ser facilmente criados a partir de vetores de pixels existentes na memória.
  • Os dados podem ser modificados individualmente ou em grandes grupos, alterando a paleta, se esta estiver presente.
  • Podem ser facilmente traduzidos para dispositivos de saída com CRTs e impressoras.

Contudo, eles apresentam as seguintes desvantagens:

  • Podem ser muito grandes, especialmente se a imagem contiver uma quantidade muito grande de cores. Técnicas de compressão de dados podem reduzir o tamanho dos dados a serem armazenados, mas estes dados terão de ser descompactados antes de serem usados, o que torna mais lenta a utilização destes dados.
  • Pode ser difícil modificar o tamanho das imagens, sendo às vezes conveniente imprimir a imagem na sua resolução original.

Imagens Vetoriais

O formato de dados vetoriais é um meio de representar primitivas gráficas pela representação numérica de 'pontos chave'. Exemplos de primitivas gráficas são pontos, linhas, polígonos, curvas ou figuras geométricas simples. O trabalho de um programa para mostrar dados representados desta forma, é gerar as linhas para conectar os 'pontos chave' ou desenhar estas linhas usando estes pontos como guia. Sempre existem atributos, como cor e largura de linha, associados aos dados, além de uma série de convenções que permitem ao programa desenhar os objetos desejados. Estas convenções podem ser implícitas ou explícitas, e apesar de serem usadas com os mesmos objetivos, podem ser diferentes de programa para programa.

 

Resolução Espacial
Imagens de Bitmap são definidas pela dimensão delas em pixels, a resolução espacial. Por exemplo, uma imagem de 640X480 contém 640 pixels X 480 pixels respectivamente na direção horizontal e vertical. Se você aumenta uma área pequena de uma imagem de bitmap, você pode ver os pixels que são usados para criá-la muito claramente. Quando normalmente vista, os pequenos pixels se fundem em harmonia contínua muito parecido com os pontos que criam fotografias de jornal fazem. Cada um dos pequenos pixels possuem uma graduação de cinza ou uma cor. Usando cor de 24-bit, cada pixel pode ser fixado em qualquer uma de 16 milhões de cores. Todas as fotografias e pinturas digitais são bitmapped e qualquer outro tipo de imagem pode ser guardada ou pode ser exportada em um formato de bitmap.

 

Resolução Contraste


A quantidade de bits usada para representar cada pixel é chamada de profundidade de imagem ou resolução contraste. Quando 1 bit é usado para representar a informação de um pixel, pode-se representar dois estados de cores, 0 ou 1 (21). Quando 2 bits são usados para representar 1 pixel, quatro (22) cores podem ser representadas, porque existem quatro possíveis combinações para os valores destes bits: 00, 01, 10 e 11. Da mesma forma, com 4 bits representando um pixel podemos obter 16 (24) cores, e assim sucessivamente.

 

Classes de imagens Baseado na Resolução Contraste


Imagem P&B com dois níveis de intensidade - São imagens cujos pixels possuem apenas dois níveis, indicando apenas se este ponto está acesso (branco) ou apagado (preto). Também conhecida como imagem binária.

Imagem P&B com N níveis de intensidade - São imagens onde é possível distinguir diferentes níveis de intensidade de cinza, obtidos através da quantificação das intensidades de luz intermediárias entre o preto e o branco. O número N de tons é normalmente uma potência de dois, e depende do número de bits usados para armazenar o valor da intensidade do pixel. Usualmente trabalha-se com 256 tonalidades, o que equivale a 8 bits/pixel. Este número é mais que suficiente para representar as diferentes tonalidades da escala de cinza perceptíveis ao olho humano.

Imagem de uma banda do espectro com N níveis de intensidade - Assim como se obtém uma escala de cinza, é possível obter uma escala de tonalidades de outras bandas espectrais (faixas de comprimentos de onda abrangidas). Exemplos de diferentes bandas espectrais são: escala de vermelho, verde, azul, infravermelho, etc. É interessante ressaltar que uma escala de tonalidades não precisa ficar restrita apenas às freqüências visíveis, podendo atingir outras faixas de comprimento de onda, como por exemplo o infra-vermelho. Esta banda é muito usada em satélites, que possuem sensores especiais para esta faixa, podendo detectar, por exemplo, a emissão de calor e consequentemente identificar queimadas.

Imagens multi-espectrais (coloridas) - A quantificação das intensidades de mais de uma banda espectral por vez fornecerá uma informação mais completa a respeito da cena adquirida. Este é o caso da obtenção de imagens coloridas, pois estas são obtidas através de sensores específicos para a determinação de cada uma das intensidades de vermelho ( Red ), verde ( Green ) e azul ( Blue ) - RGB. A mistura destas três bandas ou cores, permite que se tenha a sensação de enxergar imagens coloridas, uma vez que o olho humano possui sensores que atuam justamente nestas três faixas de comprimento de onda. As imagens coloridas são usualmente compostas por um conjunto de 24 bits : 8 bits para representar as intensidades de vermelho, 8 bits para o verde e 8 bits para o azul. Com a composição destas três cores básicas utilizando-se 24 bits/pixel, pode-se chegar a um número de até 16 milhões de cores e tonalidades distintas. Este número é perfeitamente adequado para a representação da realidade, em cenas digitalizadas, sem a menor perda de detalhes e qualidade em relação às cores. Isto é devido ao fato deste número de cores ser em muito superior à capacidade do olho humano em distinguir cores e tonalidades.

Imagens coloridas com uso de Look Up Table (paleta) - A obtenção de imagens coloridas não está restrita apenas às imagens com representação multi-espectral para cada ponto. Pode-se gerar uma imagem onde cada pixel é associado a um valor referente a uma tabela de palette (LUT - Look Up Table), que descreve a cor real deste ponto da imagem. Desta forma não é preciso associar a cada ponto da imagem as informações a respeito das intensidades RGB, podendo então armazenar imagens de cenas coloridas sem a necessidade de reservar uma memória de 24 bits/pixel. Para este tipo de imagens, uma cena é composta pelo mapa de pixels, ou seja, a matriz MxN de pontos com os índices de acesso às cores da LUT, adicionada a uma tabela de acesso indireto às cores reais (LUT), a chamada tabela de palette.

Formatos de Arquivos


BMP

Arquivos BMP, usam um formato bitmap do Windows. Estas imagens são armazenadas em um formato dispositivo independente bitmap (DIB). O termo "independente de dispositivo" significa que o bitmap especifica a cor do pixel em uma forma independente do método usado por um dispositivo de exibição para representar a cor.

JPG

JPEG é um padrão internacional, proposto pelo comitê ISO Joint Photographers Expert Group. JPEG foi desenvolvido para comprimir imagens naturais do mundo real, tanto coloridas como em tons de cinza. Ela trabalha bem em fotografias, arte naturalística e material similar, mas não é adequada para imagens simples como faixas, cartões ou desenho com linhas.

Esse formato permite a transferência de arquivos por uma grande variedade de plataformas e é baseado em codificação da imagem por transformação matemática, o que oferece altas taxas de compressão, embora haja perda de informações.

Este formato pode comprimir imagens até um quinto do tamanho original, sem perda de qualidade perceptível. Os arquivos de imagens que seguem este formato têm extensão .jpeg ou .jpg.

A técnica de compressão de imagem adotada pelo JPEG possui perda, ou seja, a imagem após a compressão não é exatamente a mesma que a original. Isto ocorre porque JPEG foi projetado para explorar limitações conhecidas a respeito do olho humano, principalmente o fato de que pequenas mudanças de cores são menos perceptíveis que pequenas mudanças de brilho.

É comum a existência de um certo receio pelo fato da compressão ser feita com perda, porém é importante ressaltar que quando a digitalização de uma imagem é feita para representar cenas do mundo real, e nenhum formato de imagem digital pode reter toda a informação que incide no olho humano. Em comparação com cenas do mundo real, JPEG perde bem menos informações que os outros formatos de imagens.

Uma útil propriedade do JPEG é que o grau de perda pode ser variado ajustando-se os parâmetros de compressão. Isto significa que o criador da imagem pode decidir o que é mais importante: tamanho ou qualidade da imagem. Pode-se obter arquivos de imagens extremamente pequenos, se a qualidade não for importante, porém é possível sacrificar o espaço de armazenamento, melhorando-se a qualidade até o nível desejado. Um outro importante aspecto do JPEG é que os decodificadores podem fazer um balanço entre velocidade e qualidade da imagem, usando aproximações mais rápidas, porém menos precisas para os cálculos necessários. Alguns softwares visualizadores obtêm incríveis velocidades desta forma.

GIF

O arquivo gráfico GIF foi desenvolvido em 1987 pela empresa Compuserve. Esta empresa criou a tecnologia Graphics Interchange Formats (Formato de Intercâmbio de Gráficos), sua primeira versão surgiu com o nome GIF87a. Desde então esta tecnologia foi se aprimorando sempre com muito sucesso devido a sua baixa taxa de compactação. Coma a explosão da internet, a imagem gif se propagou por todo mundo com muita ênfase.

Este talvez seja o formato mais popular da Web. O formato GIF foi originalmente criado pela empresa CompuServer, uma das primeiras redes on-line comercias. Como este formato foi desenvolvido principalmente para uma rede de computadores com baixa largura de banda, nada mais óbvio ele ser o primeiro formato de imagem escolhido à Web.

O formato GIF se baseia no algoritmo Lempel-Ziv Welch (LZW), uma fórmula matemática que pode transformar grandes arquivos em arquivos menores e realmente adaptados ao uso na Web. Este algoritmo realiza sua mágica compactando uma séria de símbolo repetidos em um único símbolo multiplicado pelo número de vezes que ele aparece. Por exemplo, se numa imagem fossem agrupados 10 pixels pretos, num arquivo sem compactação, estes seriam representados por 10 símbolos. No entanto em um arquivo GIF compactado são necessários apenas dois símbolos: um com o número de repetições da cor e outro com a cor em si. Como você pode ver, ao invés de 10 elementos de dados são necessários apenas dois.

A compactação LZW é chamada de formato de dados sem "perda", pois mesmo que os dados estejam sendo compactados, a imagem após ser compactada possui o mesmo aspecto da imagem original. Outro detalhe sobre o formato GIF é que ele permite imagens com no máximo 256 cores. Esta limitação se deve justamente ao motivo pelo qual este formato foi criado, ou seja, transmissão de imagens com pequena largura de banda entre os computadores. Já que cada cor adicional em uma imagem é um dado a mais, logo, quanto menos cores tiver menor será o tamanho do arquivo.

PNG

O formato PNG surgiu como resposta às limitações técnicas e às restrições legais derivadas dos direitos de propriedade do formato GIF. Na verdade, o limite de 256 cores deste formato deixou de atender às exigências dos usuários quando estes passaram a dispor de hardware gráfico que permitia a exibição de mais de 256 cores.

A definição do formato PNG manteve algumas das características do formato GIF:

  • Suporte de imagens até 256 cores (imagens com 1, 2, 4 e 8 bits por pixel), empregando mapas de cor.
  • Conceito de canal de dados gráficos, o que permite a apresentação e transmissão seqüenciada e controlada de imagens.
  • Apresentação progressiva de imagens, que permite a sua apresentação antes de completada a sua transmissão, embora com baixo nível de detalhe.
  • Transparência parcial, permitindo que partes da imagem sejam declaradas como transparentes.
  • Informação textual, que permite a inclusão de textos e de comentários, como informações de copyright.
  • Independência de plataforma de hardware e software.
  • Compressão sem perda de dados.
  • Complementando a definição do formato GIF, o formato PNG acrescentou as seguintes funcionalidades:
  • Imagens com cores reais (truecolor), utilizando até 48 bits por pixel, permitindo 24 ou 48 bits por pixel, ou seja, 8 ou 16 bits por cada componente de cor.
  • Transparência por meio de um canal alfa, definindo máscaras de transparência globais, variando de pixel para pixel, nas imagens com 8 ou 16 bits por pixel ou por componente de cor.
  • Informação (opcional) sobre a correção gama aplicada a imagem, que, quando presente, permite que as aplicações possam realizar a correção adequada às cores da imagem, em função das características do dispositivo de exibição.
  • Detecção da corrupção de dados, realizada em todos os blocos das imagens.
  • Maior rapidez na apresentação de imagens através de um algoritmo melhorado de entrelaçamento para apresentação progressiva.
  • Algoritmos de compressão de domínio público que não se encontram sujeitos a restrições ou licenças derivadas de direitos de propriedade e que permitem compactar a informação até 25% mais do que o algoritmo LZW do formato GIF.

Bibliografia


Processamento Digital de Imagens - Conceitos básicos de imagens
http://www.ee.furg.br/~silviacb/DIP/Conceitos_Basicos.html

Usando o Computador para Processamento de Imagens Médicas
http://www.informaticamedica.org.br/informaticamedica/n0106/imagens.htm

Fundamentos da Imagem Digital
http://www.tecgraf.puc-rio.br/~rtoledo/cg1/apostila%20imagem%20digital.pdf

Formatos de Imagem e Formatos de Arquivo
http://www.mariomarino.com.br/digital/formatos.htm

Wikipedia: Imagem digital
http://pt.wikipedia.org/wiki/Imagem_digital

Formato de Arquivo: BMP
http://easygrid.ic.uff.br/~aconci/curso/bmp.pdf