4. Morfologia matemática em cores


A morfologia matemática realiza suas operações com conjuntos que compõem um volumem completo, isto é, que obedecem a relações de ordem em seus níveis digitais e tem um limite inferior e um limite superior.

As imagens binárias e as imagens em níveis de cinza atendem a essa condição, enquanto, nas imagens coloridas, surgem problemas para ordenar as cores presentes e definir esses limites. A desvantagem surge na ausência de ordem entre os pixels cromáticos, uma vez que eles correspondem a vetores tridimensionais e, a priori, não há ordem natural para determinar que, por exemplo, no sistema RGB, um pixel com valor (34,26,123) é menor que (59,1,104). A formulação da morfologia matemática em cores requer a presença de ordem entre os pixels da imagem.

Uma solução para o problema da ausência de ordem pode ser obtida considerando imagens coloridas como a composição de três funções bidimensionais independentes com valor unidimensional. No caso do espaço RGB, a imagem é considerada como uma composição de mapas unidimensionais de valor I1 = vermelho, I2 = verde, I3 = azul:



Figura 1. Imagem colorida de Lenna representada em mapas monocromáticos bidimensionais I1 = R, I2 = G e I3 = B.

O tratamento individual de cada mapa I1, I2 e I3 é conhecido como processamento marginal. Uma alternativa ao processamento marginal é abordar o problema da ordenação de pixels e tratar os dados como vetores indivisíveis. Tanto a aproximação marginal quanto a aproximação vetorial são possíveis se os canais individuais de cada um dos espaços de cores tiverem uma ordem interna que identifique claramente os limites inferior e superior. A maioria dos modelos cromáticos são divididos em mapas escalares com mínimo definido no valor 0 e máximo no 255. Mas surge um problema naqueles modelos que têm uma componente de tinta ou matiz, por exemplo em HSI, onde o valor de 0º corresponde a um tom vermelho, 90º com um amarelo verdeado, assim até retornar a 360º que, obviamente, é o mesmo matiz do que 0º.


Figura 2. Círculo de matiz em HSI.

Além disso, na ausência de saturação, o matiz é indefinido. A indefinição da tinta raramente pode ser representada no próprio canal de matizes, uma vez que o intervalo de valores [0º, 360º] é reduzido para [0,255] e 0 representa a cor vermelha e as matizes indefinidas.


4.1 Aproximação marginal

O tratamento marginal das imagens coloridas consiste no processamento de cada canal da imagem separadamente. A imagem é dividida em canais individuais, os mesmos critérios são usados em cada um deles para depois compor e unir os resultados [Ortiz, 1998], [Chanussot, 1998a], [Lambert, 1999].


Figura 3. Esquema de processamento marginal para três canais de informação independentes.

Vejamos na Figura 4 o efeito da erosão e dilatação em cores, realizado por meio de tratamento marginal com um elemento estruturante planar de tamanho 3x3.


a)

b)

c)

Figura 4. De esquerda para a direita: a) Imagem original, b)imagem erosionada e, c) imagem dilatada por aproximação marginal.

A primeira vista, os resultados observados são bastante consistentes com o significado da operação morfológica realizada. Há uma perda de valor do sinal cromático como um todo e a imagem aparece mais escura no caso de erosão e mais clara no caso de dilatação. No entanto, se uma operação de zoom é realizada em uma determinada área das imagens originais e processadas, observa-se como novas cromaticidades apareceram na imagem original, isso é conhecido como falsas cores (Figura 5).


a)

b)

Figura 5. Detalhe da erosão de uma imagem colorida por processamento marginal: a) Zoom na imagem original e, b) Zoom da operação de erosão, aparecimento de novas cromaticidades.

O efeito de novas cromaticidades, um fenômeno conhecido como falsascores, deve-se ao processamento individual de cada canal de informação, o que causa, em alguns casos, a decomposição dos pixels na imagem. Esse efeito pode ser observado numericamente. A Figura 6a mostra uma seção da imagem original representando os pixels RGB. O pixel central da seção tem um tom azulado, definido em componentes RGB = (51 , 102 , 153). A erosão (Figura 6b) produz uma nova composição de valores no pixel central (51 , 102 , 51) que não está presente no ambiente da vizinhança. Visualmente, o pixel adquire uma tonalidade esverdeada.


a)

b)

Figura 6. Falsas cores no processamento marginal: a) Valor das componentes na imagem original e, b) Valor das componentes após operação de erosão.

Aparecem novas cromaticidades inexistentes na imagem original, cores falsas.


Figura 7. Detalhe da dilatação de uma imagem colorida por processamento marginal.

O processamento marginal em bases YIQ, Lab ou HSI tem, a priori, a mesma desvantagem. Mas, ao contrário de RGB, eles codificam a luminância em um componente. Se apenas este sinal for processado, a imagem resultante não irá variar a composição espectral original [González, 1993].

Uma solução proposta para RGB [Lambert, 1999], consiste em representar a imagem em HSI, e operar só com a intensidade, onde o valor de matiz dos pixels permanece intacto.


Figura 8. Exemplo de processamento marginal para evitar o aparecimento de falsas cores em imagens no espaço de cores RGB.

A decomposição do pixel continua existindo, o que acontece é que nenhuma mudança espectral é vista na imagem, já que apenas a intensidade varia de posição sob o ambiente de vizinhança definido pela forma do elemento estruturante (Figura 9).


Figura 9. Exemplo de processamento marginal com transformação do espaço de cor da imagem de RGB à HSI. Após a transformação é dilatado apenas o canal I e logo transformada novamente ao espaço de cores RGB com o canal I dilatado com disco de raio 10.


Figura 10. Exemplo de processamento marginal com elemento estruturante em forma de disco com raio 10:
a) Imagem erosionada no canal I do espaço de cores HSI, b) Imagem erosionada nos canaisR,
G e B no espaço de cores RGB, c) Imagem dilatada no canal I do espaço de cores HSI e, d) Imagem dilatada
nos canais R, G e B no espaço de cores RGB.

Pode-se concluir afirmando que a abordagem marginal não é, em geral, um método satisfatório para a extensão da morfologia clássica às imagens em cores. É facilmente deduzido que o resto das operações morfológicas no processamento marginal são afetadas igualmente e principalmente pelo efeito das cores falsas, dado que são composição das operações básicas vistas anteriormente.


4.2 Aproximação vetorial

Para evitar o aparecimento de falsas cores, cada pixel deve ser considerado e tratado como um vetor de componentes indivisíveis. O problema surge na ausência de ordem natural dos pixels vetoriais, qualquer que seja o número de componentes que eles possuem. É necessário adaptar diferentes estratégias de ordenação multidimensional aos modelos cromáticos RGB, YIQ, HLS, etc. em que as imagens são representadas.


Figura 11. Esquema de processamento de vetores para três canais de informação independentes.

O ordenação de dados multidimensionais não é uma tarefa simples. Por exemplo, ordenar os pixels de uma imagem com três componentes de cor, exemplo RGB, onde cada elemento é codificado com 256 níveis, terá que considerar 2563=16777216 rótulos de cores diferentes.


a)

b)

Figura 12. Espaços de cor a) RGB, b) HIS.

Define-se uma função de ordem, sob numa base Zn que projeta um índice de ordem no espaço Z [Chanussot, 1998b]. Em imagens com n=3:


de modo que: ∀(p , q) ∈ Z 3 p ≤ q ↔ o(p) ≤ o(q), elementos vetoriais em negrito. É necessário definir o conceito de relação de ordem vetorial para diferenciá-los das relações de pré-ordem.


Relações de ordem vetorial

Uma relação de ordem vetorial "≤" num conjunto X n é uma relação binaria se é:
1) Reflexiva: ∀p ∈ X n, p ≤ p (porque p está relacionado consigo mesmo);
2) Antissimétrica: p ≤ q e q ≤ p → p = q, ∀(p , q) ∈ X n;
3) Transitiva: p ≤ q e q ≤ r → p ≤ r, ∀(p , q , r) ∈ X n.

Uma relação binária no conjunto X que é apenas reflexivo e transitivo não pode ser conhecido como uma relação de ordem, mas sim de pré-ordem.Essa consideração é importante na morfologia matemática, dado que a ausência da propriedade antissimétrica não assegura, em teoria, a singularidade do limite inferior e superior do volumem completo.Para evitar encontrar dois vetores diferentes com o mesmo índice de ordem, será preferível o uso de relações de ordem que às de pré-ordem.


Diferença entre as relações de ordem:


a)

b)

c)

Figura 13. Relação de ordem (a) injetiva, (b) sobrejetiva e (c) bijetiva.

Uma relação bijetiva é aquela que é injetiva e sobrejetiva. Com isso, garante-se que cada elemento da imagem corresponda a um único elemento de origem, ou seja, que cada pixel de vetor corresponda a um único índice de ordem e vice-versa.


Ordem por uma componente:

Consiste em ordenar vetores de acordo com o valor de um único componente, previamente definido como fonte de ordem. A ordem neste caso é reduzida para uma comparação escalar. Segue-se que este tipo de relacionamento não é antissimétrico, por isso será formalmente definido como uma pré-ordem o tal que:


a)

b)

onde x e x' correspondem com a componente do vetor selecionado como escalar que define o índice de ordem para o vetor.

Dado que os pré-ordem não garantem a unicidade dos limites inferior e superior, é utilizado como critério geométrico a seleção do limite superior, em uma dilatação vetorial, aquele pixel mais próximo da origem do elemento estruturante, esse mesmo critério é utilizado para encontrar o limite inferior em uma erosão vetorial.

Quando há vários candidatos para ser mínimo local (erosão) ou máximo local (dilatação), por estar na mesma distância geométrica do centro do elemento estruturante, é escolhido o primeiro selecionado.


a)

b)

c)

Figura 14. Erosão de vetores por pré-ordem de um componente. a) Erosão
dirigida pelo canal R. b) Erosão dirigida pelo canal G. c) Erosão dirigida pelo canal B.

No processamento pelo componente vermelho, os tons esverdeados reforçam sua presença na imagem.
No processamento pelo componente verde, os elementos de matiz avermelhada expandem sua definição.
Na erosão pelo tom azul, os objetos amarelos aumentam seu tamanho.


Ordem por medida de distância:

Este método de ordem é baseado no cálculo de uma distância previamente definida para um pixel de referência. Na maioria dos casos, o pixel de referência é a coordenada preta (0,0,0) em RGB. [Comer, 1998] usa a norma euclidiana como método de classificação de pixels baseados em RGB, desta forma:


Para estender o método da distância à outros modelos de cores, deve-se levar em conta as particularidades de cada espaço cromático.


a)

b)

Figura 15. Medição de distância para espaços de cores a) RGB e b) Lab.

No espaço HLS, devemos considerar que a componente matiz é uma medida do ângulo cromático, por isso não deve ser adicionado aos elementos de saturação e intensidade na norma euclidiana se quisermos satisfazer a desigualdade triangular.


Ordem lexicográfico:

A ordem lexicográfica é também conhecida como dicionário [Chanussot, 1998b]-[Talbot, 1998] e baseia-se na atribuição de prioridades aos elementos do vetor para que alguns tenham mais peso ou importância do que outros, no momento de definir a ordem.
A ordem é determinada com o componente de maior prioridade, se os valores forem o mesmo é passado para comparar o próximo componente e assim por diante. Dependendo se um ou outro componente é escolhido como aquele com a prioridade mais alta, a ordem lexicográfica resultante é diferente.

Para vetores de três componentes, define-se a ordem lexicográfica como:


onde p(1) corresponde ao componente do vetor p de maior prioridade, p(2) o componente da segunda prioridade e p(3) o elemento da menor prioridade.

Este método de ordenação será orientado para espaços de cor cujos componentes cromáticos tenham uma importância visual diferente para a percepção humana: HSI, HLS, HSV, LCH, Lab, YIQ, etc, [Iwanowski, 1999]. Nesses modelos de cores, a luminância ou intensidade é o atributo que melhor define os objetos e cenas em uma imagem, mas haverá ocasiões em que a matiz ou saturação é um fator determinante na identificação de objetos.

Nas imagens reais, os operadores morfológicos baseados na ordem lexicográfica com intensidade, luminância ou valor na primeira posição ou prioridade, serão adequados para preservar os contornos dos objetos na imagem.

Em situações nas quais os objetos de interesse são altamente coloridos e altamente saturados, operadores com distância de matiz em primeiro lugar serão os melhores para discriminar alguns objetos de outros [Hanbury, 2001b].

A ordem induzida no método vetorial será fortemente influenciada pelo componente prioritário:
1) Volumem orientado a matiz, (H → I → S), claramente destinado a discriminar alguns objetos de certa tonalidade contra outros;
2) Volumem orientado para a intensidade, (I → H → S), para aplicações de atenuação ou aumento de objetos de acordo com a intensidade luminosa que possuem.

Para reduzir a alta dependência do método lexicográfico com o sinal definido como prioridade, a versão de ordenação, conhecida como α-lex, permite reduzir a dependência de alta ordem com o componente prioritário e consegue a transformação de um volumem lexicográfico orientado a matiz a um volumem lexicográfico focado em intensidade e vice-versa:
1) Outros métodos de ordenação vetorial podem ser encontrados na bibliografia. Em [Chanussot, 1998a] propõe a estratégia de ordenação vetorial por intercalação de bits. Esse método de classificação tende a tratar os diferentes componentes do pixel do vetor do formulário;
2) Essas relações de ordem condicionais continuam sendo relações parciais de ordem, com a consequente ambiguidade e indeterminação de ordem para alguns vetores.

Como vimos até aqui, existem diversos métodos de ordens vetoriais, então a escolha de um deles dependerá das caraterísticas da imagem e dos resultados pretendidos das operações morfológicas à usar, além disto você mesmo poderia definir um ordenamento para os cores de suas imagens. A continuação uma tabela com um resumo dos principais métodos de ordem vetorial.


Ordem vetorial Características Espaços óptimos
Uma componente - Pré-ordem
- Útil quando uma única componente proporciona suficienteinformação da cena
RGB, HSI, YIQ, CIELAB, CIELUV
Distância - Pré-ordem
- Baseado geralmente numa medida de distância euclidiana
RGB, CIELAB, CIELUV
Canónico - Ordem parcial
- Ordem muito rígido. Útilsó em componentessimétricas
RGB
Lexicográfico clássico - Ordem total
- Adequadoquandoa importância dos sinaisnainformaçãoda imagemé diferente
- Permite tratar aindefinição do matiz
HSI, LCH
Novo lexicográfico α-lex - Ordem total
- Reduzea excessivaparticipação da primeira componente do vetor noordemlexicográficoclássico
- Permite tratar a indefinição do matiz
HSI, LCH
Entrelaçado de bits - Ordem total
- Útil quando se evidencia uma simetria entre as componentesdo vetor
RGB

Tabla 1. Resumem dos ordenes vetoriais mais conhecidos. Relação aos espaços de cores idóneos.



Anterior | Seguinte