Download PDF
ads:
LETÍCIA ANDRADE SABO
ANÁLISE DA INCERTEZA NA
REPRESENTAÇÃO DE CLASSES
TEMÁTICAS RESULTANTES DA
APLICAÇÃO DE UMA REDE NEURAL
ARTIFICIAL
Presidente Prudente
2006
UNIVERSIDADE ESTADUAL PAULISTA
Faculdade de Ciências e Tecnologia
Campus de Presidente Prudente
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
LETÍCIA ANDRADE SABO
ANÁLISE DA INCERTEZA NA
REPRESENTAÇÃO DE CLASSES
TEMÁTICAS RESULTANTES DA
APLICAÇÃO DE UMA REDE NEURAL
ARTIFICIAL
Dissertação apresentada à Faculdade de Ciências
e Tecnologia da Universidade Estadual Paulista,
Unesp, para a obtenção do título de Mestre em
Ciências Cartográficas.
Orientador: Maria de Lourdes B. Trindade Galo
Presidente Prudente
2006
ads:
S122a
Sabo, Letícia Andrade
Análise da incerteza na representação de classes temáticas resultantes
da aplicação de uma rede neural artificial / Letícia Andrade Sabo.
Presidente Prudente: [s.n.], 2006.
122 f. : il.
Dissertação (mestrado) - Universidade Estadual Paulista, Faculdade
de Ciências e Tecnologia.
Orientadora: Maria de Lourdes Bueno Trindade Galo
1. Classificação de ambientes urbanos. 2. Redes neurais artificiais.
3. Incerteza na classificação. 4. Sensoriamento remoto. I. Sabo, Letícia
Andrade. II. Galo, Maria de Lourdes Bueno Trindade. III. Título.
CDD (18.ed.) 519.7
AGRADECIMENTOS
À professora Maria de Lourdes Bueno Trindade Galo pelo apoio, dedicação,
sugestões, ensinamentos, paciência e amizade.
Aos membros da banca examinadora: Selma Regina Aranha Ribeiro, Aparecida
Doniseti Pires de Souza, Nilton Nobuhiro Imai e Luciene Delazari Stamato.
Ao professor Maurício Galo pela contribuição com implementações computacionais
na área de conversão de imagens.
Aos professores do Departamento de Cartografia, Nilton Nobuhiro Imai, Mônica
Modesta dos Santos Decanini , Antônio Maria Garcia Tommaselli e ao colega Edmur Pugliesi
pelo auxílio, idéias e sugestões apresentadas.
À professora do Departamento de Matemática, Estatística e Computação, Aparecida
Doniseti Pires de Souza pelo apoio e sugestões na parte conceitual de estatística.
À Coordenação de Aperfeiçoamento de Nível Superior (CAPES), pela concessão da
bolsa de estudos.
Ao Fred e à minha família pelo apoio, incentivo e paciência.
A todos que direta ou indiretamente contribuíram para a realização deste trabalho.
“Tudo tem seu tempo determinado, e
tempo para todo propósito debaixo do
céu”.
(Eclesiastes: 3.1)
RESUMO
A grande diversidade de materiais que caracteriza os ambientes urbanos
determina uma estrutura de classes misturadas, quando a classificação destas áreas é realizada
a partir de imagens multiespectrais cujo elemento de resolução espacial é da ordem de
dezenas de metros. Nesse sentido, é importante definir um sistema de classificação adequado,
prevendo a utilização de um classificador não paramétrico, que permita incorporar dados de
natureza não espectral (tais como textura) ao processo. Os modelos de redes neurais
artificiais, diferente do classificador de máxima verossimilhança que assume uma função
densidade de probabilidade normal ou gaussiana para as classes, permitem incorporar
atributos não espectrais aos dados de entrada para a classificação e, a partir dos valores de
saída da rede calculados em relação a cada classe, analisar a incerteza associada a cada
elemento de resolução classificado. Considerando estas premissas, foi desenvolvido um
experimento baseada na aplicação de uma rede neural artificial para a classificação da
cobertura do solo urbano de Presidente Prudente, SP, e na análise da incerteza na
representação das classes temáticas mapeadas. A ambigüidade que caracteriza essas classes
foi analisada através da distribuição espacial da probabilidade por classe, da incerteza por
classe e da entropia, as quais foram posteriormente representadas em imagens em tons de
cinza e mapas temáticos. Os resultados mostraram que o objetivo de discriminar as variações
na cobertura do solo urbano através da aplicação de uma rede neural artificial na classificação
foi atingido e, a partir das representações geradas, foi possível visualizar a variação espacial
da incerteza na atribuição das classes de cobertura do solo urbano ao pixel. Além disso, foi
possível verificar que a classe caracterizada por um padrão definido como intermediário,
quanto à impermeabilidade do solo urbano, foi aquela que apresentou maior grau de
ambigüidade e, portanto, maior mistura em relação às demais. A realização do experimento
confirmou a expectativa inicial quanto ao potencial da rede neural artificial em discriminar
classes de cobertura do solo urbano, caracterizadas pelo alto grau de mistura que apresentam,
e representar espacialmente a incerteza associada a cada classe, desde que a aplicação de
interesse seja cuidadosamente modelada.
Palavras-chave: Classificação de ambientes urbanos, Redes Neurais Artificiais, Incerteza na
classificação, Sensoriamento Remoto.
ABSTRACT
The great diversity of materials that characterizes the urban environment
determines a structure of mixed classes, when the classification of these areas is accomplished
using medium resolution (10-30 m) multiespectral images. In that sense, it is important to
define an appropriate classification system, using a classifier that allows incorporating non -
spectral data (texture) to the process. The Artificial Neural Networks (ANN) models, that not
assume a known probability density function for the classes, allow incorporating non-spectral
attributes to the input data for the classification. They also allow analyzing the uncertainty
associated to each class from the output values of the network calculated in relation to each
class. Considering these properties, an experiment that consisted in the application of an ANN
was carried out. This experiment aims the classification of the urban land cover of Presidente
Prudente city and the analysis of the uncertainty in the representation of the mapped thematic
classes. The ambiguity that characterizes those classes was analyzed through of the spatial
distribution of the probability by class, of the uncertainty for class and of the entropy, wich
were represented in gray levels images and thematic maps. The results showed that the aim of
discriminating the variations in the urban land cover through the application of an ANN in the
classification was reached. It was also possible to visualize the spatial variation of the
uncertainty in the attribution of classes of urban land cover and from the generated
representations. The class characterized by a pattern that define an intermediary level, related
to the impermeability of the urban soil, showed larger ambiguity degree and, therefore, larger
mixture. The experiment confirmed that the ANN can discriminate classes of urban land
cover with high level of mixture and represent spatially the uncertainty associated with each
class, since the application of interesting be modeled carefully.
Keywords: Classification of urban environment, Artificial Neural Networks, Uncertainty in
the classification, Remote Sensing.
LISTA DE FIGURAS
Figura 1
Curvas de reflectância dos materiais característicos de ambientes urbanos...
20
Figura 2
A estrutura de uma rede de alimentação progressiva (feed-forward).............
33
Figura 3
Modelo sinático de neurônio artificial, nó, ou elemento de processamento
de uma rede.....................................................................................................
34
Figura 4
Hierarquia da classificação de ambientes urbanos.........................................
42
Figura 5
Localização do Município de Presidente Prudente no contexto do Oeste do
Estado de São Paulo ......................................................................................
54
Figura 6
Composição Colorida (BGR-234) da imagem CCD/Cbers2 .........................
58
Figura 7
Carta de Zoneamento Urbano de Presidente Prudente...................................
60
Figura 8
Fluxograma das atividades previstas para o projeto ......................................
66
Figura 9
Classes de cobertura do solo, especificadas para a área urbana e de
expansão urbana de Presidente Prudente.
69
Figura 10
Imagens geradas a partir da conversão RGB IHS RGB .......................
73
Figura 11
Imagem de Textura (a) e de Índice de Vegetação da Diferença
Normalizada (NDVI) (b) ...............................................................................
76
Figura 12
Imagens de entrada (123g, 234b, 234r,Textura e NDVI) para a
classificação da rede neural artificial .............................................................
78
Figura 13
Localização das áreas de treinamento nos planos de entrada da rede neural
artificial ........................................................................................................
79
Figura 14
Média das classes obtidas a partir dos planos de entrada (123g, 234b, 234r,
Textura e NDVI).............................................................................................
81
Figura 15
Desvio Padrão das médias de cada classe...................................................... 82
Figura 16
Esquema de Classificação pela Rede Neural Artificial .................................
88
Figura 17
Classificação resultante da aplicação da RNA com a arquitetura [5-54-7]....
89
Figura 18
Imagens em tons de cinza indicando as estimativas de probabilidades por
classe...............................................................................................................
93
Figura 19
Imagens em tons de cinza representando a Incerteza/classe..........................
95
Figura 20
Mapas de Incerteza para classe Maior Densidade de Superfícies
Impermeáveis e Densidade Intermediária de Superfícies
Impermeáveis......................................................
97
Figura 21
Mapas de Incerteza para classe Menor Densidade de Superfícies
Impermeáveis e Vegetação Arbórea/Arbustiva..............................................
98
Figura 22
Mapas de Incerteza para classe Vegetação Rasteira/Solo Exposto e Corpo
D’água............................................................................................................
98
Figura 23
Composição colorida das três classes utilizando as imagens de
probabilidade referentes às classes Maior (R), Intermediária (G) e Menor
Densidade de Superfícies Impermeáveis (B)..................................................
99
Figura 24
Composição colorida das três classes utilizando os mapas de incerteza,
referentes a estas classes.................................................................................
100
Figura 25
Entropia associada ao conjunto de seis classes.............................................. 102
Figura 26
Localização da incerteza média apresentada ao cruzar as classes Maior
Densidade e Densidade Intermediária, Densidade Intermediária e Menor
Densidade e as classes Vegetação Rasteira/Solo Exposto e Densidade
Intermediária .................................................................................................
104
ANEXO
Figura 27
Janela de gerenciamento do SNNS................................................................ 114
Figura 28
Janela de controle de arquivos ...................................................................... 116
Figura 30
Janela para criação de modelos de redes neurais de alimentação
progressiva (“feedforword”)..........................................................................
117
Figura 31
Janela de visualização de uma rede “feedforword” antes do treinamento.... 118
Figura 32
Janela que controla as operações de treinamento e validação de uma rede... 119
Figura 33
Janela usada para salvar os resultados da aplicação da rede.......................... 122
LISTA DE TABELAS
Tabela 1
Exemplos de cálculos de incertezas para várias distribuições...........................
50
LISTA DE QUADROS
Quadro 1
Parâmetros dos instrumentos imageadores presentes no CBERS-2 ..............
57
Quadro 2
Associação entre classes de interesse e zonas especificadas na Carta de
zoneamento ....................................................................................................
68
Quadro 3
Caracterização das seis classes de cobertura do solo urbano de Presidente
Prudente .........................................................................................................
70
Quadro 4
Número de pixels adquirido para cada uma das classes, na área de
treinamento e validação .................................................................................
80
Quadro 5
Intervalos de valores que definiram o fatiamento das Imagens de
Incerteza..........................................................................................................
97
Quadro 6
Intervalos de valores que definiram o fatiamento das Imagens de Incerteza.
101
SUMÁRIO
1
INTRODUÇÃO.............................................................................................................
12
1.2 - Objetivo...................................................................................................................
15
1.3 – Justificativa ............................................................................................................
15
1.4 – Estrutura do Trabalho ............................................................................................
17
2
SENSORIAMENTO REMOTO E AMBIENTE URBANO .................................... 18
3
CLASSIFICAÇÃO........................................................................................................
21
3.1 – Sistemas de Classificação ......................................................................................
22
3.2 - Métodos de Classificação de Imagens ..................................................................
25
3.2.1 – Método de Classificação por Máxima Verossimilhança...............................
28
3.2.2 – Método baseado em Redes Neurais Artificiais ............................................ 31
3.3 – Classificação de áreas urbanas ..............................................................................
40
4
INCERTEZA NA CLASSIFICAÇÃO ....................................................................... 44
4.1 – Medidas de Incerteza .............................................................................................
45
4.2 – Estimativa de Incertezas locais para atributos temáticos ...................................... 48
4.3 – Representação da Incerteza ...................................................................................
51
5
CARACTERIZAÇÃO DO EXPERIMENTO DESENVOLVIDO: MÉTODO E
RESULTADOS OBTIDOS ........................................................................................
54
5.1Área de estudo ..................................................................................................... 54
5.2 – Dados utilizados ................................................................................................... 55
5.3 – Aplicativos utilizados ............................................................................................
61
5.4 – Método ...................................................................................................................
64
5.4.1 – Concepção do projeto de classificação.........................................................
67
5.4.2 Caracterização das amostras de t
reinamentos por classe e da rede neural
artificial utilizada..............................................................................................
79
5.4.3 – Classificação ................................................................................................
83
5.4.4 -
Tratamento dos dados de saída da rede e representação da incerteza e
entropia.........................................................................................................
90
6
CONCLUSÕES ............................................................................................................ 106
REFERÊNCIAS BIBLIOGRÁFICAS........................................................................
109
ANEXO A ......................................................................................................................
114
12
1 – INTRODUÇÃO
A classificação de dados de Sensoriamento Remoto é um processo de
extração de informações que engloba um conjunto de técnicas que possibilitam reconhecer
padrões e objetos com características similares nas imagens. Nesse processo, é importante
estabelecer claramente as classes que representarão a informação a ser extraída e para isso,
deve ser levado em consideração o nível de detalhamento oferecido pelos dados disponíveis a
serem classificados.
O vel de detalhamento de dados é definido em um esquema de
classificação, o qual deve considerar o uso que sedado à informação representada no mapa
temático e os atributos das classes que são discerníveis nos dados disponíveis para sua
elaboração. Segundo Congalton e Green (1999), um esquema de classificação tem dois
componentes críticos: o conjunto de categorias ou rótulos definidos para representar as classes
de interesse e o conjunto de definições ou regras que permitam caracterizar os diferentes tipos
de ocorrências ou classes de interesse. Os mapas temáticos buscam generalizar as feições da
superfície terrestre através das categorias especificadas no esquema de classificação.
O método de classificação adotado para a extração da informação de
interesse é outro aspecto a ser considerado no esquema de classificação. Nesse sentido, as
abordagens de classificação supervisionada usando redes neurais artificiais, têm apresentado
resultados expressivos quando comparados aos métodos tradicionais de classificação de dados
de Sensoriamento Remoto (VENTURIERI e SANTOS, 1998). Essa condição tem levado a
uma crescente utilização dessa ferramenta, particularmente das redes multicamadas treinadas
com o algoritmo de aprendizagem backpropagation. No entanto, apesar da quase
unanimidade em relação ao modelo de rede que tem sido adotado, diferentes situações de
13
classificação exigem arquiteturas de rede e parâmetros de treinamento distintos, cuja
definição influencia na capacidade da rede “aprender” as características das classes de
interesse, que possibilitem uma associação correta para todo o conjunto de dados.
Genericamente, utilizar técnicas para classificar informações, colocando-as
em grupos previamente definidos, implica em reduzir a entropia do sistema. Assim, a entropia
é determinada pelo grau de incerteza contido em uma dada informação e é uma questão chave
para avaliar a qualidade temática do mapa produzido e, conseqüentemente, para verificar o
grau de adequação, para usos posteriores, do conjunto de dados classificados (VAN DER
WELL et al., 1998).
Uma situação totalmente incerta ou entrópica é imprevisível, de modo que o
grau de entropia de um sistema é inversamente proporcional à sua capacidade de previsão dos
resultados. Isso destaca a importância da abordagem estatística em estimativas de incerteza
pois, na maioria das vezes, algumas alternativas ou resultados têm maior probabilidade de
ocorrer do que outras, as quais estão fortemente associadas ao seu contexto, ou aos aspectos
gerais do meio onde o fato ocorre. Nas abordagens onde as alternativas são igualmente
prováveis, o grau de incerteza é elevado e a quantidade possível de informações a ser extraída
também é elevada. Quando se aumenta a probabilidade de um dos possíveis resultados ocorrer
em relação aos demais, ocorre o decréscimo da entropia ou incerteza e maior será a
informação contida. Portanto, sendo a informação uma medida de incerteza, quanto maior a
incerteza, menor a informação inerente à situação (SANTOS et. al., 2003).
A questão da incerteza na atribuição de classes é particularmente
significativa quando as classes definem um padrão misturado na cena. Pelo fato das cidades
constituírem ambientes heterogêneos, sua classificação apresenta grande grau de dificuldade.
Raramente, dentro de uma cidade, podem ser definidas classes discretas, pelo fato das
diferentes categorias de ocupação do espaço urbano não apresentar limites bem definidos, ou
14
seja, transições abruptas. Dependendo da designação das classes, o que caracteriza esses
ambientes urbanos é a ocorrência de classes misturadas, definindo uma continuidade nas áreas
de transição entre elas (classes contínuas) (GALO, 2000b).
Em relação aos ambientes urbanos, Hamburger (1993) especifica que as
categorias de uso do solo apresentam-se como uma manifestação entre o comportamento
sócio-econômico e cultural e a ocupação espacial de uma determinada área. Considerando as
funções urbanas de residir, trabalhar, circular e recrear como uma manifestação espacial dos
fenômenos urbanos, é necessário que as classes de cobertura do solo urbano sejam definidas
no contexto de uma análise específica, o que geralmente implica em se estabelecer classes
com maior grau de ambigüidade.
Considerando que a classificação da paisagem urbana, realizada a partir da
utilização de imagens de média resolução espacial, incorpora uma componente de
ambigüidade na definição das classes e, ainda, que a maioria dos métodos de classificação
convencionais, como o classificador de máxima verossimilhança, assume uma função
densidade de probabilidade conhecida para as classes, concebeu-se uma pesquisa que prevê o
desenvolvimento de um sistema de classificação que não tenha essa limitação dos
classificadores paramétricos e que permita representar espacialmente a incerteza da
classificação.
Nesse contexto, parte-se do pressuposto que a aplicação de uma rede neural
artificial na classificação da área urbana de Presidente Prudente deve possibilitar o
mapeamento das variações na cobertura do solo urbano e que, através da manipulação dos
valores gerados na classificação, pode ser realizada uma análise da variação espacial da
incerteza na definição dessas classes de cobertura do solo urbano.
15
1.2 – Objetivo
Realizar uma análise da incerteza associada à representação de classes de
cobertura do solo urbano, definidas a partir da aplicação de uma rede neural artificial para a
classificação de imagem multiespectral de média resolução espacial. Nesse sentido, foram
delineados os seguintes objetivos específicos:
aplicar uma rede neural artificial na classificação da área urbana de
Presidente Prudente, a fim de discriminar variações na cobertura do solo
urbano e;
gerar representações que permitam visualizar a variação espacial da
incerteza na atribuição de classes de cobertura do solo urbano e analisá-las.
Nesse contexto, o propósito geral da pesquisa passa a incorporar uma
análise da qualidade temática do produto gerado, a partir da aplicação de uma rede neural
artificial na classificação de dados de sensoriamento remoto, considerando o aspecto da
incerteza na representação de classes de natureza contínua.
1.3 – Justificativa
Os ambientes urbanos caracterizam-se pela ocorrência de classes
misturadas, definindo uma continuidade nas áreas de transição entre elas (classes contínuas).
Devido a isto, a utilização restrita aos dados multiespectrais de sensoriamento remoto na
classificação dessas áreas tem se mostrado pouco efetiva. Porém, com a possibilidade de
16
incorporar dados de natureza não espectral, derivados de processamentos aplicados às
imagens multiespectrais (tais como indicadores de textura e índice de vegetação), a aplicação
de redes neurais artificiais tem apresentado resultados expressivos quando comparados aos
métodos tradicionais de classificação de dados de sensoriamento remoto (VENTURIERI &
SANTOS, 1998), principalmente, em se tratando de áreas urbanas. Tal fato tem levado a uma
crescente utilização dessa ferramenta, particularmente das redes multicamadas treinadas com
o algoritmo de aprendizagem backpropagation.
Em relação aos ambientes urbanos, Hamburger (1993) especifica que as
categorias de uso do solo apresentam-se como uma manifestação entre o comportamento
sócio-econômico e cultural e a ocupação espacial de uma determinada área, e sugere que esse
é um dos pressupostos básicos para qualquer classificação de uso do solo, uma vez que tais
classes estão profundamente ligadas às funções urbanas de residir, trabalhar, circular e
recrear. Considerando-as como uma manifestação espacial dos fenômenos urbanos, é
necessário que as classes de uso do solo urbano sejam definidas no contexto de uma análise
específica.
Pelo fato das cidades constituírem ambientes heterogêneos, sua classificação
apresenta grande grau de dificuldade. Raramente, dentro de uma cidade, é possível
discriminar classes discretas, devido ao fato destas não apresentarem limites bem definidos,
ou seja, mudanças (divisões) abruptas.
A partir da aplicação de uma rede neural artificial na classificação de dados
de sensoriamento remoto e temáticos, será considerado o aspecto da incerteza na
representação de classes contínuas, sendo esse aspecto destacado na presente proposta.
17
1.4. Estrutura do Trabalho
No primeiro capítulo, a título de introdução, é apresentado e contextualizado
o assunto investigado na pesquisa, são explicitados os objetivos do trabalho, assim como uma
justificativa para sua realização.
O segundo, terceiro e quarto capítulos referem-se à fundamentação teórica,
sendo tratados os conceitos básicos relacionados com Sensoriamento Remoto aplicado a
estudos urbanos, classificação de imagens e incerteza na definição das classes,
respectivamente.
O experimento e os resultados são descritos no Capítulo 5, no qual se inclui
a caracterização da área de estudos, dos dados e aplicativos utilizados, a descrição do
procedimento metodológico adotado no desenvolvimento do trabalho e os resultados obtidos e
a análise realizada.
Finalmente, no Capítulo 6apresentam-se as conclusões do trabalho, face aos
objetivos propostos.
18
2 – SENSORIAMENTO REMOTO E AMBIENTE URBANO
O sensoriamento remoto orbital tem se mostrado uma importante técnica de
auxílio às diversas pesquisas que têm como enfoque o ambiente urbano. A aquisição sistemática
de informações para uma mesma área, através de sensores instalados em satélites voltados para o
estudo de recursos naturais (como os das séries Landsat 7, SPOT 5, Quick Bird, IKONOS,
CBERS), possibilita captar as mudanças ocorridas no espaço urbano a um custo relativamente
baixo, quando comparado com outros tipos de levantamento, como o aerofotogramétrico.
Vários fatores determinam a viabilidade ou não da utilização do sensoriamento
remoto orbital em estudos urbanos, entre eles: as características urbanas do ambiente a ser
estudado, os objetivos do pesquisador e as resoluções espacial, espectral e temporal do sistema.
Costa
1
(1996) apud Costa, Freitas e Di Maio (2005), afirma que uma das maiores dificuldades
encontradas na utilização de dados de sensoriamento remoto em estudos de áreas urbanas é a
complexidade de feições encontradas neste ambiente, normalmente composto por alvos variados,
tais como: concreto, asfalto (ruas e avenidas), telhados de diversos materiais, solo exposto, grama,
árvores, água etc. Muitas destas coberturas, como salientou Forster
2
(1985) apud Costa, Freitas e
Di Maio (2005), são menores que a resolução de um pixel (ou elemento de resolução),
dependendo do sensor.
Em ambientes intra-urbanos, esta situação é ainda mais evidente. Como analisa
Forster (1985) apud Costa, Freitas e Di Maio (2005), em uma área residencial, a densidade de
construção pode ser baixa, com pouca vegetação. Ao mesmo tempo, uma outra área residencial
1
COSTA, S. M. F. da. Metodologia alternativa para o estudo do espaço metropolitano, integrando as tecnologias de
SIG e sensoriamento remoto – aplicação à Área Metropolitana de Belo Horizonte. 1996. 200p.Tese de doutorado
Doutorado em Informação Espacial – POLI/USP) - Escola Politécnica da Universidade de São Paulo. 1996.
2
FORSTER, B.C. An examination of some problems and solutions in urban monitoring from satellite platforms.
International Journal of Remote Sensing, v.6,n.1, p.139-151, 1985.
19
pode possuir uma alta densidade de construção, com baixo índice de vegetação ou, ainda, ser
totalmente desprovida de vegetação.
O termo cobertura do solo refere-se aos materiais biofísicos encontrados no
solo. A informação sobre a cobertura do solo urbano é necessária para uma grande variedade
de aplicações, incluindo seleção da localização residencial-industrial-comercial, estimação de
população, determinação de taxas, desenvolvimento de direção do zoneamento, etc. (GREEN
et al., 1994; CULLING WORTH, 1997, apud JENSEN, 2000). Isto significa que informação
urbana coletada para uma aplicação pode ser útil para uma outra.
Porém, a variabilidade que caracteriza um ambiente urbano dificulta sua
classificação em categorias homogêneas. Costa (1996) apud Costa, Freitas e Di Maio (2005)
mostrou que, em relação à faixa espectral mais adequada para o estudo de áreas urbanas, o asfalto,
o concreto e a telha, alvos bem comuns em áreas urbanas, possuem uma área de absorção na faixa
do infravermelho próximo. Assim, para ressaltar o contraste existente entre o urbano e o o-
urbano, constituído na maioria das vezes por áreas agrícolas e/ou de vegetação em geral, é usual a
utilização de imagens obtidas nas faixas do vermelho e infra-vermelho próximo do espectro ótico.
- Comportamento Espectral dos Alvos Urbanos
Em sensoriamento remoto, a assinatura espectral de um alvo compreende
um conjunto de valores de reflectância para o mesmo, medido num intervalo específico de
comprimento de onda. Vários são os fatores que podem influenciar nas medidas de
reflectância.
Jensen (1983) apud Carrara (1992) relata que a assinatura espectral não é
constante para um determinado alvo e depende da relação entre a energia incidente e o ângulo
de visada do sensor, dos efeitos atmosféricos e das propriedades físicas do alvo. O referido
autor estudou a assinatura espectral de alguns alvos urbanos em laboratório e, usando um
20
espectroradiômetro para fazer as medidas, e construiu curvas de reflectância para os principais
alvos urbanos (Figura 1).
Figura 1 – Curvas de reflectância dos materiais característicos de ambientes urbanos.
Fonte: Adaptado de Jensen (2000).
Porém, em áreas urbanas encontra-se uma paisagem com uma grande
diversidade de alvos, constituída principalmente de asfalto, concreto, solo, água e vegetação,
formando uma paisagem tipicamente heterogênea. Assim, uma classificação detalhada dessas
áreas, a partir de imagens de média/baixa resolução, é limitada pelo fato de que a radiação
recebida por um único elemento de resolução espacial (pixel) é composta da radiação de um
grande número de alvos diferentes, que individualmente têm assinatura espectral distinta mas
que, no geral, fornecem uma resposta espectral que não é representativa de nenhum deles
(JENSEN, 1983 apud CARRARA, 1992).
Percentual de Refletctância
Grama sadia
Grama amarelada
Ardósia (vermelha)
Tijolo (vermelho)
Concreto
Asfalto
Turfa
Asfalto telha (preto)
Características de materiais urbanos comuns
Comprimento de onda (µm)
21
3 – CLASSIFICAÇÃO
Segundo Gong (1996), classificação é um processo de abstração e
generalização dos dados coletados sobre um certo fenômeno, a fim de aperfeiçoar nosso
entendimento da cena. É um importante componente na análise de dados espaciais de
diferentes fontes que envolve o agrupamento de medidas tomadas individualmente e a
associação de cada grupo a uma categoria de acordo com certas regras de similaridade. Em
um primeiro momento é feita uma observação qualitativa para em seguida, medir
quantitativamente os fenômenos espaciais com os instrumentos disponíveis. Como resultado,
são obtidas descrições e medidas sobre o alvo de interesse, as quais constituem um conjunto
de variáveis discriminantes, freqüentemente chamadas atributos.
Quando se trata da utilização da classificação em aplicações de
sensoriamento remoto relacionadas com mapeamentos temáticos, deve-se prever inicialmente
a definição de um sistema de classificação que seja adequado ao estudo que se pretende
desenvolver. É importante estabelecer claramente as classes que constarão do mapeamento e,
nesse processo, deve ser levado em consideração o nível de detalhamento oferecido pelos
dados disponíveis.
O nível de detalhamento estabelecido para um dado esquema de
classificação é direcionado pelo uso que será dado à informação representada no mapa e pelos
atributos da terra que são discerníveis nos dados utilizados na sua elaboração. Segundo
Congalton e Green (1999), um esquema de classificação tem dois componentes críticos: o
conjunto de categorias ou rótulos definidos para representar as classes de interesse e um
conjunto de definições ou regras que caracterizem os diferentes tipos de ocorrências a serem
mapeadas.
22
Os mapas temáticos procuram generalizar as feições da superfície terrestre
através de categorias especificadas em um projeto (esquema) de classificação apropriado para
cada aplicação. Os esquemas de classificação constituem, então, os meios usados para
organizar a informação espacial de uma maneira lógica e ordenada e possibilitam, para quem
produz o mapa, caracterizar as feições da paisagem e, para o usuário do mapa, reconhecê-las
(CONGALTON e GREEN, 1999).
3.1 – Sistemas de Classificação
Com a grande diversidade de tipos de cobertura da terra, o homem sentiu a
necessidade de descrevê-las mais apropriadamente e classificá-las com vistas ao
desenvolvimento de sistemas sustentáveis, incorporando a necessidade crescente de
padronizar e compatibilizar os dados para o mapeamento, análise e monitoramento de
extensas áreas, de maneira prática e consistente (DI GREGÓRIO, 2004).
Assim, o Centro de Sensoriamento Remoto da FAO (Food and Agriculture
Organization of the United States) tem se dedicado a ampliar, para um nível global, um
sistema de classificação, designado LCCS Land Cover Classification System, o qual foi
desenvolvido originalmente no contexto de um projeto de mapeamento da cobertura da terra
para o Leste da África (AFRICOVER). Esse Sistema de Classificação de Cobertura da Terra
(LCSS) procura disponibilizar um sistema de classificação compreensível e com padronização
“a priori” para suprir as demandas específicas do usuário. A seguir são apresentadas as
principais definições que caracterizam essa concepção de sistema de classificação:
23
- Cobertura e Uso da Terra
Cobertura da terra representa a cobertura física observada sobre a superfície
da terra. Sua descrição deve se limitar às características da vegetação e de feições naturais e
antrópicas. A definição dos tipos de cobertura da terra é fundamental e está restrita ao
observável.
Uso da terra é caracterizado pelas atividades desenvolvidas pelas pessoas
que ocupam um tipo de cobertura da terra específico e interagem para mantê-lo ou modificá-
lo. Desse modo, a definição do uso da terra procura estabelecer uma ligação direta entre
cobertura da terra e as ações das pessoas sobre o ambiente. Como exemplo, tem-se que “área
de recreação” é um termo que designa uso da terra, o qual pode ser aplicado a diferentes tipos
de cobertura da terra desde áreas verdes, como áreas construídas.
- Classificação e Legenda
Classificação é uma representação abstrata da situação observável em
campo usando critérios de diagnósticos bem definidos. Pode-se dizer que a classificação é um
ordenamento ou arranjo de objetos em grupos ou classes com base em suas relações. Uma
classificação descreve o suporte sistemático definindo os nomes das classes e os critérios
usados para distingui-los, envolvendo definição de limites de classes, os quais devem ser
claros, precisos, quando possível quantitativos, e baseados em critérios objetivos. Uma
classificação deve ser:
Independente da escala: as classes podem ser aplicáveis a qualquer
escala ou nível de detalhe;
24
Independente da fonte: os meios de coleta de informação
independentes, por imagem de satélite, fotografia aérea, levantamento
de campo ou usando combinação de fontes.
Legenda é a aplicação da classificação a uma área específica e deve se
referir a um mapeamento com escala definida e um conjunto de dados específicos. Uma
legenda pode conter apenas uma proporção, ou subconjunto, de todas as possíveis classes
definidas para a classificação, Assim, uma legenda é dependente de:
Escala e representação cartográfica;
Dados e metodologia de mapeamento.
- Sistemas Hierárquicos e Não-hierárquicos
Os sistemas de classificação são definidos a partir de dois formatos básicos:
o hierárquico e não-hierárquico. A maioria dos sistemas é de estrutura hierárquica, pelo fato
desses oferecerem maior consistência devido à sua habilidade de acomodar diferentes níveis
de informação, iniciando com classes estruturadas em veis mais amplos, que permitem
subdivisão em níveis, para subclasses mais detalhadas. A cada nível, as classes definidas
utilizam critérios mutuamente exclusivos, ou seja, os critérios usados para um nível de
classificação não são repetidos para outro nível de classificação. Nos níveis mais altos do
sistema de classificação poucos critérios de diagnóstico são aplicados, enquanto que nos
níveis mais baixos o número de critérios aumenta.
25
- Sistemas “a priori” e “a posteriori”
Em um sistema de classificação “a priori”, as classes são concepções
abstratas dos tipos que realmente acontecem. m como base a definição das classes antes
que qualquer coleta de dados seja feita, de modo que todas as possíveis combinações de
critérios devem ser estabelecidas antes da classificação. A vantagem principal deste método é
que a definição das classes é feita independente da área e dos meios utilizados. Porém, sua
desvantagem é que se trata de um método rígido, fazendo com que algumas das amostras de
campo não se categorizem facilmente nas classes pré-definidas.
A classificação “a posteriori” é basicamente o agrupamento de classes por
semelhanças ou diferenças de amostras coletadas em campo. A vantagem deste tipo de
classificação está na flexibilidade, quando comparada com a rigidez da classificação “a
priori”. O método “a posteriori” implica em um mínimo de generalização, sendo o tipo de
classificação que melhor ajusta as observações coletadas em campo para uma área específica.
Porém, uma classificação “a posteriori” depende de uma especificação da área descrita e da
adaptação às condições locais, não podendo ser definidas classes unificadas. O agrupamento
de amostras para definir as classes só pode ser feito após a coleta de dados e da verificação da
relevância de critérios de certa área.
3.2 – Métodos de Classificação de Imagens
Em sensoriamento remoto, a classificação de imagens consiste em se
estabelecer um processo de decisão no qual um pixel ou grupo de pixels é definido como
26
pertencente a uma determinada classe (VENTURIERI e SANTOS, 1998). Nesse sentido, os
sistemas computacionais auxiliam o usuário na interpretação da imagem. Para Richards
(1986), a classificação multiespectral consiste em rotular os pixels de uma cena a partir de
suas características espectrais, sendo que essa categorização implementada por um programa
computacional habilitado para reconhecer os pixels espectralmente similares. Segundo Novo
(1989), as técnicas de classificação digital implicam na implementação de um processo de
decisão para que o computador possa atribuir certo conjunto de pontos (pixels) a uma
determinada classe.
Para a análise de dados multiespectrais, Richards (1986) destaca dois
procedimentos abrangentes de classificação. Um deles, definido como classificação não-
supervisionada, é um meio pelo qual os pixels de uma imagem são associados a classes
espectrais, sem que haja um conhecimento prévio da existência ou nome destas classes.
A classificação supervisionada se constitui na ferramenta analítica essencial
usada na extração de informação quantitativa a partir de dados multiespectrais. O processo é
dito supervisionado, pois implica na interação entre o intérprete humano e o sistema de
análise, possibilitando o treinamento do algoritmo de classificação através de amostras usadas
para caracterizar ou estimar parâmetros estatísticos de cada classe. Essas amostras (que
correspondem a padrões conhecidos das classes) são normalmente chamadas de padrões de
treinamento, sendo que sua totalidade define o conjunto de treinamento. O processo pelo qual
um conjunto de treinamento é usado para obter as funções de decisão é denominado
aprendizagem ou treinamento (GONZALEZ e WOODS, 1993). Um pressuposto importante
adotado na maioria dos procedimentos mais consolidados de classificação supervisionada é o
de que as classes de interesse podem ser modeladas por uma distribuição de probabilidade no
espaço multiespectral e, consequentemente, descritas pelos parâmetros dessa distribuição, em
geral normal ou Gaussiana.
27
De um modo geral, a natureza multiespectral dos dados de sensoriamento
remoto tem promovido a utilização de métodos estatísticos de reconhecimento de padrões.
Entretanto, conforme ressaltam Benediktsson et al. (1990), os métodos de classificação
multivariada que implicam na definição prévia da distribuição estatística das classes, não
foram concebidos para a utilização de dados obtidos por diferentes sensores, os quais não
podem ser descritos por um modelo multivariado único. A tentativa de melhorar o
desempenho dos classificadores, de modo a se obter resultados mais acurados, tem motivado
vários pesquisadores a desenvolver métodos que utilizem modelos de classificação que
integrem dados adquiridos por múltiplos sensores (SOLBERG et al., 1994), ou que usem a
informação contextual fornecida por uma vizinhança de pixels (KARTIKEYAN et al., 1994).
No processo de classificação supervisionada, três etapas são realizadas:
aquisição de dados e pré-processamento, representação dos dados e tomada de decisão. De
acordo com Ripley
3
(2000) apud Santos et al. (2003), o classificador toma decisões baseando-
se no aprendizado realizado a partir de um conjunto de treinamento, o qual contém exemplos
de padrões de todas as classes existentes no sistema. Um classificador é uma função que
possui como entrada padrões desconhecidos e, como saída, rótulos que indicam a que classe
tais padrões provavelmente pertencem. O que difere um classificador de outro é a forma como
são gerados os limites de decisão a partir dos exemplos de treinamento. Entendendo a
classificação como uma partição do espaço de atributos segundo critérios determinados, na
classificação supervisionada esse critério baseia-se na definição de padrões para cada uma das
classes de estudo obtidas a partir de amostras de treinamento (RENNÓ, 1998).
Pode-se dizer também que classificação é uma forma de reduzir a incerteza,
ou seja, minimizar a imperfeição, conforme destaca Santos et al. (2003).
3
RIPLEY, B. D. Pattern Recognition and neural networks. Cambridge University, Press, Cambridge, 2000.
28
Na seqüência são apresentadas duas das abordagens de classificação de
dados de sensoriamento remoto, as quais permitem estimar a incerteza associada às classes.
3.2.1 - Método de Classificação por Máxima Verossimilhança
O método de classificação por máxima verossimilhança, baseado no
teorema de Bayes é o mais utilizado na classificação supervisionada de dados de
sensoriamento remoto (RICHARDS e JIA, 1999). O processo de classificação consiste em
definir a classe mais provável para estes pixels. Ou seja, dado um valor de x
r
definir a classe
mais provável (
j
ω
), dentre um conjunto finito de classes possíveis:
M321
,...,,,W ωωωω= . Isto
pode ser expresso pela probabilidade condicional
(
)
xp
j
r
ω
.
O conceito de probabilidade condicional também pode ser usado para
descrever a freqüência dos pixels numa classe. Ou seja, dada uma classe, pode-se descrever a
probabilidade de se encontrar um determinado pixel neste grupo
(
)
j
xp
ω
r
. Por exemplo, dada
a classe “vegetação” (
j
ω
= vegetação), a probabilidade de se encontrar pixels com alto valor
nas bandas do infravermelho próximo é grande. Por outro lado, se a classe considerada for
água (
j
ω
= água), a probabilidade de se encontrar pixels com alto valor no infravermelho
próximo é pequena (RICHARDS e JIA, 1999).
A partir dos valores dessas probabilidades condicionais, torna-se viável
calcular a probabilidade de um pixel ocorrer na imagem, pois este valor está associado à
probabilidade do pixel pertencer a qualquer uma das classes.
29
(
)
( )
j
N
j
j
pxpxp
ωω
*)(
1
=
=
rr
(01)
A probabilidade da ocorrência simultânea dos eventos “o pixel x
r
e “a
classe
j
ω
” pode ser calculada a partir da probabilidade conjunta
(
)
(
)
)(*, xpxpxp
jj
r
r
r
ωω
=
(02)
que é análoga à expressão
(
)
)(*),(
jjj
pxpxp
ωωω
r
r
=
(03)
Igualando as expressões (02) e (03), pois ambas descrevem o mesmo evento
conjunto, tem-se
(
)
(
)
(
)
(
)
jjj
pxpxpxp
ωωω
**
r
r
r
=
(04)
da qual uma expressão para a probabilidade condicional pode ser obtida
( )
(
)
(
)
( )
.
*
xp
pxp
xp
jj
j
r
r
r
ωω
ω
=
(05)
A relação (05) é conhecida como o Teorema de Bayes (RICHARDS e JIA,
1999), e é usada para estimar a probabilidade de uma classe ocorrer, dado que o pixel x
r
, com
probabilidade )(xp
r
é observado na imagem.
Assim, um vetor x
r
de valores de brilho para um dado pixel, descreve esse
pixel como um ponto no espaço multiespectral (cujas coordenadas são definidas pelos valores
de brilho) e
(
)
xp
j
r
ω
indica a probabilidade da classe
j
ω
ser a correta, para um pixel cujo
valor de brilho é x
r
. Normalmente, a classificação é realizada de acordo com a seguinte regra
de decisão:
j
x
ω
r
se
(
)
(
)
xpxp
ij
r
r
ωω
> , para todo
i
j
(06)
isto é, o pixel x
r
pertence a classe
j
ω
se
(
)
xp
j
r
ω
é maior do que
(
)
xp
i
r
ω
para qualquer
i
j
(RICHARDS e JIA, 1999).
30
Apesar de sua simplicidade, as probabilidades
(
)
xp
j
r
ω
em (06) são
desconhecidas. Supondo-se, porém, que dados de treinamento estejam disponíveis para cada
classe
j
ω
, então pode ser estimada uma distribuição de probabilidade que descreva a chance
de encontrar um pixel x
r
na classe
j
ω
, o que é descrito por
(
)
j
xp
ω
r
, independente desta
distribuição. Desta forma, haverá tantas
(
)
j
xp
ω
r
quantas forem as classes de interesse. Em
outras palavras, pode ser calculado um dado pixel x
r
no espaço multiespectral, um conjunto
de probabilidades que indica a chance relativa desse pixel pertencer a cada uma das classes
disponíveis (RICHARDS e JIA, 1999).
As probabilidades
(
)
xp
j
r
ω
desejadas e as
(
)
j
xp
ω
r
disponíveis, estimadas a
partir dos dados de treinamento, são relacionadas pelo Teorema de Bayes, conforme mostrado
na Equação 07, ou seja,
( )
(
)
(
)
( )
xp
pxp
xp
jj
j
r
r
r
ωω
ω
= (07)
onde )(
j
p
ω
é a probabilidade da classe
j
ω
ocorrer na imagem e )(xp
r
é a probabilidade de
encontrar um pixel x
r
na imagem.
As )(
j
p
ω
são chamadas probabilidades “a priori”, enquanto
(
)
xp
j
r
ω
são
chamadas probabilidades “a posteriori”. Substituindo-se a Equação (07) em (06), chega-se à
seguinte regra de decisão:
j
x
ω
r
se
(
)
(
)
(
)
(
)
iijj
pxppxp
ωωωω
r
r
>
, para todo
i
j
. (08)
De acordo com Richards (1986), no sensoriamento remoto, a formulação
mais usada para expressar a função de decisão de Máxima Verossimilhança (MV) é dada por:
)()|()(
iii
pxpxG
ωω
=
r
(09)
sendo a regra de classificação dada por:
31
i
x
ω
se
(
)
(
)
xGxG
ji
r
r
>
i
j
(10)
O desenvolvimento completo do método de máxima verossimilhança pode
ser encontrado em Richards e Jia, 1999.
Para o sensoriamento remoto, a experiência prática indica a função
densidade de probabilidade Gaussiana como sendo a mais adequada a estes dados. Neste caso,
o classificador passa a denominar-se Método de Máxima Verossimilhança Gaussiana (MVG)
e a função decisão (09), após algumas simplificações bem conhecidas adquire a forma:
(
)
(
)
(
)
(
)
(
)
i
i
T
i
pxxxG
ωµµ
ln2ln
1
1
11
+=
r
r
r
(11)
i = 1...m, sendo µ
i
o vetor de médias e
i
a matriz de covariância associados à classe ω
i
,
respectivamente, e m o número de classes. Os parâmetros do vetor de médias µ
i
e da matriz de
variâncias
i
são normalmente estimados a partir dos dados de treinamento disponíveis.
3.2.2 - Método baseado em Redes Neurais Artificiais
Muitas vezes, as propriedades estatísticas de uma classe não podem ser
estimadas, de modo que os problemas de teoria de decisão são melhor trabalhados pelos
métodos que produzem diretamente as funções de decisão através dos dados de treinamento,
sem levar em conta qualquer informação probabilística das classes de interesse. Os modelos
de redes neurais artificiais permitem desenvolver adaptativamente os coeficientes das funções
de decisão através de apresentações sucessivas de conjunto de padrões de treinamento
(GONZALEZ e WOODS, 2000).
32
A tentativa inicial de reproduzir o alto desempenho do rebro humano em
tarefas cognitivas extremamente complexas motivou o desenvolvimento inicial dos modelos
de Redes Neurais Artificiais (RNA). Tais modelos representam um tipo especial de
processamento da informação que consiste de muitas células primitivas que trabalham em
paralelo e estão conectadas através de ligações diretas ou conexões. A principal função dessas
células é distribuir padrões de ativação através de suas conexões, de maneira similar ao
mecanismo básico do cérebro humano (ZELL et al., 1995).
Segundo Brondino (1999), as RNA são baseadas em modelos abstratos do
funcionamento do cérebro humano e tentam reproduzir sistemas biologicamente realísticos,
sendo caracterizadas dentre os benefícios da computação neural por:
Habilidade de aprender com exemplos: os sistemas têm a capacidade de
aprender com a experiência;
Robustez: habilidade de lidar com ruídos. As RNA são tolerantes a falhas e
podem continuar a fornecer respostas adequadas por um bom tempo, o que as diferencia dos
sistemas convencionais, onde uma falha pode causar prejuízo do sistema como um todo;
Velocidade do processamento: como as RNA consistem de um grande
número de unidades de processamento operando em paralelo, elas podem trabalhar em
velocidades consideráveis em relação aos métodos computacionais comuns.
As RNA são organizadas em camadas que compõem sua topologia ou
arquitetura. Existem redes neurais de camada simples (perceptron) constituídas por um grupo
de neurônios arranjados em apenas uma camada, e as redes multicamadas, formadas por
várias camadas intermediárias ou pela combinação de várias redes de camadas simples
(VENTURIERI e SANTOS, 1998). Assim, a topologia de uma rede refere-se à maneira como
os elementos de processamento são organizados, o que afeta o desempenho da rede, uma vez
que sua estrutura está intimamente ligada ao algoritmo de aprendizado usado na fase de
33
treinamento da rede. A Figura 2 mostra a estrutura genérica para uma configuração
comumente usada, a rede neural com três camadas. As interconexões entre cada tem um
peso associado. Quando o valor é transmitido àquela interconexão, ele é multiplicado pelo
peso. Estes valores de peso contêm o conhecimento distribuído da rede. As especificidades
das camadas apresentadas na configuração de uma rede são:
Camada de Entrada: que serve como uma estrutura de distribuição para os
dados serem apresentados à rede. Nenhum processamento é realizado nesta camada;
Camadas Escondidas ou Intermediárias: onde é feita a maior parte do
processamento, através das conexões ponderadas; podem ser consideradas como extratoras de
características;
Camada de Saída: onde o resultado final é concluído e apresentado.
Figura 2 A estrutura de uma rede de alimentação progressiva (feed-forward)
Fonte: Adaptado de Gonzales e Woods (1993).
Os elementos básicos de uma RNA são chamados nós (ou neurônios), e as
conexões são simbolizadas por “ na Figura 3, a qual mostra o esquema de neurônio
camada escondida J
N
J
nós
N
padrões
vetoriais
de
entrada
pesos Wjx
i
j=1,2,...,N
J
i=1,2,...,N
i
pesos Wqj
q=1,2,...,N
q
j=1,2,...,N
J
classe
ω
1
classe
ω
2
classe
ω
M
x
1
2
3
n
camada de saída Q
N
q
nós
34
artificial (nó). Na camada de saída, cada corresponde a uma única classe ω
M
que gera o
valor y
k
associado àquela classe.
Figura 3 - Modelo sinático de neurônio artificial, nó, ou elemento de processamento de uma rede.
Fonte: (HAYKIM, 1994 apud BRONDINO,1999).
Por exemplo, sendo w
kj
, o peso associado à conexão entre um nó da camada
k com outro da camada j sucessiva, a entrada para um nó da camada j, é
j
N
j
kjk
xwu
=
=
1
(12)
e a saída do nó dessa camada j é:
)(
kj
ufO = (13)
onde f é uma função de ativação, freqüentemente da forma sigmóide,
)(
1
1
juj
j
e
O
θ
+
+
= (14)
e θj serve como um limiar. As funções de ativação permitem que cada possa reagir
diferentemente a uma dada entrada. Alguns nós podem ser facilmente ativados para gerar alto
valor de saída quando o valor de θj é elevado. Caso contrário, quando θj é pequeno, o terá
uma resposta mais baixa para a entrada u
j
.
A partir da Figura 3 é possível distinguir os elementos que compõe a
estrutura de um neurônio artificial, designados:
U
k
Função de
Ativação
Pesos
Sináticos
Sinais
de
entrada
X
1
X
2
X
N
ϕ
ϕϕ
ϕ
(.)
θ
θθ
θ
k
Threshold
(limiar)
Saída
y
k
w
k1
w
k2
w
kj
Função
Soma
35
- Sinapses (Conexões): caracterizadas por um peso, w, que pode representar
sua intensidade. O papel do peso w
kj
é multiplicar o sinal x
j
na entrada da sinapse j, conectada
a um neurônio k. O peso w
kj
é positivo se a sinapse associada é excitatória e negativo se a
sinapse associada é inibitória;
- Somatório (função soma): realiza a soma de todas as entradas ponderadas
pelos seus pesos respectivos, ou seja:
j
N
1i
kjk
xwu
=
=
(15)
- Limiar (threshold), θ
θθ
θ
k
: tem o papel determinante na saída do neurônio.
Sua função é controlar a intensidade da função de ativação para se obter o desempenho
desejado para a rede. Se o valor de u
k
for menor que este limiar, então a saída do neurônio fica
inibida, caso contrário o neurônio fica ativo;
- Função de ativação: funciona como um limitante à amplitude de saída do
neurônio, ou seja, a entrada é normalizada dentro de um intervalo fechado, comumente [0,1]
ou [-1,1];
- Saída do neurônio, (y
k
):
(
)
kkk
uy
θϕ
;= (16)
onde
ϕ é a função de ativação.Segundo Brondino (1999), a função de ativação
define a saída do neurônio em termos de nível de atividade do mesmo. Dentre as funções de
ativação mais comuns se enquadram as seguintes:
Função Linear:
)
(
(
)
tvtj
ii
=+1
36
Função threshold ou limiar:
)
(
11 =+tj
i
, se
(
)
θ
tv
i
0, se
(
)
θ
<tv
i
Função sigmóide logística:
(
)
(
(
)
)
tv
i
i
etj
+=+ 111
Função tangente hiperbólica:
)
(
(
(
)
)
(
)
)
(
tvtv
i
ii
eetj
+=+ 111
Função linear por partes:
(
)
11 +=+tj
i
, se
(
)
θ
<tv
i
-1, se
(
)
θ
<tv
i
(
)
tv
i
, fora do intervalo.
Uma rede de alimentação progressiva (feed-forward) requer um conjunto
único de pesos e limiares que deverão satisfazer todos os pares entrada-saída a ela
apresentados.
A entrada é um conjunto de observações e as saídas são os valores
associados às classes desejadas C
p
= {c
p1
, c
p2
, ..., c
pk
}. O processo de obtenção dos pesos e
tendências é feito através da aprendizagem da rede, que é, essencialmente, um treinamento
supervisionado. Durante esse treinamento da rede, elementos do conjunto de observações L
p
=
{l
p1
, l
p2
, ...l
pm
} correspondem aos nós da camada de entrada. Para uma dada entrada L
p
, a rede
deve ajustar o conjunto de pesos associados às conexões e também aos limiares dos nós, de
modo a se obter a saída desejada. Uma vez que esse ajustamento tenha sido efetuado pela
rede, um outro par de L
p
e C
p
é apresentado e a rede calcula o valor de saída correspondente
(GONG, 1996). Em geral, a saída da rede Y
p
= {y
pq
}, não será a mesma que aquela obtida
para os valores desejados C
p
. Para cada L
p
, o Erro Médio Quadrático (EMQ) é:
2
1
)(
pq
k
q
pqp
yc =
=
ε
(17)
onde k é o número de classes e o Erro Médio Quadrático (EMQ) do sistema é dado por
2
1 1
)(
1
pq
nt
p
k
q
pq
yc
nt
=
= =
ε
(18)
37
onde Nt é o número de pares de treinamento.
Embora uma rede com três camadas possa formar regiões de decisão
complexas, algumas vezes a dificuldade na aprendizagem pode ser minimizada aumentado o
número de camadas internas. Por outro lado, se forem usadas muitas camadas na rede ou
muitos nós nas camadas, são necessários muito mais cálculos e a rede pode perder a
habilidade de generalizar (GONG, 1996).
As redes multicamadas têm sido muito utilizadas para soluções de
problemas envolvendo altos graus de não-linearidade, quando os dados de entrada são dados
muitos similares. Tais redes adotam um treinamento supervisionado que utiliza um algoritmo
muito popular chamado de retro-propagação de erro (error backpropagation), e é baseado na
Regra Delta Generalizada, que “corrige” o erro durante o treinamento (HAYKIN, 1994 apud
BOCANEGRA, 2002).
Normalmente, o algoritmo de treinamento ou aprendizagem
backpropagation utilizado para treinar uma rede Multicamadas é derivado da Regra Delta
Generalizada, e é o algoritmo mais conhecido para aprendizagem supervisionada. Esse
algoritmo permite um ajuste de pesos em cada uma das camadas da rede e é projetado para
minimizar o erro entre a saída calculada por uma arquitetura multicamadas e a saída desejada.
O componente essencial desse algoritmo é o método iterativo que propaga regressivamente o
erro requerido para adaptar os pesos, a partir dos neurônios da camada de saída para os nós
das camadas precedentes (LIPPMANN, 1987).
Segundo Galo (2000a), o processo de treinamento pelo algoritmo começa
com a definição de um conjunto arbitrário de pesos para as conexões da rede e envolve duas
fases distintas. Na primeira, um vetor de treinamento com a respectiva saída desejada é
apresentado à rede e propagado através de suas camadas para computar uma saída para cada
elemento de processamento. As saídas dos nós da última camada são, então, comparadas com
38
as saídas desejadas e a partir disso são calculados os termos de erro. A segunda fase envolve
um retrocesso, ou seja, uma passagem de volta através da rede a partir da última camada,
durante a qual, o erro é repassado para cada elemento de processamento e os pesos
correspondentes são convenientemente alterados. Em um treinamento bem sucedido, este erro
diminui com o aumento do número de iterações e o procedimento converge para um conjunto
estável de pesos.
O objetivo do treinamento é minimizar a função de erro, mostrada na
Equação 18. Se esta função for simples, a rede tem garantia de encontrar solução. Caso
contrário, a rede pode cair em um mínimo local e não produzir uma saída satisfatória. A
atualização dos pesos se dá pela adição de um termo de variação a eles w
kj
, ou seja, para um
peso w
kj
(o peso do nó k para o nó j), o seu peso atualizado na iteração (t+1) é dado por
kjkjkj
w)t(w)1t(w
+
=
+
(19)
onde, de acordo com Bocanegra (2002), tem-se
kjkj
ow
ηδ
=
(20)
onde
)o1)(od(o
jjjjj
=δ
(21)
δ
j:
a diferença (erro) entre a camada de saída computada e a saída desejada do neurônio j;
o
j
: a saída do neurônio
j
, e
d
j
: a saída desejada.
O parâmetro η é denominado taxa de aprendizado e seu valor vai determinar
o quão “suavemente” se dará a atualização dos pesos. Se η for grande, o valor de
ij
w
também o será e, conseqüentemente, os pesos sofrerão uma alteração mais brusca.
39
Para atualizar os pesos das camadas escondidas, considerando a conexão w
kr
entre um n
k
de uma camada escondida ligado a outro neurônio n
r
da camada anterior, tem-
se
rkr
o*r)|η(δw
=
(22)
onde,
rδ
é o erro relativo do neurônio n
r.
O algoritmo backpropagation apresenta alguns problemas quanto às
dificuldades de aprendizado. Em superfícies muito complexas, o treinamento é muito lento e
existe o risco da rede cair num nimo local. Além disso, pode ocorrer overfitting, fenômeno
que surge depois de um certo tempo de treinamento, quando a rede memoriza os padrões que
foram apresentados e o processo de classificação piora sensivelmente. Possíveis soluções
para estes problemas podem ser citadas como: diminuir a taxa de aprendizado, adicionar nós
na camada intermediária ou utilizar um termo de momentum.
Para dimensionar uma arquitetura de rede neural artificial, que seja
adequada para classificar uma dada situação de interesse, deve-se definir o número de
camadas que constituirão, assim como o número de nós (ou neurônios) que constarão de cada
camada da rede.
De acordo com Gonzalez e Woods (1993) o número de elementos de
processamento (nós) da primeira camada corresponde ao número de variáveis ou dimensão
vetor de atributos dos dados de entrada, a camada de saída terá tantos elementos quantas
forem as classes a serem separadas. O problema está na definição do número de camadas
escondidas e do número de nós que as compõem. Na prática este problema tem sido
geralmente resolvido por tentativa e erro experimentalmente e/ou pela experiência prévia do
operador no domínio de uma dada situação.
40
Segundo Galo (2000a) após o aprendizado da rede, ela classifica os padrões
de interesse usando o conjunto dos pesos ajustados durante a fase de treinamento e calculando
para cada padrão de entrada, os valores de saída associados a cada classe.
3.3 – Classificação das áreas urbanas
O ambiente urbano é caracterizado pela ocorrência de diversos materiais
como concreto, asfalto, metal, plástico, telhado, vidro, água, grama, arbustos, árvores, e terra,
os quais são organizados pelo homem para construção de casas, sistemas rodoviários,
comércios e instalações industriais, bem como ambientes recreativos, definindo uma estrutura
complexa (JENSEN, 2000). Essa maior complexidade implica na necessidade de um maior
detalhamento espacial, quando da utilização do sensoriamento remoto, para a identificação
dos diferentes constituintes do espaço urbano.
Considerando, então, a notória complexidade das paisagens urbanas e que a
simples separação entre área urbana e não-urbana permite apenas avaliar tendências de
crescimento, torna-se necessário prover um detalhamento adicional para a extração da
informação do uso urbano, quanto às especificidades desses usos, tais como: residencial,
comercial e serviços, industrial, infra-estrutura para transporte, e comunicações e utilidades.
Geralmente, em ambientes urbanos a informação mais detalhada pode ser extraída a partir de
imagens tomadas por sensores remotos com alta resolução espacial (JENSEN, 2000).
O mesmo autor argumenta que para a extração de informações de alvos
urbanos a partir de dados obtidos por sensores remotos, o mais importante é uma alta
resolução espacial do que espectral. Obviamente, o caráter espectral deve ser considerado
41
para que o objeto de interesse possa ser detectado e identificado, e mesmo porque se trata do
atributo essencial no qual se baseia a maior parte dos procedimentos de classificação digital
de imagens. Porém, como em qualquer processo de interpretação, a extração de informação
em ambientes urbanos deve considerar, além desse atributo (analisado na imagem em termos
de tonalidade de cinza ou cor), a geometria dos elementos espaciais da cena (tais como forma
de objeto, tamanho, textura, orientação, padrão, sombra).
No contexto urbano, a textura se torna um elemento importante na
identificação dos alvos, uma vez que é avaliada a partir de um arranjo espacial de elementos
texturais, definidos como sendo a menor feição contínua e homogênea distinguível em uma
imagem e passíveis de repetição. Entretanto, como qualquer outro elemento de interpretação
que incorpore a natureza espacial na sua definição, a textura não é um atributo normalmente
considerado nas abordagens tradicionais de classificação de imagens multiespectrais. Para
classificação de imagens de alta resolução do ambiente urbano, novos algoritmos e
ferramentas devem considerar a informação textural.
Um dos aspectos básicos da utilização dos procedimentos de
classificação a partir de dados de sensoriamento remoto é modelar uma aplicação que seja
adequada ao estudo que se pretende desenvolver, estabelecendo um sistema de classificação
adequado ao nível de detalhamento oferecido pelos dados. Assim, a definição desse sistema
será direcionada pelo uso dado à informação representada e pelos atributos da terra que são
discerníveis a partir dos dados disponíveis para sua elaboração. A Figura 4 esquematiza a
idéia da hierarquização da informação, extraída a partir de dados de diferentes resoluções.
42
Figura 4 – Hierarquia da classificação de ambientes urbanos
Fonte: Adaptado de Jensen (2000)
Na Figura 4, para a classificação de ambientes urbanos foram categorizados
quatro níveis de hierarquia, na qual cada grau do nível apresenta uma maior resolução,
possibilitando um aumento no detalhamento da superfície urbana.
Na concepção da FAO para um sistema de classificação global e
hierárquico, Di Gregório (2004) insere a classificação de áreas urbanas no contexto de
superfícies artificiais e associadas definido-as como áreas impermeáveis, nas quais a
cobertura original natural foi substituída por uma artificial (usualmente de longa duração).
Essa classe é subdividida em padrões lineares e não lineares, que definem a seguinte
hierarquia:
Lineares
: referem-se a qualquer meio de transporte, comunicação ou
sistema de abastecimento que constitua uma estrutura linear (seu comprimento é maior que
Impermeáveis Permeáveis
Nível
I
II
Tipos de cobertura da terra
Hierarquia da Classificação de Ambientes Urbanos
III
IV
Edificações
Espaços Abertos
Impermeáveis
Espaços Abertos
sem Vegetação
Vegetação
Construções
Totalmente
Impermeável
Parcialmente
Impermeável
Corpo
D’água
Solo
Exposto
Vegetação
Gramínea
Vegetação
Arbórea
- Azulejos - Concreto - Concreto - Rios - Areia - Campos - Folhosas
- Telhados - Asfalto Solto - Lagos - Pedras - Gramados - Coníferas
- PVC - Pavimento de - Lagoas - Terra
Paralelepípedo - Represas
43
sua largura) e usada para conectar dois locais. Os perímetros da estrutura e o material da
cobertura podem ser posteriormente definidas. A subdivisão hierárquica é feita em estradas,
estradas de ferro, e linhas de comunicação.
- Estradas: são constituídas de material mais uniforme com estrutura linear
que cobre a superfície de terra em cima de longas distâncias. São
subdivididas em estradas pavimentadas (cobertas com um material artificial
consolidado à superfície de terra) e estradas não pavimentadas (superfície
comprimida ou coberta com material não consolidado, como pedregulho).
- Estradas de Ferro: consistem da combinação de materiais como madeira,
concreto, ferro e pedregulho.
- Linhas de Comunicação: caracterizadas pela combinação de elementos
pontuais como mastros, postes e elementos lineares. Os elementos lineares
estão situados acima do chão, suportados pelos elementos pontuais, como
linhas de transmissão de energia elétrica.
Não-Lineares: descrevem as áreas impermeáveis não lineares com
cobertura artificial construída. A subdivisão hierárquica é feita para áreas industriais e outras
e áreas urbanas.
- Industriais e outras: São superfícies não lineares impermeáveis,
relacionadas com fábricas, distribuição e comércio. A densidade das
construções artificiais em relação às áreas vizinhas pode ser descrita
separadamente.
- Área Urbana: são áreas de cobertura construída por estruturas
impermeáveis adjacentes ou conectada através de ruas. Essa cobertura está
relacionada com os centros populacionais. Possui elementos lineares como
estradas, estradas de ferro, e linhas de comunicação apesar dessas não serem
44
as características dominantes. A densidade das construções artificiais em
relação às áreas vizinhas pode ser descritas separadamente.
Assim, a densidade é aplicável para áreas industriais e outras e áreas
urbanas. A subdivisão é feita a partir da ocorrência de superfícies impermeáveis comparadas
às superfícies permeáveis.
Alta densidade: Mais de 75% do total da superfície consistem de
superfícies impermeáveis.
Média densidade: 50 para 75% do total da superfície consistem de
superfícies impermeáveis.
Baixa densidade: 50 para 30% do total da superfície consistem de
superfícies impermeáveis.
Espalhado: menos que 30 para 15% do total da superfície consistem de
superfícies impermeáveis.
Considerando as características inerentes à paisagem urbana e o fato de que
a classificação deste tipo de ambiente, a partir de imagens de média resolução espacial,
incorpora uma componente de subjetividade na atribuição da classe a um dado elemento de
resolução, uma análise da incerteza nesta atribuição pode ser de grande utilidade na avaliação
da ambigüidade na definição das classes de interesse.
4 - INCERTEZA NA CLASSIFICAÇÃO
Tão importante quanto a informação resultante de uma classificação, é
conhecer o grau de incerteza associada a esta informação. Comumente, o utilizados índices
45
que refletem o grau de exatidão de um mapa ou classificação para avaliar esse aspecto. Entre
os índices mais utilizados, destacam-se a exatidão global, que avalia a porcentagem de acerto
em um mapa, e o coeficiente Kappa, que se baseia também nas informações marginais de uma
matriz de confusão. Em ambos os casos, são usadas amostras para as quais são conhecidas as
verdades de campo, escolhidas arbitrariamente. No entanto, esses índices são globais, ou seja,
consideram todo o mapa e não refletem as incertezas espacialmente distribuídas. A fim de se
obter um mapa de incertezas (incertezas espacialmente distribuídas) associadas ao mapa
proveniente de uma classificação, pode-se inicialmente basear-se na probabilidade de se estar
atribuindo erroneamente o pixel a uma determinada classe (SANTOS et. al., 2003).
A qualidade geral de um conjunto de dados é freqüentemente um padrão
satisfatório. Porém, isso não significa que a qualidade é uniformemente mantida ao longo do
conjunto de dados. Em algumas áreas/locais, variações significantes nessa qualidade podem
existir, e essas regiões podem ser de interesse especial para o usuário. Então, uma
representação espacial dos pontos de maior incerteza na classificação pode informar ao
usuário as variações locais na qualidade do dado.
4.1 – Medidas de Incerteza
A classificação de dados de sensoriamento remoto, normalmente,
negligencia o aspecto contínuo (fuzzy) do meio ambiente e, conseqüentemente, introduz
incerteza nas classes designadas.
Esta incerteza é propagada nos estágios subseqüentes da classificação,
quando da produção de um produto que seja cartograficamente atrativo, ou seja, a edição pós-
46
classificação, por exemplo, pode incorporar um efeito de suavização de um fenômeno
potencialmente significativo.
A incerteza, que é introduzida durante a classificação de dados de
sensoriamento remoto, pode ser caracterizada pelos vetores de probabilidade que são
produzidos como um subproduto da classificação, disponibilizados pela maioria dos
procedimentos de classificação probabilísticos (GOODCHILD, SUN e YANG, 1992, apud
GOODCHILD, 2002). Por exemplo, na classificação pela probabilidade máxima “a
posteriori”, para cada pixel da imagem multiespectral é calculado um vetor de probabilidades
o qual especifica a chance de uma dada classe se constituir na classe verdadeira. Se a
observação sobre um pixel é entendida como uma variável aleatória x que pode estar
associada a uma das classes
ω
j
, j = 1, ....., M, então o vetor calculado para este pixel especifica
a probabilidade "a posteriori”:
x/P
j
r
ω=ω
(23)
para j = 1,..., M, e onde x
r
denota o dado avaliado.
Os vetores de probabilidade produzidos na classificação refletem as
diferenças da incerteza para a classificação resultante e podem ser considerados indicativos de
classificações duvidosas, de pixels misturados, classes heterogêneas, de limites ambíguos
entre classes.
A partir dos vetores de probabilidade, várias medidas de incerteza podem
ser estimadas. Um exemplo dessas medidas é a probabilidade máxima indicada no vetor de
probabilidade, cujo valor expressa o grau de atribuição para a classe designada e a possível
confusão com outras classes. Uma máxima probabilidade alta (como 0,95), deixa poucas
dúvidas a respeito da classificação do pixel. Uma probabilidade máxima baixa (como 0,50)
pode indicar atribuição duvidosa a uma classe. A diferença entre a probabilidade máxima e a
segunda maior probabilidade no vetor pode, então, servir para esclarecer situações de dúvida,
47
ao mesmo tempo em que fornece a informação sobre a certeza da classe mais provável (VAN
DER WEL et al., 1998).
Os vetores de probabilidades gerados nos procedimentos estatísticos de
classificação de um conjunto de dados de Sensoriamento Remoto fornecem uma informação
útil sobre a qualidade da classificação resultante em termos das incertezas envolvidas, cujo
conhecimento é necessário para se dispor de um critério de qualidade da classificação. Para
explorar completamente a informação do vetor de probabilidade, medidas adicionais de
incerteza são necessárias (VAN DER WEL et al., 1998).
A incerteza numa única classe para um pixel é a probabilidade requerida
para estabelecer esta classe com acurácia total. A incerteza na classe
ω
j
é definida como
(
)
xP1
j
r
ω=ω
(24)
para j = 1, ..., M, e onde x
r
denota os dados avaliados. Então o valor esperado para a
incerteza associada é:
)]x(P1[(*)x(P
j
M,...,1j
j
r
r
ω=ωω=ω
=
(25)
Quando são usadas medidas de entropia, que pode ser entendida como uma
medida relacionada a organização espacial de um atributo, a incerteza em um único valor,
para uma variável aleatória, é definida como sendo uma parte da informação que deveria
revelar este valor com perfeita acurácia. Para um pixel classificado, a incerteza ponderada na
classe
ω
j
é definida como
(
)
xPlog
j2
r
ω=ω
(26)
se j = 1, ... , M; a incerteza ponderada é medida em unidades de bits de informação.
Geralmente, a classe verdadeira do pixel não é conhecida e,
conseqüentemente, a quantidade de informação requerida para indicar a classe do pixel é
também desconhecida. A entropia do pixel é, conseqüentemente, definida como o índice de
48
informação esperado de uma parte da informação que revela sua verdadeira classe. Para este
fim, a medida de entropia combina as incertezas das várias classes do pixel, ponderando-as
por suas probabilidades
)x(Plog*)x(P
j2
M,...,1j
j
r
r
ω=ωω=ω
=
(27)
A entropia do pixel é mínima se tanto a incerteza quanto a verdadeira classe
forem determinadas. Deste modo, se
(
)
xP
j
r
ω=ω = 1 para uma dada classe
ω
j
,
Mj1
, isto é,
se a classe
ω
j
estiver estabelecida com acurácia perfeita e se não houver informações além das
requeridas para mostrar a verdadeira classe do pixel, então a entropia é igual a zero. A
entropia é máxima se nenhuma das classes são preferenciais, isto é, se total ignorância em
relação à classe verdadeira do pixel. Assim, se as probabilidades
xP
j
r
ω=ω
, j = 1, ..., M,
forem distribuídas uniformemente, ou seja, se todas as classes
ω
j
tiverem
(
)
xP
j
r
ω=ω
= 1/M,
então a entropia é máxima.
A principal vantagem da medida de entropia global sobre a medida simples
é sua habilidade de sumariar toda a informação contida no vetor das probabilidades num
único número, mas ela não é a única medida que exibe esta propriedade.
4.2 - Estimativa de incertezas locais para atributos temáticos
Quando se trata de atributos temáticos, Felgueiras (1999) apresenta duas
formulações para a estimativa da incerteza local dos dados temáticos: a incerteza definida pela
moda da distribuição e a incerteza estimada por uma medida de entropia, a entropia de
Shannon.
49
A incerteza em x
i
, Inc(x
i
), pode ser determinada por um único valor de
probabilidade, a probabilidade da classe modal
ω
j
, associada à posição x
i
. Essa medida,
referenciada por Felgueiras (1999) como incerteza pela moda, tem a seguinte formulação
(
)
(
)
iji
xpxInc
ω
= 1 (28)
Outra possibilidade é medir a incerteza a partir da combinação dos valores
das probabilidades para as M classes em x
i
. A incerteza por entropia pertence a esse grupo de
medidas e é calculada a partir da medida de entropia proposta por Shannon e Weaver
4
(1949),
apud Felgueiras (1999). Informalmente, a entropia pode ser entendida como uma medida da
organização espacial de um atributo, que mede a confusão, a desordem, relacionada com os
valores, ou possíveis estados deste atributo.
Quando a variável aleatória é temática, ou o resultado da discretização de
uma variável aleatória contínua, a entropia de Shannon, em sua distribuição univariada
discreta (H), tem a seguinte formulação
))x(pln()x(p)x(H
ii
M
1j
i
jj
ω
=
ω
=
(29)
onde p
wj
(x
i
), j=1,...,M, são as probabilidades univariadas das M classes, ou categorias, do
domínio da variável aleatória. A entropia de Shannon para variáveis aleatórias discretas, mede
o grau de confusão entre as classes, pois considera as probabilidades de todas as classes de
forma unificada.
Ainda conforme Felgueiras (1999), os dois procedimentos anteriores para o
cálculo de incertezas, não são as duas únicas abordagens possíveis, porém apresentam, entre
si, diferenças significativas. A título de exemplo, a Tabela 1 mostra valores de incerteza, pela
moda e por entropia, calculados para 6 distribuições de probabilidades com 4 classes distintas.
4
SHANNON, C. E.; WEAVER, W. The mathematical theory of communication. Urbana: The University of lllinois.
Press, 1949. 117p.
50
Analisando-se essas distribuições observa-se que:
a distribuição 1 da tabela mostra que, quando a probabilidade de uma
das classes é igual a 1,0 e a das demais é igual a 0, as incertezas pela moda e por entropia são
iguais e têm valor 0;
Para as distribuições 2, 3 e 4, a incerteza pela moda se mantém
constante, enquanto que a incerteza por entropia aumenta à medida que mais classes
apresentam probabilidades diferentes de 0;
As distribuições 5 e 6 mostram que, para distribuições uniformes, o
valor da incerteza por entropia, que é máximo, cresce quando M aumenta, ou seja, quando o
número e classes com probabilidades diferentes de 0 aumentam.
Tabela 1 – Exemplos de cálculos de incertezas para várias distribuições.
Distribuições Probabilidades Incerteza
P(Classe=1) P(Classe=2) P(Classe=3) P(Classe=4)
Por
moda
Por
entropia
1 1.000 0.000 0.000 0.000 0.000 0.000
2 0.520 0.480 0.000 0.000 0.480 0.692
3 0.520 0.240 0.240 0.000 0.480 1.025
4 0.520 0.160 0.160 0.160 0.480 1.220
5 0.333... 0.333... 0.333... 0.000 0.666... 1.099
6 0.250 0.250 0,250 0.250 0.750 1.386
Fonte: Felgueiras (1999).
O objetivo da inserção da Tabela 1 e das observações sobre a mesma é
mostrar, quantitativamente, as principais diferenças entre os dois procedimentos de estimativa
de incerteza para atributos temáticos.
51
4.3 - Representação da Incerteza
A incerteza é gerada pela imperfeição da informação na qual se baseia a
tomada de decisões, sendo que essa imperfeição pode estar relacionada com várias
características diferentes da informação, tais como: imprecisão, conflito, ignorância parcial ou
total, etc. A qualidade da decisão tomada a partir da informação fornecida, irá depender,
primeiramente, da própria qualidade da informação conhecida, que pode variar de perfeita a
imperfeita, seja pela total ausência de informações ou por informações completamente
conflitantes (BITTENCOURT, 2002). Além disso, a qualidade da decisão dependerá do
modelo de representação escolhido e da sua adequação para tratar a informação disponível
sendo que, para cada tipo de informação, existe um modelo formal conhecido de tratamento.
Segundo Santos et. al. (2003) uma informação de conotação probabilística
pode se utilizar da teoria de probabilidades ou da teoria da evidência, também conhecida
como Teoria de Dempster-Shafer (SHAFER, 1976); a informação imprecisa e/ou vaga pode
ser tratada pela teoria dos conjuntos nebulosos (ZADEH, 1965); (DUBOIS e PRADE, 1980);
pela teoria dos conjuntos de aproximação (rough sets) (PAWLAK, 1992), ou pela
manipulação de classes de referência (KYBURG JR, 1983); a informação possibilista pode
ser tratada pela teoria de possibilidades (ZADEH, 1978; DUBOIS e PRADE, 1988). A
informação de incerteza pode ser tratada tanto pelas teorias de probabilidades, possibilidades
ou evidência.
Se a incerteza varia espacialmente um mapa de incerteza será mais útil do
que uma quantificação global da incerteza, particularmente para um analista que usa o mapa
para visualização exploratória ou confirmatória (MACHEACHREN, 1992).
Uma dessas representações, o mapa bivariado, indica uma relação
combinada, na qual dado e qualidade são mostrados em uma única visualização. Embora a
52
exibição bivariada seja complexa e difícil de ser interpretada, provê uma imediata
visualização da incerteza, representando uma importante regra na exploração e
desenvolvimento de visualização da qualidade do dado, para a qual um número significativo
de técnicas tem sido proposto e aplicado. As exibições bivariadas podem ser estáticas ou
dinâmicas. Exemplos de técnicas estáticas são transformações de cor, mistura, foco, superfície
de incerteza tridimensional e ofuscamento. Técnicas dinâmicas referem-se a fatiamento,
cintilamento, movimento e zoom (VAN DER WEL, 1998).
A mistura é particularmente percebida nas zonas de transição que ocorrem
entre classes, representando ambigüidade de posição e de atributo. Mescla de cores/tons de
cinza nas zonas misturadas podem corresponder a fronteiras entre tipos de vegetação ou de
solo, como proposto por McGranaghan
5
(1993) apud Drecki (2002). A aplicação destas
técnicas pode criar uma impressão de variabilidade contínua entre feições naturais.
Em uma aproximação dinâmica, a incerteza pode ser representada pelo
fatiamento. Neste método, diferentes valores de limiar podem ser atribuídos para diferenciar a
qualidade dos dados. Também a técnica de zoom permite a visualização dinâmica da incerteza
e esta é baseada na ferramenta de zoom disponível em muitos dos aplicativos. A qualidade
dos dados pode ser vista de diferentes perspectivas. Uma visualização distanciada pode ser
usada para dado incerto, enquanto para dados de alta confiabilidade utiliza-se uma visão
detalhada.
Variações no tempo de exibição das feições do mapa, normalmente são
proporcionais à sua confiança e, para sua visualização, pode-se criar um efeito de
cintilamento. Freqüentemente, objetos cintilantes em uma tela indicam alto valor de incerteza,
5
MCGRANAGHAN, M. A cartographic view of spatial data quality. Cartographica, 30, pp. 8-19, 1993.
53
enquanto os mais estáveis ou informações constantemente exibidas expressam dados
confiáveis (FISHER
6
, 1994a, apud DRECKI, 2002).
Finalmente, a animação pode ser também aplicada para criar posições
múltiplas ou efeitos de movimento. Enquanto um método de posição múltipla usualmente se
refere à incerteza posicional, um efeito de movimento pode também comunicar incerteza de
atributo. Num caso padrão, Fisher (1994b) apud Drecki (2002) exemplifica o caso de um
mapa pontual de densidade populacional animado, no qual posições continuamente variáveis
de pontos comunicam a distribuição espacial da população, em lugar do local particular da
população.
6
FISHER, P. Visualisation of the reability in classified remotely sensed images. Photogrammetric Engineering & Remote
Sensing, 60, pp. 905-910, 1994.
54
5 CARACTERIZAÇÃO DO EXPERIMENTO DESENVOLVIDO: MÉTODO E
RESULTADOS OBTIDOS
5.1 – Área de estudo
O Município de Presidente Prudente está localizado a oeste do Estado
de São Paulo, entre as seguintes coordenadas geográficas: 21º 43’ a 22º 12’ de latitude Sul e
51º 13’ a 51º 24’ de longitude Oeste Grw. A Figura 5 apresentada a seguir mostra a
localização do Município de Presidente Prudente, no contexto do Oeste do Estado de São
Paulo.
Figura 5 – Localização do Município de Presidente Prudente no contexto do Oeste do Estado de São Paulo
Fonte: Adaptada do site do IBGE (2005)
Segundo o Plano Diretor de 1996, a área do Município é de 562 km
2
e a
população é de aproximadamente 201.347 habitantes (IBGE, 2005).
PRESIDENTE PRUDENTE
55
O município de Presidente Prudente está localizado no planalto ocidental
paulista, constitui a continuidade física do reverso das Cuestas Basálticas, com a qual se
limita a leste. As colinas amplas estão presentes na porção norte do município, já nas
barrancas do rio do Peixe. As colinas médias são observadas na extremidade sul onde se
encontra o córrego do Cedro e os morrotes e espigões, predominantes no município
abrangendo cerca de 80% de seu território; a altitude média é de 472 m acima do nível do
mar.
Do ponto de vista climático, a região de Presidente Prudente sofre a atuação
da maioria dos sistemas atmosféricos presentes na América do Sul e pelo fato desta região
estar no extremo oeste paulista, torna-se um campo de alternância dos sistemas tropicais e
polares, mas dominado por massas de ar Tropical marítima (AMORIM, 2000).
5.2 – Dados Utilizados
Para o desenvolvimento desta pesquisa foram utilizados dados
multiespectrais de média resolução espacial, obtidas por satélite, e informações extraídas da
Carta de Zoneamento do Uso do Solo Urbano de Presidente Prudente.
A imagem multiespectral utilizada no projeto corresponde a dados orbitais
CCD/Cbers (bandas espectrais 1, 2, 3 e 4), abrangendo a área urbana e de expansão urbana de
Presidente Prudente. A data da tomada da cena é 15 de dezembro de 2004, corresponde á
órbita/ponto 159/125, tendo sido obtida pelo sensor CCD/Cbers 2. Esta imagem foi obtida
diretamente do “site” do INPE (www.dpi.inpe.br/catalogo), que mantém um acervo das cenas
já adquiridas, disponibilizando-as gratuitamente para download.
56
O programa CBERS (China-Brazil Earth Resources Satellite ou Satélite
Sino-Brasileiro de Recursos Terrestres) mantém dois satélites de observação terrestre em
órbita: o CBERS-1 e o CBERS-2, lançados na China em 14 de outubro de 1999 e 21 de
outubro de 2003, respectivamente. Os satélites são equipados com sensores de diferentes
resoluções espaciais que podem cobrir o planeta em menos de 5 dias e ao mesmo tempo
produzir informações mais detalhadas em uma visada mais estreita. O CBERS carrega
câmeras para observação óptica e um sistema de coleta de dados ambientais. É um sistema
único, pois mantêm em órbita instrumentos sensores que combinam características
especialmente adequadas às diversas escalas temporais e espaciais, necessárias ao
monitoramento dos recursos terrestres.
No módulo principal desses satélites, designado "carga útil", estão
colocados os sistemas ópticos (CCD Câmera Imageadora de Alta Resolução, IRMSS
Imageador por Varredura de Média Resolução e WFI – Câmera Imageadora de Amplo Campo
de Visada) usados para observação da Terra e o Repetidor para o Sistema Brasileiro de Coleta
de Dados Ambientais (EMBRAPA, 2004).
O Quadro 1 apresenta os parâmetros dos instrumentos imageadores
presentes no Cbers 2. Vale ressaltar que, apesar de se estar apresentando as características dos
sistemas sensores imageadores instalados na plataforma, nesta investigação são usados apenas
os dados multiespectrais CCD, pela sua característica de dia resolução espacial (20
metros). Neste quadro, as bandas são especificadas pelos intervalos de comprimento de onda
correspondentes, sendo definidas como: banda 1, intervalo espectral de 0,45 a 0,52 µm (luz
azul); banda 2, entre 0,52 e 0,59 µm (luz verde), banda 3, de 0,63 a 0,69 µm (luz vermelha) e
banda 4, entre 0,77 a 0,89 µm (intervalo espectral do infravermelho próximo).
57
Quadro 1 – Parâmetros dos instrumentos imageadores presentes no CBERS-2
Fonte: Embrapa (2004)
A imagem adquirida pelo sistema CCD/Cbers2 em 15/12/2004, abrangendo
a área de estudos é mostrada na Figura 6, na forma de uma composição colorida das bandas
espectrais 2, 3 e 4, associadas aos canais B, G e R.
ESPECIFICAÇÕES
CCD
IR-MSS
WFI
Bandas Espectrais (mm)
0,51 - 0,73 (pan)
0,45 - 0,52
0,52 - 0,59
0,63 - 0,69
0,77 - 0,89
0,50 - 1,10 (pan)
1,55 - 1,75
2,08 - 2,35
10,40 - 12,50
0,63 - 0,69
0,76 - 0,90
Campo de Visada 8,3º 8,8º 60º
Resolução Espacial (m) 20 80 (pan e IV) 260
Res. Temporal (Nadir): 26 dias 26 dias 3 - 5 dias
Res. Temporal (Fora do Nadir): 3 dias (+/- 32º) - -
Largura da Faixa Imageada 113 km 120 km 890 km
Capacidade de Visada Lateral +/- 32º - -
58
Figura 6 - Composição Colorida (BGR-234) da imagem CCD/Cbers2
O fato de se utilizar uma imagem de média resolução para a extração da
informação temática justifica-se, uma vez que se pretende gerar uma classificação que
viabilize a estimativa da incerteza associada a cada pixel. Isso implica na utilização de uma
abordagem de classificação pixel a pixel, considerando-se que o tamanho do pixel deve
incorporar mistura de classes. Nesse contexto, quanto maior a resolução espacial, menor a
ambigüidade, dependendo das classes que foram definidas.
Outro tipo de dado que se mostrou importante no desenvolvimento dessa
investigação foi uma carta representando o “Zoneamento de Uso e Ocupação do Solo
Urbano” do Município de Presidente Prudente, elaborada para a Secretaria de Planejamento e
Desenvolvimento Urbano da Prefeitura Municipal de Presidente Prudente e disponibilizada
em arquivo digital (formato DXF) por Gouveia e Queiroz (1999). Essa carta mostra a
59
delimitação espacial das zonas urbanas de interesse e foi usada como subsídio para a
definição das categorias de cobertura da terra, passíveis de serem discriminadas na imagem
multiespectral e, também, na aquisição de dados de treinamento para a classificação
supervisionada realizada pela RNA.
A carta original, datada de 1997, está na escala 1:15.000, sistema de
projeção UTM (Universal Transversa de Mercartor), elipsóide International de Hayford,
datum Córrego Alegre, e contém informações sobre o uso e a ocupação do solo dividido em
zonas, sendo elas:
ZR1 – Zona residencial de baixa densidade populacional
ZR2 – Zona residencial de baixa densidade populacional
ZR3 – Zona residencial de baixa densidade populacional
ZR4 – Zona residencial de média densidade populacional
ZR5 – Zona residencial de média densidade populacional
ZR6 – Zona residencial de alta densidade populacional
ZCS1 – Zona de comércio e serviço central
ZCS2 – Zona de comércio e serviço de eixos viários estruturais
ZCS3 – Zona de comércio e serviço de vias principais
ZCS4 – Zona de comércio e serviço de vias secundárias
ZI1 – Zona de Indústrias não poluitivas
ZI2 – Zona de Indústrias potencialmente poluitivas
ZPPA – Zona de preservação e proteção ambiental
ZE – Zonas especiais
Segundo os autores, os critérios para a diferenciação das zonas ZR1, ZR2,
ZR3, ZR4 e ZR5 foram: tamanho mínimo do lote (m
2
), frente mínima do lote (m), taxa de
ocupação máxima (%) e área mínima de terreno por unidade habitacional (m
2
). A Figura 7
mostra uma representação das zonas de uso e ocupação do solo extraídas da carta de
zoneamento urbano, resultante da sua digitalização.
60
Figura 7 – Carta de Zoneamento Urbano de Presidente Prudente.
A princípio, a finalidade da utilização da Carta de Zoneamento Urbano
de Presidente Prudente foi servir como subsídio para a delimitação espacial das classes de
interesse, a partir da fusão das diferentes zonas representadas. Porém, devido às dificuldades
que surgiram na edição dessa carta, que os polígonos que definiam diferentes zonas não
estavam fechados, a carta de zoneamento foi usada apenas para orientar a aquisição dos dados
de treinamento para a rede neural artificial e na delimitação e recorte da área urbana de
interesse.
Mesmo considerando a utilização mais restrita desta carta, essa foi
submetida, necessariamente, a um processo de registro em relação à imagem multiespectral
CCD/CBERS.
61
5.3 – Aplicativos utilizados
Para o processamento e análise digital dos dados espaciais foram usados
aplicativos instalados em microcomputador Pentium 4, funcionando em sistema operacional
Windows.
Foram desenvolvidos e implementados programas computacionais para
converter os dados a serem classificados em um arquivo padrão que pudesse ser
compreendido pelo simulador, assim como, para a conversão dos valores de saída da rede
neural artificial para o formato de uma imagem classificada. Através destes programas
implementados, os valores de saída da rede neural artificial foram convertidos em valores de
probabilidade por classe e valores de incerteza por classe. Estes programas implementados
foram desenvolvidos na linguagem C++, pelo Professor Doutor Maurício Galo, docente do
Departamento de Cartografia da FCT/UNESP.
Para os demais processamentos e análise digital dos dados multiespectrais
foram usados os softwares: SPRING, IDRISI e o SNNS, descritos a seguir.
SPRING
O SPRING (Sistema de Processamento de Informações Georreferenciadas)
é um banco de dados geográfico desenvolvido, para ambientes UNIX e Windows, cujas
características principais são: opera como um banco de dados geográfico e suporta grande
volume de dados (sem limitações de escala, projeção e fuso), mantendo a identidade dos
objetos geográficos ao longo de todo banco e administra tanto dados vetoriais como dados
matriciais (raster) e realiza a integração de dados de Sensoriamento Remoto e SIG (Sistema
de Informações Geográficas).
62
O SPRING tem se mostrado uma opção atrativa na área de
geoprocessamento, desde que passou a ser considerado um software de domínio público.
Além disso, constitui um produto desenvolvido com tecnologia totalmente nacional pelo
Instituto Nacional de Pesquisas Espaciais – INPE, em São José dos Campos/SP.
O sistema Spring constitui-se de três aplicativos ou programas executáveis,
o Impima utilizado para leitura de imagens e conversão para o formato GRIB, o Spring
programa principal do sistema onde serão modelados os dados e o Scarta este programa
permite a elaboração de cartas a partir de dados previamente tratados no programa Spring
(INPE, 1999).
IDRISI
O software IDRISI versão 3.2, é também um Sistema de Informações
Geográficas e de processamento de imagens desenvolvido pelo Graduate School of
Geography” da “Clark University” e projetado para a análise de dados geográficos em
formato matricial (EASTMAN, 1998). Consiste de um programa principal de interface e mais
de 150 módulos de programas que fornece facilidades na entrada, visualização e análise de
dados geográficos. Também possui um módulo de conversão vetor-matriz, pois ele trabalha
com imagens e operações que permitem o cruzamento entre planos de informações.
O IDRISI trabalha na forma analítica matriz (imagem), cobrindo um amplo
espectro de necessidades de SIG e de Sensoriamento Remoto, desde consulta a banco de
dados e modelagem espacial, até realce e classificação de imagens. Facilidades especiais estão
incluídas para monitoramento ambiental e gerenciamento de recursos naturais, destacando
análise de séries temporais/mudanças, apoio à decisão por múltiplos critérios e por objetivos
múltiplos e modelagem de simulação (EASTMAN, 1998).
63
Simulador SNNS
O SNNS (Stuttgart Neural Network Simulator) é um ambiente para a
simulação e pesquisa de redes neurais, desenvolvido por um grupo de pesquisadores da
Universidade de Stuttgart, inicialmente para ambiente UNIX, sendo um dos simuladores de
redes neurais mais empregado pela comunidade científica. Engloba uma vasta quantidade dos
modelos de redes neurais mais conhecidos e utilizados atualmente, e proporciona um
ambiente eficiente e flexível para auxiliar na criação, o treinamento e a operação com redes
neurais artificiais (ZELL et al.,1995). A título de complementação, apresenta-se no Anexo 1,
uma descrição do simulador SNNS.
Programas específicos para conversão de dados:
PBM-SNNS
Para treinar, validar, ou mesmo classificar quaisquer tipos de dados usando
o simulador SNNS é necessário convertê-los para um formato apropriado. Esse formato
define um arquivo de padrões, composto por um cabeçalho e um componente de dados. O
cabeçalho estabelece quantos padrões o arquivo contém, assim como a dimensionalidade dos
vetores de entrada e classes de saída. O componente de dados é simplesmente uma listagem
de números que representam os atributos de entrada e de saída, normalizados no intervalo
entre 0 e 1. Para cada padrão, o número de valores listados deve corresponder ao número de
elementos de processamento da primeira camada da rede, acrescido do número de unidades de
saída, conforme definido no cabeçalho (ZELL, et. al., 1995).
Para transferir cada arquivo de dados para o sistema operacional Linux e
então gerar os arquivos de padrões no formato aceito pelo SNNS, foi implementado um
programa computacional que permite organizar esses arquivos de padrões segundo a estrutura
64
anterior, a partir dos planos que compõem cada segmento da imagem
7
. Esse programa é
flexível o suficiente para permitir que sejam definidos vários padrões em um único arquivo.
SNNS-PBM
Este programa tem o objetivo de converter o arquivo ASC II produzido pela
RNA contendo as ativações de saída por classe, em uma imagem no formato .pbm. O
programa opera da seguinte maneira: primeiramente o somadas todas as ativações de saída
por pixel (de todas as classes), na seqüência o valor de ativação de cada classe é dividido pela
soma anterior, resultando em valores de estimativa de probabilidade por pixel em relação à
cada classe. Posteriormente são elaborados arquivos distintos para cada classe, indicando as
probabilidades de cada pixel estar associado a cada uma das classes. Cada um desses arquivos
das probabilidade/classe são gerados no formato .pbm.
Desta maneira, o resultado obtido é um mapa de probabilidade por classe, o
qual foi importado para o software IDRISI. Neste software, através da ferramenta Image
Calculator foram geradas as imagens de incerteza para cada classe e a entropia global, a partir
da utilização das operações indicadas pelas Equações (30) e (31), respectivamente.
5.4 – Método
O desenvolvimento do experimento é apresentado em cinco etapas: a
primeira se constitui na definição do esquema de classificação, a segunda nos processamentos
prévios aplicados aos dados a serem classificados, a terceira etapa diz respeito à classificação.
7
Programa Implementado pelo Prof. Dr. Maurício Galo do Departamento de Cartografia da FCT/Unesp.
65
A quarta etapa refere-se ao tratamento dos dados de saída da RNA e a quinta e última etapa se
refere à representação temática e análise da incerteza
Na primeira etapa foram definidas as classes de interesse e respectiva
legenda, assim como os dados que possibilitaram discriminar tais classes e a configuração do
classificador utilizado. Na segunda etapa são descritos os processamentos aplicados aos
dados, tais como: registro da imagem com a carta de zoneamento urbano de Presidente
Prudente, uma transformação multiespectral do espaço RGB para o IHS e o retorno para o
espaço RGB, como uma tentativa de realçar as características urbanas e a geração das
imagens de textura e índice de vegetação.
Na terceira parte do trabalho foram definidas as classes de interesse, o
procedimento de coleta de elementos amostrais, os parâmetros usados no treinamento da RNA
e a classificação das imagens. Na quarta etapa foi aplicado um programa computacional às
saídas de ativação resultantes da rede para que estas fossem convertidas nos mapas de
probabilidade por classe e mapas de incerteza por classe. Na quinta etapa foi gerado o mapa
da entropia.
O fluxograma apresentado na Figura 8 mostra as etapas desenvolvidas no
projeto e na seqüência cada uma delas é detalhada.
66
Figura 8 – Fluxograma das atividades previstas para o projeto
*Métricas: Incerteza/global e por classe
**Geração de planos de Informação representando a incerteza na classificação de cada pixel.
Classes de
Interesse
Dados de
Entrada
Imagem
Multiespectral
Carta de
Zoneamento
Concepção do Projeto de
Classificação
Registro
Recorte da Área
de estudos
Processamentos prévios para geração
dos dados de entrada
Seleção dos dados de
entrada para a RNA
Classificação supervisionada – RNA
Definição das arquiteturas para treinamento
Aquisição de amostras de treinamento e validação
Treinamento das arquiteturas de RNA
Identificação da arquitetura mais adequada
Aplicação da arquitetura na classificação da
imagem
Representação da
Incerteza** e
entropia
Análise da
Incerteza
Tratamento dos
dados de saída da
rede
Estimativa de
medidas* de
Incerteza
Estimativa de
Probabilidade
67
5.4.1 – Concepção do projeto de classificação
No projeto (ou esquema) de classificação são especificadas as classes a
serem representadas no mapa temático, o método de classificação a ser adotado e tipos de
dados, assim como os processamentos necessários à extração da informação.
Considerando o propósito geral da investigação, ou seja, analisar a incerteza
associada à representação de classes de cobertura do solo urbano, definidas a partir da
aplicação de uma RNA a dados orbitais de média resolução espacial, o método de
classificação adotado considerou as seguintes características:
- necessidade de se realizar uma análise no nível do pixel, uma vez que são
usadas imagens de média resolução espacial, cujo elemento de resolução incorpora mistura de
alvos urbanos e, portanto, ambigüidade;
- possibilidade de tratar os dados de saída do classificador de modo a avaliar
o grau de incerteza na atribuição de um pixel a uma dada classe de interesse.
Assim, a classificação é desenvolvida de modo supervisionado, usando uma
RNA treinada para reconhecer classes previamente especificadas, a partir de um conjunto de
dados espaciais de entrada que englobem uma imagem na qual a variabilidade espacial dos
ambientes urbanos esteja minimamente representada.
Classes de Saída: Legenda
A especificação das classes baseou-se inicialmente na carta de zoneamento e
foi feita mediante a fusão das zonas que apresentaram padrão similar na imagem
multiespectral. A carta de zoneamento urbano, como indicado anteriormente, define catorze
68
(14) zonas e a partir de uma verificação visual na imagem multiespectral (CCD/Cbers 2), foi
possível uma definição preliminar das classes de interesse. Uma associação entre as classes de
interesse e as zonas estabelecidas na Carta de Zoneamento é apresentada no Quadro 2.
Quadro 2 – Associação entre classes de interesse e zonas especificadas na Carta de zoneamento
Classes de Interesse
Classes definidas na Carta
de Zoneamento
- Alta densidade de ocupação urbana ZR 6
ZCS 1
- Média densidade de ocupação urbana ZR 4
ZR 5
parte de ZI 1
- Baixa densidade de ocupação urbana ZR 1
ZR 2
ZR 3
parte de ZI 1 e ZE
ZI 2
- Área verde ZPPA
ZE
- Loteamento novo
- Represa
- Não classificada
Nesse processo, confirmou-se a impossibilidade de discriminar todas as
zonas representadas na carta, pois muitas delas são caracterizadas essencialmente em função
de um uso cultural que, muitas vezes, não define um padrão observável na imagem. No
entanto, a partir dos critérios adotados para estabelecer Zonas Residenciais, que o
parâmetros que podem determinar um padrão de textura, essas zonas foram agrupadas com
base nos padrões específicos definidos na imagem, relacionados com a intensidade da
ocupação física, o que está relacionado ao uso do solo, ou seja, uma área que apresenta maior
densidade de ocupação apresenta uma maior densidade de construção e asfalto, a qual se
manifesta por variações de textura. Portanto, a especificação das classes foi feita com base na
69
definição preliminar mostrada no Quadro 2, mas considerou principalmente a estrutura
hierárquica indicada em Jensen (2000) e explicitada por Di Gregório (2004). Desse modo, o
diagrama hierárquico concebido para essa análise e baseado em Jensen (2000) é apresentado
na Figura 9, enquanto que a descrição das classes e respectiva designação na legenda do mapa
temático dos tipos de cobertura do solo da área urbana e expansão urbana de Presidente
Prudente são feitas no Quadro 3.
Figura 9 – Classes de cobertura do solo, especificadas para a área urbana e de expansão urbana de Presidente
Prudente.
Fonte: Adaptado de Jensen (2000).
Dependendo de como as classes são especificadas, é possível discriminar
tipos de cobertura de níveis hierárquicos mais detalhados, porém a própria designação das
classes pressupõe que haja ambigüidade na sua definição (nível hierárquico II).
AMBIENTES URBANOS
Impermeável
Permeável
Cobertura da Terra
Maior
Densidade de
Superfícies
Impermeáveis
Densidade
Intermediária de
Superfícies
Impermeáveis
Menor
Densidade
de Superfícies
Impermeáveis
Vegetação
Arbórea/
Arbustiva
Vegetação
Rasteira/Solo
Exposto
Corpo
d’água
70
Quadro 3 – Caracterização das seis classes de cobertura do solo urbano de Presidente Prudente
CLASSES DESCRIÇÃO
Maior Densidade de
Superfícies Impermeáveis
Constituída por áreas com maior densidade de construções, mais
verticalizadas, ou simplesmente superfícies revestidas com material
impermeável.
Densidade Intermediária
de Superfícies
Impermeáveis
Engloba áreas construídas, porém com maior heterogeneidade quanto aos
revestimentos da superfície que se constituem de materiais permeáveis e
impermeáveis.
Menor Densidade de
Superfícies Impermeáveis
Áreas externas ao núcleo urbano, constituídas por bairros residenciais com
terrenos de dimensões maiores, loteamentos recentes, etc, caracterizando
construções mais esparsas.
Vegetação
Arbórea/Arbustiva
Refere-se às áreas verdes que ocorrem no contexto urbano e área de
expansão urbana.
Vegetação Rasteira/Solo
Exposto
Vegetação de menor porte, constituído basicamente por gramíneas.
Corpo d’água __________________________
Dados de Entrada para a classificação
A fim de adquirir dados que possibilitassem discriminar as classes de
interesse, alguns processamentos prévios foram aplicados às imagens multiespectrais do
sensor CCD/Cbers2. Estes processamentos foram realizados nos softwares IDRISI e SPRING,
incluindo a geração de uma imagem contendo indicadores de textura e uma imagem de índice
de vegetação.
Como anteriormente explicitado, para especificar uma abordagem de
classificação adequada à presente proposta, considerou-se a necessidade de incorporar dados
de natureza não espectral, derivados de processamentos aplicados às imagens multiespectrais,
relacionados com indicadores de textura e índice de vegetação. Nessas situações, a aplicação
de RNA pode apresentar resultados expressivos em se tratando de áreas urbanas que
constituem ambientes heterogêneos, caracterizados pela ocorrência de classes misturadas, os
71
quais geram uma maior dificuldade na classificação, quando uma informação de textura não é
considerada. Outro fator importante que direcionou para o uso de RNA é o fato de que esse
tipo de abordagem, quando realizada no SNNS, disponibiliza os valores de ativação de saída
da rede, a partir dos quais é possível estimar o grau de associação de cada pixel à determinada
classe, e que depois de tratados são objeto da análise da incerteza gerada na classificação. A
partir disso, pôde-se especificar que o procedimento de classificação realizado mediante a
aplicação de uma RNA foi um método supervisionado com uma análise pixel a pixel, já que o
objetivo era estimar a incerteza associada a cada elemento de resolução espacial da imagem.
Para que os dados de sensoriamento remoto possam constituir os planos de
entrada para a rede, mas principalmente, para que as classes de interesse possam ser
efetivamente discriminadas nas imagens, muitas vezes, são necessários alguns
processamentos específicos. Desta maneira, foram realizados os seguintes processamentos: o
registro entre a imagem multiespectral e a Carta de Zoneamento Urbano de Presidente
Prudente, uma transformação para converter as imagens do espaço RGB para o IHS e retorno
para o espaço RGB. Em seguida foi gerada uma imagem de textura e uma imagem de Índice
de Vegetação da Diferença Normalizada (NDVI).
Inicialmente foi realizado um registro entre a imagem multiespectral e a
Carta de Zoneamento Urbano de Presidente Prudente, para que houvesse sobreposição das
feições da carta de zoneamento de Presidente Prudente na imagem multiespectral. O registro
foi feito a partir da seleção de oito pares de pontos de controle, representando feições bem
definidas e espalhadas na imagem e na carta. Pelo fato de dois dos pontos de controle
apresentarem discrepâncias maiores, eles foram desconsiderados, tendo-se obtido um resíduo
total (erro) de 0,456, usando os seis pontos de controle remanescentes.
A etapa seguinte refere-se à conversão das bandas multiespectrais
(CCD/Cbers2) do modelo de representação RGB (R-vermelho, G-verde, B-azul) para as
72
componentes IHS (I-intensidade, H-matiz e S-saturação), em seguida a componente I
(Intensidade) foi submetida a uma ampliação linear de contraste e esta componente
contrastada foi usada na transformação inversa IHS RGB, de modo que as bandas RGB
apresentassem uma variação similar no brilho. Esse procedimento foi aplicado, inicialmente
às bandas 1, 2 e 3 associadas às cores azul (B), verde (G) e vermelho (R), respectivamente e
também às bandas 2, 3 e 4 associadas às cores B, G e R.
Das duas operações de transformação realizadas no espaço de cor, foram
produzidas seis imagens componentes, três derivadas da combinação das bandas 1, 2 e 3 e
outras resultantes da composição 2, 3 e 4. Dessas imagens componentes foram analisadas e
selecionadas visualmente aquelas que possibilitaram uma melhor definição das classes de
interesse.
Na Figura 10 são mostradas todas as imagens geradas após a transformação
no espaço de cor, indicadas por: 123b, 123g, 123r, 234b, 234g e 234r.
73
Figura 10
– Imagens geradas a partir da conversão RGB IHS RGB
(b) Imagem 123g
(d) Imagem 234b
(f) Imagem 234r
(a) Imagem 123b
(c) Imagem 123r
(e) Imagem 234g
74
Na seqüência foi gerada a imagem de textura, a partir da componente I
(Intensidade), utilizando um operador de contexto denominado índice de fragmentação, o qual
calcula um índice numérico com base na variabilidade espacial observada em uma janela de
3x3, 5x5 e 7x7 pixels. Esta operação foi realizada para a componente Intensidade, que se
refere ao brilho total de uma cor.
O operador de contexto, Índice de fragmentação (F) utilizado no processo é
definido por:
F = (n-1)/(c-1) (30)
onde, n é o número de pixels com diferentes atributos (valores radiométricos atribuídos aos
pixels), presentes em uma janela de dimensão igual a c (no caso da janela 3x3, c é igual a 9).
A utilização desse operador de contexto produziu uma imagem representando
os indicadores texturais gerados a partir da componente Intensidade. Tal imagem foi incluída
na composição dos dados de entrada para a classificação desenvolvida pela RNA. O objetivo
da geração da imagem de textura é quantificar a variabilidade espacial a fim de possibilitar
uma melhor caracterização dos padrões que definem as classes de interesse, visto a
necessidade de se considerar também as propriedades estatísticas ou estruturais de uma
vizinhança de pixels, ou seja, propriedades que possam descrever a variabilidade da cena.
Outra imagem gerada foi a de Índice de Vegetação, que é uma combinação
aritmética simples baseada no contraste entre as respostas espectrais da vegetação na região
do vermelho e do infravermelho próximo. Índices de vegetação podem ser entendidos como
razões matemáticas entre bandas. Um dos índices de vegetação amplamente utilizado em
análises da vegetação é o chamado NDVI (Normalized Diference Vegetation Index). O índice
de vegetação da diferença normalizada utiliza uma combinação das bandas do vermelho e do
infravermelho próximo, de acordo com EASTMAN (1998) e é expresso como a diferença
75
entre a banda do infravermelho próximo (IVP) e vermelho (VER), normalizada pela soma das
bandas, o NDVI é expresso pela seguinte fórmula:
NDVI = (IVP – VER)/(IVP + VER) (31)
na qual:
IVP: resposta espectral do pixel na banda do infravermelho próximo (banda 4);
VER: resposta espectral do pixel na banda do visível (banda 3).
O uso de uma imagem de índice de vegetação acarreta um brilho das áreas
de vegetação e melhora a aparência da distribuição espacial de informações das imagens,
tornando-as de fácil interpretação visual e computacional (SHIMABUKURO, 1991).
Portanto, as demais imagens de entrada para a classificação foram
constituídas por uma representação da textura, gerada a partir da componente Intensidade
(I_123) e a imagem de Índice de Vegetação da Diferença Normalizada (NDVI) gerada a partir
das bandas 3 e 4, mostradas na Figura 11.
76
Figura 11Imagem de Textura (a) e de Índice de Vegetação da Diferença Normalizada (NDVI) (b)
A imagem de textura apresentada na Figura 11 (a), nada mais é que um
indicador da variabilidade dos alvos. Os tons mais escuros representam uma menor
variabilidade d e no caso dessa imagem, somente a água e a vegetação apresentam uma
diferenciação e representam baixa variabilidade. As demais classes apresentam tons mais
claros, o que define uma maior variação, mostrando que a área urbana em si é muito
heterogênea em termos de variabilidade de brilho.
Com relação à imagem de Índice de Vegetação da Diferença Normalizada
(NDVI) (b), tem-se que as regiões mais claras representam as áreas de vegetação, tons de
(a)
Imagem de
Textura
(b)
Imagem de
Índice de
Vegetação da
Diferença
Normalizada
(NDVI)
77
cinza intermediários representam a área urbana geral e cinza mais escuro representa o corpo
d’água.
Definidos os planos de entrada para a RNA, as imagens foram recortadas a
partir do limite definido na carta de zoneamento urbano da cidade de Presidente Prudente, de
modo a excluir todas as áreas externas à delimitação urbana e de expansão urbana
estabelecida nessa carta.
A Figura 12 a seguir, mostra os planos de entrada efetivamente utilizados na
classificação.
78
Figura 12 Imagens de entrada (123g, 234b, 234r,Textura e NDVI) para a classificação da rede neural artificial
Imagem 123g
Imagem 234b
Imagem 234r
Imagem de Textura
Imagem NDVI
79
5.4.2 Caracterização das amostras de treinamentos por classe e da rede neural
artificial utilizada
Realizados os processamentos anteriores, no software IDRISI, foram
selecionados os elementos amostrais para o treinamento e validação da rede neural artificial.
A Figura 13 mostra a localização da área de treinamento nos planos de entrada da rede neural
artificial. O maior cuidado na obtenção dessa área foi de que todas as classes de interesse
estivessem presentes no recorte (retângulo vermelho).
Figura 13Localização das áreas de treinamento nos planos de entrada da rede neural artificial
Os planos de entrada, foram então recortados da imagem original, a partir da
delimitação apresentada na figura anterior.
Posterior à definição da localização das áreas de treinamento e validação
foram extraídos polígonos em cada um dos planos de entrada da rede (três das imagens
80
resultantes da conversão RGB-IHS-RGB, a imagem de textura gerada a partir da componente
I, e a imagem de índice de vegetação da diferença normalizada - NDVI), cada qual
representando uma das classes de interesse, em um plano de informação diferenciado. Esses
arquivos foram convertidos em imagens, com as mesmas dimensões das áreas de treinamento
e validação, sendo que cada imagem continha apenas as amostras representando a classe em
questão e fundo. Nesses arquivos de saída, as áreas externas à classe de interesse mantiveram
seu identificador igual a zero.
Dessa maneira, os planos de entrada da rede se resumem às imagens
CCD/CBERS resultantes da conversão RGB-IHS-RGB das bandas 1, 2 e 3 associadas à cor
verde (G) e também das bandas 3, 4 e 5 associadas às cores azul (B) e vermelho (R) e às
imagens representando as amostras de cada uma das classes de saída, incluindo a classe
Fundo.
O Quadro 4 mostrado a seguir apresenta o número de pixels adquirido para
as amostras de cada uma das classes, tanto para a área de treinamento, quanto para a área de
validação.
Quadro 4 - Número de pixels adquirido para cada uma das classes, na área de treinamento e de validação.
Número de pixels por amostra
Classes
Treinamento Validação
Maior Densidade de Superfícies
Impermeáveis
903 1141
Densidade Intermediária de
Superfícies Impermeáveis
1241 713
Menor Densidade de Superfícies
Impermeáveis
1331 1069
Vegetação Arbórea/Arbustiva 763 1499
Vegetação Rasteira/Solo Exposto 423 462
Corpo d’água 438 26
Fundo 1570 7464
81
Com a finalidade de analisar as diferenças entre os números digitais (NDs)
das seis classes para as imagens usadas como dado de entrada para a classificação foram
extraídos a média e o desvio padrão de todos os planos de entrada (123g, 234b, 234r, Textura
e NDVI). A partir dessas estatísticas foi elaborado o gráfico mostrado na Figura 16, no qual
estão indicadas as médias dos NDs das classes e na Figura 14 estão os desvios padrões das
médias de cada classe, com exceção da classe Fundo.
Figura 14 – Média das classes obtidas a partir dos planos de entrada (123g, 234b, 234r, Textura e NDVI)
Analisando as médias estimadas a partir dos dados de treinamento (Figura
14) verifica-se que a classe Vegetação Arbórea/Arbustiva apresenta maior variação nas
médias nos diferentes planos de entrada, e conseqüentemente maior discriminação da classe.
O mesmo ocorre para as classes Maior Densidade de Superfícies Impermeáveis e Corpo
Média das classes por plano de entrada
0
50
100
150
200
250
Classes
Média NDs
123-G
118,11 114,97 140,8 65,7 83,24 163,73
234-B
42,56 92,33 149,74 121,5 84,2 112,28
234-R
77,65 118,86 179,37 214,82 141,85 54,31
Textura
203,32 177,37 181,38 130,7 77,01 76,5
NDVI
131,54
147,34
152,26
217,02
180,45
33,13
Maior Intermedria Menor
Veget.
Arbórea/Arbustiva
Veget.
Rasteira/Solo
exposto
Corpo d'água
82
d’água, também com variação nas dias, enquanto que para Vegetação Rasteiar/Solo
Exposto essa variação é menor, mas ainda ocorre. As classes Densidade Intermediária de
Superfícies Impermeáveis e Menor Densidade de Superfícies Intermediárias são aquelas que
menos apresentam variações nas médias. Desse modo, as imagens derivadas da transformação
RGB-IHS-RGB indicam variações nas classes Maio Densidade, Densidade Intermediária e
Menor Densidade de Superfícies Impermeáveis, o que permite inferir que oferecem potencial
de discriminação entre essas três classes.
A imagem de textura, em função da uniformidade das médias para as
diferentes classes, contribui mais na separação da classe Maior Densidade de Superfícies
Impermeáveis e Corpo d’água. Por outro lado, a imagem NDVI, apesar de contribuir pouco
na separação das superfícies impermeáveis, permite diferenciar as áreas de vegetação de
diferente porte.
A Figura 15 mostrada a seguir apresenta os desvios padrões das médias de
cada classe.
Figura 15
Desvio Padrão das médias de cada classe
60,67
32,84
18,46
65,16
45,80
51,48
0
10
20
30
40
50
60
70
Desvio Padrão
Maior Intermediária Menor Veget
Arborea
Veget
Rasteira
Corpo
d'água
Classes
Desvio Padrão das Médias do Planos
83
A Figura 15 vem confirmar o que foi apresentado na Figura 14, pois se
verifica claramente que as classes que apresentam os menores valores de desvio padrão são
exatamente as mesmas duas classes com menor variação nas médias nos diferentes planos de
entrada da RNA.
A partir dos dados apresentados nas Figuras 14 e 15 pode-se verificar que
para o conjunto de amostras adquiridas para as classes de interesse, aquelas referentes à
Densidade Intermediária de Superfícies Impermeáveis e Menor Densidade de Superfícies
Intermediárias foram aquelas com menor variação nas médias em relação aos planos de
entrada da rede. Isto se explica pelo fato da aquisição de amostras ser trabalhosa, já que a área
urbana é muito heterogênea, dificultando a definição das áreas que representam cada classe e
seus limites.
5.4.3 – Classificação
A partir da análise do comportamento de uma rede neural artificial durante
a fase de treinamento é possível avaliar sua adequação para a classificação dos dados
disponíveis. Isto significa que, além da arquitetura da rede (definida pelo número de camadas
escondidas e número de nós em cada camada), devem ser estabelecidos os parâmetros
relacionados com as funções de aprendizagem e ativação e com as regras estabelecidas para a
atualização de pesos e inicialização da rede, além do critério de término das iterações ou
ciclos.
As simulações, realizadas durante a etapa de treinamento, são feitas a partir
da aplicação de diferentes arquiteturas de rede aos dados de validação, com o intuito de
84
selecionar a melhor arquitetura, quando o erro atingir um valor mínimo pré-definido e a rede
discriminar todas as classes.
A definição de uma arquitetura de rede neural multicamadas, adequada para
classificar o conjunto de dados, implicou na determinação prévia da dimensionalidade dos
dados de entrada e das classes de ocorrência, os quais especificam, respectivamente, o
número de elementos de processamento (nós) das camadas de entrada e de saída da rede.
Assim, a camada de entrada foi constituída por cinco (5) nós, referentes às imagens
CCD/CBERS resultantes da conversão RGB-IHS-RGB, da imagem de textura gerada a partir
da componente I, e a imagem de índice de vegetação da diferença normalizada (NDVI),
enquanto que, o número de elementos de processamento da camada de saída, foi sete (7)
elementos, em consonância com as classes de interesse (Maior Densidade de Superfícies
Impermeáveis, Densidade Intermediária de Superfícies Impermeáveis, Menor Densidade de
Superfícies Impermeáveis, Vegetação Arbórea/Arbustiva, Vegetação Rasteira/Solo Exposto,
Corpo d’Água e fundo).
Para definir o número de camadas escondidas e o número de nós de cada
uma dessas camadas intermediárias foram realizadas simulações com diferentes arquiteturas
de rede e verificado o desempenho da rede treinada sobre a amostra de validação. O número
de camadas escondidas e o número de elementos nestas camadas foram definidos por
tentativa e erro, sendo que um erro satisfatório foi obtido com 1 (uma) camada escondida e
54 elementos nesta camada.
A arquitetura básica definida para a rede neural RNA foi:
Camada de entrada: 5 planos de informação (123g, 234b, 234r,
Textura e NDVI);
Camada escondida: foram avaliadas configurações com 1 e 2 camadas
intermediárias e respectivo número de nós, os quais definidos a partir de tentativa e erro;
85
Camada de saída: 7 classes (Maior Densidade de Superfícies
Impermeáveis, Densidade Intermediária de Superfícies Impermeáveis, Menor Densidade de
Superfícies Impermeáveis, Vegetação Arbórea/Arbustiva, Vegetação Rasteira/Solo Exposto,
Corpo d’Água e fundo).
Após a definição da arquitetura básica da RNA (planos de entrada e
classes de saída) e o número de camadas escondidas é necessária a definição de alguns
parâmetros para a classificação.
O modelo de rede neural adotado foi o de Multicamadas, com camada de
entrada, camadas escondidas e camada de saída, sendo que alguns dos modelos de redes com
essa estrutura são definidos como de alimentação progressiva (feed-forward). As arquiteturas
das redes foram treinadas com o algoritmo de aprendizagem backpropagation padrão.
O processo de treinamento utilizando backpropagation implica na definição
prévia da taxa de aprendizagem, que corresponde à proporção de mudança nos pesos
calculados que seusada na correção desses pesos e, no presente trabalho foram testadas
0,01 e 0,10. Além disso, fixou-se o termo de erro em zero (0) na retropropagação, para que
nenhuma proporção da diferença entre a resposta esperada e a calculada fosse incorporada aos
valores atualizados dos pesos durante o treinamento.
As funções de ativação e inicialização também foram definidas antes de
iniciar o treinamento. Uma função sigmóide foi usada para verificar se um elemento de
processamento era ou não ativado por uma entrada específica, ou seja, para calcular o valor de
ativação em cada nó. Quando se adota backpropagation, a função de inicialização mais
adequada é randomize weights. Essa função inicializa os pesos a partir de uma distribuição
aleatórias dos valores.
O modo de atualização escolhido foi o topological-order, ou estrutura
topológica. Nesta função, os pesos são ajustados seguindo uma ordem topológica de
86
ordenação dos nós na rede, o que significa que a primeira camada a ser processada é a camada
de entrada, seguida pela primeira camada escondida e assim sucessivamente até a camada de
saída. Os pesos iniciais foram definidos no intervalo entre (-0,1; 0,1) e estabeleceu-se que a
cada 100 iterações (ou ciclos) o treinamento seria interrompido para calcular o erro (EMQ)
para o conjunto de padrões de validação. Esse erro foi monitorado tanto para padrões de
treinamento quanto para validação e era verificado se o mesmo atingia o valor mínimo pré-
estabelecido, usualmente de 0,05.
Como o SNNS permite operar simultaneamente com dois conjuntos de
padrões, um de treinamento e outro de validação, a maneira mais adequada para verificar a
capacidade de generalização da rede é monitorar a queda no erro médio quadrático (EMQ)
para o conjunto de validação e finalizar o processo quando esse atingir um valor mínimo
(ZELL et al., 1995). Com base nesse erro e no resultado da aplicação da rede treinada à área
estabelecida para validação, foi selecionada a arquitetura de rede mais adequada para
classificar o conjunto de dados espaciais. Neste trabalho, foi usada a arquitetura [5-54-7], a
qual 5 corresponde aos dados de entrada, 54 ao número de elementos de processamento na
camada escondida e 7 às classes de saída da última camada. Esta arquitetura foi treinada com
6000 iterações discriminando todas as sete classes de interesse, com um erro de 0,00365.
Nas simulações realizadas, duas arquiteturas foram testadas, sendo uma
delas com duas camadas intermediárias e a outra com apenas uma. A configuração com duas
camadas, representada por [5-21-11-7] apresenta 5 elementos na camada de entrada, 21
elementos na primeira camada intermediária, 11 elementos na segunda e 7 elementos na
camada de saída. a configuração com uma camada intermediária [5-54-7] constou de 5
elementos na camada de entrada, 54 na camada intermediária e 7 elementos na camada de
saída.
87
Estas duas arquiteturas foram testadas com dois diferentes valores de taxa
de aprendizagem, 0,01 e 0,1. Utilizando a menor taxa (0,01) verificou-se que o resultado
demorava a convergir, já com a taxa de 0,1, a rede convergiu mais rapidamente. Apesar disso,
foi necessário um número grande de ciclos de treinamento para a rede convergir.
Com 4000 ciclos e a taxa de 0,01, a arquitetura [5-54-7] retornou quatro
classes, porém com o mesmo número de ciclos e a taxa de 0,1, passou a retornar as sete
classes. Embora as sete classes terem retornado, elas ainda não estavam bem discriminadas.
Sendo assim, foram 6000 ciclos e a taxa de 0,1, retornando desta maneira, as sete classes e
todas bem representadas.
com a arquitetura [5-21-11-7], o número máximo de classes que retornou
foi seis, sendo que, o número de ciclos utilizados foi bem maior. Esta arquitetura foi testada
com um mínimo de 5000 ciclos chegando até 10.000 ciclos e com a taxa de aprendizagem de
0,1. Analisando essas seis classes que retornaram foi possível perceber que elas não estavam
representadas de maneira adequada, além de não ter representado uma das classes.
Apesar do Erro Médio Quadrático (EMQ) obtido na classificação ser
bastante reduzido (da ordem de 0,00365) há uma grande dificuldade em discriminar as
classes, mesmo com um alto número de ciclos de treinamento. Isto é explicado pelo fato da
área urbana ser muito heterogênea (como pode ser verificado na imagem de textura
apresentada na Figura 11 (a) e pelo fato das classes Densidade Intermediária e Menor
Densidade de Superfícies Impermeáveis apresentarem pouca variação nos NDs, o que torna
difícil separar estas duas classes.
A Figura 16, apresentada a seguir, mostra o esquema de classificação pela
rede neural artificial, concebido para esta aplicação.
88
Figura 16 - Esquema de Classificação pela Rede Neural Artificial
Comparando as duas arquiteturas, tendo sido ambas treinadas com taxa de
aprendizagem igual a 0,1 pode-se observar que a arquitetura de rede que apresentou um
melhor desempenho quanto ao número de classes discriminadas foi [5-54-7], definindo todas
as sete classes de interesse.
A Figura 17 mostra a classificação resultante da aplicação da arquitetura [5-
54-7], treinada com 6000 ciclos.
(a) Imagem 123g
(b) Imagem 234b
(c) Imagem 234r
(d) Imagem de textura
(e) Imagem de Índice de
Vegetação (NDVI
)
RNA
Densidade
Intermediária de
Superfícies
Impermeáveis
Maior Densidade de
Superfícies
Impermeáveis
Menor Densidade
de Superfícies
Impermeáveis
Vegetação
Arbórea/Arbustiva
Vegetação
Rasteira/Solo Exposto
Corpo d’água
Fundo
89
Figura 17 – Classificação resultante da aplicação da RNA com a arquitetura [5-54-7]
Como mostra a Figura 17, com a aplicação de uma arquitetura com uma
camada escondida obteve-se uma classificação na qual estão representadas as sete classes de
interesse. Essas classes ficaram bem representadas e a delimitação geral da área urbana
também ficou bem definida na classificação.
Pela Figura 17 pode-se notar ainda que os eixos centrais da área urbana
foram bem representados e foram incluídos na classe Maior Densidade de Superfícies
Impermeáveis, caracterizada por áreas com maior densidade de construções e totalmente
90
revestidas com material impermeável. A classe Densidade Intermediária de Superfícies
Impermeáveis foi a que apresentou maior mistura de classes, o que se deve ao fato desta ser
constituída por áreas construídas, porém com maior heterogeneidade quanto aos
revestimentos da superfície, que podem ser tanto impermeáveis quanto permeáveis. A classe
Menor Densidade de Superfícies Impermeáveis ficou bem caracterizada na classificação e
representou bem o espalhamento urbano, já que essa classe é constituída por áreas externas ao
núcleo urbano, ou seja, bairros residenciais com terrenos de dimensões maiores e loteamentos
recentes. A classe Vegetação Arbórea/Arbustiva referente a áreas verdes que ocorrem no
contexto urbano e área de expansão urbana foi representada corretamente, assim como
Vegetação Rasteira/Solo Exposto constituída por vegetação de menor porte e a classe Corpo
d’água também foram bem discriminadas na classificação.
5.4.4 - Tratamento dos dados de saída da rede e representação da probabilidade,
incerteza e entropia
Para se dispor de uma estimativa da ambigüidade de cada pixel em relação a
cada classe, os valores de ativação, resultantes da aplicação da rede neural treinada e
armazenados em um arquivo no formato ASCII, foram tratados de modo a possibilitar a
geração de mapas de incerteza por classe e entropia, a partir de uma estimativa inicial das
probabilidades por classe.
Após a classificação da imagem contendo integralmente a área de estudo, os
valores obtidos na última camada da rede (associados às classes de saída) e arranjados em
91
uma estrutura (pixels da imagem) foram convertidos em valores de probabilidade, a partir da
seguinte expressão:
ijj4j3j2j1
ij
ij
o...oooo
o
P
+++++
=
(32)
onde
P
ij
representa a probabilidade de um dado pixel j estar associado à classe i;
o
1j
….o
ij
valor de ativação de saída da rede, referente a um dado pixel j, para cada um das i
classes, i = 1, 2, ... e j = 1, 2, ....
Os valores resultantes da Equação (32) foram armazenados em um novo
arquivo, a partir do qual foi possível estimar valores indicando a probabilidade de cada pixel
estar associado a cada classe, separando cada classe em arquivos individuais, de modo a se
obter uma imagem das probabilidades por classe. Esta operação foi implementada em um
programa computacional desenvolvido pelo Professor Doutor Mauricio Galo, docente do
Departamento de Cartografia da FCT/Unesp.
Na seqüência foi avaliada a ambigüidade para cada pixel em relação a uma
determinada classe, através do cálculo da incerteza por classe e entropia global, a partir das
imagens representando as probabilidades por classe usadas. Primeiramente foram gerardas
imagens da incerteza por classe. A incerteza obtida pela operação expressa na Equação (33),
aplicada a cada pixel j, em relação a uma dada classe i, especificada é
ijij
P1I
=
Efetivamente, as imagens indicando a incerteza por classe foram geradas
utilizando uma função do aplicativo IDRISI que permite definir expressões matemáticas e
aplicá-las a imagens representadas em 8 bits. Assim, a operação realizada foi uma subtração
do valor de probabilidade (normalizado para o intervalo de 0 a 255), associado a cada pixel da
imagem gerada para cada classe, do valor de 255.
92
A imagem representando a entropia global da classificação foi também
produzida a partir dos valores normalizados de probabilidades por classe, a partir da seguinte
expressão
ij2ijij
Plog*PE
=
(34)
Novamente, a aplicação da Equação (34) às imagens de probabilidade por
classe foi feita no aplicativo IDRISI.
Como especificado anteriormente, a ambigüidade das classes de interesse
está representada através de imagens em tons de cinza da estimativa de probabilidade e
incerteza por classe; de mapas temáticos representando intervalos associados a maior,
intermediária e baixa probabilidade e incerteza/classe; além da entropia global da
classificação.
As imagens de estimativa de probabilidade têm o intuito de indicar as áreas
com uma maior probabilidade de estar associada à determinada classe. A Figura 18 a seguir
apresenta as imagens em tons de cinza das estimativas de probabilidades obtidas para cada
uma das seis classes.
93
Figura 18 - Imagens em tons de cinza indicando as estimativas de probabilidades por classe.
Maior Densidade de Superfícies Impermeáveis
Vegetação Arbórea/Arbustiva
Vegetação Rasteira/Solo Exposto
Corpo d’água
Densidade Intermediária de Superfícies Impermeáveis
Menor Densidade de Superfíc
ies Impermeáveis
94
Na Figura 18, as áreas mais claras referem-se àquelas com maior
probabilidade de pertencer à determinada classe, as escuras são referentes às menores
probabilidades. Analisando a classe Maior Densidade de Superfícies Impermeáveis nota-se
que as áreas com maior probabilidade de estar associada a essa classe estão concentradas nos
eixos centrais da área urbana, e correspondem a construções, ou simplesmente superfícies
revestidas com material impermeável. Na classe Densidade Intermediária de Superfícies
Impermeáveis, as áreas com maior probabilidade de pertencer a essa classe delimitam a área
urbana, porém, essa classe apresenta certa confusão com a Vegetação Arbórea/Arbustiva, o
que é parcialmente explicado pelo fato dessa classe se caracterizar por superfícies constituídas
de materiais permeáveis e impermeáveis. As áreas associadas à classe Menor Densidade de
Superfícies Impermeáveis estão caracterizadas na imagem, uma vez que tal classe refere-se às
áreas externas ao núcleo urbano, ou seja, áreas de espalhamento. Na classe Vegetação
Arbórea/Arbustiva as maiores probabilidades concentram-se exatamente as áreas verdes, do
mesmo modo que Vegetação Rasteira/Solo Exposto, e Corpo d’água, que estão definindo
bem as áreas de vegetação de menor porte e pequenas represas, respectivamente.
As imagens de incerteza têm o objetivo de apresentar as regiões de maior
incerteza em relação a uma dada classe, o que pode ser verificado na Figura 19, na qual se
representa a incerteza de cada pixel estar associado à determinada classe, ou seja, o
complementar da probabilidade.
95
Figura 19– Imagens em tons de cinza representando a Incerteza/classe.
Na Figura 19, as regiões que se apresentam mais claras na imagem em tons
de cinza indicam maior incerteza na associação à classe em questão. as áreas mais escuras
Menor Densidade de Superfícies Impermeáveis
Densidade Intermediária de Superfícies Impermeáveis
Vegetação Arbórea/Arbustiva
Corpo d’água
Vegetação Rasteira/Solo Exposto
Maior Densidade de Superfícies Impermeáveis
96
representam menor incerteza. Quanto maior a incerteza, menor a chance de um pixel estar
associado à determinada classe.
Como previsto, regiões não incluídas na classe representada aparecem em
branco. Assim, na classe Maior Densidade de Superfícies Impermeáveis, as regiões
caracterizadas pelas maiores incertezas são aquelas que excluem os principais eixos urbanos
centrais, enquanto que na Densidade Intermediária de Superfícies Impermeáveis as maiores
ambigüidades estão concentradas na área externa ao núcleo urbano, inclusive no corpo
d’água. Na classe Menor Grau de Impermeabilização as áreas mais ambíguas representam a
Vegetação Arbórea/Arbustiva e o corpo d’água. Para a classe Vegetação Arbórea/Arbustiva,
as maiores incertezas ocorrem tanto no núcleo urbano (inseridos em outras classes), quanto
nas áreas de espalhamento e no corpo d’água. Já para Vegetação Rasteira/Solo Exposto,
poucos locais indicaram baixo grau de incerteza, e para Corpo d’água a única representação
com ambigüidade reduzida refere-se a uma represa incluída na área de estudo.
Posteriormente, as seis imagens (cada uma associada a uma classe de
interesse) representando a incerteza por classe, foram fatiadas em intervalos de valores
indicando alta, média e baixa incerteza para a classe em questão, gerando os mapas de
incerteza.
No fatiamento das imagens de incerteza, os intervalos de valores que
definiram cada classe (alta, média e baixa incerteza) estão apresentados no Quadro 5. Estes
intervalos foram definidos com base na análise dos histogramas e testes realizados com
diferentes intervalos.
97
Quadro 5 – Intervalos de valores que definiram o fatiamento das Imagens de Incerteza
Classes
Todos os
valores de
Até menos
que
Alta 0 85
Média 85 191
Baixa 191 256
A fim de permitir uma visualização do resultado do fatiamento da incerteza
para cada classe, foram elaboradas as Figuras 20, 21 e 22. Nestes mapas temáticos é possível
verificar as áreas associadas à alta, média e baixa incerteza em cada uma das seis classes
(Maior Densidade de Superfícies Impermeáveis, Densidade Intermediária de Superfícies
Impermeáveis, Menor Densidade de Superfícies Impermeáveis, Vegetação Arbórea/Arbustiva,
Vegetação Rasteira/Solo Exposto e Corpo d’água). Os maiores valores (alta incerteza) são
mostrados em branco, média incerteza em um verde e baixa incerteza em verde escuro.
Figura 20 – Mapas de Incerteza para classe Maior Densidade de Superfícies Impermeáveis e Densidade
Intermediária de Superfícies Impermeáveis
98
Figura 21 – Mapas de Incerteza para classe Menor Densidade de Superfícies Impermeáveis e Vegetação
Arbórea/Arbustiva
Figura 22 – Mapas de Incerteza para classe Vegetação Rasteira/Solo Exposto e Corpo D’água
99
Em seguida, foram geradas composições coloridas a partir das imagens de
probabilidade e de incerteza não fatiadas.
Nas Figuras 23 e 24 são apresentadas as composições coloridas geradas a
partir dos mapas de probabilidade e incerteza, respectivamente, ambos referentes às três
classes citadas anteriormente.
Figura 23 Composição colorida das três classes utilizando as imagens de probabilidade referentes às classes
Maior (R), Intermediária (G) e Menor Densidade de Superfícies Impermeáveis (B).
Na Figura 23 a cor vermelha refere-se à classe Maior Densidade de
Superfícies Impermeáveis, a cor verde à Densidade Intermediária de Superfícies
Impermeáveis e a cor azul, à classe de Menor Densidade de Superfícies Impermeáveis. Pela
análise dessa figura, verifica-se então que as áreas com maior probabilidade de pertencer a
classe Maior Densidade de Superfícies Impermeáveis são representadas pela cor vermelha e
estão concentradas no eixos centrais da cidade. Os pixels que assumem uma cor amarelada
Alta Densidade
Densidade
Intermediária
Menor
Densidade
Densidade
Intermdiária e
Menor Densidade
100
indicam locais onde ocorre ambigüidade entre as classes Maior e Densidade Intermediária de
Superfícies Impermeáveis, uma vez que altas probabilidades de ocorrência da classe
Densidade Intermediária aparecem em verde mais intenso. Já o azul mais brilhante indica
regiões com alta probabilidade para a classe Menor Densidade de Superfícies Impermeáveis.
Figura 24– Composição colorida das três classes utilizando os mapas de incerteza, referentes a estas classes.
Contrariamente ao que se observa na composição colorida (Figura 23)
representando as probabilidades associadas às três classes de Densidade de Superfícies
Impermeáveis, na composição colorida da incerteza, resultante da atribuição das cores
vermelha, verde e azul às variações das classes Maior Densidade, Densidade Intermediária e
Menor Densidade, respectivamente, predominam cores secundárias. Assim, a classe Maior
Densidade aparece predominantemente na cor ciano, que sua incerteza é menor, ou seja,
essa cor (ciano) indica maior grau de incerteza para as outras duas classes (Densidade
101
Intermediária verde e Menor Densidade - azul). A cor magenta indica pequeno grau de
incerteza para Densidade Intermediária e alta incerteza para as classes Maior Densidade e
MenorDensidade. O mesmo raciocínio é válido para regiões que aparecem na cor amarela,
indicando baixas incertezas para classe de Menor Densidade.
Na seqüência é apresentada a imagem da entropia (Figura 25), a qual foi
fatiada, a partir dos intervalos apresentados no Quadro 6 a seguir, com o intuito de facilitar a
análise visual da entropia para todas as classes.
Quadro 6 - Intervalos de valores que definiram o fatiamento das Imagens de Incerteza
Classes
Todos os
valores de
Até menos
que
Alta 0 85
Média 85 191
Baixa 191 256
102
Figura 25 – Entropia associada ao conjunto de seis classes.
A entropia nada mais é do que uma combinação das incertezas das classes
estimadas para um dado pixel, ponderadas por suas estimativas de probabilidades. Quanto
maior a entropia, menor a chance de o pixel pertencer à determinada classe.
No caso da Figura 25, os tons mais escuros da imagem referem-se às
menores entropias, ou seja, às regiões onde não ocorrem misturas de classes. Sendo assim,
quanto mais clara a região, maior será a ambigüidade em relação às classes presentes. Nessa
figura, as menores entropias referem-se às classes Maior Densidade de Superfícies
Impermeáveis, Vegetação Arbórea/Arbustiva, Vegetação Rasteira/Solo Exposto e Corpo
d’água, o que implica dizer que essas classes foram melhor definidas na imagem, pelo fato de
não possuírem alto grau de mistura entre elas.
Conforme pode ser verificado em algumas representações anteriores,
principalmente aquelas mostradas nas Figuras 19 e 20, a classe Densidade Intermediária de
103
Superfícies Impermeáveis é a mais ambígua em relação às demais. Com o intuito de mostrar a
dispersão espacial da ambigüidade dessa classe em relação à Maior Densidade, Menor
Densidade de Superfícies Impermeáveis e Vegetação Rasteira/Solo Exposto, foram realizados
cruzamentos entre essa classe e cada uma das anteriores, para indicar os locais que
apresentam incerteza média (mistura entre as duas classes consideradas). O resultado desses
cruzamentos é mostrado na Figura 26.
104
Figura 26 Localização da incerteza média apresentada ao cruzar as classes Maior Densidade e Densidade
Intermediária, Densidade Intermediária
e Menor Densidade e as classes Vegetação Rasteira/Solo Exposto e
Densidade Intermediária.
(b)
(a)
(c)
105
Analisando a Figura 26 verifica-se que dentre os cruzamentos realizados, o
cruzamento (c) Vegetação Rasteira/Solo Exposto e Densidade Intermediária é o que apresenta
menor incerteza média. Isto se deve ao fato de que a classe Vegetação Rasteira/Solo Exposto
é uma classe que pode ser definida com maior clareza, o que não ocorre para as demais
classes, pois não possuem uma transição clara como a vegetação.
106
6 – CONCLUSÕES
A partir dos resultados apresentados e discutidos anteriormente pôde-se
verificar que o propósito geral de investigação, assim como os objetivos específicos
delineados, foram atingidos.
A aplicação de RNA na classificação e mapeamento da cobertura do solo
urbano de Presidente Prudente mostrou-se viável para a separação das classes de interesse,
apesar de necessitar um alto tempo de processamento na etapa de treinamento. A classificação
a partir de RNA permite incorporar dados de natureza não espectral que, neste caso se
constituíram da imagem de textura e da imagem índice de vegetação (NDVI). A incorporação
destes dados foi importante para a seleção das áreas de treinamento e também para a
discriminação das classes, visto que a cobertura do solo urbano apresenta classes misturadas,
definido assim uma continuidade nas áreas de transição entre elas (classes contínuas).
A questão da aquisição de dados de treinamento para as classes deve ser
cuidadosamente considerada, pois é a partir das amostras coletadas, que a rede trabalha. E no
caso da cobertura da área urbana as classes são misturadas e sem uma delimitação nítida, o
que dificultou identificar as classes de interesse.
Outra questão relevante na aplicação das RNA é a definição dos parâmetros
necessários para o treinamento e classificação dos dados. Definidos os parâmetros iniciais,
percebeu-se que o valor atribuído à taxa de aprendizagem era muito pequeno, o que implicou
em um aumento no tempo de treinamento da rede. Alterando o valor da taxa de treinamento
de 0,01 para 0,1 a rede passou a convergir mais rapidamente, mas mesmo assim o número de
ciclos necessário foi grande.
A aplicação da RNA treinada na classificação dos dados permitiu
discriminar todas as classes especificadas no esquema de classificação proposto. Para algumas
delas, como Densidade Intermediária e Menor Densidade de Superfícies Impermeáveis isso já
107
era esperado, pelo fato de exibirem um padrão mais heterogêneo, conforme especificado na
própria descrição das classes.
A partir dos valores de saída da rede, foram geradas informações
quantitativas sobre a incerteza na representação das classes, o que possibilitou analisar a
variação espacial da incerteza na atribuição de classes de cobertura do solo urbano. Nesta
análise da incerteza foi possível perceber que as classes que apresentaram maior incerteza
foram Densidade Intermediária e Menor Densidade de Superfícies Impermeáveis. O
comportamento observado para essas classes era esperado, conforme comentado
anteriormente, visto que as médias estimadas a partir dos dados de treinamento tiveram
pequena variação nos diferentes planos de entrada para classificação pela rede, antecipando
maior dificuldade na discriminação entre elas.
Posteriormente, analisando a imagem de entropia, o resultado observado foi
o mesmo, as menores entropias ocorreram nas classes Maior Densidade de Superfícies
Impermeáveis, Vegetação Arbórea/Arbustiva, Vegetação Rasteira/Solo Exposto e Corpo
d’água, o que implica dizer que essas classes ficaram melhor definidas, pelo fato de não
possuírem alto grau de ambigüidade. Isso permite concluir que as classes com maior entropia,
ou seja, maior mistura, referem-se à Densidade Intermediária e Menor Densidade de
Superfícies Impermeáveis. Finalmente, com o cruzamento das incertezas pôde-se verificar que
as constatações colocadas anteriormente se mantiveram.
Tendo em vista os resultados obtidos considera-se que as imagens orbitais
de média resolução espacial constituem-se de uma fonte de dados útil para representar
espacialmente e fornecer informações importantes para análises da área urbana para o nível
hierárquico II, definido no esquema de classificação. O uso das Redes Neurais Artificiais e
das imagens de média resolução permitiu a análise da incerteza gerada na classificação da
área urbana de Presidente Prudente.
108
A realização do experimento confirmou a expectativa inicial quanto ao
potencial da rede neural artificial em discriminar classes de cobertura do solo urbano,
caracterizadas pelo alto grau de mistura que apresentam, e representar espacialmente a
incerteza associada a cada classe, desde que a aplicação de interesse seja cuidadosamente
modelada.
109
REFERÊNCIAS BIBLIOGRÁFICAS
AMORIM, M. C. C. T.. O Clima Urbano de Presidente Prudente/SP. 2000. Tese
(Doutorado em Geografia) - Tese apresentada ao Curso de Pós Graduação em Geografia,
Universidade de São Paulo.
BENEDIKTSSON, J. A.; SWAIN, P. H.; ERSOY, O. K. Neural networks approaches versus
statistical methods in classification on multisource remote sensing data. IEEE Transactions
on Geoscience and Remote Sensing, v.28, n.4, p.540-52, 1990.
BITTENCOURT, G. Inteligência Computacional. Florianópolis: UFSC, 2000.
http://www.lcmi.ufsc.br/gia/softcomp/softcomp.html
BOCANEGRA, C.W.R. Procedimentos para tornar mais Efetivo o Uso das Redes
Neurais Artificiais em Planejamento de Transportes. 2002. Dissertação (Mestrado), Escola
de Engenharia de São Carlos, Universidade de São Paulo.
BRONDINO, N.C.M. Estudo da Influencia da Acessibilidade no Valor de Lotes Urbanos
Através do Uso de Redes Neurais. São Carlos, SP, 1999.
RENNÓ, C. D. Avaliação das incertezas nas classificações de máxima verossimilhança e
contextual de modas condicionais iterativas em imagens jers na região de Tapajós,
Estado do Pará. São José dos Campos: INPE, 1998.
http://www.dpi.inpe.br/cursos/ser301/trabalhos/camilo_incertezas.pdf
CARRARA, A. L. R.. Análise comparativa dos índices de vegetação em áreas urbanas
obtidos de dados TM LANDSAT e HRV-SPOT: Cidade de Taubaté. 1992. Dissertação
(Mestrado), Instituto Nacional de Pesquisas Espaciais (INPE), São José dos Campos.
CONGALTON, R.G.; GREEN, K. Assessing the Accuracy of Remotely Sensed Data:
Principles and Practices. 137p. Cap. 3, pg. 12-14. Boca Ratton: Lewis Publishers, 1999.
COSTA, M. F. ; FREITAS, R. N.; DI MAIO, A. C.. O Estudo de Aspectos do Espaço Intra-
Urbano Utilizando Imagens CBERS. In: SIMPÓSIO BRASILEIRO DE SENSORIAMENTO
REMOTO, XII, 2005, Goiânia. Anais.
DI GREGORIO, A. Land Cover Classification System (LCCS), version 2: Classification
Concepts and User Manual. FAO, Rome, 2004.
110
DRECKI, I. Visualisation of Uncertainty in Geographical Data. In: Spatial Data Quality,
2002. Taylor & Francis, London e New York, 2002, 141-159.
EASTMAN, J.R. Idrisi for windows – User’s guide, version 2.0. Worcenter, Clark Labs for
Cartographic Technology and Geographic Analysis, Clark University, 1998.
EMBRAPA, 2004. Disponível em http://www.sat.cnpm.embrapa.br/satelite/cbers.html
FELGUEIRAS, C.A.. Modelagem ambiental com tratamento de incertezas em SIG: o
paradigma geoestatístico por indicação. 1999. Tese (Doutorado) - Instituto de Pesquisas
Espaciais – INPE, São José dos Campos.
GALO, M. L. B. T.. Aplicação de redes neurais artificiais e sensoriamento remoto na
caracterização ambiental do Parque Estadual Morro do Diabo. 2000a. 205f. Tese
(Doutorado em Engenharia Ambiental) - Escola de Engenharia de São Carlos. Universidade
de São Paulo.
GALO, M. L. B. T. Aplicação de redes neurais artificiais na classificação de dados de
sensoriamento remoto: Relatório de projeto de pesquisa referente ao triênio 29/07/97 a
28/07/00. Presidente Prudente, FCT/Unesp, 2000b.
GONG, P.. Integrated Analysis of Spatial data from multiple sources: using evidential
reasoning and artificial neural network techniques for geological mapping. Photogrammetric
Enginnering & Remote Sensing, v.62, n 5p, 513 – 523, 1996.
GONZALES, R. C.; WOODS, R. E.. Recognition and Interpretation. In: Digital Image
Processing. Reading, Addison-Wesley, 1993.
GONZALEZ, R. C.; WOODS, R. E.. Processamento Digital de Imagens. Edgard Blücher,
2000. 717p.
GOODCHILD, M. F.; SHI, W.; FISHER, P. F.. Spatial Data Quality. Taylor & Francis,
London e New York, 2002.
GOUVEIA, A. L.; QUEIROZ, C. J. Aplicação de Técnicas de Sensoriamento Remoto na
Análise de Áreas Verdes de Presidente Prudente.1999. Trabalho de conclusão de curso
(Graduação em Engenharia Cartográfica), Universidade Estadual Paulista - UNESP,
Presidente Prudente, SP, 1999.
111
HAMBURGER, D. S.. Utilização de Informações Derivadas de Características Texturais
de Imagens Orbitais na definição de Classes de Uso do Solo Urbano. Apostila. São José
dos Campos. INPE, 1993.
IBGE Instituto Brasileiro de Geografia e Estatística. Pesquisa Censo 2000. Disponível em:
<www.Ibge.gov.br/ibge/estística/população/censo2000> . Acesso em: 2005.
INPE – Instituto Nacional de Pesquisas Espaciais. TUTORIAL – SPRING. Agosto, 1999.
INPE – Instituto Nacional de Pesquisas Espaciais. Catálogo de Imagens CBERS. Disponível
em: <www.dpi.inpe.br/catalogo>. Acesso em: 2004.
JENSEN, J.R.. Remote Sensing of the environment: a Earth resource prespective.
NewJersey, 2000.
KARTIKEYAN, B.; GOPALAKRISHINA, B.; KALUBARME, M. H.; MAJUMDER, K. L.
(1994). Contextual techniques for classification on high and low-resolution remote sensing
data. International Journal of Remote Sensing, v.15, n.5, p.1037-51, 1994.
LIPPMANN, R. P.. An introduction to computing with neural nets. IEEE ASSP Magazine,
v.4, 4-22p, 1987.
MACHEACHREN. Visualization Quality and the Representation of Uncertainty. In: ______.
“Some Truth with Maps”, 1992. p. 67.
NOVO, E. M. L. M.. Sensoriamento Remoto: Princípios e Aplicações. São Paulo: Edgard
Blucher, 1989.
RICHARDS, J. A.. Remote Sensing Digital Image Analysis: Na Introduction. New York,
Springer Verlag, 1986.
RICHARDS, J. A.; JIA, X.. Remote Sensing Digital Image Analysis. Springer, 1999.
SANTOS, R. L. et. al.. A Teoria da Incerteza Aplicada a Classificação de Imagens de
Satélites. In: Congresso Brasileiro de Cartografia, XXI, 2003, 050/SR12.
112
SHIMABUKURO, Y.E.; SMITH, J.A. The least-squares mixing models to generate fraction
images derived from remote sensing multispectral data. IEEE Transactions on Geoscience
and Remote Sensing, v.29, n.1, p.16-20, 1991.
SOLBERG, A. H. S.; JAIN, A. K.; TAXT, T. Multi-source classification of remotely sensed
data: fusion of Landsat TM and SAR images. IEEE Transactions on Geoscience and
Remote Sensing, v.32, n.4, p.768-78, 1994.
VAN DER WEL, F. J. M., VAN DER GAAG, L. C., and GORTE, B. G. H. Visual
exploration of uncertainty in remote sensing classification. Computers and Geosciences,
24:335-343, 1998.
VENTURIERI, A.; SANTOS, J. R. Técnicas de Classificação de Imagens para Análise de
Cobertura Vegetal. In: ASSAD, E. D.; SANO, E. E., eds. Sistema de Informação
Geográfica: Aplicações na Agricultura. Brasília: DF. Embrapa –SPI/Embrapa-CPAC, 1998. p
351-371.
ZELL, A. et al.. SNNS: Stuttgart Neural Network Simulator. User Manual, Version 4.1.
Stuttgart: University of Stuttgart, 1995.
113
ANEXO
114
Anexo A
Simulador SNNS
No simulador SNNS, o processamento da informação real é modelado pela função de
ativação e pela função de saída da rede. A função de ativação calcula primeiro a entrada para
uma unidade de processamento a partir de valores ponderados de saída de unidades prévias,
sendo então calculado um novo valor de ativação para essa unidade (a partir da unidade
prévia). Possibilita também, executar um ciclo de validação a cada n ciclos de treinamento.
A criação e edição das arquiteturas das redes são tarefas simples e rápidas no
simulador. Também é fácil acompanhar a evolução, tanto do erro de treinamento quanto de
validação, através de janelas gráficas que o mesmo fornece.
De acordo com Zell et al. (1995), ao inicializar o simulador, a janela de gerenciamento
do SNNS aparece na tela, a qual é mostrada na Figura 27.
.
Figura 27 – Janela de Gerenciamento do SNNS.
A seguir são relacionados os principiais comandos, do simulador:
Erro Gráfico Criação da rede
Controle do Treinamento
e Validação
Manipulação de
Arquivos
Sair
115
Manipula os arquivos.
Controla o treinamento e o teste das RNA.
Informa sobre as unidades de processamentos simples e pesos.
Gráfico da evolução do erro durante o treinamento e validação.
Definição do modelo de rede e criação da arquitetura.
O simulador SNNS suporta cinco tipos de arquivos, especificado em FILE, sendo que
os mais utilizados são:
Arquivos que contém a definição da rede, incluindo informação sobre
sua topologia da rede e regras de aprendizagem. A extensão de seus
arquivos é .net.
Arquivos de padrões contendo dados de treinamento e teste. A
extensão desses arquivos é .pat.
Arquivos dos resultados. A saída da rede pode ser interpretada de
muitas maneiras. Dependendo do problema o SNNS permite que o
usuário transfira sua saída para posteriores análises.
Para iniciar a operação com o simulador, a primeira atividade a ser realizada é
usar a opção FILE, acionando.PAT para carregar os arquivos, contendo os padrões de
FILE
CONTROL
DISPLAY
GRAPHY
BIGNET
NET
PAT
RES
116
treinamento e validação e, posteriormente, na fase de teste, o arquivo com dados a serem
classificados. A Figura 28 ilustra esta janela.
Figura 28 - Janela de controle de arquivos.
O SNNS permite criar diferentes tipos de redes. Para exemplificar esse processo, será
considerada a criação de uma rede convencional de alimentação progressiva (feedforward).
O primeiro passo para criar esse modelo de rede é selecionar, no gerenciador do painel
de controle, o ícone BIGNET na opção feedforward, mostrado na figura 29. A parte superior
desse painel permite definir a topologia da rede, ou seja, como as unidades são distribuídas
em cada camada e como elas deverão aparecer quando a rede for visualizada no monitor. A
parte inferior da janela permite fazer a conexão entre as camadas e criar a rede. Na
terminologia do SNNS, cada grupo especifica um determinado tipo de camada (entrada,
escondida e saída) e cada plano contém um número de nós arranjados em um sistema de
coordenadas x, y e z, isso é usado apenas para visualizar a configuração da rede no monitor.
Tipos de
arquivos
Diretório
Corrente
Sair
Nome do
arquivo
Abrir
Arquivo
Salvar
117
Figura 29 - Janela para criação de modelos de redes neurais de alimentação progressiva (“feedforword”).
Pode-se mudar as entradas usando outros valores nas “caixas” ou clicando em TYPE
para mudar o tipo de unidade da rede.
A caixa TYPE tem a finalidade de mudar o tipo da camada, de modo que, depois de
atribuídos os valores para a camada de entrada pode-se dimensionar tanto a camada
escondida, como a de saída, dependendo da arquitetura a ser criada. Alterado o tipo de
camada, deve-se voltar à caixa” e atribuir os valores dessa camada. Se a arquitetura da rede
tiver mais do que uma camada escondida deve-se atribuir a segunda camada separadamente
da primeira, cada qual contendo o respectivo número de elementos de processamentos,
previamente definidos.
Após definida a topologia das camadas, as conexões devem ser feitas clicando em
FULL CONNECTION, depois selecionando CREATE NET para criar a rede e DONE para
fechar essa janela.
Enter
Definir os
planos das
camadas
Janelas (caixas)
com as arquiteturas
das camadas
Mudar
posição
das
camadas
Ignorar
estas
janelas
Conectar as redes
Criar a rede
118
Selecionando o ícone DISPLAY, pode-se visualizar a rede que foi criada, mas seus
pesos iniciais serão iguais a zero, pois ainda não foi realizado o treinamento. A Figura 30
exemplifica uma rede feedforword com 35 nós na camada de entrada, 10 nós na camada
escondida e 26 nós de saída.
Figura 30 - Janela de visualização de uma rede “feedforword” antes do Treinamento.
Após criar a rede e armazená-la em FILE, deve-se importar os arquivos de padrões
(.PAT) para o simulador, cujas definições em termos de variáveis de entrada e classes de
saída, devem se ajustar à topologia da rede. Na seqüência foram apresentados os parâmetros
para o início do treinamento da rede especificada.
Todo o treinamento da rede, a validação ou teste e a classificação são feitos a partir da
opção CONTROL. Esse painel consiste de duas partes, conforme pode ser visto na Figura 31.
A parte superior controla as condições em que o treinamento será realizado. As três linhas
inferiores desse painel permitem especificar as funções de aprendizagem, atualização e
inicialização, dentre as várias alternativas implementadas no simulador. Os campos que
119
precedem essas caixas de seleção estão em branco e devem ser preenchidos para definir os
parâmetros associados a cada função.
Para os parâmetros do treinamento deve-se estabelecer (CYCLES), o número de ciclos
ou iterações de treinamento, em uma dada simulação, quantos padrões constituem os dados de
treinamento (PATTERN), para que números de ciclos de treinamento será feita uma validação
(VALID). Em USE são configurados os arquivos.PAT que serão usados no treinamento e
validação da rede neural.
Figura 31 – Janela que controla as operações de treinamento e validação de uma rede.
Quanto aos parâmetros de aprendizagem deve-se selecionar uma função de
aprendizagem, cujo “default” é a backpropagation padrão (Std_Backpropagation), porém
pode-se usar funções diferentes. Para isso, clica-se em SEL FUNC e escolhe-se a que for mais
apropriada. Cada função de aprendizagem requer um conjunto diferente de parâmetros, sendo
os mais usados: Std_Backpropagation, BackpropMomentum e Rprop. Todas elas adotam a
função sigmóide logística para calcular a ativação em cada nó da rede.
A função de atualização, como a topological_order, deve ser definida nesta etapa,
sendo essa considerada mais adequada para as redes do tipo feedfoward (ZELL et al., 1995).
Funções
Parâmetros de
Aprendizagem
Parâmetros de
Treinamento
Número de Ciclos
Inicia o treinamento Para o treinamento
120
Usando essa função de atualização, os pesos são ajustados seguindo uma ordem topológica de
ordenação dos nós na rede, que é dada pela topologia. Isso significa que a primeira camada a
ser processada é a camada de entrada, seguida pela primeira camada escondida e assim
sucessivamente até a ultima camada de saída.
A função de inicialização também é definida nesta etapa. Quando se adota
backpropagation, a função de inicialização mais adequada é randomize weights. Essa função
inicializa os pesos a partir de uma distribuição aleatórias de valores no intervalo (α, β) onde α
e β são fornecidos no painel de controle, em INIT, sendo α > β.
Depois que todos os parâmetros tiverem sido definidos pode-se iniciar o treinamento.
O treinamento é feito para um determinado número de ciclos ou iterações, especificado em
CYCLES. Nessa etapa, deve-se fornecer o número desejado de ciclos para o treinamento.
Todos os padrões de treinamento são apresentados uma vez durante cada ciclo.
Algumas vezes é preferível selecionar aleatoriamente os padrões para apresentá-los à rede ao
invés de apresenta-los em ordem. Para fazer isso, deve-se ativar SHUFFLE, que é uma opção
importante para aprendizagem otimizada e deve ser usada quando vários padrões são
apresentados em ordem diferente nos diferentes ciclos.
Antes de começar o processo de aprendizagem é aconselhável abrir o painel GRAPH
em MANAGER, para monitorar o progresso do erro durante o treinamento.
Acionando-se em ALL o treinamento da rede é iniciado. Nesta etapa a rede é treinada com
todos os padrões para número de ciclos de treinamento especificado anteriormente. No ícone
STOP o treinamento pode ser interrompido a qualquer momento, quando se considerar, por
exemplo, que o erro foi satisfatoriamente minimizado.
Segundo Zell et al. (1995), uma das maiores vantagens das redes neurais é sua
capacidade de generalização. Isto significa que uma rede treinada pode classificar dados de
treinamento, sem conhecimento prévio de todo o conjunto. Em aplicações do mundo real,
121
normalmente se dispõe de uma pequena parte dos padrões possíveis para a generalização da
rede. Para obter melhor generalização os autores recomendam que a base de dados seja
dividida em três partes:
- conjunto de treinamento – usado para o aprendizado da rede neural. O erro da base de
dados é minimizado durante o treinamento;
- conjunto de validação - usado para estimar o desempenho da rede neural sobre o
conjunto de padrões que não foram treinados durante a aprendizagem.;
- conjunto de teste para checar o desempenho global da rede. Refere-se ao conjunto
de dados a ser classificado.
A aprendizagem deve ser finalizada quando o erro, para o conjunto de validação, for
mínimo, pois nesse ponto a rede generaliza melhor. Quando a aprendizagem da rede não é
adequadamente finalizada ocorre um supertreinamento e o desempenho da rede para o
conjunto total de dados decresce, apesar de que os erros para os dados de treinamento ainda
poderem diminuir.
Depois de concluída a fase de treinamento a rede deve ser aplicada ao terceiro
conjunto de dados, o conjunto teste, pois ainda é impossível julgar o desempenho da rede
nesse momento. Entretanto, é sensato assegurar que a rede não foi supertreinada (over-
training) antes de aplicá-la ao conjunto teste e verificar se está generalizando corretamente.
Como especificado anteriormente os dois botões USE, no painel de controle, permitem
selecionar quais conjuntos de dados serão usados para o treinamento e validação. O botão
superior permite selecionar o conjunto de treinamento e o seguinte seleciona o conjunto de
validação. Se o usuário entrar com o conjunto teste ao invés de validação, e especificar o
valor zero, a rede simplesmente calculará as ativações de saída para esse conjunto teste,
considerando que os pesos ajustados, definidos no treinamento, são adequados.
Os arquivos resultantes devem ser salvos em RES do file browser. Esses arquivos
conterão as ativações de todas as unidades de saída da rede. Acionando SAVE para gravar,
122
uma outra janela aparecerá permitindo que o usuário especifique as condições em que as
saídas da rede serão armazenadas. A figura 32 ilustra essa janela.
Figura 32 – Janela usada para salvar os resultados da aplicação da rede.
Os arquivos das redes, assim como os dos padrões, são armazenados como arquivos
ASCII.
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo