
A metodologia aqui empregada baseia-se, co-
mo já foi dito, na utilização da análise fatorial, pa-
ra reduzir as dimensões do conjunto de 15 variá-
veis, finalmente escolhidas para a construção do
índice de situação educacional, em um novo con-
junto de quatro variáveis, denominado de fatores.
Todos os fatores possuem variâncias explica-
das diferentes no modelo adotado, devendo ser en-
tendido, por isso mesmo, que cada um estabele-
ce uma linha básica de variação entre os elemen-
tos do conjunto (no caso, as microrregiões),
constituindo-se, pois, em quatro dimensões dis-
tintas e independentes, para que os elementos
possam se diferenciar uns dos outros e serem di-
ferenciados, seja para a construção do índice de
situação educacional ou para a construção da ti-
pologia educacional.
A análise de conglomerados, ou de agrupa-
mentos, uma vez medidas as distâncias entre ca-
da par de elementos, através de algum algoritmo
adotado, agrupa esses elementos, minimizando as
distâncias entre os elementos de um mesmo gru-
po e, por definição, maximizando as distâncias en-
tre os grupos, realizando assim, matematicamen-
te, o objetivo do processo de construção de con-
glomerados espaciais em termos educacionais (ou,
o pr^c^çso de regionalização do sistema educa-
cional), que é o de agrupar os elementos mais se-
melhantes e tornar cada agrupamento o mais ho-
mogêneo internamente e o mais heterogêneo em
relação a outros grupos.
Nesse contexto, iniciou-se o presente trabalho
com a utilização de três algoritmos de conglome-
ração, a saber: Método de Ward, Método do Cen-
tróide e Método do Average Linkage (ou Método
da Média de Agrupamentos).
Com base nesses três métodos e nos quatro
fatores previamente definidos, as microrregiões fo-
ram divididas em quatro, cinco, seis... 15 conglo-
merados, empregando-se o programa-produto
Clustan. Ao mesmo tempo, para esses mesmos
métodos, gerou-se uma variável CCC — Cubic
Clustering Criterium, cujo gráfico, que apresenta
em sua evolução números de agrupamentos, é in-
formativo da presença de 'famílias' ou 'grupos ho-
mogêneos'.
Após todos esses procedimentos, optou-se pe-
la utilização do Método de Ward com sete con-
glomerados ou tipos.
O Método de Ward é uma técnica de hierar-
quização aglomerativa, tendo, como função de
agrupamento, a distância euclidiana e o critério de
agrupamento é dado pelo valor do incremento, que
se obtém na matriz de dispersão (ou matriz da so-
ma dos quadrados).
O Método de Ward, como é comum nos mé-
todos hierárquicos, gera, por vezes, classificações
inadequadas de certos elementos (das microrre-
giões, no caso), mas são mais baratos e rápidos
de serem executados do que os não-hierárquicos,
mas que são, por seu turno, em geral, ineficientes
em situações ou estudos com mais de duzentos
elementos (ou observações).
Por isso, submeteu-se a conglomeração obti-
da ao procedimento Relocate do programa-produto
Clustan. A motivação básica dessa abordagem é
a de evitar possíveis erros de aglomeração resul-
tantes da aplicação do Método de Ward,
conseguindo-se, desse modo, reclassificar as mi-
crorregiões inadequadamente classificadas.
Com relação à determinação do número ideal
ou ótimo de conglomerados, é preciso frisar que
não existe um método totalmente satisfatório,
qualquer que seja a técnica de agrupamento utili-
zada. Embora já definidos os sete aglomerados pe-
lo Método de Ward, usou-se ainda a análise dis-
criminante, principalmente com o objetivo de va-
lidar a escolha realizada e que indicou o mesmo
número de grupos.
Para cada uma das conglomerações, obteve-
se uma função discriminante, com o objetivo de
verificar qual das conglomerações gerava um
maior poder discriminatório, ou seja, qual proces-
so de agrupamento gerava uma função discrimi-
nante com menor erro de reclassificação.
Nessa parte do estudo, usou-se probabilidades
proporcionais aos tamanhos de cada agrupamento
(ou tipo).
Como já foi ressaltado, a função discriminan-
te foi constituída a partir de quatro fatores já re-
feridos. Daí que o vetor 'x' da função utilizada re-
presenta os escores dos fatores e não os valores
das 15 variáveis consideradas inicialmente. Para ca-
da vetor 'x' obteve-se a probabilidade de 'x' per-
tencer a cada um dos 'k' agrupamentos, tendo 'x'
sido classificado no grupo de maior probabilidade.
Definição conceitual dos agrupamentos (ou
conglomerados)
O resultado da conglomeração foi o seguinte:
Conglomerado I — 65 microrregiões
Conglomerado II — 60 microrregiões
Conglomerado III — 59 microrregiões
Conglomerado IV — 55 microrregiões