Download PDF
ads:
A DISTRIBUIÇÃO BETA BINOMIAL
NEGATIVA
ANA PAULA COELHO MADEIRA
2009
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
ANA PAULA COELHO MADEIRA
A DISTRIBUIÇÃO BETA BINOMIAL NEGATIVA
Dissertação apresentada à Universidade Federal
de Lavras como parte das exigências do
Programa de Pós-graduação em Estatística e
Experimentação Agropecuária, para a obtenção
do título de "Mestre".
Orientador
Prof.Dr. Lucas Monteiro Chaves
LAVRAS
MINAS GERAIS - BRASIL
2009
ads:
Madeira, Ana Paula Coelho.
A Distribuição Beta Binomial Negativa / Ana Paula Coelho
Madeira. Lavras : UFLA, 2009.
81 p. : il.
Dissertação (Mestrado) Universidade Federal de Lavras, 2009.
Orientador: Lucas Monteiro Chaves.
Bibliografia.
1. Mistura. 2. Distribuições generalizadas. 3. Distribuição
Binomial Negativa. 4. Distribuição Beta 5. Momentos fatoriais I.
Universidade Federal de Lavras. II. Título.
CDD 519.53
Ficha Catalográfica Preparada pela Divisão de Processos Técnicos da
Biblioteca Central da UFLA
ANA PAULA COELHO MADEIRA
A DISTRIBUIÇÃO BETA BINOMIAL NEGATIVA
Dissertação apresentada à Universidade Federal
de Lavras como parte das exigências do
Programa de Pós-graduação em Estatística e
Experimentação Agropecuária, para a obtenção
do título de "Mestre".
APROVADA em 26 de fevereiro de 2009
Prof. Dr. Daniel Furtado Ferreira UFLA
Prof. Dr. Denismar Alves Nogueira UNIFAL
Prof. Dr. João Domingos Scalon UFLA
Prof. Dr. Lucas Monteiro Chaves
UFLA
(Orientador)
LAVRAS
MINAS GERAIS BRASIL
Ao mestre dos mestres, Jesus Cristo,
Aos meus saudosos pais Sebastião (em memória) e Marlene,
Aos meus queridos irmãos Luiz Gustavo, Luiza e Antônio César,
Ao meu fiel companheiro Valdevino Júnior e minha amada filha Ana Luiza,
Aos meus dedicados mestres,
Dedico.
AGRADECIMENTOS
A Deus que se faz presente em minha vida, guiando meus passos e
concedendo-me graças a cada dia.
À Universidade Federal de Lavras (UFLA), em especial ao
Departamento de Ciências Exatas (DEX), pela realização de um sonho.
À FAPEMIG pela bolsa de estudo concedida.
Aos professores do DEX pelos valiosos ensinamentos e a professora
Maria do Carmo pela amizade e carinho.
Ao meu orientador, Lucas Monteiro Chaves, pela arte de ensinar.
A todos os funcionários do DEX pelos serviços prestados.
Ao meu professor de Graduação Alex Erickson que muito contribuiu
para minha vida acadêmica, incentivou-me e despertou em mim o hábito de
estudar.
Aos meus colegas de curso Altemir, Ana Patrícia, Augusto, Denise,
Edcarlos, Iron, Isabel, Paulo, Ricardo, Richardson, Stephânia e Tania pelo
convívio e amizade.
Ao colega Devanil que muito acrescentou em minha formação.
Às minhas amigas Ana Patrícia e Tania pelas longas horas de estudo,
brincadeiras, confidências, afeto,...
À minha amiga Lilyane pelo carinho e amizade de muitos anos.
À minha amiga Heloíza Ribeiro pelo apoio, carinho e consideração.
Ao meu querido marido Valdevino Júnior pela compreensão, incentivo,
zelo, amizade e amor.
À minha amada filha Ana Luiza por ser a razão de minhas conquistas.
Ao meu amado pai que, mesmo “entre nuvens”, olhou por mim e a quem
sempre pude me espelhar. À minha prezada mãe pelo exemplo de vida, força,
incentivo e dedicação.
Aos meus queridos irmãos Luiz Gustavo, Luiza e Antônio César que
vibram com as minhas conquistas.
Enfim, a todos que contribuíram, direta ou indiretamente, meus eternos
agradecimentos.
SUMÁRIO
Página
LISTA DE TABELAS ........................................................................
LISTA DE FIGURAS ........................................................................
RESUMO ............................................................................................
ABSTRACT ........................................................................................
1
INTRODUÇÃO ......................................................................
2
REFERENCIAL TEÓRICO .................................................
2.1
Mistura de distribuições ...........................................................
2.1.1
Simulando misturas ..................................................................
2.2
Função geradora de probabilidade ...........................................
2.2.1
Função geradora de probabilidade da mistura de distribuições
2.2.2
Função geradora de probabilidade da soma de um número
aleatório de variáveis aleatórias independentes........................
2.3
Distribuições generalizadas.......................................................
2.4
A mistura das distribuições binomial negativa e beta...............
2.4.1
Função geradora de momentos fatoriais da BBN.....................
2.4.2
Média e variância......................................................................
2.5
Unimodalidade..........................................................................
2.5.1
Unimodalidade da distribuição beta..........................................
2.5.2
Unimodalidade da distribuição binomial negativa....................
2.5.3
Unimodalidade de misturas.......................................................
3
MATERIAL E MÉTODOS ...................................................
3.1
Dados........................................................................................
3.2
Simulação de distribuições obtidas por mistura........................
3.3
Estimação e ajuste.....................................................................
4
RESULTADOS E DISCUSSÃO ...........................................
4.1
Simulando mistura....................................................................
4.2
Estimadores de máxima verossimilhança.................................
4.2.1
Sistema de equações de aproximadas para o cálculo dos
estimadores de máxima verossimilhança..................................
4.3
Ajustes.......................................................................................
5
CONCLUSÕES ......................................................................
6
REFERÊNCIAS BIBLIOGRÁFICAS .................................
7
ANEXO
7.1
ANEXO A: Função gama.........................................................
7.2
ANEXO B: Rotinas...................................................................
i
LISTA DE TABELAS
TABELA 1
Valores observados e esperados pelas distribuições
binomial Negativa e Beta Binomial Negativa para dados
do número de cáries em crianças de 12 anos....................
63
TABELA 2
Valores observados e esperados pelas distribuições Binomial
Negativa e Beta Binomial Negativa para dados do número de
acidentes por maquinista num período de três meses...............
65
TABELA 3
Valores observados e esperados pelas distribuições
Binomial Negativa e Beta Binomial Negativa para
dados do número de plantas, Salicornia stricta, por
quadrado............................................................................
66
TABELA 4
Valores observados e esperados pelas distribuições
binomial negativa e beta binomial negativa para dados
de contagem do número de ácaros em folhas de maçã.....
68
ii
LISTA DE FIGURAS
FIGURA 1
Representação de um padrão espacial aleatório........................
7
FIGURA 2
Representação da mistura de normais.......................................
12
FIGURA 3
Representação gráfica da mistura das distribuições Poisson e
gama..........................................................................................
13
FIGURA 4
Representação de um padrão espacial agrupado.......................
24
FIGURA 5
Distribuição beta binomial negativa
3,5,7
...........................
35
FIGURA 6
Gráficos da distribuição beta binomial negativa para
diferentes valores dos parâmetros
,ab
e
r
............................
21
FIGURA 7
Gráficos da distribuição beta.....................................................
41
FIGURA 8
Distribuição binomial negativa
5, 0,3rp
.....................
44
FIGURA 9
Distribuição binomial negativa
5, 0,08rp
..................
44
FIGURA 10
Distribuição binomial negativa
5, 0,9rp
....................
45
FIGURA 11
Discretização da variável
x
e do parâmetro .......................
54
FIGURA 12
Distribuição das freqüências do número de cáries por criança.
Ajuste pelas distribuições binomial negativa e beta binomial
negativa ....................................................................................
40
iii
FIGURA 13
Distribuição das freqüências de acidentes por maquinista,
período de três meses. Ajuste pelas distribuições binomial
negativa e beta binomial negativa ............................................
65
FIGURA 14
Distribuição do número de plantas Salicornia stricta por
quadrado. Ajuste pelas distribuições binomial negativa e beta
binomial negativa......................................................................
67
FIGURA 15
Distribuição do número ácaros em folhas de maçã. Ajuste
pelas distribuições binomial negativa e beta binomial
negativa.....................................................................................
68
iv
RESUMO
MADEIRA, Ana Paula Coelho. A Distribuição beta binomial negativa. 2009.
81 p. Dissertação (Mestrado em Estatística e Experimentação Agropecuária) -
Universidade Federal de Lavras, Lavras, MG.
1
Os conceitos de mistura e de distribuições generalizadas são trabalhados. A
mistura da distribuição binomial negativa com a distribuição beta é obtida e
denominada distribuição beta binomial negativa. A distribuição é unimodal,
apresenta super dispersão e não possui todos os momentos. Uma aproximação
das equações de log-verossimilhança é encontrada, obtendo-se estimativas dos
parâmetros do modelo. Uma validação matemática para o algoritmo de
simulação de misturas é apresentado. Como aplicações, são realizados os ajustes
da distribuição beta binomial negativa a dados da literatura, analisados
anteriormente pela distribuição binomial negativa.
1
Orientador: Lucas Monteiro Chaves UFLA
v
ABSTRACT
MADEIRA, Ana Paula Coelho. The beta negative binomial distribution 2009.
81p. Dissertation (Master of Statistics and Agricultural Experimentation)
Federal University of Lavras, Lavras, MG.
1
The mixture concepts and of generalized distributions are worked. The mixture
of the negative binomial distribution with the beta distribution is obtained and
denominated negative beta binomial distribution. The distribution is unimode, it
presents over dispersion and it doesn't present every moments. An approach of
the log-likelihood equations is found, being obtained the estimator of the
parameters of the model. A mathematical validation for the algorithm of
simulation of mixtures is presented. As application, fittings are accomplished
from the negative beta binomial distribution to data of the literature, previously
analyzed by the negative binomial distribution.
1
Adviser: Lucas Monteiro Chaves UFLA
1
1 INTRODUÇÃO
Novas distribuições de probabilidade são obtidas quando é admitido que
o parâmetro da distribuição também varie segundo uma distribuição de
probabilidade, isto é, o parâmetro de interesse passa a ser considerado também
uma variável aleatória com sua própria distribuição. Esse mecanismo de
obtenção de distribuições de probabilidade é definido como mistura. É bem
conhecido que a distribuição beta binomial surge quando o parâmetro
p
da
binomial é permitido variar de grupo a grupo segundo uma distribuição beta.
Outra distribuição obtida pelo processo de mistura é a binomial negativa, muito
usada no ajuste de dados biológicos. Essa distribuição é resultado da mistura das
distribuições Poisson e gama. O conceito de mistura é suficientemente flexível
para se permitir obter novas distribuições, a partir de distribuições conhecidas,
com propriedades desejáveis.
Outro processo similar para se obter novas distribuições é dado pelo
conceito de distribuições generalizadas, resultado da soma de um número
aleatório de variáveis aleatórias independentes e identicamente distribuídas.
Novamente, obtém-se a distribuição binomial negativa como distribuição
generalizada de uma distribuição de Poisson com uma distribuição logarítmica.
Deste modo, tem-se que, a distribuição binomial negativa pode ser obtida por
dois processos distintos, com pressupostos diferentes, mistura e distribuição
generalizada. Algumas relações entre mistura de distribuições e distribuições
generalizadas foram obtidas por Gurland (1957).
A distribuição binomial negativa tem sido muito empregada para
descrever a distribuição de pragas em lavouras. Considerando uma plantação,
define-se uma unidade espacial na qual é contado o número de insetos. A
2
presença de insetos em uma unidade espacial é afetada pela maior ou menor
densidade nas unidades vizinhas, portanto, é razoável supor que o parâmetro
p
,
probabilidade de ocorrência de um inseto, varia de unidade a unidade. Supondo
uma distribuição beta para o parâmetro
p
e fazendo a mistura entre essas
distribuições, obtém-se a distribuição discreta beta binomial negativa.
Alguns autores, entre eles, Jonhson e Kotz (1969), Gerstenkorn (2004) e
Hassan e Bilal (2008) trabalham com a mistura das distribuições binomial
negativa e beta.
O presente trabalho teve por objetivo estudar a mistura das distribuições
binomial negativa e beta, a distribuição beta binomial negativa, estimar seus
parâmetros segundo o método da máxima verossimilhança. Como aplicação,
alguns ajustes a dados anteriormente analisados na literatura são realizados, no
sentido de mostrar a aplicabilidade desta distribuição. Uma validação
matemática do algoritmo para simular misturas é apresentada.
3
2 REFERENCIAL TEÓRICO
2.1 Mistura de distribuições
Seja
01
(.), (.),..., (.),...
n
f f f
uma seqüência de funções densidades de
probabilidades e
01
, ,..., ,...
n
p p p
uma sequência dos números satisfazendo
0
i
p
e
0
1
i
i
p
, então
0i
ii
h x p f x
é também uma densidade de
probabilidade, pois
1,
i i i i
x x i i x
i i i
i x i
h x p f x p f x
p f x p
e é denominada mistura. Tal procedimento é útil para se obter novas
distribuições de probabilidade com propriedades adequadas. Um exemplo de
interesse é:
Exemplo 1: Mistura de normais.
1 1 2 2
; 1 ;h x pf x p f x
em que
2
11
; ,1 exp , 1,2
2
2
j j j
f x x j
4
hx
é uma mistura de normais envolvendo dois componentes com médias
diferentes
12
e
e variâncias iguais a um, onde
p
é chamado peso ou
proporção da mistura.
Para
1
3
p
, tem-se
22
12
1 1 1 2 1 1
exp exp
3 2 3 2
22
h x x x
.
É interessante notar que, os estimadores de máxima verossimilhança
(considerando uma amostra de tamanho
1n
) dos parâmetros
12
e
,
dados pela solução do sistema,
2
1
1
1
2
2
2
2
ˆ
1
ˆ
exp 0
2
32
ˆ
2
1
ˆ
exp 0
2
32
x
hx
x
x
hx
x
22
1
21
2
ˆ
1
ˆˆ
exp
ˆ
22
x
xx
x
não possuem expressões explícitas pelo fato das equações serem transcendentes.
Assim, os valores estimados são obtidos por métodos numéricos iterativos, tais
como: algoritmo EM, métodos de Newton-Raphson, entre outros.
5
Na mistura de normais, pode-se ainda considerar os casos em que as
médias são iguais e variâncias diferentes, as médias e as variâncias são
diferentes e, por fim, misturas envolvendo mais que duas normais.
Exemplo 2: Seja
X
uma variável aleatória com distribuição
,1N
.
Suponha que
é também uma variável aleatória com distribuição
0,1N
2
2
11
,1 ; exp
2
2
11
0,1 exp
2
2
X N f x x
Ng
A distribuição
hx
, é dada pela mistura
;f x g
2
2
22
2
2
2
2
;
1 1 1 1
exp exp
22
22
1 1 1 1
exp exp 2 2
22
22
11
exp
22
2
11
exp 2 2 2
2
2 2 2
h x f x g d
xd
x x d
x
x
xx
d
6
Fazendo
1
2
2
y d dy
,
2
2
2
2
1 1 1 1 1
exp exp
2 2 2
2 2 2 2
1 1 1
exp 0,2
2
2 2 2
xx
x y dy
x
N
Silva (2003) destaca o uso da mistura de normais na Genética onde esses
modelos são usados para estimar os parâmetros relativos a um gene de efeito
maior e no mapeamento de QTLs.
O conceito de mistura pode ser estendido.
Seja
;;fx
uma família de funções densidade de
probabilidade parametrizadas por em um espaço paramétrico . Se
g
é
uma função densidade de probabilidade definida em , então
;h x f x g d
é uma nova densidade de probabilidade, pois
;;
xx
h x dx f x g d dx f x g dxd
;1
x
g f x dx d g d
7
também é denominada mistura das distribuições
;fx
e
g
. Considere a
notação
;
X Y X Y
f x f x g
, apresentada por Gurland (1957), para
representar a densidade de probabilidade da mistura das distribuições
;X f x
com
Yg
, em que
;fx
representa a distribuição
original dependendo do parâmetro e
g
a distribuição para o parâmetro.
Exemplo 3: Suponha que fêmeas de insetos depositem ovos em determinados
locais que denominaremos de unidades, folhas, por exemplo. Suponha que se
tenha uma uniformidade na postura dos ovos, isto é, as fêmeas depositam
exatamente
n
ovos nas unidades (folhas). Essa situação encontra-se
representada na Figura 1.
FIGURA 1: Padrão espacial aleatório
8
Considere, agora, o seguinte modelo: com probabilidade
p
, cada ovo
eclode dando origem a uma larva. Então, para cada unidade a quantidade de
larvas será o resultado de
n
ensaios de Bernoulli. O número de larvas por folha
(unidade) segue um modelo binomial,
Bin ,X n p
. A probabilidade de
exatamente
k
ovos eclodirem é dada por
0,1,2,...,
1I
n
nk
k
n
P X k p p x
k
Porém, sob certas condições, a pressuposição de que
p
é constante em todas as
unidades não é valida, ou seja, a probabilidade de um ovo eclodir varia de
unidade a unidade. Tal pressuposição faz sentido, pois uma folha mais exposta
ao sol, por exemplo, pode ser menos propícia ao desenvolvimento dos ovos.
Uma forma de modelar a variação de
p
é supor que
p
varia segundo uma
distribuição beta
0,1
1
1
1
1I
,
b
a
g p p p p
ab
A distribuição resultante da mistura das distribuições binomial e beta,
Bin , Beta ,
p
n p a b
, é denominada beta binomial cuja distribuição de
probabilidade é dada por
1
0
;h x f x p g p dp
1
0
1
1
1
11
,
n x b
xa
n
p p p p dp
x
ab
9
1
0
1
1
1
1
,
bnx
ax
n
p p dp
x
ab
0,1,2,...,
,
I
,
n
n
a x b n x
x
x
ab
Outra aplicação de mistura de distribuições de probabilidade é discutida
em Pielou (1977). Na distribuição espacial de certos organismos, a
probabilidade de uma unidade conter
x
indivíduos é modelada por uma
distribuição de Poisson ,
0,1,2,...
;I
!
x
e
f x x
x
. Considerando
que as unidades são heterogêneas, algumas provêm de ambientes mais
favoráveis que outras, a média de indivíduos na unidade varia de unidade a
unidade, isto é,
é também uma variável aleatória. Considerando a distribuição
de uma gama,
1
0,
Ige
, tem-se
1
00
;
!
x
e
f x g d e d
x
1
1
0
!
x
ed
x
1
1
0
1
!
1
x
x
x
x
ed
xx
10
0,1,2,...
1
1
I.
11
x
x
h x x
x
#
A distribuição resultante para o número de indivíduos por unidade é, portanto,
uma distribuição binomial negativa com parâmetros e
1
p
. A média e
a variância são, respectivamente,
q
EX
p
e
2
q
Var X
p
.
Exemplo 4: Seja
n
X
uma variável aleatória com distribuição binomial com
parâmetros
enp
,
0,1,...,
n
Xn
e
; , 1
nk
k
n
b k n p p p
k
. Defina
0
n
k
para
kn
e estenda a definição de
n
X
para uma variável aleatória
assumindo valores em
0,1,2,..., ,..., , 1,...k n n
. Neste caso,
0
11
k
nk
k
n
pp
k
.
Considere
n
uma variável aleatória com distribuição Poisson com
parâmetro ,
0,1,2,...
I
!
n
e
g n n
n
.
A mistura
;,
n
b k n p g n
é dada por
0
; , 1
!
n
nk
k
n
nk
n
e
h k b k n p g n p p
k
n
11
! 1 1
! ! ! ! !
kk
n
n
n k n k
q
n p p
e e q
n k k q n q k n k
11
!!
k
n k k
nk
p
e q q
q k n k
11
!!
k
k n k
nk
p
e q q
q k n k
Fazendo a substituição
s n k
tem-se que, quando
n
varia de
k
até
nk
,
s
varia de 0 a
0s
. Portanto,
0
1 1 1
! ! !
kk
k s k
q
s
pp
h k e q q e q e
q k s q k
1
1
!
k
q
pe
k
Portanto temos a distribuição de Poisson, com parâmetro
p
0,1,2...
!
k
p
ep
h k I k
k
. #
Os exemplos acima mostram, claramente, que o conceito de mistura é
muito útil na modelagem de fenômenos aleatórios. Permite que se faça uma
hierarquia entre os parâmetros e depois toma-se o efeito médio de todos eles.
Como referência para o estudo das distribuições obtidas pelo processo de
mistura, tem-se o livro clássico de Jonhson e Kotz (1969).
12
2.1.1 Simulando misturas
A seguir são apresentados dois exemplos de simulação de misturas,
obtidos via algoritmo mistura, Devroye (1986). Uma validação matemática para
o algoritmo é apresentada na seção resultados e discussão.
Exemplo 5: Mistura de Normais
Seja
12
, ...
n
x x x
uma amostra aleatória de tamanho
100000n
, obtida por
simulação (ver rotina no apêndice) da distribuição
hx
.
A distribuição
;h x f x g d
é resultado da mistura de
normais,
;1XN
e
0;1N
Na Figura 2 apresenta-se o histograma de freqüências de
x
.
FIGURA 2: Função densidade de probabilidade que aproxima a
distribuição de freqüências observadas.
13
Percebe-se que a distribuição
hx
corresponde a uma distribuição Normal
com média
0
. O resultado obtido pode ser confirmado pelo exemplo 2,
onde se obtém uma distribuição
0,2N
a partir da mistura de duas normais.
Exemplo 6: Simulando a distribuição Binomial Negativa.
Seja
12
, ...
n
x x x
uma amostra aleatória de tamanho
100000n
, obtida
por simulação, via algoritmo mistura, da distribuição
hx
. A distribuição
hx
é resultado da mistura das distribuições Poisson e gama
10,1
.
Um histograma de freqüências de
x
é apresentado na Figura 3.
FIGURA 3: Densidade da mistura das distribuições Poisson e gama
Contata-se que a distribuição
hx
apresenta comportamento semelhante
ao de uma distribuição Binomial Negativa. De fato, a mistura das distribuições
Poisson e gama resulta em uma distribuição binomial negativa (ver página 9),
neste caso com parâmetros
10,0.5
.
14
2.2 Função geradora de probabilidade
Seja
X
uma variável aleatória discreta assumindo valores inteiros não
negativos,
0,1,2,...X
,
x
P X x p
e
0
1
x
x
p
. A função geradora
de probabilidade (f.g.p.) de
X
, denotada por
X
Gz
, ou apenas
Gz
quando
a variável aleatória a qual se refere a f.g.p estiver explicitada, é definida por
0
X
X
x
x
x
G z p z E z
.
Sendo
X
uma variável aleatória contínua, a função geradora de
probabilidade é dada por
X
XX
x
G z E z z f x dx
.
Exemplo 7: Seja
X
uma variável aleatória com distribuição binomial negativa
com parâmetros
r
e
p
0,1,2,...
1
; , I
X
rx
xr
f x r p p q x
x
.
Reescrevendo o coeficiente binomial de acordo com Feller (1968) página 61,
11
11
1
!!
x
r r r x
r
r r r x
x
xx
1
1
x
rx
x
para
0r
15
obtém-se uma expressão alternativa para a densidade
0,1,2,...
; , I
X
x
r
r
f x r p p q x
x
.
X
X
G z E z
é dada por
2
2
...
0 1 2
X
r r r
r r r
G z p p q z p q z
2
...
0 1 2
r
r r r
p qz qz
.
Como
0
1
kr
k
r
qq
k
(Mood, Graybill & Boes, 1974, página
533), segue que
1
1
X
r
r
r
p
G z p qz
qz
.
2.1
Definição 1: Se
X
é uma variável aleatória, o l-ésimo momento fatorial de
X
é definido como (l é um inteiro positivo):
1 ... 1
l
E X X X l E X
.
em que
1 2 ... 1
l
x x x x x l
representa um fatorial
descendente.
16
De uso mais corrente que a função geradora de probabilidade tem-se a
função geradora de momentos definida por
X
X
t
m t E e
(Mood, Graybill
& Boes, 1974, página 78).
Uma observação interessante é que, a função geradora de probabilidade
e a função geradora de momentos estão relacionadas. Tal fato, não se encontra
explicitado na maioria dos textos usuais de Estatística Matemática. Esta relação
é:
ln
ln
XX
XX
z
G z E z E e m z
.
A função geradora de probabilidade é também chamada de função
geradora de momentos fatoriais, pois é usada para gerar momentos fatoriais do
mesmo modo como os momentos usuais são obtidos a partir da função geradora
de momentos,
[]
tX
X
m t E e
, exceto que
z
se aproxima de 1 em vez de 0.
X
G z E z
X
XX
xx
d d d
G z E z z f x dx z f x dx
dz dz dz
11X
X
x
xz f x dx E Xz
1
lim
z
G z E X
11
XX
xx
dd
G z xz f x dx xz f x dx
dz dz
12
2
11
XX
X
x
x x z f x dx E X X z
1
lim 1
z
G z E X X
17
32
1
X
x
d
G z x x z f x dx
dz
..
..
..
1 2 ...
1 ... 1
X X X l
l
G z E X X X l z
1
1 lim 1 ... 1
ll
z
G G z E X X X l
1
l
l
Gm
Observe que, a média e a variância de
X
são:
1E X G
2.2
2
2
Var X E X E X
2.3
Sendo
2
11G E X X E X E X
, segue que
2
1 1 1E X G E X G G
2.4
Substituindo
2.4
em
2.3
2
1 1 1Var X G G G
1 1 1 1G G G
2.5
18
A importância da função geradora de momentos fatoriais fica evidente
no seguinte teorema.
Teorema 1: Se
X
e
Y
são variáveis aleatórias independentes com
função geradora de momentos fatoriais iguais, então
X
e
Y
tem a mesma
distribuição de probabilidade (Mood, Graybill & Boes, 1974).
Para algumas variáveis aleatórias (usualmente as discretas), os
momentos fatoriais podem ser facilmente obtidos a partir dos momentos usuais e
vice-versa.
Exemplo 8: Seja
X
uma variável aleatória com distribuição de Poisson com
parâmetro . Sua função geradora de probabilidade é dada por
2
0 1 2
0
...
x
x
x
G z p z p p z p z
23
2! 3!
e z e z
e e z
23
1
1.
2! 3!
z
z
zz
e z e e e
2.6
Assim,
1
1
1.
z
z
E X G e
1 1 1 1Var X G G G
Como
1
22
1
1
z
z
Ge
, segue que
2
1.Var X
19
Exemplo 9: Seja
X
uma variável aleatória com distribuição logarítmica,
1,2,3,...
;I
ln
x
q
f x p x
xp
. A função geradora de probabilidade da
distribuição logarítmica é dada por
23
1 2 3
...
X
G z p z p z p z
2 3 2 3
1
ln 2ln 3ln ln 2 3
qz qz qz qz
qz
qz
p p p p

Sendo
23
1
ln
1 2 3
qz qz
qz
qz
Anton (2000), obtém-se,
1
1 1 1
ln ln 1
ln 1 ln
X
G z qz
p qz p
ln 1
1
ln 1
ln ln
qz
qz
pp
2.7
#
Exemplo 10: Seja
X
uma variável aleatória contínua com distribuição
gama
,
. A função geradora de probabilidade da variável
X
é dada por
0,
1
Gama , I
X
x
X f x x e x
1
0
X
XX
x
xx
G z E z z f x z x e dx
20
11
00
ln
1
zx
x
x
z x e dx x e dx
1
0
ln
ln
ln
zx
z
x e dx
z
ln z
.
2.8
#
2.2.1 Função geradora de probabilidade da mistura de distribuições
Seja
X
uma variável aleatória com função de probabilidade
;fx
e
função geradora de probabilidade
X
Gz
. Considere a variável aleatória
X
com distribuição
;h x f x g d
em que
g
é uma distribuição
para o parâmetro .
A função geradora de probabilidade de
X
,
X
Gz
é dada por
XX
G z G z g d
.
Prova:
;
X
X
xx
G z E z z h x dx z f x g d dx
;
X
x
z f x dx g d E z g d
X
G z g d
#
21
Os momentos fatoriais das distribuições resultantes de mistura de
distribuições são obtidos pela derivação de
X
Gz
.
Outra forma de obter os momentos é dada por Gerstenkorn (2004).
l
l
l
m E X E X g d
2.9
sendo representado por
l
E X g
, em que
l
EX
é o momento
fatorial da distribuição original.
Prova:
;
l l l
E X X h x dx X f x g d dx
;
l
g X f x dx d
l
E X g d
#
2.2.2 Função geradora de probabilidade da soma de um número aleatório
de variáveis aleatórias independentes.
Sejam X e Y variáveis aleatórias independentes e
S X Y
.
X Y X Y X Y
XY
S
G z E z E z z E z E z G z G z
22
No caso em que
X
e
Y
são variáveis aleatórias discretas não negativas,
j
a P X j
e
k
b P Y k
, o evento
,X j Y k
tem probabilidade
j
k
ab
. O evento
Sr
é a união dos eventos mutuamente excludentes
0, 1, 1 ... , 0 .S r X Y r X Y r X r Y
Portanto,
0 1 1 2 2 0
...
r r r
rr
c P S r a b a b a b a b
2.10
A sequência
r
c
definida por
2.10
é dita convolução das
sequências
k
a
e
k
b
e é usualmente denotada por
k k k
c a b
. Essa
fórmula segue diretamente de
XY
G z G z
, pois
2 3 2 3
0 1 2 3 0 1 2 3
... ...
XY
G z G z a a z a z a z b b z b z b z
2
0 0 0 1 1 0 0 2 1 1 2 0
...a b a b a b z a b a b a b z
Uma situação importante em aplicações é a seguinte: seja N uma
variável aleatória, assumindo valores inteiros,
1N
. Considere
12
...
NN
S X X X
a soma de variáveis aleatórias
i
X
, independentes e
identicamente distribuídas (i.i.d.) em que N, o número de termos da soma é
também uma variável aleatória independente dos
i
X
. Seja
n
p P N n
a
distribuição de N e
N
Gz
sua função geradora de probabilidade. A função
geradora de probabilidade de
N
S
é dada por
23
NN
N
SS
S
G z E z E E z N
(Mood, Graybill & Boes, 1974)
1 2 1
...
...
NN
X X X X X
E E z N E E z z N
N
X N X
E G z G G z
2.11
Portanto, tem-se uma propriedade simples para o cálculo da função geradora de
probabilidade de
N
S
, dada pela composição de funções,
N
NX
S
G z G G z
.
Exemplo 11: Seja
i
X
variáveis aleatórias com distribuição Bernoulli
p
e
N
com distribuição de Poisson . Defina
12
...
NN
S X X X
.
Bernoulli
X
i
X p G z q pz
1
Poisson
N
z
N G z e
N
NX
S
G z G G z
1
1
q pz
pz
ee
1
Poisson
N
N
S
pz
G z e S p
2.3 Distribuições generalizadas
O importante conceito de soma de um mero aleatório de variáveis
aleatórias i.i.d nos leva ao seguinte conceito.
24
Considere
X
e
Y
variáveis aleatórias com funções geradoras de
probabilidades
X
Gz
e
Y
Gz
. Define-se a distribuição generalizada de
X
com
Y
como a variável aleatória
XY
cuja função geradora de
probabilidade é dada por
XY
G G z
. Esse procedimento é também um
mecanismo adequado para se gerar novas distribuições.
Uma aplicação deste conceito é descrito por Pielou (1977) e enunciada
no exemplo abaixo. Suponha que fêmeas de insetos depositem grupos de ovos
em unidades (folhas), representação na Figura 4. Considere que os grupos de
indivíduos (larvas) constituem entidades tendo um padrão específico e que o
número de indivíduos por grupo seja também uma variável aleatória com sua
própria distribuição.
FIGURA 4: Padrão espacial agrupado.
Considerando
X
Gz
a função geradora de probabilidade relativa à
variável
X
: número de grupos por unidade (folha), em que
X
é uma Poisson,
25
e
Y
Gz
a função geradora de probabilidade da variável
Y
: número de
indivíduos por grupo,
Y
tendo distribuição logarítmica, a distribuição do
número de indivíduos por unidade é
dada por
1
Poisson
X
z
X G z e
equao 2.6
ln 1
Log
ln 1
Y
qz
Y p G z
q
equao 2.7
ln 1
exp 1
ln 1
XY
qz
G G z
q
Fazendo a reparametrização,
lnrp
em que
1pq
tem-se,
ln 1
exp ln 1
ln 1
ln 1
exp ln exp ln
ln
exp ln 1 exp ln
XY
qz
G G z r p
q
qz
r p r p
p
r qz r p
1
1
r
r
r
p
qz p
qz
#
26
que, como visto em
2.1
, representa a função geradora de probabilidade da
distribuição binomial negativa. Em termos de soma de um número aleatório de
variáveis aleatórias, pode-se considerar que a distribuição binomial negativa
resulta de uma soma de
N
variáveis aleatórias i.i.d com distribuição
logarítmica
p
em que
N
tem distribuição Poisson .
É interessante notar que, a distribuição binomial negativa pode ser
obtida por dois processos diferentes, pela mistura das distribuições Poisson e
gama,
Poisson Gama ,
, como também pela generalizada das
distribuições Poisson e logarítmica,
Poisson Log p
. Pielou (1977)
discute as consequências deste fato que serão analisadas na seção Resultados e
Discussão.
Outra aplicação da distribuição generalizada surge se for considerado
que, na distribuição espacial de larvas por unidade de área, a variação no número
de grupos de ovos por unidade pode ser representada por uma distribuição de
Poisson com parâmetro e o número de larvas que se desenvolve dentro de
cada grupo como uma variável Poisson com parâmetro .
1
Poisson
X
z
X G z e
1
Poisson
Y
z
Y G z e
A distribuição do número de larvas por unidade de área será dada então
por
Poisson Poisson
, que é uma Neyman Tipo A ou Poisson-Poisson
(Pielou, 1977).
27
A função geradora de probabilidade, definida por
XY
H z G G z
, é
exp exp 1 1H z z
.
Fazendo a expansão em série da função geradora de probabilidade,
obtém-se a função densidade de probabilidade da distribuição Neyman tipo A,
que é dada por
0
0,1,2,...
!!
x
ee
h x x
x
.
Os dois primeiros momentos da distribuição generalizada são,
1z
E X G z
1
exp exp 1 1 exp 1
z
zz
Sendo
1 1 1 1Var X G G G
e
2
2
1G
,
obtémse
2
2
11Var X
. #
Definição 2: Considere
1
X
e
2
X
variáveis aleatórias com função de
distribuição
1
;Fx
,
2
;Fx
respectivamente. Se para cada existe um
tal que
12
;;F x F x
qualquer que seja
x
, então as variáveis
aleatórias
1
X
e
2
X
são ditas equivalentes,
12
XX
.
Para certas classes de distribuições, o resultado obtido pela mistura de
28
;f x g
é essencialmente igual ao obtido pela generalizada de
;g f x
. Tal fato é obtido pelo teorema.
Teorema 2: (Gurland, 1957) Seja
X
uma variável aleatória com função
geradora de probabilidade
X
G z h z
, onde é um parâmetro dado.
Suponha que seja uma variável aleatória
cY
, tal que
cY
onde
c
é uma
constante e
Y
possui função densidade de probabilidade
Y
fy
e função
geradora de probabilidade
Y
Gz
. Então, qualquer que seja a variável
Y
, a
variável
XY
é equivalente à variável
YX
,
X Y Y X
.
Prova: Tem-se que,
;X f x
,
X
G z h z
. Considerando
cY
,
Y g y
e
Y
Gz
sua função geradora de probabilidade, a mistura
das distribuições é dada por
;
c
h x f x g y f x g y dy
Sendo
XY
Gz
a função geradora de probabilidade da mistura, segue que
;
X
XY
xx
G z E z z h x dx z f x g y dy dx
;
X
g y z f x dx dy g y h z dy
cy
h z g y dy
29
A função geradora de probabilidade de
YX
é
Y X Y
y
G G z G h z E h z
y
y
h z g y dy h z g y dy
Assim, quando
c
temos que
X Y Y X
. #
Exemplo 12: Seja
X
uma variável aleatória com distribuição binomial negativa,
,BN r p
. Considere
r
uma variável aleatória com distribuição gama
,
.
Temos,
BN , Gama ,
r
rp
,
1
X
r
p
X BN r p G z
qz
equaçao 2.1
Considere
r cy
em que
Gama ,Y
. A função geradora de
probabilidade da mistura é dada por
1
0
1
cy
y
p
G z y e dy
qz
1
1
0
ln lncy p qz
y
e y e dy
30
1
1
0
ln ln
1
c qz p y
y e dy
ln 1 ln
ln
1
c qz p
p
c
qz
.
Gama , BN ,rp
Gama ,
ln
Y
Y G z
z
equaçao 2.8
BN ,
1
X
r
p
X r p G z
qz
Então,
1
ln
ln
1
1
Y X Y
r
r
p
G G z G
qz
p
p
r
qz
qz
Portanto, quando
rc
tem-se que
BN , Gama , Gama , BN , .
r
r p r p
#
O uso das distribuições generalizadas torna-se muito útil como um
recurso auxiliar na obtenção de determinadas misturas. Como para certas
31
distribuições, fazer a mistura é equivalente a fazer a generalizada, usa-se este
artifício para evitar cálculos muito complexos.
Exemplo 13: Considere novamente a situação descrita no exemplo 3, porém,
admita que o número de ovos observados em cada grupo
i
é também uma
variável aleatória. Adote a extensão da variável binomial feita no exemplo 4.
Em cada grupo
i
, a quantidade de larvas será o resultado de
n
ensaios
de Bernoulli, assim, o total de ovos
i
Y
que eclodem em cada grupo será dado
por uma binomial,
Bin ,
i
Y n p
. Então, em cada unidade tem-se uma soma de
Binomiais e o total de larvas é dado por
12
...
N
Y Y Y
. Como cada
i
Y
representa uma soma de variáveis Bernoulli, pode-se representar o total de larvas
por
12
...
nN
X X X
, que é uma soma aleatória de variáveis Bernoulli.
Bernoulli
iX
X p G z q pz
Considere que o número de termos desta soma segue uma distribuição
Poisson . Portanto,
00
nN
kk
kk
G z P nN k z P N k n z
00
!!
kk
nn
kk
kk
e
z e z
kk
nn
Fazendo
k
s
n
tem-se que, quando
0
k
s
n
0,1,2,3,...s
,
0k
0, ,2 ,3 ,...k n n n
. Então,
32
00
!!
n
nN
s
s
sn
ss
z
G z e z e
ss
1
n
n
z
z
e e e
1
n
nN X nN
q pz
G G z G q pz e
#
nN X
G G z
representa a função geradora de probabilidade da distribuição do
número de larvas por unidade quando é assumido que
N
é uma variável
Poisson.
2.4 A mistura das distribuições binomial negativa e beta.
Considere uma sequência de ensaios de Bernoulli realizada de forma
independente com probabilidade
p
constante e defina
X
como o número de
fracassos anteriores ao r-ésimo sucesso. A variável aleatória
X
segue o modelo
binomial negativo com parâmetros
r
e
p
, em que
01p
e
0r
, e tem
função densidade de probabilidade dada por:
0,1,2,...
1
; , 1 I
x
r
rx
f x r p p p x
x
2.12
Quando
r
é um número inteiro positivo,
2.12
pode ser interpretada como a
distribuição do tempo de espera para a ocorrência do r-ésimo sucesso, sendo
também conhecida por distribuição Pascal (Feller, 1968). Para
1r
ela se reduz
a distribuição geométrica. A distribuição binomial negativa (BN) apresenta uma
33
propriedade importante, a variância excede a média. Essa característica é, às
vezes, referida como superdispersão.
A distribuição binomial negativa tem exercido um importante papel para
descrever a distribuição de pragas (insetos) em lavouras de determinadas
culturas (Bearzoti, 1998). Dado uma plantação, define-se uma unidade espacial
na qual conta-se o número de insetos presentes na unidade. Sabe-se que a
presença de insetos em uma determinada unidade é afetada pela maior ou menor
densidade nas unidades vizinhas (isso ocorre em geral com pulgões e
colchonilhas). Se a presença de indivíduos em uma unidade depende das outras
unidades, a pressuposição de que
p
é constante é violada, tornando a aplicação
da binomial negativa inadequada. Uma forma de contornar o problema da
variabilidade de
p
é supor que
p
varia segundo uma distribuição beta
1
0,1
1
1
1I
,
b
a
g p p p p
ab
Neste caso, obtém-se como mistura a distribuição discreta beta binomial
negativa (BBN) dada por
1
0
; , , ;h x a b r f x p g p dp
.
1
1
0
1
1
1
1
,
b
r x a
rx
h x p q p p dp
x
ab
1
0
1
1
1
1
1
,
xb
ra
rx
p p dp
x
ab
34
1
0
1
1
1
,
1
1
,,
xb
ra
rx
r a x b
p p dp
x
a b r a x b
0,1,2,...
1
,
I
,
rx
r a x b
x
x
ab
2.13
#
Utilizando-se a função beta em termos da função gama
,
ab
ab
ab
,
0a
e
0b
e as relações
1t t t
e
1!tt
, para
t
inteiro,
equação
2.13
pode ser expressa em termos da função gama,
1
; , ,
rx
r a x b a b
h x a b r
x
a b r x a b
2.14
Considere
1 2 ... 1
n
xn
x x x x x n
x
em que
n
x
representa um fatorial ascendente. A equação
2.14
pode ser reescrita como,
1 ... 1 1 ... 1
1
; , ,
1 ... 1
a a a r b b b x
rx
h x a b r
x
a b a b a b r x
11
00
1
0
1
rx
ii
rx
i
a i b i
rx
x
ab
35
que, também, pode ser representada em termos de fatoriais ascendentes
; , ,
!
x r x
rx
r a b
h x a b r
x a b
2.15
Exemplo 14: Seja
X
uma variável aleatória com distribuição beta binomial
negativa
3, 5, 7a b r
.
10 5 8 9! .105
;3,5,7
15 3 5 14 13 5
x
hx
x x x x
O gráfico de
;3,5,7hx
encontra-se na Figura 5.
FIGURA 5: Beta binomial negativa (3, 5, 7)
Outras representações gráficas da distribuição beta binomial negativa
(BBN) são dadas na Figura 6.
36
a) BBN
( 3, 10, 2)a b r
b) BBN
( 10, 3, 2)a b r
c) BBN
( 10, 10, 10)a b r
d) BBN
( 3, 2, 10)a b r
e) BBN
( 0,6, 5, 3)a b r
f) BBN
( 0,6, 0,8, 10)a b r
FIGURA 6: Gráficos da distribuição beta binomial negativa para diferentes
valores dos parâmetros
,ab
e
r
.
37
2.4.1 Função geradora de momentos fatoriais da BBN.
1
0
ll
p
l
m E X E X g p dp
equao 2.9
. Os
momentos fatoriais da mistura o obtidos como uma média dos momentos
fatoriais da distribuição original
l
p
l
m E X
é o l-ésimo momento fatorial
da distribuição binomial negativa. Tem-se que:
1
X
r
p
Gz
qz
Diferenciando
Gz
e tomando
1
lim
l
z
Gz
obtém-se
1
1
r
r
d
G z rqp qz
dz
2
2
2
2
11
r
r
d
G z r r q p qz
dz
..
..
..
1
1 1 2 ... 1 1
l
rl
lr
l
z
d
G r r r r l q p qz
dz
1 1 ... 1 ,
ll
l
l
l
l
d q q
G r r r l r m BN r p
pp
dz
38
Sendo,
1
0
,,
l
p
l
m BBN a b r E X g p dp
, segue que
1
1
1
0
1
1
,
l
l
b
a
q
r p p dp
p a b
1
1
1
0
1
1
,
al
l
bl
r p p dp
ab
1
1
1
0
11
,1
,,
al
l
bl
r a l b l p p dp
a b a l b l
e, portanto, o l-ésimo momento fatorial da distribuição beta binomial negativa é
dado por
,
,,
,
l
l
a l b l
m BBN a b r r
ab
2.16
2.4.2 Média e variância
Como
,
,,
,
l
l
a l b l
m BBN a b r r
ab
.
1
1m BBN G E X
1, 1 1 1
,
a b a b a b
rr
a b a b a b
1
rb
a
para
1a
.
39
Sendo,
1 1 1 1Var X G G G
e
2, 2
11
,
ab
G r r
ab
22
1
a b a b
rr
a b a b
21
1
1 2 2
a b b b a b
rr
a b a a a b
11
12
rb r b
aa
tem-se,
2
11
1 2 1 1
rb r b
rb rb
Var X
a a a a
2
11
12
rb r a a b
aa
para
para 2a
.
Observa-se que, assim como a distribuição binomial negativa, a beta
binomial negativa apresenta variância maior que a média.
Diferente do exposto em Hassan e Bilal (2008), a distribuição beta
binomial negativa, referida pelos autores como “Negative Polya-Eggenberger
Distribution”, não apresenta todos os momentos. Os momentos existem somente
até a ordem
la
, onde
l
representa o momento a ser calculado e
a
, um dos
parâmetros da distribuição. A distribuição beta binomial negativa
2,5,3
, por
exemplo, apresenta apenas o primeiro momento.
40
2.5 Unimodalidade
Definição 3: Uma variável aleatória
X
é dita unimodal se existe um valor
0
x
tal que
X
fx
é estritamente crescente à esquerda de
0
x
e estritamente
decrescente à direita de
0
x
. Caso
X
fx
seja diferençável,
0
0
X
fx
. O
valor
0
x
é chamado de moda.
2.5.1 Unimodalidade da dbistribuição beta
Seja
P
uma variável aleatória com distribuição beta
1
1
0,1
1
; , 1 I
,
P
b
a
f p f p a b p p p
ab
Como
fp
é diferençiável, tem-se
1
ln ln 1 ln 1 ln 1
,
f p a p b p
ab
ln
11
0
1
d f p
ab
dp p p
1
1 1 1 0 , 1
2
a
a p b p p a b
ab
Um estudo desses pontos críticos nos que a distribuição é unimodal
para
1a
e
1b
. Na Figura 7 ilustram-se alguns possíveis casos da
distribuição beta para diferentes valores dos parâmetros
a
e
b
.
41
a) Beta
( 0,2, 0,6)ab
b) Beta
( 1, 1)ab
c) Beta
( 0,2, 3)ab
d) Beta
( 3, 0,2)ab
e) Beta
( 3, 8)ab
f) Beta
( 8, 3)ab
FIGURA 7: Gráficos da distribuição beta
42
Observam-se na Figura 7, itens de a até d, que a distribuição beta
não apresenta moda. Porém, nos itens e e f, a distribuição é unimodal e a moda
ocorre no ponto
1
2
a
p
ab
. Na beta (3,8) a moda é
0.22p
e na beta (8,3)
a moda é
0.78p
.
2.5.2 Unimodalidade da distribuição binomial negativa
Considere
X
uma variável aleatória com distribuição binomial
negativa,
0,1,2,...
1
; , 1 I
X
x
r
rx
f x r p p p x
x
Se
0
x
é uma moda da distribuição, tem-se:
0
0
0
0
1
1
1
1
Px
Px
Px
Px
Resolvendo as desigualdades,
0
0
00
1
0
00
0
0
0
1
1
1
11
2
1
1
1
x
r
x
r
rx
pp
x
P x r x q
rx
P x x
pp
x
43
1
0
0
00
0
00
0
0
0
1
1
11
11
1
1
1
x
r
x
r
rx
pp
x
P x r x p
rx
P x x
pp
x
obtém-se
0
0
0
0
0
0
1
1
1 se
1
1 se
1
Px
rq
x
P x p
P x r q
x
P x p
Portanto a moda da distribuição binomial negativa ocorre no valor
0
x
tal que
0
1
1
rq
rq
x
pp
Uma análise desses pontos críticos realizada por Johnson, Kotz e Kemp
(1992), mostra que:
Quando
1rq
p
não é um número inteiro, Figura 8, a distribuição é
unimodal;
44
FIGURA 8: Binomial negativa
5, 0,3rp
Quando
1rq
p
é inteiro, a distribuição apresenta duas modas nos
pontos
0
1rq
x
p
e
0
1rq
x
p
, Figura 9.
FIGURA 9: Binomial negativa
5, 0,08rp
45
Na distribuição binomial negativa (5, 0,08) os pontos
0
45x
e
0
46x
são
os valores da moda da distribuição.
Quando
1rq
, o ponto
0
0x
é a moda, Figura 10.
FIGURA 10: Binomial negativa
5, 0,9rp
Outra maneira interessante de se obter a moda da binomial negativa é
utilizar o fato de que a função gama generaliza o fatorial permitindo assim uma
extensão contínua. Desta forma, é possível derivar obtendo-se uma aproximação
do valor da moda.
0,1,2,...
1
; , 1 I
X
x
r
rx
f x r p p p x
x
0,1,2,...
1I
1
x
r
rx
p p x
rx
ln ln ln ln 1 ln ln 1f x r x r x r p x p
46
Sendo
ln xr
xr
x
(ver apêndice),
tem-se
ln
1 ln 1 0
fx
r x x p
x
1
1
1
1 ln 1 0
r
k
x x k x p
x
1
1
1
1 ln 1
r
k
x k p
x
1
2
1 ln 1
r
k
x k p
Conhecendo-se os valores dos parâmetros
r
e
p
é possível, com o
auxílio de um software, obter uma aproximação para o valor da moda.
2.5.3 Unimodalidade de misturas
Holgate (1970) discute a unimodalidade de algumas misturas
envolvendo a distribuição de Poisson.
Teorema 3: Seja
g
a função densidade de probabilidade de uma
variável aleatória positiva, contínua e unimodal.
47
A variável aleatória com função densidade de probabilidade dada por
0
1
!
x
h x e g d
x
é uma variável unimodal.
Baseado no Teorema 3 confirma-se novamente que a distribuição
binomial negativa é unimodal pois
Binomial Negativa Poisson Gama
e a distribuição gama assume valores positivos, é continua e unimodal.
A unimodalidade da distribuição beta binomial negativa é estudada por
Hassan e Bilal (2008). Os autores justificam a unimodalidade da distribuição
com base nos resultados obtidos por Holgate (1970). No entanto, para tal
afirmação ser um corolário do Teorema 3, faz-se necessário provar a
unimodalidade da distribuição resultante da mistura das distribuições gama e
beta, pois
Beta Binomial Negativa Binomial Negativa Beta
porém,
Binomial Negativa Poisson Gama
então,
Beta Binomial Negativa Poisson Gama Beta
Provar a unimodalidade da mistura das distribuições gama e beta parece
ser um problema mais difícil que a própria prova da unimodalidade da beta
48
binomial negativa. Os autores não apresentam uma discussão sobre essa questão.
Um intervalo contendo a moda da beta binomial negativa é obtido no teorema
abaixo.
Teorema 4: (Hassan e Bilal, 2008) A distribuição beta binomial negativa é
unimodal para todos os valores de
,,a b r
e a moda ocorre em
0x
se
1rb
e para
1rb
a moda é algum outro ponto
xM
tal que
1 1 1
11
r b a b r b
M
aa
.
Prova: Seja
0,1,2,...
1
,
; , , I
,
rx
r a x b
h x a b r x
x
ab
.
A razão
1
1
P x r x b x
P x x a b r x
2.17
é menor que um, isto é
1
1
Px
Px
se
1 , , 0rb a b r
.
Então, para
1rb
, a razão
1Px
Px
é uma função monótona decrescente e a
moda existe e ocorre no ponto
0x
.
Suponha que para a moda seja igual a
xM
. Então,
2.17
fornece
duas desigualdades
49
1
11
1
11
11
11
P M M r M b
P M M a b r M
P M M r M b
P M M a b r M
Resolvendo o sistema em
M
, obtêm-se as seguintes desigualdades
1
1
r b a b
M
a
e
11
1
rb
M
a
.
Portanto,
1 1 1
11
r b a b r b
M
aa
#
50
3 MATERIAL E MÉTODOS
3.1 Dados
Diferentes conjuntos de dados da literatura foram utilizados no trabalho.
Esses foram analisados anteriormente pela distribuição binomial negativa. Um
estudo semelhante é feito, utilizando-se a distribuição beta binomial negativa.
Os dados estudados são relativos à contagem do número de número de
Cáries por criança, Tabela 1, (Gurland, 1959); número de acidentes por
maquinista, Tabela 2, (Bliss e Fisher, 1953); número de plantas Salicornia
stricta por quadrado, Tabela 3, (Bliss e Fisher 1953) e número de ácaros por
folha, Tabela 4, (Bliss e Fisher 1953).
3.2 Simulação de distribuições obtidas por misturas
Foram desenvolvidas rotinas em R, versão 2.8.0, com o objetivo de
implementar o algoritmo mistura, Devroye (1986). Uma validação matemática
para o algoritmo é apresentada posteriormente.
Algoritmo mistura:
i) Um valor do parâmetro é simulado a partir de
g
;
ii) Com o valor de
obtido no passo anterior, um valor
x
é simulado
a partir de
;fx
;
iii) Os passos i e ii são repetidos
n
vezes resultando na amostra
aleatória de tamanho n.
51
Com o algoritmo mistura, foram simulados dados das distribuições
Normal, binomial negativa e beta binomial negativa.
3.3 Estimação e ajuste
Um sistema de equações de máxima verossimilhança aproximado é
obtido e os valores estimados para cada conjunto de dados são determinados
com o auxílio do software Maple versão 11.
A estatística utilizada para testar a qualidade do ajuste da distribuição
beta binomial negativa aos dados é dada por
2
2
1
c
k
ii
i
i
Fo Fe
Fe
em que
i
Fe
Freqüência esperada de elementos na categoria
i
;
i
Fo
Freqüência observada de elementos na categoria
i
;
k
Número de categorias.
A distribuição da estatística
2
c
é aproximada por uma distribuição qui-
quadrado com
1k
graus de liberdade. Quando o modelo a ser testado
envolve a estimação de parâmetros desconhecidos
2
c
tem distribuição
aproximada de qui-quadrado com
1kt
graus de liberdade, em que
t
é o
número de parâmetros estimados no modelo pelo método da máxima
verossimilhança.
52
Um teste de ajuste é realizado considerando-se um nível de significância
0,05
.
Alguns autores, dentre eles Bliss e Fisher (1953), recomendam que as
freqüências esperadas nas categorias não sejam inferiores a 5. Caso isso ocorra,
as categorias devem ser agrupadas em uma única categoria antes do cálculo de
2
c
. Desse modo, o número de graus de liberdade, para os dados das Tabelas 2,
3 e 4, é calculado segundo essa metodologia.
53
4 RESULTADOS E DISCUSSÃO
4.1 Simulando misturas
Uma validação matemática do algoritmo mistura é apresentada no teorema.
Teorema 5: O algoritmo mistura simula uma amostra da distribuição
;h x f x g d
.
Prova: Suponha e o domínio de
;fx
intervalos reais finitos,
representados na Figura 12.
Considere em uma partição em subintervalos de tamanho ,
nos quais toma-se um ponto central que serão indexados por
1
,..., ,...,
jk
.
Da mesma forma, uma partição para o domínio de
;fx
é realizada,
obtendo-se os pontos
1
,..., ,...,
im
x x x
. Assim, pode-se obter as distribuições
discretas
, 1,...,
j
g
jk
S
, onde
1
k
j
j
Sg
,
e
,
, 1,...,
j
i
f x x
im
S
,
1
;
m
ij
i
S f x x
,
que aproximam as densidades
g
e
,
j
fx
. Portanto a distribuição
hx
é aproximada por
54
1
, , 1,...,
jj
j
i
f x g x i m
SS
Utilizando a distribuição
, 1,...,
j
g
jk
S
, uma amostra de tamanho
n
é
obtida. Ordenando-se essa amostra e observando que valores repetidos de
j
são
obtidos, tem-se, pela lei dos grandes números, que o número de vezes que um
determinado
j
aparece na amostra é aproximadamente igual a
j
g
n
S
.
j
2
1
i
x
2
x
1
x
FIGURA 11: Discretização do parâmetro e da
variável
x
.
55
12
1 1 1 2 2 2
...
k
g n g n
gn
SS
S
k k k
n

Para cada valor de
j
, um valor
i
x
é simulado utilizando-se a
distribuição
,
j
i
f x x
. Ordenando-se os valores de
i
x
, tem-se que o
número de vezes que um valor
i
x
aparece na amostra de tamanho
n
é
aproximadamente
2
j
j
f x x g n
SS
12
1 1 2 2
... ... ... ...
...
... ... ...
j
m j j
j j j j
gn
S
f x x g n
f x x g n f x x g n
SS
S S S S
j j j j j j
mm
x x x x x x

Portanto, o número de vezes que um valor que um valor
i
x
aparece na
amostra de tamanho n é aproximadamente
1
,
jj
j
i
f x g x
SS
.
Fazendo
0
e
0x
, obtém-se
56
1
lim , ;
i
i
jj
i
i
f x g x f x g d h x
SS
#
4.2 Estimadores de máxima verossimilhança
Hassan e Bilal (2008) propõem um sistema de equações de verossimilhança
aproximadas. No entanto, foram detectados alguns erros na dedução das
fórmulas. A saber, foi utilizada a aproximação
1
ln
2
xx
x
As aproximações adequadas são
1
ln
2
xx
x
ou
ln 0.5xx
E também no uso da relação de recorrência
1
1
1
n
k
x n x x k
Neste trabalho, foram deduzidas novas aproximações das equações de
máxima verossimilhança.
57
4.2.1 Sistema de equações aproximadas para o cálculo dos estimadores de
máxima verossimilhança
Seja
X
uma variável aleatória
BBN , ,a b r
com função densidade de
probabilidade dada por
0,1,2,...
1
,
I
,
!
x r x
rx
rx
r a x b
r a b
h x x
x
ab
x a b
4.1
Porém,
1 2 ... 1
1
r
x
a b r
rx
ab
a b a b a b a b a b r
a b r a b r a b r x


rx
rx
a b a b a b r
.
Assim,
4.1
pode ser escrita como
; , ,
!
x r x
rx
r a b
h x a b r
x a b a b r
4.2
Considere
11
,...,
nn
X x X x
uma amostra aleatória desta população.
Os estimadores de máxima verossimilhança dos parâmetros
a
,
b
e
r
são
aqueles que maximizam a função de verossimilhança
58
1
1
, , ; ,..., ; , ,
n
n
i
i
L L a b r x x h x a b r
11
!!
i i i i
ii
n
x x x x
rr
nn
r
r x x
ii
ii
r a b a r b
L
ab
x a b a b r x a b r
A amostra
1
,...,
n
xx
é uma coleção de números inteiros com possíveis
repetições. Coletando-se os valores iguais desta seqüência e denominando de
x
f
o número de vezes que o inteiro
x
aparece na amostra
1
,...,
n
xx
e
0
x
f
para indicar que o inteiro
x
não apareceu na seqüência. Desta forma, pode-se
fazer o somatório em
x
f
para
x
variando de zero até infinito. Note que neste
caso,
0
x
x
fn
.
Para obter os máximos da função de verossimilhança é comum o uso da
função
1
ln , , ; ,...,
n
L a b r x x
, pois facilita o processo algébrico nos
procedimentos de maximização.
ln ln ln ln ln
r
r x x
xx
L n a a b f r f b
ln ln !
x
xx
f a b r f x
4.3
Desenvolvendo-se os fatoriais em
4.3
,
59
ln ln 1 ... 1 ln ln 1 2 ...L n a a a r a b a b a b
... 1 ln 1 ... 1 ln
xx
a b r f r r r x f b
... 1 ln ! ln 1 ...
xx
b x f x f a b r a b r
1a b r x
1 1 1
0 0 0
ln ln ln ln
r r x
x
k k k
L n a k a b k f r k
11
00
ln ln ! ln
xx
x x x
kk
f b k f x f a b r k
Para encontrar os estimadores de máxima verossimilhança basta tomar
as derivadas parciais da função
1
ln , , ; ,...,
N
L a b r x x
em relação aos
parâmetros
a
,
b
e
r
, igualar a zero e resolver as equações. Portanto,
1 1 1
0 0 0
ln
1 1 1
1
r rx
x
k k k
L
n n f
a a k a b k a b r k
1 1 1
0 0 0
ln
1 1 1
2
x r x
xx
k k k
L
f n f
b b k a b k a b r k
ln ln
ln ln
3
ln
r
rx
x
x
x
L a b
ar
n n f
r r r r
a b r
f
r
60
Convertendo a 3ª equação em termos da função gama tem-se:
ln ln ln
ln
x
x
a r a b r r x
n n f
r a r a b r r
a b r x
f
r a b r
segue que,
ln ln ln ln ln
ln ln ln
ln
0
x x x
x
L a r a a b r a b
n n n n
r r r r r
r x r a b r x
f f f
r r r
a b r
f
r
portanto,
ln ln ln ln
x
L a r a b r a b r x
n n f
r r r r
ln ln ln
x x x
r r x a b r
f f f
r r r
4.4
A diferenciação da equação
4.4
não é direta e pode ser resolvida com
o auxílio de uma relação de recorrência apresentada por Johnson, Kotz e Kemp,
(1992), (ver apêndice),
1
1
1 , 1,2,...
n
j
x n x x j n
4.5
61
em que
ln
x
d
xx
dx x
é chamada função digama ou função
psi. Uma boa aproximação para
x
é
1
ln
2
xx
x
4.6
Substituindo
4.6
em
4.5
1
1
1
ln 1 , 1,2,...
2
n
j
x n x x j n
x
4.7
Aplicando
4.7
em
4.4
ln
x
L
n a r a b r f r a b r
r
r x a b r x
11
1 1 1 1 1
ln ln ln
2 1 2 1 2
a a b
x
kk
n r r f r
r r k r r k r
11
1 1 1 1
ln ln
2 1 2 1
a b x
kk
rr
r r k r r k
1
11
ln
21
a b x
k
r
r r k
62
obtém-se a terceira equação da verossimilhança,
1 1 1
11
ln
1 1 1
1 1 1
11
11
a a b a b
x
k k k
x a b x
kk
L
nf
r r k r k r k
r k r k
O sistema obtido
ˆ
1 1 1
0 0 0
1 1 1
0 0 0
11
ˆ
ˆ
ˆ
ˆˆ
ln 1 1 1
0
ˆˆ
ˆ
ˆ ˆ ˆ
ln 1 1 1
0
ˆ ˆ ˆ
ˆ ˆ ˆ
ln 1 1 1
ˆ ˆ ˆ
11
r rx
x
k k k
x r x
xx
k k k
a a b
x
kk
L
n n f
a a k
a b k a b r k
L
f n f
b
b k a b k a b r k
L
nf
r r k r k r k
1
11
ˆ
ˆ
ˆ
ˆ
1
11
0
ˆˆ
11
ab
k
x a b x
kk
r k r k
pode ser resolvido utilizando-se um software de computação algébrica.
verossimilhança. Neste trabalho utilizou-se o software Maple, versão 5.
63
4.3 Ajustes
Considere os dados, tabela 1, do número de Cáries que se desenvolvem
em crianças de 12 anos, analisados por Gurland (1959) pela binomial negativa.
Sendo
ˆ
2,5a
,
ˆ
2b
e
ˆ
2r
, estimativas de máxima verossimilhança, um
ajuste via beta binomial negativa é também realizado, Figura 12.
TABELA 1: Distribuição do número de cáries em crianças de 12 anos.
Contagem por
criança
x
Freqüência
observada
Fo
Freqüência
esperada
BBN
Freqüência
esperada
BN
0
63
56,2
61,2
1
29
35,1
29,2
2
12
21,3
18,8
3
15
13,5
13,1
4
8
9,0
9,6
5
9
6,2
7,1
6
5
4,4
5,4
7
4
3,3
4,1
8
6
2,5
3,2
9
2
1,9
2,4
10
3
1,5
1,9
11
3
1,2
1,6
12
2
1,0
1,2
13
+
2
0,8
4,2
2
c
---
20,3
10,0
22
c
P
---
0,03
0,53
..gl
---
10
11
64
FIGURA 12: Distribuição das freqüências do número de cáries por criança.
Ajuste pela distribuição binomial negativa e beta binomial negativa.
Como
22
0,03
c
P
pode-se concluir que a distribuição do
número de cáries em crianças não pode ser descrita pela distribuição beta
binomial negativa, indicando que o parâmetro
p
, probabilidade de um dente
desenvolver cárie, não varia de dente para dente.
Os dados apresentados a seguir, Tabela 2, são referentes ao número de
acidentes por maquinista num período de três meses, analisados por Bliss e
Fisher (1953). Os valores observados e esperados pelas distribuições binomial
negativa e beta binomial negativa (
ˆ
5,4a
,
ˆ
1,5b
e
ˆ
1,5r
), é apresentado
na Figura 13.
65
TABELA 2: Distribuição do número de acidentes por maquinista.
Acidentes por
maquinistas
x
Freqüência
observada
Fo
Freqüência
esperada
BBN
Freqüência
esperada
BN
0
296
290,5
296,7
1
74
77,8
71,0
2
26
25,9
26,4
3
8
10,2
11,0
4
4
4,5
4,8
5
4
2,2
2,2
6
1
1,2
1,0
7
0
0,6
0,5
8
1
0,4
0,2
9
+
0
0,2
0,2
2
c
---
0,8
1,1
22
c
P
---
0,37
0,57
..gl
---
1
2
FIGURA 13: Distribuição das freqüências de acidentes por maquinista.
Ajuste pela distribuição binomial negativa e beta binomial negativa.
66
Os dados da Tabela 3 referem-se à distribuição de plantas, por quadrado,
Salicornia Stricta que se desenvolvem num pântano.
TABELA 3: Contagem do número de plantas por quadrante.
Plantas por
quadrante
x
Freqüência
observada
Fo
Freqüência
esperada
BBN
Freqüência
esperada
BN
0
4
3,2
3,3
1
3
5,5
6,4
2
8
8,5
8,4
3
13
10,2
9,4
4
11
10,7
9,6
5
9
10,2
9,2
6
8
9,2
8,4
7
10
8,0
7,5
8
3
6,7
6,5
9
3
5,5
5,6
10
8
4,4
4,7
11
3
3,6
3,1
12
4
2,8
2,5
13
4
2,2
2,1
14
0
1,8
1,7
15
3
1,4
1,3
16
0
1,1
1
17
0
0,9
0,8
18
1
0,7
0,6
19
0
0,5
0
20
+
3
0,4
5,9
2
c
---
8,1
7,5
22
c
P
---
0,32
0,48
..gl
---
7
8
67
O ajuste via distribuição binomial negativa e beta binomial negativa
(
ˆ
12,3a
,
ˆ
8,7b
e
ˆ
8,7r
) encontra-se na Figura 14.
FIGURA 14: Distribuição do número de plantas Salicornia stricta por
quadrado. Ajuste pela distribuição binomial negativa e beta binomial
negativa.
Os dados da Tabela 4 referem-se à contagem do mero de ácaros em
folhas de maçã. As freqüências esperadas pelas distribuições binomial negativa e
beta binomial negativa (
ˆ
8,1a
,
ˆ
2,9b
e
ˆ
2,9r
) são obtidas e o ajuste é
apresentado na Figura 15.
68
TABELA 4: Distribuição de ácaros em folhas de maçã.
Ácaros por
folha
x
Freqüência
observada
Fo
Freqüência
esperada
BBN
Freqüência
esperada
BN
0
70
66,67
69,49
1
38
40,34
37,6
2
17
20,59
20,1
3
10
10,36
10,7
4
9
5,34
5,69
5
3
2,84
3,02
6
2
1,56
1,6
7
1
0,89
0,85
8
0
0,52
0,95
2
N
150
3,46
2,48
2
P
---
0,18
0,48
..gl
---
2
3
FIGURA 15: Distribuição do número de ácaros por folhas de maçã. Ajuste pela
distribuição binomial negativa e beta binomial negativa.
69
Pelo exposto, tem-se que a distribuição beta binomial negativa se
ajustou aos dados das Tabelas 2, 3 e 4, portanto foi adequado considerar a
variabilidade do parâmetro
p
nesses casos.
Pielou (1977) desenvolve uma discussão sobre o ajuste de distribuições
teóricas a dados observados. Os dados analisados são adequadamente ajustados
pela binomial negativa. A binomial negativa pode ser obtida como distribuição
generalizada de uma Poisson e uma logarítmica como também por mistura de
uma Poisson com uma gama. Portanto, a distribuição binomial negativa surge de
modelos matemáticos diferentes, com pressupostos biológicos diferentes. Com
isto Pielou coloca o problema:
,,, o ajuste de distribuições de freqüência teóricas a dados observados
não é suficiente para explicar o padrão natural de uma população
O Ajuste obtido pela betabinomial negativa acrescenta mais um aspecto
a esta discussão.
70
5 CONCLUSÕES
1) A distribuição beta binomial negativa é uma distribuição trabalhável e
com boas propriedades;
2) As equações aproximadas para o cálculo dos estimadores de máxima
verossimilhança foram obtidas;
3) Uma validação matemática do algoritmo mistura é apresentada;
4) A distribuição beta binomial negativa apresentou um bom ajuste aos
dados analisados sendo, portanto um modelo alternativo para explicar os
dados considerando-se a variabilidade do parâmetro
p
.
71
REFERÊNCIAS BIBLIOGRÁFICAS
ANTON, H. Cálculo: um novo horizonte. 6.ed. Porto Alegre: Bookman, 2000.
BEARZOTI, Eduardo. Introdução à teoria de probabilidade e à inferência
estatística. Lavras: UFLA, 1998.
BLISS, C.I. FISHER, R.A. Fitting the negative binomial distribution to
biological data. Biometrics, Washington, v.9, n.2, p.176-200, May 1953.
Devroye, Luc. Non-uniform random variate generation. New York: Springer-
Verlag, 1986.
FELLER, W. An introduction to probability theory and its applications.
New York: John Wiley, 1968.
GERSTENKORN, T. A compound of the generalized negative binomial
distribution with the generalized beta distribution. Central European Journal
of Mathematics, London, v.2, n.4, p.527-237, Aug. 2004.
GURLAND, J. Some interrelations among compound and generalized
distributions. Biometrika, London, v.44, n.1-2, p.265-268, June 1957.
GURLAND, J. Some applications of the negative binomial distribution and
other contagious distributios. Biometrika, London, v.49, n.10, p.1388-1399,
Dec. 1959.
HASSAN, A.; BILAL, S. On estimation of negative Polya-Eggenberger
distribution and applications. Journal of the Korean Society for Industrial
and Applied Mathematics, Seul, v.12, n.2, p.81-95, Aug. 2008,
HOLGATE, P.B. The modality of compound Poisson distribution. Biometrika,
London, v.57, n.3, p.665-667, Dec. 1970,
JOHNSON, N.L.; KOTZ, S. Discrete distributions. New York: John Wiley,
1969.
JOHNSON, N.L.; KOTZ, S.; KEMP, A.W. Univariate Discrete distributions.
New York: John Wiley, 1992.
72
MOOD, A.M.; GRAYBILL, F.A.; BOES, D.C. Introduction to the theory of
statistics. New York: McGraw-Hill, 1974. (Probability and statistics).
PIELOU, E.C. Mathematical ecology. New York: John Wiley, 1977.
R DEVELOPMENT CORE TEAM. R: a language and environment for
statistical computing. Vienna, Austria: R Foundation for Statistical Computing
2007
SILVA, W.P. Estimadores de máxima verossimilhança em misturas de
densidades normais: uma aplicação em genética. 2003, 60p. Dissertação
(Mestrado em Estatística e Experimentação Agropecuária)Universidade
bFederal de Lavras, Lavras, MG.
73
ANEXOS
ANEXO A:
Função gama..........................................................................
74
ANEXO B:
Rotinas....................................................................................
77
74
ANEXO A
Função gama
A função gama, denotada por
.
, é definida por
1
0
xt
x t e dt
para
0x
,
1
Usando integração por partes, (1) fornece uma relação de recorrência
para
x
:
1x x x
2
e, se
xn
é um inteiro,
1!nn
.
Utilizando a recorrência dada em (2), obtém-se uma relação entre a
função gama e o fatorial ascendente,
1 ... 1
x
ax
a a a a x
x
A relação entre as funções beta e gama é
, , 0
ab
a b a b
ab
,
A derivada do logaritmo da função gama, denominada função digama
ou função psi, é dada por
75
ln
x
d
xx
dx x
A expressão (2) para a função gama produz a seguinte fórmula de
recorrência para a função psi, (Johnson, Kotz e Kemp, 1992):
1
1xx
x
Prova:
1
1
1
1
x x x
x x x x
xx
x
xx
Mas,
x
x
x
, então
1
1
x
xx
x
1
1
1
xx
xx
x
11x x x x
1
1xx
x
76
Conseqüentemente,
1
1
1
1 1 1
2 1 1 1
11
1 1 1 1
3 2 1 2
2 1 2
..
..
..
1 1 1
1 1 ...
11
1
1
n
j
xx
x
x x x x
x x x
x x x x
x x x x
x n x n x
x x x n
x n x
xj
A função
xn
representa a derivada do logaritmo da função
xn
.
Prova:
1
1
ln
1
n
n
j
x
x n x x j x
x
ln
xn
x
xx
como
ln
d
xx
dx
, segue que
ln ln ln lnx x n x x n
xn
x x x x
77
ANEXO B
Rotinas
As rotinas utilizadas na simulação das misturas, realizadas pelo software
R versão 2.8.0, são apresentadas abaixo.
Simulando mistura de normais
# X~Normal(mu,1) -- mu~Normal(1,0)
n = 10000
X = rnorm(n,rnorm(n),1)
hist(X, freq = F, breaks = 50, main="",
xlab="x", ylab= "h (x)")
x = (-50:50)/10
Y = dnorm(x,0,sqrt(2))
lines(x,Y,col="red")
Simulando binomial negativa
n = 1000000 # Tamanho da amostra
a = 10 # Parâmetro da distribuição gama
b = 1 # Parâmetro da distribuição gama
X = sort(rpois(n,rgamma(n,a,b))) # Vetor de amostras da mistura Poisson gama
levX = as,numeric(levels(factor(X)))
nX = length(levX)
fX = matrix(0,nX,2) # Matriz de freqüências
fX[1:nX,1] = levX[1:nX]
78
kk = 0
for (i in 1:nX){
ref = fX[i,1]
k = 0
while ((kk+k) < n & X[kk+k+1] == ref){
k = k+1
}
fX[i,2] = k
kk = kk + k
}
ma = max(X)
brea = (0:(ma+1))-0,5
x = 0:ma
Y = dnbinom(x,a,(b/(b+1)))
hist(X,breaks = brea, freq = F, main="",
xlab = "Eixo dos X", ylab = "Eixo dos Y" )
points(x,Y,col="red")
Simulando beta binomial negativa
n = 10000 # Tamanho da amostra
X = 1:n # Vetor de amostras
a = 4 # Parâmetro da beta
b = 4 # Parâmetro da beta
r = 3 # Parâmetro r da binomial negativa
X = sort(rnbinom(n,r,rbeta(n,a,b))) # Gera o vetor de dados
flag = 1
k = 2
while (flag < 3 & k < n){
79
k = k+1
flag = X[k] - X[k-1]
}
max = X[k]-1
for (i in 1:n){
if (X[i]>max) X[i] = max
}
levX = 0:max
nX = length(levX)
fX = matrix(0,2,nX) # Matriz de freqüências
fX[1,1:nX] = levX[1:nX]
for (i in 1:nX){
ref = fX[1,i]
k = 0
for (j in 1:n) if (X[j] == ref) k = k+1
fX[2,i] = k
}
for (i in 1:nX){
ref = fX[1,i]
k = 0
for (j in 1:n) if (X[j] == ref) k = k+1
fX[2,i] = k
}
Ajustando uma beta binomial negativa
xx = 0:20 # Valores observados
yy =c(4,3,8,13,11,9,8,10,3,3,8,3,4,4,0,3,0,0,1,0,3) # Freqüência observada
n = sum(yy)
plot(xx,yy, type = "h", xlab=" ", ylab=" ")
80
a = , b = , r = #Parâmetros do modelo
bbn <- function(x,a,b,r){
num = gamma(r+x)*gamma(r+a)*gamma(x+b)*gamma(a+b)
den = gamma(r)*gamma(r+a+b+x)*gamma(a)*gamma(b)*factorial(x)
h = num/den
return(h)
}
Ybbn = bbn(xx,a, b, r)*n
lines(xx,Ybbn,col="red")
points(xx,Ybbn,col="red")
legend(12,12,lty=c(1,1), c("beta binomial negativa"),
lwd=1, bty="n",cex=0,8, col="red")
Na estimação dos parâmetros da distribuição beta binomial negativa
pelo método da Máxima verossimilhança utilizou-se o software Maple versão 5.
A rotina é dada abaixo,
> restart;
with(LinearAlgebra):
A matriz das freqüências observadas Fx
> fx := convert([7,16,23,20,23,24,12,13,9,9,8,10,8,7,2,12,3,5,4,2,2,5,5,2,1,16],Vector):
tam := Dimension(fx):
Fx := Matrix(tam,2):
N := 0:
for i from 1 to tam do
Fx[i,1] := i-1:
Fx[i,2] := fx[i]:
N := N + fx[i]:
end do:
81
As equações de verossimilhança aproximadas
> f11 := (a,b,r)-> N*sum('1/(a+k)',k=0,,(r-1)):
f12 := (a,b,r)-> N*sum('1/(a+b+k)',k=0,,(r-1)):
f13 := (a,b,r)-> sum('Fx[(x+1),2]*sum(1/(a+b+r+k),
k=0,,(x-1))',x=1,,(tam-1)):
f1 := (a,b,r) -> f11 - f12 - f13:
> f21 := (a,b,r)-> sum('Fx[(x+1),2]*sum(1/(b+k),
k=0,,(x-1)))',x=1,,(tam-1)):
f22 := (a,b,r)-> N*sum('1/(a+b+k)',k=0,,(r-1)):
f23 := (a,b,r)-> sum('Fx[(x+1),2]*sum(1/(a+b+r+k), k=0,,(x-1))',x=1,,(tam-1)):
f2 := f21 - f22 - f23:
> f31 := (a,b,r)-> N*sum('1/(r+k-1)',k=1,,a):
f32 := (a,b,r)-> N*sum('1/(r+k-1)',k=1,,(a+b)):
f33 := (a,b,r)-> sum('Fx[(x+1),2]*(sum(1/(r+k-1),
k=1,,x))',x=1,,(tam-1)):
f34 := (a,b,r)-> sum('Fx[(x+1),2]',x=1,,(tam-1))
*sum('1/(r+k-1)',k=1,,(a+b)):
f35 := (a,b,r)-> sum('Fx[(x+1),2]*(sum(1/(r+k-1),
k=1,,(a+b+x)))',x=1,,(tam-1)):
f3 := f31 - f32 + f33 + f34 - f35:
> fsolve({f1(a,b,r)=0, f2(a,b,r)=0, f3(a,b,r)=0}, {a,b,r});
{a= , b= ,r= }
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo