Download PDF
ads:
Universidade Federal do Rio Grande do Sul
Instituto de Matem´atica
Programa de os-Gradua¸ao em Matem´atica
CADEIAS DE MARKOV CL
´
ASSICAS E QU
ˆ
ANTICAS
por
CARLOS FELIPE LARDIZ
´
ABAL RODRIGUES
Porto Alegre, Mar¸co de 2006
ads:
Livros Grátis
http://www.livrosgratis.com.br
Milhares de livros grátis para download.
Disserta¸ao submetida por Carlos Felipe Lardiz´abal Rodrigues
1
como re-
quisito parcial para a obten¸ao do grau de Mestre em Matem´atica pelo Pro-
grama de os-Gradua¸ao em Matem´atica do Instituto de Matem´atica da
Universidade Federal do Rio Grande do Sul.
Professor Orientador: Dr. Artur Oscar Lopes
Banca Examinadora:
Dr. Artur Oscar Lopes
Dr. Alexandre Tavares Baraviera
Dr. Jairo da Silva Bochi
Dr. Rafael Rig˜ao Souza (UNISINOS)
Data de Defesa: 10 de mar¸co de 2006.
1
Bolsista do Conselho Nacional de Desenvolvimento Cient´ıfico e Tecnol´ogico - CNPq
ads:
Resumo: seguindo o trabalho de S. Gudder, fazemos uma constru¸ao
de cadeias de Markov quˆanticas a partir de matrizes complexas, unit´arias,
estoasticas e analisamos o conceito de interferˆencia nesse contexto, dando
aten¸ao para uma cadeia que chamamos de moeda quˆantica. Estamos in-
teressados na entropia de cadeias de Markov reais, no princ´ıpio variacional
para energia livre associado e em uma poss´ıvel constru¸ao an´aloga no caso
complexo. Este trabalho visa tamem dar uma introdu¸ao matematicamente
rigorosa de certos aspectos de mecˆanica quˆantica.
Abstract: following the work of S. Gudder we make a construction of
quantum Markov chains via complex, unitary, stochastic matrices and we
analyse the concept of interference in that context, with emphasis on a certain
chain we call the quantum coin. We are interested in the entropy of real
Markov chains, in the associated variational principle for free energy and
in analogous constructions in the complex case. This work also aims to
be a mathematically rigorous introduction to certain aspects of quantum
mechanics.
Agradecimentos
Esta disserta¸ao de mestrado foi criada a partir de algumas notas sim-
ples que escrevi durante minha gradua¸ao e que serviram como um primeiro
trabalho de inicia¸ao cient´ıfica.
´
E claro que com o passar dos semestres, tais
notas melhoraram em extens˜ao e principalmente em profundidade. Aproveito
para agradecer a meu orientador Artur Oscar Lopes pela orienta¸ao e pelas
in´umeras sugest˜oes para melhorar este trabalho, e mais geralmente pelo per-
manente incentivo, desde os tempos em que eu era um aluno da computa¸ao
at´e os dias de hoje, ao concluir o bacharelado e mestrado em matem´atica.
Agrade¸co ainda aos professores Alexandre Baraviera, Rafael Rig˜ao Souza
e Jairo Bochi pelas diversas sugest˜oes e apoio durante a elabora¸ao deste tra-
balho. Agrade¸co aos meus colegas e `a minha fam´ılia pela generosa paciˆencia
na vida cotidiana.
Porto Alegre, mar¸co de 2006.
Sum´ario
1 Introdu¸ao 3
1.1 Sobre medi¸oes em um sistema quˆantico . . . . . . . . . . . . 4
2 Cadeias de Markov quˆanticas 7
2.1 Introdu¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7
2.2 N-cadeias quˆanticas . . . . . . . . . . . . . . . . . . . . . . . . 8
2.3 Matrizes de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . 17
2.4 Distribui¸oes de Probabilidade . . . . . . . . . . . . . . . . . . 23
2.5 Alguns alculos . . . . . . . . . . . . . . . . . . . . . . . . . . 33
2.6 Apˆendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37
3 Integrais de Feynman 43
3.1 O formalismo das integrais de Feynman . . . . . . . . . . . . . 43
3.2 Distribui¸ao de Probabilidade . . . . . . . . . . . . . . . . . . 47
3.3 Sobre a amplitude de Feynman . . . . . . . . . . . . . . . . . 50
4 Operadores densidade e mecˆanica quˆantica 54
4.1 Nota¸ao de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 55
4.2 Produto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . 57
4.3 Operador densidade . . . . . . . . . . . . . . . . . . . . . . . . 62
4.4 Postulados da mecˆanica quˆantica . . . . . . . . . . . . . . . . 64
4.5 Estados emaranhados . . . . . . . . . . . . . . . . . . . . . . . 66
5 Entropia 71
5.1 Entropia de Shannon . . . . . . . . . . . . . . . . . . . . . . . 71
5.2 Entropia de von Neumann . . . . . . . . . . . . . . . . . . . . 75
5.3 Subaditividade forte . . . . . . . . . . . . . . . . . . . . . . . 83
5.4 Cadeias quˆanticas: entropia de Shannon . . . . . . . . . . . . 85
5.5 Cadeias quˆanticas: entropia de von Neumann . . . . . . . . . 88
1
6 Formalismo Termodinˆamico 91
6.1 Introdu¸ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91
6.2 Caracteriza¸ao variacional . . . . . . . . . . . . . . . . . . . . 92
6.2.1 Introdu¸ao . . . . . . . . . . . . . . . . . . . . . . . . . 92
6.2.2 Energia livre . . . . . . . . . . . . . . . . . . . . . . . . 93
6.2.3 Caracteriza¸ao variacional . . . . . . . . . . . . . . . . 96
6.3 Observoes sobre processos quˆanticos . . . . . . . . . . . . . 104
6.4 Apˆendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108
6.4.1 Prova do lema de Wielandt . . . . . . . . . . . . . . . 111
7 C
algebras e cadeias de Markov quˆanticas 118
7.1 C
algebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118
7.2 Cadeias de Markov quˆanticas . . . . . . . . . . . . . . . . . . 119
7.3 CAR C
algebras e estados KMS . . . . . . . . . . . . . . . . 124
7.4 Moeda quˆantica revisitada . . . . . . . . . . . . . . . . . . . . 128
8 Apˆendice: Processos de Markov quˆanticos 130
8.1 Nota¸oes e defini¸oes . . . . . . . . . . . . . . . . . . . . . . . 130
8.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135
8.3 Processos de Markov quˆanticos
quase-discretos . . . . . . . . . . . . . . . . . . . . . . . . . . 142
2
Cap´ıtulo 1
Introdu¸ao
Um princ´ıpio fundamental da mecˆanica quˆantica diz que a evolu¸ao tem-
poral de um sistema f´ısico isolado pode ser colocada em correspondˆencia com
um espa¸co vetorial de dimens˜ao infinita de tal modo que os estados do sistema
ao representados por vetores e uma medi¸ao f´ısica qualquer corresponde a
um operador linear. Com o intuito de simplificar o problema, vamos analisar
um modelo onde o tempo ´e discreto, o espa¸co vetorial ´e de dimens˜ao finita
e a cadeia de Markov cl´assica ´e modificada pela introdu¸ao de uma matriz
complexa.
As cadeias de Markov quˆanticas ao ´uteis para obter um comportamento
aproximado do problema em dimens˜ao infinita da mecˆanica quˆantica (que
´e muito mais complexo). Esta aproxima¸ao (assim como outras abordagens
discretas) ´e motivada n˜ao apenas pela necessidade de se estudar uma simpli-
fica¸ao do problema maior, mas tamb´em pela possibilidade de que o pr´oprio
tempo seja discreto (quest˜ao complicada).
´
E razo´avel tamb´em especular que
o problema real com espa¸co de estados continuo possa ser aproximado por
um com espa¸co de estados discreto.
Inicialmente analisamos o trabalho feito por J. Marbeau e S. Gudder em
[15], onde consideramos uma matriz de amplitude de transi¸ao que tem a
forma de uma matriz de Dirichlet. Tais matrizes geram um an´alogo discreto
da amplitude de Feynman cont´ınua. Depois, calculamos a distribui¸ao de
probabilidade para estas cadeias.
A seguir, estaremos interessados em ferramentas que permitam descre-
ver outros processos, ditos discretos ou quase-discretos, seguindo a descri¸ao
dada em [16]. Vamos considerar uma medida complexa sobre um espa¸co,
onde tamb´em definiremos certos tipos de medi¸oes.
Como estamos interessados em estudar processos de natureza quˆantica,
ser´a ´util ter em mente os postulados da mecˆanica quˆantica, que ao discuti-
dos com detalhe em uma formula¸ao via operadores densidade. A nota¸ao
3
de Dirac, de uso corrente em mecˆanica quˆantica, tamem ´e introduzida. Es-
tudaremos tamb´em as entropias de Shannon e von Neumann e analisamos a
entropia de certos processos de Markov quˆanticos.
No cap´ıtulo 6, analisamos um problema variacional para cadeias de Markov
finitas. Mais especificamente, se H denota a entropia, U ´e um potencial, e λ
´e um certo autovalor associado a U, temos o conhecido princ´ıpio variacional
para energia livre:
H(µ)
U log λ
onde vale a igualdade se e somente se µ for uma determinada medida especial
ν = ν
(U)
, que chamamos medida de Markov.
Dado este teorema para cadeias de Markov (reais), podemos nos per-
guntar se existe algum an´alogo para cadeias quˆanticas. Neste trabalho, ao
propomos uma solu¸ao para esse problema, mas fornecemos algumas ferra-
mentas que podem ajudar na sua resolu¸ao.
Na literatura, uma cadeia de Markov quˆantica normalmente est´a asso-
ciada a uma importante constru¸ao via ´algebra de operadores, devida a L.
Accardi ([1], veja tamb´em [30]). Nossa abordagem inicial difere bastante de
tal contexto, mas no cap´ıtulo 7 faremos uma breve introdu¸ao `as cadeias
quˆanticas, fazendo uso de C
algebras.
1.1 Sobre medi¸oes em um sistema quˆantico
Em processos estoasticos, estamos interessados nos resultados obtidos por
uma fam´ılia, ou seq¨uˆencia, de fun¸oes mensur´aveis. Podemos considerar, por
exemplo, que o processo representa o resultado de se jogar uma moeda um
n´umero arbitr´ario de vezes, ou ent˜ao a quantidade de chamadas telefˆonicas
em um certo intervalo de tempo, ou mais geralmente, um fenˆomeno tal que
sua evolu¸ao depende da probabilidade de ocorrˆencia de um determinado
evento. Tais problemas fazem parte de uma quantidade consider´avel de
pesquisa em matem´atica.
Como a mecˆanica quˆantica possui um car´ater probabilistico, ´e natural
perguntar de que forma podemos descrever o movimento de uma part´ıcula
microsc´opica nos moldes de um processo estoastico. Veremos que a mecˆanica
quˆantica imp˜oe restri¸oes severas quanto a evolu¸ao dos objetos que descreve.
Dito de maneira geral, estaremos interessados em operadores que fornecem
amplitudes de transi¸ao. No caso discreto, isso significa considerar ma-
trizes unit´arias agindo sobre os vetores estados que descrevem a evolu¸ao das
part´ıculas; no caso cont´ınuo, isso significa que a evolu¸ao de tal vetor estado
4
satisfaz a equa¸ao de Schr¨odinger:
i
d|ψ
dt
= H|ψ
No entanto, descrever fenˆomenos quˆanticos ´e um problema substancial-
mente mais dif´ıcil do que modelar problemas cl´assicos. A id´eia de realizar
uma seq¨uˆencia de medi¸oes sobre um el´etron, como em um experimento co-
mum com objetos macrosc´opicos, ´e no m´ınimo problem´atica. Surge ent˜ao a
necessidade de se construir um formalismo de interferˆencia entre medi¸oes.
Uma parte importante de nosso trabalho consistir´a da constru¸ao matem´atica
dessa id´eia. Aqui X
t
vai descrever a evolu¸ao temporal de amplitude quˆantica
de um sistema. O processo X
t
, t N, vai tomar valores num conjunto finito
S = {0, 1, ..., n 1}.
´
E natural tentar encontrar um ”setting quˆantico sobre um conjunto de
estados S = {0, 1, ..., n1} que seja de alguma forma semelhante ao ”setting
probabil´ıstico sobre um conjunto de estados S = {0, 1, ..., n 1}”. Neste
´ultimo caso, se analisa P (X
t
= s) [0, 1], onde X
t
´e um processo estoastico e
s S. Sendo assim, se espera que no primeiro ”setting”intervenha de alguma
forma uma medida complexa A e se deseja entender a evolu¸ao A(X
t
= s)
C, onde X
t
´e um processo estoastico e s S. Vamos assumir que de alguma
forma natural a hip´otese markoviana apare¸ca no problema. Desejamos que
uma matriz A, do tipo n por n, descreva a ”amplitude de transi¸ao”. Como
veremos, neste formalismo nos deparamos com o conceito de interferˆencia e
com a quest˜ao do futuro (eventualmente poder) interferir no passado, o que
nos parece indesejado (embora talvez fisicamente poss´ıvel).
Dois resultados importantes que veremos nesse sentido ao:
Teorema 1 Em uma N-cadeia quˆantica {X
t
}, X
t
ao interfere em X
t
, para
todo 0 t t
N.
Teorema 2 Se (X
t
)
tT
´e unit´ario ent˜ao X
t
ao interfere em X
s
para s t.
Em outras palavras, estes teoremas nos dizem que o futuro ao inter-
fere no passado. Esta ´e uma propriedade desej´avel da teoria que iremos
desenvolver. O primeiro teorema se refere a um sistema discreto, e o outro
a sistema cont´ınuos ou quase-discretos. Provaremos estes dois teoremas no
pr´oximo cap´ıtulo. A mecˆanica quˆantica, como teoria f´ısica (ou matem´atica)
da natureza, ´e incompleta e desafia muitas das caracter´ısticas que conside-
ramos senso comum no mundo cl´assico. Iremos explorar apenas algumas
propriedades de tal teoria.
5
Em geral, ao iremos discutir a validade experimental implicada pelo
formalismo matem´atico que discutiremos aqui, mas em alguns casos parti-
culares importantes, como os sistemas descritos pelas matrizes de Dirichlet
que veremos no pr´oximo cap´ıtulo, sabemos que existe tal confirma¸ao com a
realidade (as matrizes de Dirichlet ao um an´alogo discreto das amplitudes
de Feynman calculadas em eletrodinˆamica quˆantica (QED)).
6
Cap´ıtulo 2
Cadeias de Markov quˆanticas
2.1 Introdu¸ao
Nesta se¸ao consideramos apenas t N e S = {0, 1, 2..., n 1}. O
grupo das transforma¸oes lineares unit´arias B, agindo sobre C
n
´e dito grupo
unit´ario de ordem n. A evolu¸ao de um sistema quˆantico ´e descrita pela
ao de t no grupo unit´ario, denotada por U(t), onde t N ´e um parˆametro
temporal. Este semigrupo indexado por t N pode ser usado para calcular o
estado do sistema em qualquer tempo dado, bem como encontrar amplitudes
de transi¸ao.
Suponha que temos um operador unit´ario U em um espa¸co de Hilbert
(sobre os corpo de escalares complexos) H de dimens˜ao n que gera um grupo
unit´ario discreto U(t) = U
t
, t N. Dizemos que se o sistema encontra-se no
estado ψ em um certo tempo enao φ, U(t)ψ ´e a amplitude de transi¸ao do
estado ψ para o estado φ ap´os t unidades de tempo. Se ψ
j
, j = 0, 1, . . . , n 1
´e uma base ortonormal para H, definimos a n × n matriz de amplitude de
transi¸ao A relativa a esta base por A
jk
= ψ
j
, Uψ
k
.
´
E claro que A ´e
uma matriz unit´aria (e possivelmente com entradas complexas) A
jk
, onde
j, k S. Ent˜ao no nosso caso, identificamos U = A e H = C
n
. Esta de-
scri¸ao simples da mecˆanica quˆantica ser´a suficiente para o que estudaremos
neste cap´ıtulo. Iremos formular mais precisamente o que entendemos por
um sistema quˆantico no cap´ıtulo 4, quando considerarmos os postulados da
mecˆanica quˆantica.
Como temos uma interpreta¸ao probabil´ıstica desta cadeia, podemos per-
guntar se ela est´a associada a um processo estoastico que gera estas ampli-
tudes de transi¸ao. A resposta ´e afirmativa, e as fun¸oes X
j
do processo
podem ser interpretadas como observoes quˆanticas, ou como chamaremos,
medi¸oes. Como a matriz A ´e unit´aria, dizemos que X
j
´e um processo
7
unit´ario; queremos, al´em disso, que os processos considerados tenham a pro-
priedade de Markov. Para que isso ocorra, A ao deve ser apenas unit´aria,
mas tamem estoastica. Diremos que X
j
satisfazendo a isto ´e uma cadeia
quˆantica.
2.2 N-cadeias quˆanticas
Um aspecto essencial da teoria quˆantica ´e o conceito de interferˆencia. Um
observador que realiza uma medi¸ao em um sistema ir´a em geral modific´a-lo.
Ainda, distintas possibilidades (e probabilidades) interferem uma nas outras.
Come¸caremos descrevendo matematicamente o que significa interferˆencia en-
tre eventos e suas medi¸oes. Consideramos inicialmente uma medida com-
plexa A denominada amplitude. Esta medida ser´a usada posteriormente para
medir probabilidades (do mesmo modo como uma medida em uma cadeia de
Markov cl´assica).
Seja Ω = S (ou, ent˜ao = S
N
, onde N N est´a fixo) que chamaremos
espa¸co amostral. Os elementos w de ao ditos pontos amostrais e cada
ponto representa uma determinada configura¸ao de um sistema f´ısico. Seja
Λ uma σalgebra fixada de subconjuntos de e seja A: Λ C uma medida
complexa com A(Ω) =
dA = 1. Quando = S , enao Λ ´e a sigma-
algebra gerada pelos cilindros, ou seja, a sigma-algebra de Borel. Para
Λ, o n´umero complexo A(∆) =
dA ´e dito amplitude quˆantica (ou
amplitude de transi¸ao, ou amplitude de probabilidade) do evento Λ.
Assumimos acima que A ´e σ-aditiva, e tal propriedade ser´a necess´aria na
prova de alguns teoremas, como por exemplo na proposi¸ao (2.2.3).
A probabilidade P de que um evento Λ ocorra ´e definida por
P (∆) := |A(∆)|
2
Observao Em geral, P = |A|
2
ao ´e uma probabilidade no sentido
de teoria da medida se supormos que A ´e uma medida complexa. O motivo
´e que a σ-aditividade ao vale em geral: para C
1
, C
2
conjuntos disjuntos,
P (C
1
C
2
) = |A(C
1
C
2
)|
2
= |A(C
1
) + A(C
2
)|
2
= |A(C
1
)|
2
+ |A(C
2
)|
2
+ 2Re(A(C
1
)A(C
2
))
Os dois primeiros termos da ´ultima igualdade fornecem o resultado cl´assico
e o ´ultimo ´e um termo de interferˆencia, que contribui com uma soma ou
subtra¸ao `a parte cl´assica (veja tamb´em a se¸ao 3.2). Um lema asico (e
negativo) relacionado com esta quest˜ao ´e o seguinte (o leitor pode omitir a
demonstra¸ao numa primeira leitura):
8
Lema 2.2.1 Seja = {1, 2, 3} , Λ uma σalgebra de subconjuntos de ,
A : Λ C, A = µ
1
+
2
uma medida complexa, onde µ
1
, µ
2
: Λ R
ao medidas com sinal. Ent˜ao P : Λ R, P = |A|
2
´e uma medida real
aditiva (sobre os cilindros de tamanho 1) se e somente se pelo menos um dos
cilindros 1, 2, 3 Λ (mas ao todos),
1 :=
{
ω
Ω :
ω
= (
ω
1
, ω
2
, . . .
)
, ω
1
= 1
}
2 := {ω : ω = (ω
1
, ω
2
, . . .), ω
1
= 2}
3 := {ω : ω = (ω
1
, ω
2
, . . .), ω
1
= 3}
tem medida nula (i.e., A(1) = 0 ou A(2) = 0 ou A(3) = 0).
Prova Como A ´e medida, vale a aditividade para os conjuntos disjuntos
1 e 2:
P (1 2) = |A(1 2)|
2
= |A(1) + A(2)|
2
Como A(1), A(2) C,
|A(1) + A(2)|
2
= |A(1)|
2
+ |A(2)|
2
+ 2Re(A(1)A(2)) (2.1)
e portanto,
P (1 2) = P (1) + P (2) Re(A(1)A(2)) = 0.
Mas
Re(A(1)A(2)) = 0 µ
1
(1)µ
1
(2) + µ
2
(1)µ
2
(2) = 0
e analogamente para os pares de cilindros 1, 3 e 2, 3:
Re(A(1)A(3)) = 0 µ
1
(1)µ
1
(3) + µ
2
(1)µ
2
(3) = 0
Re(A(2)A(3)) = 0 µ
1
(2)µ
1
(3) + µ
2
(2)µ
2
(3) = 0
Temos o sistema
µ
1
(1)µ
1
(2) + µ
2
(1)µ
2
(2) = 0
µ
1
(1)µ
1
(3) + µ
2
(1)µ
2
(3) = 0
µ
1
(2)µ
1
(3) + µ
2
(2)µ
2
(3) = 0
Suponha que a medida de um dos cilindros seja ao nula, digamos a do
cilindro 1. Enao ao menos µ
1
(1) = 0 ou µ
2
(1) = 0. Suponha sem perda
de generalidade que µ
2
(1) = 0. Da´ı, a primeira e a segunda equa¸ao nos
fornecem
µ
2
(2) =
µ
1
(1)µ
1
(2)
µ
2
(1)
, µ
2
(3) =
µ
1
(1)µ
1
(3)
µ
2
(1)
.
9
Substituindo essas express˜oes na terceira equa¸ao, temos
µ
1
(2)µ
1
(3) +
µ
1
(1)µ
1
(2)
µ
2
(1)
µ
1
(1)µ
1
(3)
µ
2
(1)
= 0
µ
1
(2)µ
1
(3)
1 +
µ
1
(1)
2
µ
2
(1)
2
= 0
Logo, µ
1
(2)=0 ou µ
1
(3) = 0. Se µ
1
(2) = 0 ent˜ao µ
2
(2) = 0 pois
µ
2
(2) =
µ
1
(1)µ
1
(2)
µ
2
(1)
= 0
Se µ
1
(3) = 0 ent˜ao µ
2
(3) = 0 pois
µ
2
(3) =
µ
1
(1)µ
1
(3)
µ
2
(1)
= 0.
Portanto, em qualquer caso, um dos cilindros asicos deve ter medida nula.
A demonstra¸ao deste lema vale para qualquer espa¸co mensur´avel que
admita uma cobertura finita.
Vamos fazer agora a constru¸ao de N-cadeias quˆanticas. Come¸camos com
o conceito de medi¸ao.
Defini¸ao Seja S = {s
0
, s
1
, . . . , s
n
} um conjunto finito e seja X : Ω S.
Dizemos que X ´e uma medi¸ao se X
1
(s
j
) Λ, j = 0, . . . , n 1, ou seja,
que X ´e mensur´avel.
Note que se P e probabilidade sobre enao:
j
P (X
1
(s
j
)) = 1 onde
X
1
(s
j
) ´e o conjunto de eventos que produzem o resultado s
j
.
Usaremos a nota¸ao [X = s
j
] para o conjnto X
1
(s
j
). Ainda, P(X =
s
j
) = P (X
1
(s
j
)).
A menos que seja especificado, podemos supor que = S
N
para algum
N ou enao Ω = S .
Nota¸ao Escreveremos
a
0
a
1
···a
t
:= {ω |X
0
(ω) = a
0
, X
1
(ω) = a
1
, . . . , X
t
(ω) = a
t
},
10
onde a
j
S para todo j {0, 1, 2..., t}. Com esta nota¸ao, podemos aplicar
a σ-aditividade de A para escrever
A[X
t
= s
k
] = A
i
0
,i
1
,...i
t1
s
i
0
s
i
1
···s
i
t1
s
k
=
i
0
,i
1
,...i
t1
A[s
i
0
s
i
1
···s
i
t1
s
k
]
Outra nota¸ao que usaremos ´e i(t) := i
t
.
Defini¸ao Dizemos que a seq¨uˆencia {X
t
}, 0 t N, com X
t
:
S e com todas as medi¸oes sobre o mesmo conjunto de resultados S =
{s
0
, . . . , s
n1
}, ´e uma N-cadeia se, para todo t = 1, . . . , N e
s
j(1)
, s
j(2)
, . . . , s
j(t1)
, s
j(t)
,
temos
A[X
t
= s
j(t)
, X
t1
= s
j(t1)
, ···, X
1
= s
j(1)
] = 0
onde s
j(k)
ao eventos que ocorrem no tempo k.
Observao Em [15], a defini¸ao de N-cadeia inclui ainda a seguinte
condi¸ao:
[X
0
= s
0
] = Ω
ou seja, temos um certo estado inicial fixado s
0
. Em geral ao vamos supor
que essa condi¸ao vale.
A partir de agora as medi¸oes X
t
: Ω = S
N
S serˆao sempre da forma
X
t
(w) = w
t
, onde w = (w
0
, w
1
, .., w
N
) S
N
.
Ou enao, X
t
: Ω = S S serˆao sempre da forma
X
t
(w) = w
t
, onde w = (w
0
, w
1
, .., w
t
, ...) S .
Defini¸ao A amplitude do evento
1
condicionada ao evento
2
´e
A(∆
1
|
2
) :=
A(∆
1
2
)
A(∆
2
)
se A(∆
2
) = 0 e vale 0 caso contr´ario.
Defini¸ao Uma N-cadeia {X
t
} ´e homogˆenea no tempo se
A[X
t+1
= s
j
|X
t
= s
k
] = A[X
1
= s
j
|X
0
= s
k
]
para todo j, k = 1, . . . , n 1 e t = 1, 2, . . . N 1.
11
Defini¸ao Fixada uma medida complexa A, uma N-cadeia {X
t
} homo-
genea no tempo ´e uma cadeia de Markov se
A[X
t+1
= s
j
|X
t
= s
j(t)
, X
t1
= s
j(t1)
, ···, X
1
= s
j(1)
] = A[X
t+1
= s
j
|X
t
= s
j(t)
]
para todo t = 1, . . . , N 1 e j, j(t), . . . , j(1) = 0, . . . , n 1.
A matriz A da forma n por n associada a tal medida complexa A (que
define uma cadeia de Markov homogenea no tempo X
t
como definida acima)
sobre Ω = S
N
´e dada por
A
ij
= A[X
1
= s
j
|X
0
= s
i
],
i, j {0, 1, 2, ..., n 1}.
Os conceitos an´alogos para X
t
: = S S, com t N, ao definidos
de maneira semelhante.
Defini¸ao Sejam X e Y medi¸oes, X : R, Y : S, R =
{r
0
, . . . r
m1
}, S = {s
0
, . . . , s
n1
}. Dizemos que Y ao interfere em X se,
j, k, j = 0, . . . , m 1:
P [X = r
j
] =
n1
k=0
P [X = r
j
, Y = s
k
]
A probabilidade do evento ∆
1
condicionada a ∆
2
´e dada por P (∆
1
|
2
) =
P (∆
1
2
)/P (∆
2
), P (∆
2
) = 0. Dizemos que A[X
2
= s
j
|X
1
= s
k
] ´e a
amplitude de transi¸ao do sistema do estado s
k
para o estado s
j
em uma
unidade de tempo. Interpretamos o conjugado complexo A[X
2
= s
j
|X
1
= s
k
]
como sendo a amplitude de transi¸ao de s
j
para s
k
em 1 unidades de tempo.
Esta propriedade ser´a ´util para indicarmos que na cadeia em que estivermos
trabalhando, o sistema ao pode dar saltos em acr´escimos de tempo t = 0,
ou seja, se j = k enao ela satisfaz a seguinte condi¸ao:
n1
r=0
A[X
2
= s
r
|X
1
= s
j
]A[X
2
= s
r
|X
1
= s
k
] = 0. (2.2)
Diremos que
P
jk
= |A[X
2
= s
j
|X
1
= s
k
]|
2
´e a probabilidade de transi¸ao de s
k
para s
j
. Se X
2
ao interfere em X
1
enao
n1
j=0
P
jk
=
1
P [X
1
(s
k
)]
n1
j=0
P [X
2
(s
j
), X
1
(s
k
)] = 1
12
ou seja, dado um estado fixo s
k
em t = 1, as somas das probabilidades de
transi¸ao para qualquer outro estado vale 1. Logo, dizer que X
2
ao interfere
em X
1
significa que para qualquer s
k
fixado
n1
j=0
P [X
2
= s
j
|X
1
= s
k
] = 1 (2.3)
Defini¸ao Uma N-cadeia ´e unit´aria se X
2
ao interfere em X
1
(o que
implica
r
|A
rj
|
2
= 1) e se satisfaz a equa¸ao (2.2).
Defini¸ao Uma N-cadeia homogˆenea no tempo, unit´aria e Markov ´e
chamada N-cadeia quˆantica.
Conceitos similares podem ser considerados para o caso de Ω = S e X
t
:
S, medi¸oes com t N. Neste caso ter´ıamos uma N-cadeia quˆantica,
ou, cadeia quˆantica para simplificar.
A matriz A da forma n × n com entradas
A
jk
= A[X
2
= s
k
|X
1
= s
j
]
´e a matriz de amplitude quˆantica de transi¸ao para {X
t
}. Desta
maneira, a evolu¸ao do processo fica determinada por uma matriz A com
valores complexos. Associada a esta matriz temos uma matriz estoastica P
real. Examinemos com mais detalhes as propriedades da matriz de ampli-
tude.
Primeiro, A ´e uma matriz unit´aria, pois da equa¸ao (2.2),
r
A
T
jr
A
rk
=
r
A
rj
A
rk
= 0 se j = k; se j = k, temos pela equa¸ao (2.3) (que ´e alida
neste caso pois estamos supondo que {X
t
} ´e N-cadeia quˆantica, e portanto
X
2
ao interfere em X
1
), que
r
A
T
jr
A
rk
=
r
A
rj
A
rj
=
r
|A
rj
|
2
=
r
|A[X
2
= s
r
|X
1
= s
k
]|
2
= 1.
Segundo, pela defini¸ao de N-cadeia, temos que os valores A
jk
ao difer-
entes de zero, j, k = 0, . . . , n 1.
Terceiro, A
jk
´e uma matriz coluna-estoastica, pois
j
A
jk
=
1
A[X
1
= s
k
]
j
A[X
2
= s
j
, X
1
= s
k
] = 1.
Observe que a primeira propriedade que citamos vale para qualquer N-
cadeia unit´aria, e as outras duas valem para qualquer N-cadeia. Em resumo,
13
A descreve a evolu¸ao com probabilidades complexas (ondulat´oria) e P ´e a
evolu¸ao correspondente com probabilidades reais.
Resumindo, mostramos que a cada N-cadeia quˆantica corresponde uma
matriz estoastica, unit´aria e com entradas n˜ao nulas. Reciprocamente, toda
matriz n × n com essas propriedades ´e a matriz de amplitude de transi¸ao
de uma N-cadeia quˆantica [15]. De fato:
Observao O processo acima pode se revertido a partir de uma matriz
complexa A do tipo n por n que seja estoastica e unit´aria. Dada a matriz
A, temos uma maneira natural de definir a medida de amplitude complexa
A sobre S . Isso ´e an´alogo ao que ´e feito no caso real [36]. Seja
p =
(p
0
, . . . , p
n1
) uma distribui¸ao de probabilidade inicial, isto ´e, um vetor tal
que p
0
+···+p
n1
= 1. Podemos definir uma probabilidade sobre os cilindros
de S = {s
0
, . . . , s
n1
} por
A(a
0
a
1
···a
t
) = A
a
t
a
t1
A
a
t1
a
t2
···A
a
1
a
0
(
p )
a
0
Isto define a medida complexa sobre toda a σalgebra gerada pelos cilin-
dros, pelo teorema da extens˜ao de Kolmogorov. Esta A ´e sigma aditiva.
Chamamos A de medida complexa de Markov.
Seja agora X
t
: S S, onde X
t
(w) = w
t
, e w = (w
0
, w
1
, .., w
t
, ...), com
t N.
´
E acil ver que X
t
, t N, e A satisfazem a hip´otese de ser uma cadeia
quˆantica.
Se
p ´e tal que A
p =
p , enao o processo X
t
ser´a A- estacion´ario, ou
seja,
A(X
t
1
= a
1
, X
t
2
= a
2
, ...X
t
n
= a
n
) = A(X
t
1
+t
= a
1
, X
t
2
+t
= a
2
, ..., X
t
n
+t
= a
n
)
para todos t 0, e 0 t
1
< t
2
< .. < t
n
, e a
1
, a
2
, ..., a
n
S .
Teorema 2.2.2 Em uma N-cadeia quˆantica {X
t
}, X
t
ao interfere em X
t
,
para todo 0 t t
N. Em outras palavras, o futuro ao interfere no
passado.
Prova Usaremos a nota¸ao j(t) := j
t
. Podemos assumir que t 1. Pela
propriedade de Markov e pela estacionariedade, temos:
A[X
1
t
(s
j
) X
1
t
(s
k
)]
=
j(1),...,j(t
1)
A[X
1
t
(s
k
) X
1
t
1
(s
j(t
1)
) ··· X
1
t
(s
j
) ··· X
1
1
(s
j(1)
)]
14
=
j(1),...,j(t
1)
A[X
1
t
1
(s
j(t
1)
) ··· X
1
1
(s
j(1)
)]A[X
1
t
(s
k
)|X
1
t
1
(s
j(t
1)
)]
=
j(t
1)
A[X
1
t
(s
j
) X
1
t
1
(s
j(t
1)
)]A
kj(t
1)
(2.4)
Iterando esta equa¸ao obtemos
A[X
1
t
(s
j
) X
1
t
(s
k
)]
=
j(t
1)
j(t
2)
A[X
1
t
(s
j
) X
1
t
2
(s
j(t
2)
)]A
kj(t
1)
A
j(t
1)j(t
2)
=
j(t
2)
A[X
1
t
(s
j
) X
1
t
2
(s
j(t
2)
)]A
2
kj(t
2)
= ···
= ··· =
j(t)
A[X
1
t
(s
j
) X
1
t
(s
j(t)
)](A
t
t
)
kj(t)
= A[X
1
t
(s
j
)](A
t
t
)
kj
Como A ´e unit´aria, A
t
t
tamb´em ´e, e portanto
k
P [X
1
t
(s
j
) X
1
t
(s
k
)] = P [X
1
t
(s
j
)]
k
|A
t
t
kj
|
2
= P [X
1
t
(s
j
)]
o que conclui a prova.
Note que no ´ultimo passo da demonstra¸ao fica clara a importˆancia da
matriz A ser unit´aria: esse fato ´e essencial para garantir a ao interferˆencia
entre as medi¸oes da N-cadeia. Note que podemos analisar uma teoria de
amplitudes associadas a matrizes complexas estoc´asticas, sem levar em conta
a unitariedade das matrizes, mas nesse caso a demonstra¸ao que fizemos do
teorema acima ao ´e alida.
Suponha uma N-cadeia {X
t
} com matriz de amplitude de transi¸ao A =
(A)
jk
, j, k S. A amplitude e a distribui¸ao dos estados s
0
, s
1
, . . . s
n1
S no tempo t = 0, . . . , N ao dados, respectivamente, por
X
t
= (A[X
t
= s
0
], . . . , A[X
t
= s
n1
]) C
n
que ´e um vetor unit´ario (ou seja,
|A|
2
= 1) e
P
t
(k) = P [X
t
= s
k
] = |A[X
t
= s
k
]|
2
= |(
X
t
)
k
|
2
.
15
Teorema 2.2.3 Em uma N-cadeia quˆantica {X
t
},
X
t
= A
t
X
0
e
p(X
t
= k) = P
t
(k) = |(A
t
X
0
)
k
|
2
. (2.5)
Prova Por ser uma cadeia de Markov e pela homogeneidade, temos
A[X
1
t
(s
k
) X
1
t1
(s
j(t1)
) ··· X
1
0
(s
j(0)
)]
= A[X
1
t1
(s
j(t1)
) ··· X
1
0
(s
j(0)
)]A[X
1
t
(s
k
)|X
1
t1
(s
j(t1)
)]
= A
kj(t1)
A[X
1
t1
(s
j(t1)
) ··· X
1
0
(s
j(0)
)]
= A
kj(t1)
A
j(t1)j(t2)
···A
j(2)j(1)
A[X
1
1
(s
j(1)
)|X
1
0
(s
j(0)
)]
= A
kj(t1)
A
j(t1)j(t2)
···A
j(1)j(0)
(
X
0
)
j(0)
Portanto,
(
X
t
)
k
= A[X
t
= s
k
]
=
j(t1),...,j(0)
A
kj(t1)
A
j(t1)j(t2)
···A
j(1)j(0)
(
X
0
)
j(0)
= (A
t
X
0
)
k
Segue que
X
t
= A
t
X
0
e que P
t
(k) = |(A
t
X
0
)
k
|
2
.
Este teorema ilustra o fato de que temos dois sistemas evoluindo com
o tempo em paralelo: um complexo dado por A
t
X
0
e outro real dado por
P
t
X
0
. O sistema definido por P ´e a cadeia de Markov cl´assica e o definido
por A ´e a cadeia de Markov quˆantica.
Uma maneira mais simples de se obter a evolu¸ao da cadeia quˆantica
´e atraes dos autovalores e autovetores de A. Desta forma obtemos uma
express˜ao expl´ıcita para o alculo de probabilidades P (X
t
= k).
Sejam λ
0
, . . . , λ
n1
autovalores (possivelmente repetidos) de uma matriz
unit´aria A e seja ψ
0
, . . . , ψ
n1
a base ortonormal de autovetores correspon-
dente. Como ´e feito em [15], supondo que
X
0
= (1, 0, . . . , 0), temos:
A
t
X
0
= A
t
j
X
0
, ψ
j
ψ
j
=
j
(ψ
j
)
0
A
t
ψ
j
=
j
(ψ
j
)
0
λ
t
j
ψ
j
E da equa¸ao (2.5), obtemos
P
t
(k) = |
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
|
2
. (2.6)
Usaremos esta express˜ao para calcular probabilidades de transi¸ao, mas
em alguns exemplos iremos considerar o caso geral em que
X
0
´e qualquer.
16
2.3 Matrizes de Dirichlet
Nesta se¸ao vamos exibir uma grande classe de matrizes A satisfazendo a
hip´otese de ser matriz quˆantica.
Defini¸ao Sejam n, a inteiros positivos, (n, a) = 1. A matriz de Dirichlet
M(n, a) ´e a matriz n × n com entradas
B
jk
=
1
n
e
a(jk)
2
/n
, j, k = 0, 1, . . . , n 1
´
E poss´ıvel mostrar que M(n, a) gera um an´alogo discreto da amplitude de
Feynman para uma part´ıcula livre, e que se n , esse an´alogo se aproxima
da amplitude de Feynman.
Queremos saber quando a matriz M(n, a) ´e unit´aria. Precisamos do
seguinte lema, cuja prova ´e imediata.
Lema Dois inteiros positivos n e a ao relativamente primos se e somente
se al = nm, para quaisquer inteiros l, m, com 0 < |l| < n.
Teorema A matriz M(n, a) ´e unit´aria se e somente se n e a ao relativa-
mente primos.
-Prova Como
n1
k=0
|B
jk
|
2
= 1
para j = 0, . . . n 1, ´e claro que M(n, a) ´e unit´aria se e somente se
n1
k=0
B
jk
B
j
k
= 0
para j = j
. Nesse caso, temos
n
n1
k=0
B
jk
B
j
k
=
n1
k=0
exp
a
n
[(j k)
2
(j
k)
2
]
= e
a(j
2
j
2
)/n
n1
k=0
e
i2πa(j
j)k/n
Se n e a ao relativamente primos temos, aplicando o lema, que a soma
geom´etrica na ´ultima express˜ao satisfaz
n1
k=0
e
i2πa(j
j)/n
k
=
1 e
i2πa(j
j)
1 e
i2πa(j
j)/n
= 0
17
e portanto M(n, a) ´e unit´aria. Se n e a ao ao relativamente primos ent˜ao
pelo lema, existe j = j
tal que a(j j
) = nm para algum inteiro m. Nesse
caso, a s´erie geom´etrica tem soma n e portanto M(n, a) ao ´e unit´aria, o que
conclui a prova.
Defini¸ao A soma de Dirichlet ´e dada por
S(n, a) =
n1
j=0
e
aj
2
/n
A distribui¸ao de probabilidades gerada pela matriz de Dirichlet depende
da paridade de na. O seguinte lema ilustra o problema.
Lema 2.3.1 1. Se na ´e par ent˜ao
n1
j=0
e
a(jk)
2
/n
= S(n, a), 0 k 2n 2
2. Se na ´e ´ımpar ent˜ao
n1
j=0
e
a(jk1/2)
2
/n
=
1
2
S(4n, a), 0 k 2n 2
Prova 1. Primeiro suponha que j n 1. Enao
S :=
n1
k=0
e
a(kj)
2
/n
=
j1
k=0
e
a(kj)
2
/n
+
n1
k=j
e
a(kj)
2
/n
Fazendo r = j k no primeiro somat´orio e r = nk +j no segundo, obtemos
S =
j
r=1
e
ar
2
/n
+
n
r=j+1
e
a(nr)
2
/n
Como na ´e par, obtemos
S =
n
r=1
e
ar
2
/n
=
n1
r=0
e
ar
2
/n
= S(n, a)
18
A seguir, suponha que n j 2n 2. Ent˜ao j = n + r para algum inteiro
0 r n 2. Novamente, como na ´e par, temos
S =
n1
k=0
e
a(knr)
2
/n
=
n1
k=0
e
a(kr)
2
/n
Mas este ´ultimo somat´orio ´e igual a S(n, a) pelo resultado anterior.
2. Considere a soma
T :=
4n1
k=0
e
a(k2j)
2
/4n
Vale que T ´e a soma de suas somas parciais T = U + E, onde
U :=
2n
k=1
e
a(2k12j)
2
/4n
E :=
2n1
k=0
e
a(2k2j)
2
/4n
Podemos escrever E como
E =
n1
k=0
e
a(kj)
2
/n
+
2n1
k=n
e
a(kj)
2
/n
Fazendo r = k n no segundo somat´orio e usando o fato de que na ´e ´ımpar,
obtemos
2n1
k=n
e
a(kj)
2
/n
=
n1
r=0
e
a(r+nj)
2
/n
=
n1
r=0
e
a(rj)
2
/n
Portanto, E = 0. Como
e
a(4n12j)
2
/4n
= e
a(1+2j)
2
/4n
,
temos
U =
n1
k=0
e
a(2k12j)
2
/4n
+
2n1
k=n
e
a(2k12j)
2
/4n
Novamente, fazendo r = k n no segundo somat´orio e usando o fato de que
na ´e ´ımpar, obtemos
2n1
k=n
e
a(2k12j)
2
/4n
=
n1
r=0
e
a(2r+2n12j)
2
/4n
=
n1
r=0
e
a(2r12j)
2
/4n
19
Segue que
T = U = 2
n1
k=0
e
a(kj1/2)
2
/n
Mas como 4na ´e par, segue da parte 1 que T = S(4n, a).
Uma conseq¨uˆencia deste lema ´e que se na ´e par enao a soma das linhas e
das colunas de M(n, a) vale n
1/2
S(n, a); al´em disso, ´e mostrado em [15],[17]
que |S(n, a)| = n
1/2
. Podemos concluir da´ı que a matriz
A = M
(n, a) =
S(n, a)
n
M(n, a)
´e estoastica. Ela tamb´em tem entradas ao nulas e ´e unit´aria.
Desta forma obtemos uma grande classe de matrizes A satisfazendo o que
foi exigido anteriormente. Por exemplo, vamos supor n = 4, a = 1. Enao
B
jk
=
1
2
e
(jk)
2
/4
, j, k = 0, . . . , 3
e
S
(4
,
1) = 1 +
e
/4
1 +
e
/4
= 2
e
/4
Da´ı, a matriz M
´e
A = M
(4, 1) =
1
2
e
/4
1 e
/4
1 e
/4
e
/4
1 e
/4
1
1 e
/4
1 e
/4
e
/4
1 e
/4
1
Entretanto, se na ´e ´ımpar ent˜ao a matriz de Dirichlet n˜ao pode se tornar
estoastica desta forma. Por exemplo, se n = 3 e a = 1, temos:
M(3, 1) =
1
3
1 e
/3
e
4/3
e
/3
1 e
/3
e
4/3
e
/3
1
A soma da primeira e terceira colunas difere da segunda e enao nenhum
m´ultiplo de M(3, 1) pode se tornar estoastica.
Para que possamos usar a equa¸ao (2.6) obtida na se¸ao anterior, pre-
cisamos dos autovalores e autovetores de M(n, a).
20
Teorema 2.3.2 1. Se na ´e par ent˜ao, para r = 0, . . . , n 1, os autoval-
ores de M(n, a) ao
λ
r
= n
1/2
S(n, a)e
ar
2
/n
e uma base ortonormal de autovetores correspondente ´e ψ
r
, onde
(ψ
r
)
k
= n
1/2
e
i2πark/n
, k = 0, . . . , n 1
2. Se na ´e ´ımpar ent˜ao, para r = 0, . . . , n 1, os autovalores de M(n, a)
ao
λ
j
=
1
2n
1/2
S(4n, a)e
a(r+1/2)
2
/n
e uma base ortonormal de autovetores correspondente ´e ψ
r
, onde
(ψ
r
)
k
= n
1/2
e
i2πa(r+(1/2))k/n
, k = 0, . . . , n 1
Prova 1. A j-´esima coordenada de M(n, a)ψ
r
´e
[M(n, a)ψ
r
]
j
= n
1/2
n1
k=0
e
a(jk)
2
/n
e
i2πark/n
Mas
e
i2πarj/n
exp
a[(j k)
2
2rk + 2rj]/n
= (ψ
r
)
j
e
ar
2
/n
e
a(k(j+r))
2
/n
Aplicando o lema 2.3.1, item 1, obtemos
[M(n, a)ψ
r
]
j
= (ψ
r
)
j
n
1/2
e
ar
2
/n
n1
k=0
e
a(k(j+r))
2
/n
= n
1/2
S(n, a)e
ar
2
/n
(ψ
r
)
j
= λ
r
(ψ
r
)
j
2. A j-´esima coordenada de M(n, a)ψ
r
´e
[M(n, a)ψ
r
]
j
= n
1/2
n1
k=0
e
a(jk)
2
/n
e
a(2r+1)k/n
Mas
e
a(2r+1)j/n
exp
a[(j k)
2
(2r + 1)k + (2r + 1)j]/n
= (ψ
r
)
j
e
a(r+1/2)
2
/n
e
a(k(j+r+1/2))
2
/n
21
Aplicando o lema 2.3.1, item 2, obtemos
[M(n, a)ψ
r
]
j
= (ψ
r
)
j
n
1/2
e
a(r+1/2)
2
/n
n1
k=0
e
a(k(j+r+1/2))
2
/n
=
n
1/2
2
S(4n, a)e
a(r+1/2)
2
/n
(ψ
r
)
j
= λ
r
(ψ
r
)
j
Apliquemos a equa¸ao acima usando o teorema anterior, e obtemos para
na par que
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
=
S(n, a)
t
n
t/2+1
j
e
atj
2
/n
e
i2πajk/n
e para na ´ımpar obtemos
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
=
S(4n, a)
t
2
t
n
3/2
j
e
at(j+1/2)
2
/n
e
i2πa(j+1/2)k/n
Mas como |S(n, a)| =
n, obtemos da equa¸ao (2.6), para t > 0 e na par
que
P (X
t
= k) = P
t
(k) =
1
n
2
n1
j=0
e
a(tj+k)
2
/nt
2
, (2.7)
e para na ´ımpar que
P (X
t
= k) =
1
n
2
n1
j=0
e
a(t(j+1/2)+k)
2
/nt
2
(2.8)
Acima assumimos que a a matriz de transi¸ao estoastica P ´e tal que
P
ij
= |A
ij
|
2
, para todo i, j, e ainda que o vetor de probabilidade inicial ´e a
delta de Dirac em s
0
, ou seja, (1, 0, 0, ...0).
Estas equa¸oes nos fornecem express˜oes expl´ıcitas para P
t
, mas elas ao
est˜ao em uma forma fechada e portanto ao nos mostram muita informa¸ao
sobre a dinˆamica do sistema. Faremos o trabalho ecnico de calcular tais
somas na pr´oxima se¸ao.
22
2.4 Distribui¸oes de Probabilidade
Agora vamos calcular as probabilidades fornecidas pelas equa¸oes (2.7) e
(2.8) dadas na se¸ao anterior. Vamos analisar tamem alguns exemplos de
outros tipos (n˜ao Dirichlet).
Nota¸ao Sejam a, b inteiros. Denotaremos por a
(2)
o n´umero de vezes
em que o fator 2 aparece na decomposi¸ao prima de a. Ainda, o aximo
divisor comum entre a e b ´e dado por (a, b).
Note que estamos usando as distribui¸oes obtidas pela express˜ao (2.6)
da se¸ao anterior, que foi obtida tomando como distribui¸ao inicial o vetor
(1, 0, ···, 0).
Temos o seguinte teorema:
Teorema 2.4.1 Sejam n e t inteiros, com (n, t) = d, t > 0.
1. Se n ´e par, ent˜ao P (X
t
= k) = d/n se t
(2)
= n
(2)
e d|k, ou, se t
(2)
= n
(2)
e 2k/d ´e impar. Caso contr´ario, P (X
t
= k) = 0.
2. Se n ´e ´ımpar ent˜ao P (X
t
= k)=d/n se d|k. Caso contr´ario, P (X
t
=
k) = 0.
Prova 1. Aplicando (2.7) e o lema 2.6.1, ´ıtem 1
1
, temos
P (X
t
= k) =
1
n
2
d1
m=0
(1)
amnt/d
2
e
i2πakm/d
2
n/d1
j=0
e
iaπ(tj+k)
2
/nt
2
Suponha que t
(2)
= n
(2)
. Enao nt/d
2
´e par, e da´ı
d1
m=0
(1)
amnt/d
2
e
i2πakm/d
=
d1
m=0
(e
i2πak/d
)
m
A soma geom´etrica vale d se d|k e vale 0 caso contr´ario. Suponha que t
(2)
=
n
(2)
. Enao nt/d
2
´e ´ımpar e da´ı
d1
m=0
(1)
amnt/d
2
e
i2πakm/d
=
d1
m=0
(e
i2πak/d
)
m
1
ver os lemas 2.6.1 e 2.6.2 no Apˆendice deste cap´ıtulo
23
Se 2k/d ´e um inteiro ´ımpar ent˜ao a soma geom´etrica vale d. Caso contr´ario,
temos
d1
m=0
(e
i2πak/d
)
m
=
1 (1)
d
1 + e
i2πak/d
Como t
(2)
= n
(2)
e n ´e par, temos que d ´e par e portanto a ´ultima express˜ao
vale zero. Concluimos que quando P (X
t
= k) ao ´e zero, temos
P (X
t
= k) =
d
2
n
2
n/d1
j=0
e
a(tj+k)
2
/nt
2
=
d
2
n
2
n
1
j=0
e
a(t
j+1/2)
2
/nt
2
onde n
= n/d e t
= t/d. Segue que (n
, t
) = 1. Se t
(2)
= n
(2)
e d|k, vale que
nt/d
2
´e par e n
at
= ant/d
2
´e par. Aplicando o lema 2.6.2, parte 1 obtemos
n
1
j=0
e
a(t
j+k/d)/n
t
2
= |S(n
, at
)|
2
= n
Logo,
P (X
t
= k) =
d
2
n
2
n
=
d
n
Se t
(2)
= n
(2)
e 2k/d ´e ´ımpar ent˜ao nt/d
2
´e ´ımpar e n
at
= ant/d
2
´e ´ımpar.
Fazendo 2k/d = 2µ + 1 e aplicando o lema 2.6.1, ´ıtem 2, obtemos
n
1
j=0
e
a(t
j+µ+1/2)
2
/n
t
2
=
1
2
|S(4n
, at
)|
2
= n
Novamente,
P (X
t
= k) =
d
2
n
2
n
=
d
n
2. Seja n ´ımpar e a par. Aplicando (2.7) e o lema 2.6.1, parte 1, obtemos
P (X
t
= k) como no item 1 deste teorema. Se t
(2)
= n
(2)
enao nt/d
2
´e par
e enao como no item 1, a erie geom´etrica tem soma d se d|k e vale 0 caso
contr´ario. Se t
(2)
= n
(2)
enao nt/d
2
´e ´ımpar. Como a ´e par, temos
d1
m=0
(1)
amnt/d
2
e
i2πakm/d
=
d1
m=0
(e
i2πak/d
)
m
Como antes, a s´erie geom´etrica tem soma d se d|k e vale 0 caso contr´ario.
Como no item 1, P(X
t
= k) = d/n quando tal valor ao se anula. Final-
mente, seja na ´ımpar. Aplicando (2.8), e o lema 2.6.1, parte 2, temos
P (X
t
= k) =
1
n
2
d1
m=0
e
i2πakm/d
2
n/d1
j=0
e
a(t(j+1/2)+k)
2
/nt
2
24
A soma geom´etrica tem soma d se d|k e vale zero caso contr´ario. Quando
P (X
t
= k) ao se anula, temos
P (X
t
= k) =
d
2
n
2
n
1
j=0
e
a(t
(j+1/2)+k/d)
2
/n
t
2
onde n
= n/d e t
= t/d. Novamente, temos (n
, t
) = 1. Aplicando o lema
2.6.2, partes 3 e 4, concluimos que
P (X
t
= k) =
d
2
n
2
n
=
d
n
.
Este teorema nos fornece o fato interessante de que P (X
t
= k) independe
de a. Alguns corol´arios seguem a partir deste teorema.
Corol´ario 2.4.2 Temos os seguintes casos:
1. Suponha n par. Ent˜ao P (X
t
= k) = P (X
s
= k) se e somente se
(n, t) = (n, s) e t
(2)
, s
(2)
= n
(2)
ou t
(2)
= s
(2)
= n
(2)
.
2. Suponha n ´ımpar. Ent˜ao P (X
t
= k) = P (X
s
= k) se e somente se
(n, t) = (n, s).
Prova Seja d
t
= (n, t) e d
s
= (n, s).
1.
´
E claro que a condi¸ao ´e suficiente. Para ver que ´e necess´aria, vemos
que existe k tal que P (X
t
= k) = 0. Enao
d
t
n
= P (X
t
= k) = P (X
s
= k) =
d
s
n
Enao d
t
= d
s
.
2.
´
E claro que a condi¸ao ´e suficiente. Para ver que ´e necess´aria, suponha
que
P
(
X
t
=
k
) =
P
(
X
s
=
k
),
t
(2)
=
n
(2)
e
d
t
|
k
. Enao, como antes,
d
t
n
= P (X
t
= k) = P (X
s
= k) =
d
s
n
e enao d
t
= d
s
. Se s
(2)
= n
(2)
, enao como P (X
s
= k) = 0, temos que
2k/d ´e ´ımpar. Mas da´ı 2(k/d
t
) ´e ´ımpar, o que ´e uma contradi¸ao. Portanto,
s
(2)
= n
(2)
, e portanto t
(2)
, s
(2)
= n
(2)
. Suponha que t
(2)
= n
(2)
e que 2k/d
t
´e ´ımpar. Ent˜ao, como antes, d
t
= d
s
. Se s
(2)
= n
(2)
, ent˜ao como P (X
s
=
k) = 0, temos que d
s
|k. Mas da´ı 2(k/d
s
) ´e ´ımpar, o que ´e uma contradi¸ao.
Portanto, t
(2)
= s
(2)
= n
(2)
.
25
Dizemos que z ´e o per´ıodo de x(t) R
n
, t 0, se z ´e o menor inteiro
positivo tal que x(t + z) = x(t) para todo t 0. Vamos considerar assim
x(t) = (P (X
t
= s
0
), P (X
t
= s
1
), ..., P (X
t
= s
n1
)) e observar que estamos
assumindo neste momento que x(0) = (1, 0, 0..., 0). Enao z ´e o per´ıodo de
x(t) se P (X
t+z
= k) = P (X
t
= k), para todo t e para todo k.
Corol´ario 2.4.3 Temos os seguintes casos:
1. Se n ´e ´ımpar o per´ıodo de x(t) (acima definido) ´e n.
2. Se n ´e par ent˜ao o per´ıodo de de x(t) (acima definido) ´e 2n.
Prova 1. Como (n, t) = (n, n+t), pelo corol´ario 2.4.2, vale que P (X
t
= k) =
P (X
t+n
= k) para cada t. O menor inteiro positivo tal que n = (n, 0) = (n, p)
´e p = n. Portanto, n ´e o menor inteiro positivo tal que P (X
n
= k) = P (X
0
=
k). Enao n ´e o per´ıodo de probabilidade.
2. Primeiro, (n, t) = (n, 2n + t). Suponha que t
(2)
= n
(2)
= m. Ent˜ao
t = 2
m
p, n = 2
m
q, onde p e q ao ´ımpares. Portanto,
2n + t = 2
m+1
q + 2
m
p = 2
m
(2q + p)
Como 2q +p ´e ´ımpar, (2n +t)
(2)
= m. A seguir, suponha que (2n+ t)
(2)
= m.
Enao 2n + t = 2
m
p, n = 2
m
q, onde p e q ao ´ımpares. Portanto,
t = 2
m
p = 2
m+1
q = 2
m
(p 2q)
Como p2q ´e ´ımpar, t
(2)
= m. Pelo corol´ario 2.4.2, P (X
t
= k) = P (X
t+2n
=
k) para todo t. Agora suponha que p > 0 e que P (X
t
= k) = P (X
0
= k).
Pelo corol´ario 2.4.2, n = (n, 0) = (n, p). Portanto, n|p e ent˜ao p = rn para
algum inteiro positivo r. Se r = 1 enao p
(2)
= n
(2)
, mas 0
(2)
= n
(2)
o que
contradiz o corol´ario 2.4.2. Logo, r = 1. Segue que 2n ´e o menor inteiro
positivo que satisfaz P(X
2n
= k) = P (X
0
= k). Logo, 2n ´e o per´ıodo de
probabilidade.
Isso mostra que ao precisamos calcular P (X
t
= k) para t 2n, n par e
para t n, n ´ımpar. O pr´oximo corol´ario nos diz que para n par tamb´em
ao ´e necess´ario calcular P (X
t
= k), t n.
26
Corol´ario 2.4.4 Temos:
1. P (X
0
= k) = δ
0,k
2. Se n ´e par ent˜ao P (X
n
= k) = δ
n/2,k
e P (X
t
= k) = P (X
2nt
= k),
0 t 2n.
Prova A prova de 1 ´e evidente. Provemos o item 2. Pelo teorema 2.4.1,
P (X
n
= k) = 1 se e somente se 2k/n ´e ´ımpar. Mas 2k/n ´ımpar ´e equivalente
a 2k = nr, onde r ´e ´ımpar, e enao k = (n/2)r. Como 0 k n1, isso vale
se e somente se k = n/2. Para a segunda parte, (n, t) = (n, 2n t). Suponha
que t
(2)
= n
(2)
= m. Enao t = 2
m
p, n = 2
m
q, onde p e q ao ´ımpares. Logo,
2n t = 2
m
(2q p)
Como 2q p ´e ´ımpar, (2n t)
(2)
= m. A seguir, suponha que (2n t)
(2)
=
n
(2)
= m. Por um argumento semelhante, t
(2)
= m. Pelo corol´ario 2.4.2,
P (X
t
= k) = P (X
2nt
= k).
Este ´ultimo corol´ario significa que o sistema inicia em s
0
e que a seq¨uˆencia
de probabilidades para t = 0, 1, 2, . . . , n ´e a mesma para 2n, 2n 1, 2n
2, . . . , n, nesta ordem.
Lembre que assumimos at´e agora nesta se¸ao que o vetor de probabilidade
inicial ´e p = (1, 0, 0, ..., 0) e ao um p tal que Ap = p. Assim, com ao poderia
deixar de ser, a matriz de Dirichlet (com tal vetor inicial) ao determina
um Processo Estoastico Estacion´ario, mas sim uma seq¨uˆencia peri´odica de
probabilidades de estado.
Abaixo temos a tabela de P
t
(k) = P (X
t
= k), para n = 12.
27
t/k 0 1 2 3 4 5 6 7 8 9 10 11
0 1 0 0 0 0 0 0 0 0 0 0 0
1 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
2 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0
3 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0
4 0 0 1/3 0 0 0 1/3 0 0 0 1/3 0
5 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
6 1/2 0 0 0 0 0 1/2 0 0 0 0 0
7 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
8 1/3 0 0 0 1/3 0 0 0 1/3 0 0 0
9 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0
10 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0
11 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
12 0 0 0 0 0 0 1 0 0 0 0 0
13 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
14 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0
15 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0
16 1/3 0 0 0 1/3 0 0 0 1/3 0 0 0
17 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
18 1/2 0 0 0 0 0 1/2 0 0 0 0 0
19 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
20 0 0 1/3 0 0 0 1/3 0 0 0 1/3 0
21 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0
22 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0
23 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12
24 1 0 0 0 0 0 0 0 0 0 0 0
Pelo corol´ario acima, para t de 13 a 24, a tabela ´e a mesma, mas em ordem
inversa. Obtemos uma seq¨uˆencia de probabilidades de per´ıodo 2n. Podemos
dizer que em um tempo t, existem certas transi¸oes imposs´ıveis (i.e., P
t
(k) =
0 para certos k) e as que podem ocorrem, tem todas a mesma probabilidade.
Como temos um n´umero finito de estados (ou alternativamente, um n´umero
finito de vetores unit´arios que diferem de um ˆangulo constante), o n´umero
de caminhos poss´ıveis para uma part´ıcula ´e finito, e ao todos igualmente
proaveis no in´ıcio de um processo.
Outra tabela, para n=4 (ver [17]):
28
t/k 0 1 2 3
0 1 0 0 0
1 1/4 1/4 1/4 1/4
2 1/2 0 1/2 0
3 1/4 1/4 1/4 1/4
4 0 0 1 0
5 1/4 1/4 1/4 1/4
6 1/2 0 1/2 0
7 1/4 1/4 1/4 1/4
8 1 0 0 0
Vamos mostrar abaixo que existem certos p C
n
tais que para certas
matrizes de Dirichlet A vale Ap = p.
O seguinte exemplo ´e inspirado pela moeda quˆantica que ´e descrita no
exemplo 1 da se¸ao 8.2.
Exemplo Matrizes Quˆanticas A dois por dois ao necessariamente do
tipo Dirichlet. Sejam u, v C tais que u + v = 1 e |u|
2
+ |v|
2
= 1. Uma
condi¸ao necess´aria e suficiente para que essas propriedades sejam satisfeitas
´e que u = 1 v, 0 Re(u) 1 e Im(u) = ±(Re(u))
1/2
(1 Re(u))
1/2
.
Enao, vemos que o n´umero real 0 Re(u) 1 determina u e v a menos de
conjuga¸ao. Por exemplo, se Re(u) = 1/2, temos u = (1±i)/2, v = (1i)/2.
Vamos construir uma matriz quˆantica complexa A a partir do seguinte.
Sejam u
1
, v
1
e u
2
, v
2
dois pares de n´umeros complexos tais que
u
1
+ v
1
= 1 , |u
1
|
2
+ |v
1
|
2
= 1
u
2
+ v
2
= 1 , |u
2
|
2
+ |v
2
|
2
= 1
Pelo que vimos acima, tais n´umeros tem a forma
u
1
= x
1
± i
x
1
(1 x
1
) , v
1
= 1 x
1
i
x
1
(1 x
1
)
u
2
= x
2
± i
x
2
(1 x
2
) , v
2
= 1 x
2
i
x
2
(1 x
2
)
onde x
1
e x
2
[0, 1].
Seja a matriz
A
±
=
u
1
u
2
1 u
1
1 u
2
=
x
1
± i
x
1
(1 x
1
) x
2
± i
x
2
(1 x
2
)
1 x
1
i
x
1
(1 x
1
) 1 x
2
i
x
2
(1 x
2
)
Observe que, com respeito aos sinais da parte imagin´aria, devemos fazer
duas escolhas independentes, ou seja, uma para a primeira coluna e outra
para a segunda. Portanto, se queremos determinar sob quais condi¸oes a
matriz A ´e unit´aria, devemos resolver o sistema AA
= I em quatro casos:
29
1. Caso (+, +), ou seja,
A =
x
1
+ i
x
1
(1 x
1
) x
2
+ i
x
2
(1 x
2
)
1 x
1
i
x
1
(1 x
1
) 1 x
2
i
x
2
(1 x
2
)
Resolvendo uma das equa¸oes de AA
= I (que ´e um sistema de duas
equa¸oes independentes), conclu´ımos primeiro que x
1
+ x
2
= 1, e por-
tanto A tem a forma
A =
x
1
+ i
x
1
(1 x
1
) 1 x
1
+ i
x
1
(1 x
1
)
1 x
1
i
x
1
(1 x
1
) x
1
i
x
1
(1 x
1
)
E resolvendo a outra equa¸ao, obtemos que x
1
= 0 ou 1, e portanto,
neste caso,
A =
1 0
0 1
ou
0 1
1 0
Para a primeira matriz (identidade), o autovalor ´e 1, com autovetores
(1, 0) e (0, 1). Para a segunda, um autovalor ´e 1 com autovetor associ-
ado (1, 1) e o outro ´e 1 com autovetor 1/
2(1, 1).
2. Caso (, ), ou seja,
A =
x
1
i
x
1
(1 x
1
) x
2
i
x
2
(1 x
2
)
1 x
1
+ i
x
1
(1 x
1
) 1 x
2
+ i
x
2
(1 x
2
)
Aqui obtemos as mesmas solu¸oes do caso 1.
3. Caso (+, ),
A =
x
1
+ i
x
1
(1 x
1
) x
2
i
x
2
(1 x
2
)
1 x
1
i
x
1
(1 x
1
) 1 x
2
+ i
x
2
(1 x
2
)
Resolvendo uma das equa¸oes de AA
= I, conclu´ımos que x
1
+x
2
= 1,
e portanto A ´e sim´etrica da forma
A =
x
1
+ i
x
1
(1 x
1
) 1 x
1
i
x
1
(1 x
1
)
1 x
1
i
x
1
(1 x
1
) x
1
+ i
x
1
(1 x
1
)
A outra equa¸ao ´e uma identidade e ao imp˜oe restri¸oes sobre x
1
ou
x
2
. Um autovalor ´e 2x
1
1 + 2i
x
1
(1 x
1
) com autovetor associado
1/
2(1, 1) e o outro autovalor ´e 1 com autovetor 1/
2(1, 1).
30
4. O caso (, +) ´e semelhante ao caso (+, ):
A =
x
1
i
x
1
(1 x
1
) x
2
+ i
x
2
(1 x
2
)
1 x
1
+ i
x
1
(1 x
1
) 1 x
2
i
x
2
(1 x
2
)
Resolvendo AA
= I, temos que x
1
+ x
2
= 1, e portanto
A =
x
1
i
x
1
(1 x
1
) 1 x
1
+ i
x
1
(1 x
1
)
1 x
1
+ i
x
1
(1 x
1
) x
1
i
x
1
(1 x
1
)
Um autovalor ´e 2x
1
1 2i
x
1
(1 x
1
) com autovetor associado
1/
2(1, 1) e o outro autovalor ´e 1 com autovetor 1/
2(1, 1).
Assim obtemos condi¸oes para que as matrizes sejam unit´arias. Se x =
0, 1, temos que possuem entradas ao-nulas e portanto A
±
´e a matriz de
amplitude de transi¸ao de uma N-cadeia quˆantica. Como fizemos na se¸ao
de cadeias quˆanticas, vamos calcular as probabilidades de transi¸ao. Para
isso, precisamos dos autovalores e autovetores de A
±
. Pelo que vimos nos
casos acima, podemos construir uma medida de Markov estacion´aria (vista na
se¸ao 2.2) escolhendo como vetor estacion´ario o vetor associado ao autovalor
1 (que sempre ´e um autovalor para a moeda quˆantica, ao menos no caso de
ordem 2).
Observao Supondo que temos um vetor de distribui¸ao inicial
X
0
=
(1, 0, . . . , 0), podemos usar a express˜ao para probabilidades
P (X
t
= k) = P
t
(k) = |
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
|
2
obtido na se¸ao 2.2 para cadeias quˆanticas. Fazendo S = {s
0
, s
1
} = {0, 1} e
escrevendo P
t
(k) = P (f
1
t
(s
k
)), temos
P
t
(0) =
(ψ
0
)
0
λ
t
0
(ψ
0
)
0
+ (ψ
1
)
0
λ
t
1
(ψ
1
)
0
2
=
1 + λ
t
1
2
2
P
t
(1) =
(ψ
0
)
0
λ
t
0
(ψ
0
)
1
+ (ψ
1
)
0
λ
t
1
(ψ
1
)
1
2
=
1 λ
t
1
2
2
Para mostrar um exemplo, observe o caso particular em que x = Re(u) =
1/2. Enao temos a matriz
A =
1
2
1 + i 1 i
1 i 1 + i
31
Os autovalores ao
λ
0
= i , λ
1
= 1
e os respectivos autovetores ao
ψ
0
= (
1
2
,
1
2
) , ψ
1
= (
1
2
,
1
2
)
Como antes, S = {s
0
, s
1
} = {0, 1}. Temos
P
t
(0) =
(ψ
0
)
0
λ
t
0
(ψ
0
)
0
+ (ψ
1
)
0
λ
t
1
(ψ
1
)
0
2
=
1 + i
t
2
2
P
t
(1) =
(ψ
0
)
0
λ
t
0
(ψ
0
)
1
+ (ψ
1
)
0
λ
t
1
(ψ
1
)
1
2
=
1 i
t
2
2
Enao obtemos uma seq¨uˆencia peri´odica de probabilidades:
t/k 0 1
0 1 0
1 1/2 1/2
2 0 1
3 1/2 1/2
4 1 0
Observao Considere o teorema cl´assico de convergˆencia de cadeias de
Markov reais:
Teorema 2.4.5 Seja P uma matriz estoastica (real) e regular e seja S =
{1, 2, 3, . . . , d}. Ent˜ao:
1. P tem um ´unico vetor de probabilidade fixo π e os componentes de π
ao todos positivos, ou seja ´e ´unico o vetor de probabilidade π tal que
Pπ = π e
sS
π
s
= 1 e π
s
> 0,s S.
2. Se p ´e qualquer vetor de probabilidade, ent˜ao a seq¨encia de vetores
Pp, P
2
p, P
3
p, ... converge para o ponto fixo π, isto ´e,
lim
n→∞
P
n
p = π.
Como conseq¨encia, as entradas das matrizes P, P
2
, P
3
, . . . obtidas
a partir de P convergem para as entradas correspondentes da matriz
cujas colunas ao iguais ao vetor fixo π. Ou seja,
32
lim
n→∞
P
n
=
π
1
π
1
π
1
. . . π
1
π
2
π
2
π
2
. . . π
2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
π
d
π
d
π
d
... π
d
Lembramos que uma matriz estoastica real P ´e regular se existir alguma
potˆencia de P tal que todas as suas entradas sejam positivas.
Note que este teorema ao vale, em geral, para cadeias de Markov quˆanticas
(considerando que a condi¸ao de entradas positivas ´e substitu´ıda pela condi¸ao
de possuir entradas ao nulas). Por exemplo, considere o item 2 do teorema.
Um alculo simples mostra que se
A =
1
2
1 + i 1 i
1 i 1 + i
enao a seq¨uˆencia de matrizes (A
n
)
n
´e uma seq¨encia peri´odica, e portanto
ao ocorre convergˆencia para a matriz cujas colunas ao o vetor estacion´ario
(1/
2, 1/
2) de A.
2.5 Alguns alculos
Exemplo 1: Matriz de Dirichlet Seja M(n, a) a matriz de Dirichlet,
dada por
M
jk
=
1
n
e
a(jk)
2
/n
,
onde n N e a Z, j, k {0, . . . , n 1}. Por (1) sabemos que M(n, a) ´e
unit´aria se e somente se n e a ao relativamente primos (i.e., (n, a) = 1) e
que se o produto na for par enao tal matriz pode ser tornada estoastica.
Denotamos o vetor de probabilidade inicial por
X
0
= (a
0
, ···, a
n1
).
Escrevemos abaixo alguns exemplos de matrizes onde (n, a) = 1 e na par,
com os seus respectivos autovalores, autovetores e processo estoastico real
P associado. O processo P ´e dado pela matriz |M|
2
,
(P )
ij
= (|M|
2
)
ij
= |M
ij
|
2
e o vetor de probabilidade inicial real associado ´e
p = |
X
0
|
2
= (|a
0
|
2
, ···, |a
n1
|
2
)
33
Se na ´e par, a renormaliza¸ao
M
(n, a) =
S(n, a)
n
M(n, a)
´e estoastica, onde S(n, a) ´e a soma de Dirichlet:
S(n, a) =
n1
j=0
e
aj
2
/n
Vamos analisar os casos M(2, 1), M(3, 2) e M(4, 1) e tentar determinar
se existem autovetores complexos associados ao autovalor 1. Temos:
1. Matriz M(2, 1).
M(2, 1) =
1
2
1 i
i 1
No trabalho de J. Kempe [23], tal matriz ´e vista como a de uma moeda
quˆantica balanceada (p´ag. 312), onde cara e coroa ao tratados da
mesma forma e o passeio n˜ao ´e influenciado pelo seu estado inicial [23].
Os autovalores e autovetores de M(2, 1) ao
2
2
(1 i), com autovetor (1, 1)
2
2
(1 + i), com autovetor (1, 1)
Ainda,
S(2, 1) = 1 + i
e portanto,
M
(2, 1) =
1
2
1 i 1 + i
1 + i 1 i
Os autovalores e autovetores de M
(2, 1) ao
i, com autovetor (1, 1)
1, com autovetor (1, 1)
O processo estoastico real associado ´e
P (2, 1) =
1
2
1 1
1 1
Os autovalores e autovetores de P (2, 1) ao
0, com autovetor (1, 1)
1, com autovetor (1, 1)
34
2. Matriz M(3, 2).
M(3, 2) =
1
3
1
1
2
+ i
3
2
1
2
+ i
3
2
1
2
+ i
3
2
1
1
2
+ i
3
2
1
2
+ i
3
2
1
2
+ i
3
2
1
Os autovalores e autovetores de M(3, 2) ao
3 i
2
, com autovetores (1, 1, 0), (1, 0, 1)
i, com autovetor (1, 1, 1)
Ainda,
S(3, 2) = i
3
e portanto,
M
(3, 2) =
i
3
2
1
1
2
+ i
3
2
1
2
+ i
3
2
1
2
+ i
3
2
1
1
2
+ i
3
2
1
2
+ i
3
2
1
2
+ i
3
2
1
Os autovalores e autovetores de M
(3, 2) ao
1
2
i
3
2
, com autovetores (1, 1, 0), (1, 0, 1)
1, com autovetor (1, 1, 1)
O processo estoastico real associado ´e
P (3, 2) =
1
3
1 1 1
1 1 1
1 1 1
Os autovalores e autovetores de P (3, 2) ao
0, com autovetores (1, 1, 0), (1, 0, 1)
1, com autovetor (1, 1, 1)
3. Matriz M(4, 1).
M(4, 1) =
1
2
1
2
2
(1 + i) 1
2
2
(1 + i)
2
2
(1 + i) 1
2
2
(1 + i) 1
1
2
2
(1 + i) 1
2
2
(1 + i)
2
2
(1 + i) 1
2
2
(1 + i) 1
35
Os autovalores e autovetores de M(4, 1) ao
1, com autovetores (1, 0, 1, 0), (0, 1, 0, 1)
2
2
(1 + i), com autovetor (1, 1, 1, 1)
2
2
(1 + i), com autovetor (1, 1, 1, 1)
Ainda,
S(4, 1) =
2(1 + i)
e portanto,
M
(4, 1) =
2
4
(1 i)
1
2
2
(1 + i) 1
2
2
(1 + i)
2
2
(1 + i) 1
2
2
(1 + i) 1
1
2
2
(1 + i) 1
2
2
(1 + i)
2
2
(1 + i) 1
2
2
(1 + i) 1
Os autovalores e autovetores de M
(4, 1) ao
2
2
(1 i), com autovetores (1, 0, 1, 0), (0, 1, 0, 1)
1, com autovetor (1, 1, 1, 1)
1, com autovetor (1, 1, 1, 1)
O processo estoastico real associado ´e
P (4, 1) =
1
4
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
Os autovalores e autovetores de P (4, 1) ao
0, com autovetores (0, 1, 0, 1), (0, 0, 1, 1), (1, 0, 0, 1)
1, com autovetor (1, 1, 1, 1)
Exemplo 2 Considere a matriz dada por
x + i
x(1 x) 1 x i
x(1 x)
1 x i
x(1 x) x + i
x(1 x)
36
para x (0, 1). Os autovalores e autovetores ao
2x 1 + i(2i
x(1 x)), com autovetor (1, 1)
1, com autovetor (1, 1)
O processo estoastico real associado ´e
x 1 x
1 x x
Os autovalores e autovetores ao
2x 1, com autovetor (1, 1)
1, com autovetor (1, 1)
2.6 Apˆendice
Neste apˆendice provamos dois lemas t´ecnicos usados na prova do teorema
2.4.1. Esta se¸ao segue [15]. Como antes, supomos que (n, a) = 1 e k =
0, . . . , n 1.
Lema 2.6.1 Seja (n, t) = d.
1. Ent˜ao
S
1
:=
n1
j=0
e
a(tj+k)
2
/nt
=
d1
m=0
(1)
amnt/d
2
e
i2πakm/d
n/d1
j=0
e
a(tj+k)
2
/nt
2. Se na ´e ´ımpar ent˜ao
S
2
:=
n1
j=0
e
a(t(j+1/2)+k)
2
/nt
=
d1
m=0
e
i2πakm/d
n/d1
j=0
e
a(t(j+1/2)+k)
2
/nt
37
Prova 1. Divida a soma S
1
em d partes para obter
S
1
=
d1
m=0
(m+1)n/d1
j=mn/d
e
a(tj+k)
2
/nt
Definindo j = s + mn/d, obtemos
S
1
=
d1
m=0
n/d1
s=0
e
a(t(s+mn/d)+k)
2
/nt
Como d|t e d
2
|nt, temos
e
a(t(s+mn/d)+k)
2
/nt
= e
a(ts+k)
2
/nt
(1)
amnt/d
2
e
i2πakm/d
e o resultado segue.
2. Novamente, separe a soma em d partes para obter
S
2
=
d1
m=0
n/d1
s=0
e
iaπ(t(s+1/2)+k+mnt/d)
2
/nt
=
d1
m=0
e
am
2
nt/d
n/d1
s=0
e
a(t(s+1/2)+k)
2
/nt
e
i2πam(t(s+1/2)+k)/d
Como d|t, a ´ultima exponencial ´e igual a
e
amt/d
e
i2πakm/d
= (1)
amt/d
e
i2πakm/d
Como na ´e ´ımpar, (1)
amt/d
= (1)
mt/d
e
e
am
2
nt/d
= (1)
mt/d
e portanto o produto destes dois termos vale 1. O resultado segue.
Lema 2.6.2 Seja (n, t) = 1, k = 0, . . . n 1.
1. Se nat ´e par ent˜ao
n1
j=0
e
a(tj+k)
2
/nt
= e
ak
2
(αt1)
2
/nt
S(n, at)
onde α ´e um inteiro definido por αt = 1(mod n), 0 α n 1.
38
2. Se nat ´e ´ımpar ent˜ao
n1
j=0
e
a(tj+k+1/2)
2
/nt
=
1
2
e
a(2k+1)
2
(αt1)
2
/4nt
S(4n, at)
onde α satisfaz αt = 1(mod 4n), 0 α 4n 1.
3. Se na ´e ´ımpar e t ´e par ent˜ao
n1
j=0
e
a(t(j+1/2)+k)
2
/nt
= e
a((t/2+k)
2
ρ
2
)/nt
e
a(αt1)
2
ρ
2
/nt
S(n, at)
onde ρ ´e o resto de 1/2 + k(mod n).
4. Se nat ´e ´ımpar ent˜ao
n1
j=0
e
a(t(j+1/2)+k)
2
/nt
=
1
2
e
a(αt1)
2
k
2
/nt
e
a(αt1)k/n
S
(4
n, at
)
onde α satisfaz αt = 1(mod n), 0 α n 1.
Prova 1. Como (n, t) = 1, pelo algoritmo euclideano existem e ao ´unicos
os inteiros q e α tais que αt = 1 + qn, 0 α n 1. Enao k = (αt qn)k
e da´ı temos
S =
n1
j=0
e
a(tj+k)
2
/nt
=
n1
j=0
e
a((j+αk)tqnk)
2
/nt
=
n1
j=0
e
at(j+αk)
2
/n
e
a(qn)
2
k
2
/nt
Mas (qn)
2
= (αt 1)
2
e da´ı
S = e
a(αt1)
2
k
2
/nt
n1
j=0
e
at(j+αk)
2
/n
Seja m o inteiro que satisfaz
ak = m(mod n) , 0 m n 1
Como nat ´e par,
e
at(j+αk)
2
/n
= e
at(jm)
2
/n
39
Mas pelo lema 2.3.1, temos
n1
j=0
e
at(jm)
2
/n
=
n1
j=0
e
atj
2
/n
= S(n, at)
para 0 m 2n 1, o que prova o item 1.
2. A soma
S =
n1
j=0
e
a(tj+k+1/2)
2
/nt
=
n1
j=0
e
a(2tj+2k+1)
2
/4nt
´e uma soma parcial de
T =
4n1
j=0
e
a(tj+2k+1)
2
/4nt
Vale que 4nat ´e par e (4n, t) = 1 pois (n, t) = 1 e t ´e ´ımpar. Al´em disso,
0 2k + 1 4n 1 e α satisfaz αt = 1(mod 4n), 0 α 4n 1. Segue do
item 1 que
T = e
a(2k+1)
2
(αt1)
2
S(4n, at)
Agora decompomos T em uma parte par e outra ´ımpar T = E + U onde
E =
2n1
j=0
e
a(tj+k+1/2)
2
/nt
=
n1
j=0
e
a(tj+k+1/2)
2
/nt
+
2n1
j=n
e
a(tj+k+1/2)
2
/nt
=
n1
j=0
e
a(tj+k+1/2)
2
/nt
+
n1
j=0
e
a(tj+k+1/2+nt)
2
/nt
Como nat ´e ´ımpar, o termo geral da ´ultima soma se torna
e
a(tj+k+1/2)
2
/nt
Logo,
E = 2
n1
j=0
e
a(tj+k+1/2)
2
/nt
40
A parte ´ımpar ´e dada por
U =
2n1
j=0
e
a((2j+1)t+2k+1)
2
/4nt
Como nat ´e ´ımpar, temos que (2j + 1)t + (2k + 1) ´e par. Portanto,
2n1
j=0
e
a((2j+1)t+2k+1)
2
/4nt
=
n1
j=0
e
a((2j+1)t+2k+1+2nt)
2
/4nt
=
n1
j=0
e
a((2j+1)t+2k+1)
2
/4nt
e
ant
=
n1
j=0
e
a((2j+1)t+2k+1)
2
/4nt
Portanto U = 0 e
n1
j=0
e
a(tj+k+1/2)
2
/nt
=
1
2
T
O resultado segue.
3. Defina a soma
S =
n1
j=0
e
a(t(j+1/2)+k)
2
/nt
=
n1
j=0
e
a(tj+1/2)+k)
2
/nt
Como t ´e par, t/2+k ´e um inteiro e nat ´e par ent˜ao podemos usar o resultado
do item 1. Seja ρ o resto (mod n) de t/2 + k. Ent˜ao t/2 + k = ρ + µ. Segue
que
S = e
2
/nt
e
i2πaµρ/nt
n1
j=0
e
a(tj+ρ)
2
/nt
= e
a(µ
2
+2µρ)/nt
e
2
(at1)
2
/nt
S(n, at)
= e
a((1/2+k)
2
ρ
2
)/nt
e
2
(αt1)
2
/nt
S(4n, at)
4. Defina S como no item 3 e troque k por (αt qn)k como no item 1
para obter
S =
n1
j=0
e
a(t(j+1/2)+αk)qnk)
2
/nt
41
= e
a(αt1)
2
k
2
/nt
e
a(αt1)k/n
n1
j=0
e
at(j+1/2)+αk)
2
/n
Resta calcular a soma
T =
n1
j=0
e
at(j+αk+1/2)
2
/n
Seja m o inteiro definido por
αk + 1 = m + sn , 0 m n 1
Enao
j + αk +
1
2
= j m + sn
1
2
e
e
at(j+αk+1/2)
2
/n
= e
at(j(m+1/2)+sn)
2
/n
= e
at(jm1/2)
2
/n
e
ats
2
n
e
ats
Como nat ´e ´ımpar temos e
ats
= (1)
s
e
e
ats
2
n
= (1)
s
2
= (1)
s
Portanto,
T =
n1
j=0
e
at(jm1/2)
2
/n
Aplicando o lema 2.3.1 temos
T =
1
2
S(4n, at)
e o resultado segue.
42
Cap´ıtulo 3
Integrais de Feynman
Algumas referˆencias asicas para integrais de Feynman ao [12],[20]. Uma
introdu¸ao informal interessante ´e [13].
3.1 O formalismo das integrais de Feynman
A mecˆanica quˆantica tradicional teve bastante ˆexito tanto no que se
refere a compreens˜ao dos fenˆomenos quˆanticos como tamem nas previs˜oes
num´ericas de experimentos. Ela foi substanciada por muitos experimentos
feitos em laborat´orios e por observoes da natureza. Entretanto, a teoria
ao tem respostas para certos problemas, como por exemplo, a descri¸ao de
part´ıculas elementares e suas intera¸oes. Isto pode ser devido ao fato de o
conceito de amplitude de transi¸ao ao estar na sua base axiom´atica (embora
possa ser deduzido a partir dos postulados, este conceito n˜ao est´a na base da
teoria). Esta opini˜ao est´a de acordo com [18].
Uma tentativa de resolver este problema ´e o formalismo das integrais de
caminhos, proposto por R. Feynman (ver referˆencias em [18]). Embora este
formalismo seja uma ferramenta ´util, traz consigo alguns problemas devido
a sua natureza matem´atica ao rigorosa.
Para entender este formalismo, usaremos a formula¸ao lagrangiana da
mecˆanica cl´assica, que descreveremos brevemente. Suponha que temos um
sistema mecˆanico com n graus de liberdade. Diremos que C = R
n
´e o
espa¸co de configura¸oes. Um ponto q = (q
1
, . . . , q
n
) C descreve a con-
figura¸ao do sistema e ´e chamado estado lagrangiano. A dinˆamica de um
sistema ´e descrita por um caminho, ou trajet´oria q(t) = (q
1
(t), . . . , q
n
(t)),
−∞ < t < em C. Na formula¸ao hamiltoniana da mecˆanica cl´assica,
um estado s(t) ´e determinado para o tempo t desde que a condi¸ao inicial
s(t
0
) seja dada. Como veremos, o estado lagrangiano q(t), t
a
t t
b
´e
43
determinado desde que as condi¸oes de contorno q(t
a
), q(t
b
) sejam dadas.
Enao definimos as fun¸oes de velocidade v
i
= dq
i
/dt, i = 1, . . . , n e fazemos
v(t) = (v
1
(t), . . . , v
n
(t)). O lagrangiano do sistema ´e definido por
L(v, q) =
i
M
i
2
v
2
i
V (q).
(M
i
´e a massa associada a i-´esima coordenada). Logo, L ´e a energia cin´etica
menos a energia potencial.
A ao sobre um caminho q(t) entre os tempos t
a
, t
b
, t
a
< t
b
´e definida
por
S[q(t)] =
t
b
t
a
L[v(t), q(t)]dt.
Suponha que o sistema se encontra no estado lagrangiano q
a
no tempo t
a
e
q
b
no tempo t
b
, isto ´e, q
a
= q(t
a
), q
b
= q(t
b
). Na formula¸ao lagrangiana a
trajet´oria que o sistema percorre, chamada trajet´oria cl´assica, ´e determi-
nada pelo princ´ıpio da m´ınima ao. Este princ´ıpio nos diz que dentre
todos os caminhos poss´ıveis de q
a
a q
b
, a trajet´oria cl´assica ˆq(t) ´e aquela onde
S[q(t)] ´e um extremo. Isto ´e, o valor de S[ˆq(t)] ao se modifica se o caminho
ˆq(t) ´e alterado ligeiramente.
Voltemos agora `a discuss˜ao da amplitude de Feynman. Veremos que o
formalismo destas amplitudes ao leva em considera¸ao apenas a trajet´oria
cl´assica ˆq(t), mas sim todas as trajet´orias. Suponha que um el´etron encontra-
se na posi¸ao x
a
no tempo t
a
e ent˜ao se move, sob a influˆencia de alguma
for¸ca. Queremos calcular a probabilidade P (a, b) de que a part´ıcula esteja
em um ponto x
b
no tempo t
b
. O el´etron ir´a se mover por um dos muitos
caminhos poss´ıveis, mas ao seremos capazes de distinguir uma trajet´oria de
outra sem interferir no sistema. Se fizermos uma medi¸ao, sabemos que seu
movimento ir´a se modificar.
Na mecˆanica quˆantica, temos que todos os caminhos poss´ıveis devem ser
considerados. Cada caminho x(t) contribui com uma amplitude φ[x(t)] para
a amplitude total K(a, b) e P (a, b) = |K(a, b)|
2
. Em s´ımbolos:
K(a, b) =
φ[x(t)].
onde x(t) ´e todo caminho com x(t
a
) = x
a
e x(t
b
) = x
b
. Com isso, temos que
o axioma asico do formalismo das integrais de caminho ´e:
(P ) φ[x(t)] = Ae
(i/ )S[x(t)]
44
onde
S[x(t)] =
t
b
t
a
L[v(t), x(t)]dt (3.1)
´e a ao para o caminho x(t), A ´e uma constante de normaliza¸ao e L ´e o
lagrangiano do sistema.
Resumindo, cada caminho poss´ıvel contribui com uma determinada am-
plitude φ e soma destas amplitudes nos fornece uma amplitude total K. Esta
amplitude K, que ´e a amplitude de Feynman que discretizaremos nas se¸oes
seguintes, nos fornece a probabilidade de ocorrˆencia de um evento, fazendo
P (a, b) = |K(a, b)|
2
.
O axioma (P) nos diz que cada caminho contribui igualmente em m´odulo,
embora as suas fases variem. Enao ao ´e claro se um caminho em parti-
cular ´e mais importante. Entretanto, na aproxima¸ao cl´assica, S ´e grande
comparado com . Se um caminho arbitr´ario x(t) ´e modificado por uma
pequena quantidade δx(t), embora δS seja pequeno na escala cl´assica, ao ´e
pequeno comparado com . Estas pequenas varia¸oes no caminho ir˜ao, em
geral, variar bastante a fase, que ir´a oscilar rapidamente. Enao, se os cami-
nhos vizinhos de x(t) possuem uma ao diferente, suas contribui¸oes para
K(a, b) ir˜ao se cancelar, sem fornecer nenhuma contribui¸ao. Mas para o ca-
minho especial ˆx, onde S ´e um extremo, uma pequena mudan¸ca no caminho
fornecer´a praticamente nenhuma varia¸ao em S. Assim, caminhos na vizin-
han¸ca de ˆx ao fornecem fatores que se cancelam; desta forma, ˆx se destaca
e as leis cl´assicas do movimento surgem a partir das leis quˆanticas. No n´ıvel
atˆomico, quando S ´e compar´avel com , nenhum caminho se destaca. Neste
caso, todos os caminhos (mais precisamente, caminhos cont´ınuos) devem ser
considerados ao se calcular K(a, b).
Existem algumas dificuldades matem´aticas ao se tentar construir uma for-
mula¸ao rigorosa para a amplitude total K. O problema principal ´e encontrar
uma medida adequada no espa¸co de caminhos a fim de que a soma K possa
ser formulada em termos de uma integral sobre este espa¸co (ver [18] para
mais detalhes). Alguns casos especiais foram resolvidos, mas uma solu¸ao
geral ainda ao foi descoberta. Iremos seguir um argumento heur´ıstico.
Seja t
a
= t
0
< t
1
< ··· < t
n
= t
b
uma parti¸ao de [t
a
, t
b
] onde
t
i+1
t
i
= =
(t
b
t
a
)
n
, i = 0, . . . , n 1.
Seja P
n
o conjunto dos caminhos poligonais da forma x(t) onde
x(t
a
) = x
a
, x(t
b
) = x
b
, x(t
i
) = x
i
, i = 1, . . . , n 1
45
e para t
i
< t < t
i+1
, (t, x(t)) ´e o segmento de reta de (t
i
, x
i
) para (t
i+1
, x
i+1
).
Tomamos uma constante de normaliza¸ao A
n
como sendo
A
n
=
m
2πi
n/2
onde m ´e a massa da part´ıcula e defina
K
n
(a, b) =
{φ[x(t)] : x(t) P
n
}.
Se escrevermos esta integral sobre os valores de x
i
, i = 1, . . . , n 1, obtemos
K
n
(a, b) = A
n
···
e
(i/ )S[x(t)]
dx
1
, . . . , dx
n1
. (3.2)
E da´ı definimos K(a, b) como sendo
K(a, b) = lim
n→∞
K
n
(a, b)
ao ´e garantido que este limite exista (e em muito casos n˜ao existe). Quando
o limite existe, ao depende crucialmente da natureza poligonal dos cami-
nhos. Usaremos a seguinte nota¸ao intuitiva:
K(a, b) =
b
a
e
(i/ )S[x(t)]
D[x(t)]
e diremos que a equa¸ao acima ´e uma integral de caminho.
Apesar de a integral acima ao possuir um sentido matem´atico rigoroso,
ela possui importante significado f´ısico. Al´em disso, ela pode ser usada para
descobrir certas propriedades que K(a, b) deve ter se uma formula¸ao rigorosa
for poss´ıvel. Por exemplo, seja t
c
= t
i
um certo tempo fixado para um
i {1, . . . , n 1} fixo. Escrevendo a ao para os intervalos de tempo
[t
a
, t
c
], [t
c
, t
b
] como S
c
a
[x(t)], S
b
c
[x(t)], respectivamente, obtemos a partir da
equa¸ao 3.1 que
S
a
b
[x(t)] = S
c
a
[x(t)] + S
c
b
[x(t)].
Logo, a equa¸ao 3.2 nos fornece
K
n
(a, b) =
K
i1
(a, c)K
ni+1
(c, b)dx
c
Fazendo n arbitrariamente grande obtemos a seguinte ormula
K(a, b) =
K(a, c)K(c, b)dx
c
. (3.3)
46
Agora, vamos calcular a integral para um caso simples. Para uma part´ıcula
livre, o lagrangiano ´e L = mv
2
/2. Para x(t) P
n
temos
S[x(t)] =
t
b
t
a
L[v(t), x(t)]dt =
m
2
n
i=1
(x
1
x
i1
)
2
.
Enao,
K
n
(a, b) = A
n
···
exp
im
2
n
i=1
(x
i
x
i1
)
2
dx
1
, . . . , dx
n1
.
Aqui temos um produto de integrais Gaussianas que podem ser resolvidas
individualmente para obter
K
n
(a, b) =
m
2πin
1/2
exp
im
2n
(x
b
x
a
)
2
.
Como n = t
b
t
a
, os K
n
’s ao iguais para todo n. Segue que
K(a, b) =
m
2πi(t
b
t
a
)
1/2
exp
im(x
b
x
a
)
2
2(t
b
t
a
)
.
´
E poss´ıvel tamem mostrar que a equa¸ao de Schr¨odinger pode ser obtida
(novamente, sem o rigor matem´atico exigido normalmente) a partir do for-
malismo das integrais de caminho (ver [18]).
3.2 Distribui¸ao de Probabilidade
Os conceitos mais importantes tratados neste trabalho est˜ao baseados na
fun¸ao da onda, que representa o aspecto ondulat´orio de uma part´ıcula, `a
medida que a posi¸ao e o tempo variam. A fun¸ao da onda desempenha um
papel central no alculo de probabilidades em experimentos que envolvem
part´ıculas atˆomicas.
Para ilustrar o problema de tais alculos, consideremos o seguinte expe-
rimento: de um lado, temos uma fonte emissora de part´ıculas (el´etrons, por
exemplo). Cada part´ıcula deve passar por um anteparo, que possui duas
fendas, e atingir um detector no outro lado. O detector pode ser deslocado
como quisermos, e assim podemos obter uma distribui¸ao de probabilidade,
realizando o experimento sucessivas vezes (figura 1). Se fecharmos a fenda 2,
podemos calcular a probabilidade de o detector ser acionado por um el´etron
que passou pela fenda 1 (analogamente para a fenda 2). A soma destas
duas distribui¸oes nos fornece a probabilidade de o detector ser acionado
47
por um el´etron que passou pela fenda 1 ou 2. Podemos concluir a partir
da´ı o seguinte: se analisarmos classicamente o problema, concluiremos que a
probabilidade de que uma part´ıcula atinja o detector ´e
P (x) = P
1
(x) + P
2
(x)
onde P
1
e P
2
ao as probabilidades de a part´ıcula atingir o detector passando
pela fenda 1 ou 2, respectivamente.
Figura 3.1: Vers˜ao simplificada do experimento de Young. S ´e a fonte de el´etrons e D
´e um detector que se movimenta livremente na vertical.
A distribui¸ao de probabilidade cl´assica seria uma curva gerada pela su-
perposi¸ao das probabilidades via fenda 1 e 2 (figuras 3.2a-c). Entretanto,
a experiˆencia nos mostra que este alculo ao pode estar correto
1
. Deve-
mos ainda levar em conta a interferˆencia entre caminhos alternativos. A
distribui¸ao real ter´a, na verdade, o aspecto aproximado de uma sen´oide
com amplitude decrescente `a medida que nos aproximamos dos extremos do
anteparo (figura 3.2d). Desta forma, obtemos os padr˜oes de interferˆencia e
difra¸ao, tal como no experimento de Young, revelando o car´ater ondulat´orio
de part´ıculas como el´etrons.
Um resultado importante da mecˆanica quˆantica, sobre o qual est˜ao basea-
dos as defini¸oes neste texto ´e que a probabilidade de se encontrar uma
part´ıcula em qualquer ponto ´e proporcional ao quadrado do valor absoluto
da amplitude da onda de mat´eria nesse ponto. Este postulado baseia-se no
fato de que o alculo correto de probabilidades envolve uma fun¸ao de onda
(i.e., uma fun¸ao complexa).
Sendo assim, temos que o problema anterior pode ser resolvido da seguinte
maneira. Os padr˜oes de interferˆencia gerados no experimento sugerem que
1
O alculo estar´a correto no caso em que colocarmos um detector para se determinar
por qual fenda a part´ıcula passou. Ou seja, ao introduzir tal detector estaremos destruindo
o car´ater ondulat´orio do experimento.
48
Figura 3.2: (a) P
1
(x). (b) P
2
(x). (c) P
1
(x)+P
2
(x) (previs˜ao cl´assica). (d) A distribui¸ao
de P
1
(x) + P
2
(x) que realmente ocorre.
representemos a nossa fun¸ao de distribui¸ao, com tempo fixado, por uma
fun¸ao complexa. Enao podemos postular que P (x) ´e proporcional ao
quadrado do valor absoluto de uma certa quantidade φ(x) e este valor ´e
a amplitude de probabilidade, ou como chamamos nas outras se¸oes, ampli-
tude quˆantica. Al´em disso, temos o seguinte: φ(x) ser´a a soma de duas
contribui¸oes, ψ
1
(x) e ψ
2
(x), as amplitudes de chegada via fenda 1 ou 2,
respectivamente. Enao, segue que
P
1
(x) = |ψ
1
(x)|
2
, P
2
(x) = |ψ
2
(x)|
2
e
P (x) = |ψ
1
(x) + ψ
2
(x)|
2
= P
1
(x) + P
2
(x) + 2R
1
(x)ψ
2
(x).
Os dois primeiros termos do lado direito fornecem o resultado cl´assico; o
´ultimo termo ´e o correspondente `a interferˆencia quˆantica, que contribui como
uma soma ou subtra¸ao ao termo cl´assico.
Na f´ısica cl´assica, os modelos matem´aticos nos fornecem informa¸oes so-
bre os fenˆomenos que observamos, enquanto que na mecˆanica quˆantica, os
modelos ao ao observados sem que causemos alguma interferˆencia. Uma
abordagem dos fenˆomenos microsc´opicos consiste em descrever a evolu¸ao
da fun¸ao da onda, mas esta fun¸ao nos permite apenas calcular a probabili-
dade de que certos eventos ocorram. Para relacion´a-la com os experimentos,
a fun¸ao de onda deve ser interpretada de uma maneira apropriada.
49
3.3 Sobre a amplitude de Feynman
O formalismo de integrais de caminhos, sobre o qual as amplitudes de Feyn-
man est˜ao baseadas, nos permite imaginar algumas situa¸oes interessantes.
Seja o seguinte experimento: temos um emissor de otons, um detector, e
abaixo um espelho (figura 3.3). Vamos supor alida a lei de incidˆencia e re-
flex˜ao da luz. Supondo que temos uma barreira entre o emissor e o detector
(assim a luz emitida ao pode ir diretamente para o detector) conclu´ımos,
ap´os uma an´alise cl´assica, que todo oton que atingiu o detector foi refletido
pelo espelho, e al´em disso, deve ter sido no seu centro, pois o ˆangulo de
incidˆencia ´e igual ao ˆangulo de reflex˜ao, e tanto o emissor como o detector
est˜ao a uma mesma distˆancia da barreira. Isso ´e o que observamos quando
fazemos experimentos com um feixe de luz. Entretanto, quando temos ape-
nas uma part´ıcula, o formalismo das integrais nos mostra um outro aspecto
do fenˆomeno: devemos considerar todas as trajet´orias “poss´ıveis”para a luz;
em outras palavras, ao devemos supor que a luz anda apenas em linha reta,
e muito menos que ela sabe qual o caminho mais curto! Mas para fins de
simplifica¸ao, iremos supor que a luz percorre apenas linhas retas e a situa¸ao
que iremos considerar ´e: um f´oton, incidindo e refletindo em qualquer ˆangulo
e em qualquer ponto do espelho.
Figura 3.3: Dois caminhos para o oton. Sabe-se que o caminho em que o oton atinge o
espelho no centro nos fornece o menor tempo, mas ´e errado dizer que os outros pontos s˜ao
proibidos, ou que nunca ir˜ao ocorrer. Teoricamente, ´e poss´ıvel que um oton atinja outro
ponto do espelho (embora a probabilidade seja pequena, e, em grande escala, descobrimos
que as amplitudes de probabilidade destas alternativas se cancelam).
A princ´ıpio pode parecer estranho supor que um oton atinge uma parte
qualquer do espelho. Isso nos leva a uma pergunta: como poderia o oton
saber qual ´e o caminho mais curto e por que ele escolheria tal caminho? A
figura 3.4 nos fornece um gr´afico que indica os tempos necess´arios para um
oton sair da fonte e chegar at´e o detector.
Daremos apenas uma explica¸ao intuitiva do que acontece. A reflex˜ao da
luz ´e um fenˆomeno que envolve uma certa por¸ao do espelho. O fato impor-
50
Figura 3.4: Vamos dividir o espelho em parti¸oes de mesmo tamanho. (a) Todos os
caminhos poss´ıveis. (b) Tempos associados aos caminhos. O importante aqui ´e notar que
a diferen¸ca entre os tempos associados a dois pontos do centro, digamos F e G, ´e menor
do que a diferen¸ca entre os tempos associdos a dois pontos dos extremos, digamos A e B.
´
E exatamente isso que determina o fato de que apenas observamos a luz gerando ˆangulos
de incidˆencia e reflex˜ao iguais.
tante a ser observado ´e o seguinte: a diferen¸ca entre os tempos associados a
pontos pr´oximos do centro ´e menor do que a diferen¸ca entre os tempos asso-
ciados a pontos dos extremos do espelho. Isso significa que a diferen¸ca de fase
entre as exponenciais associadas `a amplitude de Feynman (ver equa¸oes na
se¸ao 1) ´e pequena para pontos pr´oximos ao centro, e logo temos amplitudes
de probabilidade que contribuem para uma amplitude maior e logo, uma
probabilidade maior; nos extremos, a varia¸ao de fase ´e maior, e existe uma
contribui¸ao menor de amplitudes, o que confere a esses pontos uma menor
probabilidade. Logo, o centro ´e a regi˜ao onde ocorrem pequenas varia¸oes
de fase e onde ´e poss´ıvel obter uma amplitude consider´avel. E ´e por isso que
podemos dizer, aproximadamente, que a luz percorre a trajet´oria em que o
tempo ´e m´ınimo (tamb´em, ao ´e dif´ıcil provar que no caminho onde o tempo
´e m´ınimo, o ˆangulo de incidˆencia ´e igual ao ˆangulo de reflex˜ao).
Vamos examinar um exemplo mais simples de fenˆomeno que pode ser
descrito por uma cadeia quˆantica. Imagine uma part´ıcula livre se movimen-
51
tando no espa¸co bidimensional. Queremos calcular a probabilidade de que
esta part´ıcula, saindo do ponto s
a
, chegue ao ponto s
b
. Como discutimos
anteriormente, se estiv´essemos considerando o fenˆomeno cont´ınuo, ter´ıamos
de calcular a integral sobre todos os caminhos poss´ıveis no espa¸co que tem
como origem o ponto s
a
e destino o ponto s
b
(figura 3.5). Dizemos que a
integral sobre cada caminho poss´ıvel ´e uma amplitude de probabilidade e a
soma destas amplitudes ´e a amplitude total. O quadrado do odulo desta
amplitude total nos fornece a probabilidade de que a part´ıcula saia de s
a
e
chegue a s
b
. Isto ´e o que o formalismo das integrais de caminhos nos diz.
Lembre que fizemos n = 12 e na matriz de Dirichlet (de acordo com [2], o
parˆametro a pode ser considerado a massa da part´ıcula, e como j´a vimos, ela
ao influi na probabilidade). Como temos uma matriz com um parˆametro n
finito, estamos descrevendo uma aproxima¸ao do fenˆomeno cont´ınuo. Enao
podemos supor que as trajet´orias poss´ıveis para a part´ıcula ao poligonais.
Mas vamos tornar as coisas ainda mais simples e supor que as fra¸oes de
caminhos poss´ıveis ao as arestas de um reticulado.
Figura 3.5: Quando consideramos sistemas discretos, o an´alogo de se calcular a integral
sobre todos os caminhos de a a b ´e somar todas as amplitudes de transi¸ao de um estado a
outro. Em particular, como est´avamos interessados na posi¸ao de uma part´ıcula, a matriz
de transi¸ao associada a cadeia quˆantica que usamos foi a matriz de Dirichlet, que gera
um an´alogo discreto para o movimento de uma part´ıcula livre.
Uma observao importante. Lembre que em cadeias quˆanticas estamos
sempre supondo que o conjunto S de estados poss´ıveis do sistema ´e finito.
Enao, temos uma part´ıcula em um plano movendo-se em um reticulado
finito. Isso quer dizer a part´ıcula livre que consideramos pode se mover
apenas no reticulado, obviamente, e est´a de acordo com o alculo de prob-
abilidades que fizemos antes, pois lembre que tinhamos uma lista peri´odica
de probabilidades (ou seja, isso deve-se tamb´em ao fato de que a part´ıcula
tem apenas um umero finito de estados que podem ser assumidos. Se o
conjunto de estados ao fosse finito, ao saber´ıamos, a priori, se existe uma
52
periodicidade nas transi¸oes do sistema).
Dizemos que f
t
´e a medi¸ao no tempo t e neste exemplo f representa
a posi¸ao da part´ıcula. Por exemplo, se o sistema est´a em um estado s
j
no tempo t, realizando outra medi¸ao, obtemos f(s
j
) = s
k
, onde s
k
´e uma
posi¸ao adjacente no reticulado. Inversamente, se estamos em um estado
s
k
no tempo t, temos que f
1
t
(s
k
) ´e o conjunto de estados que o sistema
poderia estar no tempo t 1, sabendo que passamos para s
k
no tempo t
(supomos que cada elemento deste conjunto deve necessariamente ser um
v´ertice adjacente).
´
E claro que neste exemplo, s
j
f
1
t
(s
k
). Temos, tamb´em,
o vetor de amplitude
ˆ
f
t
. Este vetor ´e unit´ario ou seja, |
j
A[f
1
t
(s
j
)]| = 1,
o que reflete a certeza de a part´ıcula estar no reticulado.
Queremos calcular a probabilidade de que a part´ıcula, saindo do estado
s
a
chegue ao estado s
b
em t unidades de tempo. Note que desta forma, esta-
mos considerando apenas as amplitudes de caminhos que levam t unidades
de tempo. (Mesmo assim, conseguimos uma boa aproxima¸ao; usando o
formalismo das integrais de caminhos, dever´ıamos considerar todos os cami-
nhos, e ao apenas os que duram t unidades de tempo). Logo, considerando
caminhos de s
a
a s
b
em um tempo t, vemos que o formalismo das integrais
(ou das somas de amplitudes sobre caminhos) se encaixa perfeitamente com
a cadeia quˆantica que estamos considerando: dado um estado inicial s
0
= s
a
,
quando queremos determinar P [f
1
t
(s
b
)], procedemos da seguinte maneira:
aplicando o estado inicial
ˆ
f
0
´a matriz de transi¸ao
A, podemos determinar
como a amplitude varia com o tempo; somamos todas as amplitudes de ca-
minhos que levam de s
a
a s
b
, calculamos o odulo e elevamos ao quadrado.
Esse ´e o prop´osito da cadeia: verificar todas as probabilidades sobre o espa¸co
de caminhos, exatamente como no formalismo das amplitudes de Feynman.
53
Cap´ıtulo 4
Operadores densidade e
mecˆanica quˆantica
Computadores cl´assicos operam com estados constru´ıdos a partir de um
n´umero finito n de bits. Cada bit pode existir em um de dois estados, 0 ou
1. O estado do sistema ´e determinado ao se especificar os valores de cada
um dos bits. Portanto, o conjunto de estados B
n
= {0, 1}
n
´e finito e tem
cardinalidade 2
n
.
Um computador quˆantico trabalha com um conjunto finito de objetos
chamados q-bits. Cada q-bit possui dois estados distintos, tamb´em denota-
dos por 0 e 1. As 2
n
combina¸oes de estados para cada q-bit ao consistem
de todos os estados poss´ıveis para o sistema, mas formam uma base para
o espa¸co de estados. Denotaremos os estados base por |x
1
, . . . , x
n
, onde
x
j
B ou ent˜ao por |x onde x B
n
. Um estado arbitr´ario do sistema pode
ser representado na forma
|ψ =
(x
1
,...,x
n
)
n
c
x
1
,...,x
n
|x
1
, . . . , x
n
, onde
(x
1
,...,x
n
)
n
|c
x
1
,...,x
n
|
2
= 1
Ainda, se multiplicamos o vetor |ψ =
x
c
x
|x por um fator de fase
e
, ϕ R, obtemos um estado fisicamente indistingu´ıvel e portanto o estado
em um computador quˆantico ´e um vetor unit´ario definido a menos de um
fator de fase.
Em um computador cl´assico, qualquer fun¸ao f : B
n
B
n
´e permitida,
ou seja composi¸oes e seq¨uˆencias quaisquer de tais fun¸oes ´e o que enten-
demos como sendo computa¸oes cl´assicas; em um computador quˆantico as
transforma¸oes permitidas ao os operadores unit´arios, ou seja, operadores
que preservam o comprimento
x
n
|c
x
|
2
de cada vetor |ψ =
x
c
x
|x.
Neste cap´ıtulo estamos interessados em estudar alguns fundamentos de
mecˆanica quˆantica. Al´em disso, queremos entender a entropia de von Neu-
54
mann, o an´alogo quˆantico da entropia de Shannon da teoria cl´assica da in-
forma¸ao. No pr´oximo cap´ıtulo, calcularemos tal entropia para as cadeias de
Markov quˆanticas que vimos no cap´ıtulo 2.
4.1 Nota¸ao de Dirac
Estamos interessados em obter algum an´alogo quˆantico para a entropia usada
na teoria de informa¸ao cl´assica (entropia de Shannon). Veremos que algumas
id´eias da teoria da informa¸ao ser˜ao ´uteis para descrever os sistemas que nos
interessam aqui. Parte desta se¸ao ´e baseada em [32] e [41].
Come¸camos introduzindo a nota¸ao de Dirac, que ´e usual em mecˆanica
quˆantica. Um vetor ψ de um espa¸co vetorial com produto interno ser´a deno-
tado por
|ψ
Dados dois vetores |ψ e |ϕ, o produto interno ´e denotado por
(|ψ, |ϕ)
Escreveremos
ψ|
para denotar o vetor dual do vetor |ψ. O vetor dual ´e um operador linear
definido em um espa¸co vetorial com produto interno, toma valores em C, e
´e definido por
ψ|(|ϕ) := ψ|ϕ := (|ψ, |ϕ),
e tamb´em denotaremos o produto interno entre dois vetores |ψ e |ϕ por
ψ|ϕ. Por conven¸ao, se |v ´e um vetor, definimos |v
:= v|. Suponha
que A ´e um operador linear em um espa¸co de Hilbert V de dimens˜ao finita.
Enao existe um ´unico operador linear A
em V , dito o adjunto de A tal
que para quaisquer |v, |w V ,
(|v, A|w) = (A
|v, |w)
´
E acil ver que (A|v)
= v|A
, pois
(A|v)
|w = (A|v, |w) = (|v, A
|w) = v|A
|w,
onde na ´ultima passagem acima, escrevemos o produto interno entre |v e
|A
w como
v|A
|w
que, equivalentemente, denota o produto interno entre A|v e |w.
55
A elegˆancia e praticidade da nota¸ao de Dirac fica evidente na seguinte
defini¸ao. Seja |v um vetor num espa¸co vetorial com produto interno V e
|w um vetor num espa¸co vetorial com produto interno W . Defina
|wv| : V W
como sendo o operador linear cuja ao ´e definida por
(|wv|)(|v
) := |wv|v
= v|v
|w
Tal operador ´e dito produto exterior. Note que a express˜ao |wv|v
pode ter as seguintes interpreta¸oes: (1) o resultado obtido ao se aplicar o
operador |wv| no vetor |v
ou (2) o resultado de se multiplicar |w pelo
n´umero complexo v|v
. As defini¸oes dadas acima ao tais que essas duas
interpreta¸oes coincidem. De fato, o que fizemos aqui foi simplesmente definir
a primeira interpreta¸ao em termos da segunda.
Seja |i uma base ortonormal qualquer para o espa¸co vetorial V . Um
vetor |v pode ser escrito como |v =
i
v
i
|i, onde v
i
= i|v. Ent˜ao temos
i
|ii|
|v =
i
|ii|v =
i
v
i
|i = |v
Logo,
i
|ii| = I
onde I ´e o operador identidade. Esta ´e a rela¸ao de completude para
vetores ortonormais. Esta rela¸ao nos permite mostrar que todo operador
linear pode ser escrito como uma combina¸ao linear de produtos exteriores.
Suponha que A : V W ´e um operador linear, |v
i
´e uma base ortonor-
mal para V e |w
j
´e uma base ortonormal para W . Usando a rela¸ao de
completude, obtemos
A = I
W
AI
V
=
ij
|w
j
w
j
|A|v
i
v
i
| =
ij
w
j
|A|v
i
|w
j
v
i
|
que ´e a representa¸ao em produto exterior de A. Note que a partir dessa
express˜ao, vemos tamb´em que a matriz A
ij
associada ao operador A ´e tal
que A
ji
= w
j
|A|v
i
(a matriz A
ij
sendo tomada com respeito as bases |v
i
e
|w
j
).
Seja ψ um vetor unit´ario e A : V V um operador qualquer. A partir
de ψ, forme uma base ortonormal ordenada de modo que ψ seja o primeiro
elemento. Enao, pela express˜ao para A
ij
que vimos acima,
tr(A|ψψ|) =
i
i|A|ψψ|i = ψ|A|ψ
56
que ´e uma express˜ao ´util para se calcular o tra¸co de operadores.
Suponha que W ´e um subespa¸co vetorial de dimens˜ao k do espa¸co ve-
torial V de dimens˜ao d. Usando o etodo de Gram-Schmidt, ´e poss´ıvel
construir uma base ortonormal |1, . . . , |d para V tal que |1, . . . , |k ´e uma
base ortonormal para W . Definimos o projetor sobre o subespa¸co W como
sendo
P :=
k
i=1
|ii|
4.2 Produto tensorial
Parte desta se¸ao ´e baseada em [21]. Vamos considerar um sistema quˆantico
que consiste de uma part´ıcula de spin 1/2 e outra de spin 1. Se considerarmos
apenas as propriedades de spin (ou seja, ignorando os graus de liberdade as-
sociados com as propriedades espaciais das part´ıculas), os espa¸cos de estados
dos subsistemas ao C
2
e C
3
, respectivamente, com bases t´ıpicas dadas pelos
autoestados {|+
1
2
, |
1
2
} e {|+ 1, |0, |1}. Uma suposi¸ao f´ısica natural
´e assumir que o sistema composto inclui estados que assumem cada um dos
valores descritos acima. Enao existem seis estados, que ser˜ao denotados por
| +
1
2
, +1, | +
1
2
, 0, | +
1
2
, 1, |
1
2
, +1, |
1
2
, 0, |
1
2
, 1 (4.1)
Como estamos considerando uma teoria quˆantica, esperamos que com-
bina¸oes lineares dos estados acima sejam permitidos. Enao parece natural
supor que o estado mais geral pode ser escrito na forma
|ψ = c
1
|+
1
2
, +1+c
2
|+
1
2
, 0+c
3
|+
1
2
, 1+c
4
|−
1
2
, +1+c
5
|−
1
2
, 0+c
6
|−
1
2
, 1
e portanto os vetores na equa¸ao (4.1) formam uma base para o espa¸co de
Hilbert do sistema composto. Como temos seis vetores, o espa¸co ´e isomorfo
a C
6
.
Para um sistema composto em geral, a opera¸ao matem´atica relevante
toma vetores ψ
1
e ψ
2
nos espa¸cos de Hilbert H
1
e H
2
,de dimens˜ao m e n
respectivamente, e os transforma em um vetor ψ
1
ψ
2
em um novo espa¸co
de Hilbert H
1
H
2
, chamado produto tensorial de H
1
e H
2
, que tem di-
mens˜ao mn. O espa¸co de estados quˆantico do sistema composto ´e, portanto,
o produto tensorial dos espa¸cos de estados quˆanticos dos subsistemas cons-
tituintes. No exemplo acima, o vetor | +
1
2
, +1 denota o produto tensorial
57
| +
1
2
| + 1. Em particular, temos que o produto tensorial C
2
C
3
´e
isomorfo a C
6
.
Se |v
i
e |w
j
ao bases ortonormais para H
1
e H
2
, respectivamente, enao
|v
i
|w
j
´e uma base para H
1
H
2
. Usaremos tamb´em as nota¸oes
|v|w , |v, w e |vw
para denotar o produto |v|w. Por exemplo, se H ´e um espa¸co de Hilbert
de dimens˜ao 2 com vetores base |0 e |1, ent˜ao |0|0+ |1|1 HH.
Agora definiremos formalmente o produto tensorial. Sejam V e W ao
espa¸cos vetoriais, que iremos supor sempre sobre R, e ainda que ao de di-
mens˜ao finita. A constru¸ao mais geral para odulos sobre an´eis comuta-
tivos, que ao precisaremos aqui, pode ser vista em [29] ou [5]. Denote por
R[V × W ] o conjunto de elementos que ao combina¸oes lineares formais de
elementos de V × W com coeficientes em R, ou seja, express˜oes do tipo
n
i=1
a
i
.(v
i
, w
i
) , a
i
R, v
i
V, w
i
W
Seja R(V, W ) o subespa¸co gerado por todos os elementos de R[V × W ]
da forma
(v
1
+ v
2
, w) (v
1
, w) (v
2
, w)
(v, w
1
+ w
2
) (v, w
1
) (v, w
2
) (4.2)
(rv, w) r(v, w)
(v, rw) r(v, w)
onde v
i
V , w
i
W e r R.
Defini¸ao O produto tensorial de espa¸cos vetoriais V e W , deno-
tado por V W ´e o espa¸co
V W :=
R[V × W ]
R(V, W )
Seja π : R[V × W ] V W a proje¸ao canˆonica e denote por v w a
imagem de (v, w) R[V × W ], ou seja,
v w := π(v, w)
Segue de (4.2) que π : V ×W V W ´e bilinear. Al´em disso tal aplica¸ao
´e universal no seguinte sentido:
58
Lema 4.2.1 Sejam U, V e W espcos vetoriais, e seja f : V ×W U uma
aplicao bilinear. Ent˜ao existe uma ´unica aplicao linear f : V W U
tal que f = f π.
Prova Como o conjunto V ×W ´e uma base para R[V ×W ], f se extende a
uma aplica¸ao linear
ˆ
f : R[V × W ] U. A bilinearidade de f implica que
ˆ
f(R(V, W )) = 0, e portanto
ˆ
f induz uma aplica¸ao f do quociente V W
em U. Por constru¸ao, f = f π, f ´e linear e como π(V ×W ) gera V W ,
f ´e determinada de maneira ´unica por f.
Segue do lema anterior que o produto tensorial ´e um funtor. De fato, se
ϕ : V V
e ψ : W W
ao aplica¸oes lineares ent˜ao a composi¸ao
V × W
ϕ×ψ
V
× W
π
V
W
´e bilinear, portanto induz uma ´unica aplica¸ao
ϕ ψ : V W V
W
A unicidade garante que (ϕ
ψ
) (ϕ ψ) = ϕ
ϕ ψ
ψ quando ϕ
:
V
V

, ψ
: W
W

.
Lema 4.2.2 Sejam V e V
espcos vetoriais com bases B e B
, respectiva-
mente. Ent˜ao V V
´e um espco vetorial com base {b b
|b B, b
B
}.
Prova A bilinearidade de π : V × V
V V
mostra que o conjunto
enunciado acima gera V V
. Suponha que
r
ij
b
i
b
j
= 0 (4.3)
Sejam ϕ
0
: V R e ϕ
0
V
R aplica¸oes lineares com
ϕ
0
(b
i
) = 0 se i = i
0
, ϕ
0
(b
i0
) = 1
ϕ
0
(b
i
) = 0 se i = j
0
, ϕ
0
(b
i0
) = 1
onde (i
0
, j
0
) ´e um par de ´ındices que aparecem em (4.3). A composi¸ao
V V
ϕ
0
ϕ
0
R R
mult
R
leva o lado esquerdo em (4.3) em r
i
0
j
0
que, portanto, deve ser zero.
59
Temos as seguintes rela¸oes:
1. R V
=
V
=
V R
2. V
1
V
2
=
V
2
V
1
3. V
1
(V
2
V
3
)
=
(V
1
V
2
) V
3
4. (V
1
V
2
) V
3
=
V
1
V
3
V
2
V
3
Existe uma generaliza¸ao natural da defini¸ao de produto tensorial para
o caso de um n´umero maior de espa¸cos e um lema de propriedade universal
correspondente:
Lema 4.2.3 Para cada aplicao multilinear f : V
1
× ··· × V
k
W existe
uma ´unica aplicao linear f : V
1
··· V
k
W tal que f = f π.
Outras propriedades do produto tensorial ao as seguintes:
1. O produto tensorial ´e linear em cada entrada, no sentido de que para
todo α, β C, ψ, φ H
1
e ξ H
2
,
(αψ + βφ) ξ = (αψ) ξ + (βφ) ξ
e se ψ H
1
e φ, ξ H
2
,
ψ (αφ + βξ) = ψ (αφ) + ψ (βξ)
e
α(ψ φ) = (αψ) φ = ψ (αφ)
2. Existem vetores em H
1
H
2
que n˜ao podem ser escritos como um ´unico
produto ψ φ, quaisquer que sejam ψ H
1
e φ H
2
. Um exemplo ´e
|ψ =
|00 + |11
2
,
ou seja, n˜ao existem estados |a e |b tais que |ψ = |a|b. Quando tal
fato ocorrer, diremos que ψ ´e um estado emaranhado (discutiremos
emaranhamento (entanglement) na se¸ao 4.5). Entretanto, todo vetor
em H
1
H
2
pode ser escrito como uma soma de tais produtos.
Em particular, se {e
1
, e
2
, . . . , e
N
1
} e {f
1
, f
2
, . . . , f
N
2
} ao bases para H
1
e H
2
, respectivamente, ent˜ao uma base para H
1
H
2
´e o conjunto de
60
vetores e
i
f
j
, i = 1, 2, . . . N
1
, j = 1, 2, . . . , N
2
. Portanto, o vetor mais
geral ψ H
1
H
2
tem a forma
ψ =
N
1
i=1
N
2
j=1
ψ
ij
e
i
f
j
onde ψ
ij
C. Em particular, isso mostra que a dimens˜ao do espa¸co de
Hilbert H
1
H
2
´e o produto das dimens˜oes de H
1
e H
2
.
3. O produto interno ´e definido em vetores produto por
ψ
1
ψ
2
, φ
1
φ
2
:= ψ
1
, φ
1
H
1
ψ
2
, φ
2
H
2
onde os produtos no lado direito ao calculados nos espa¸cos de Hilbert
indicados. A express˜ao ´e extendida para somas de vetores se definimos
ψ
1
ψ
2
, (αφ
1
φ
2
+ βφ
3
φ
4
)
:= αψ
1
, φ
1
H
1
ψ
2
, φ
2
H
2
+ βψ
1
, φ
3
H
1
ψ
2
, φ
4
H
2
4. O produto tensorial de operadores pode ser definido da seguinte
maneira. Sejam A
1
e A
2
operadores em H
1
e H
2
, respectivamente. O
produto A
1
A
2
´e definido primeiro em vetores produto
(A
1
A
2
)ψ
1
ψ
2
:= (A
1
ψ
1
) (A
2
ψ
2
)
e depois extendido para somas de produtos de maneira linear:
(A
1
A
2
)ψ :=
N
1
i=1
N
2
j=1
ψ
ij
(A
1
e
i
) (A
2
f
j
)
Da mesma forma que no caso de vetores, existem operadores em H
1
H
2
que ao podem ser escritos na forma A
1
A
2
. Entretanto, todos
os operadores podem ser descritos por uma soma de tais operadores
produto.
Enunciamos a defini¸ao do produto tensorial apenas para obter uma ex-
posi¸ao completa. ao precisaremos lembrar da constru¸ao formal que fize-
mos anteriormente, apenas de suas propriedades operacionais. Em particular,
ser´a ´util definir uma representa¸ao matricial, chamada produto de Kro-
necker. Sejam A uma matriz m × n e B uma matriz p × q. Ent˜ao temos a
seguinte representa¸ao matricial:
A B :=
A
11
B A
12
B ··· A
1n
B
A
21
B A
22
B ··· A
2n
B
.
.
.
.
.
.
.
.
.
.
.
.
A
m1
B A
m2
B ··· A
mn
B
61
Ou seja, o termo A
ij
B ´e o elemento A
ij
da matriz A multiplicado pela matriz
B. Por exemplo, o produto tensorial dos vetores (2, 3) e (4, 5) ´e
2
3
4
5
=
2 × 4
2 × 5
3 × 4
3 × 5
=
8
10
12
15
4.3 Operador densidade
Suponha que um sistema quˆantico est´a em um estado |ψ
i
dentre arios
estados poss´ıveis, onde i ´e um ´ındice, com respectivas probabilidades p
i
.
Dizemos que {p
i
, |ψ
i
} ´e um conjunto (ensemble) de estados.
Defini¸ao O operador densidade, tamb´em chamado matriz densi-
dade de um sistema ´e definido pela equa¸ao
ρ :=
i
p
i
|ψ
i
ψ
i
|
O seguinte teorema fornece uma caracteriza¸ao de operadores densidade:
Teorema 4.3.1 Um operador ρ ´e o operador densidade associado a um en-
semble {p
i
, |ψ
i
} se e somente se satisfaz
1. tr(ρ) = 1
2. ρ ´e um operador positivo
Prova Suponha que ρ =
i
p
i
|ψψ
i
| ´e um operador densidade. Ent˜ao
tr(ρ) =
i
p
i
tr(|ψ
i
ψ
i
|) =
i
p
i
= 1
Suponha que |ϕ ´e um vetor qualquer no espa¸co de estados. Ent˜ao
ϕ|ρ|ϕ =
i
p
i
ϕ|ψ
i
ψ
i
|ϕ =
i
p
i
|ϕ|ψ
i
|
2
0
Reciprocamente, suponha que ρ ´e um operador satisfazendo a condi¸ao
do tra¸co e de positividade dadas acima. Como ρ ´e positiva, ent˜ao possui uma
decomposi¸ao espectral
ρ =
j
λ
j
|jj|
62
onde os vetores |j ao ortogonais e os λ
j
ao autovalores reais ao negativos
de ρ. Pela condi¸ao do tra¸co, vemos que
j
λ
j
= 1. Portanto, um sistema
no estado |j com probabilidade λ
j
ter´a ρ como o operador densidade corres-
pondente. Ou seja, o ensemble {λ
j
, |j} ´e um ensemble de estados que induz
o operador densidade ρ.
A utilidade do operador densidade ´e a de descrever subsistemas de um sis-
tema quˆantico composto. Para isso, definimos o operador densidade reduzido.
Suponha que temos dois sistemas f´ısicos A e B cujos estados ao descritos
por um operador densidade ρ
AB
. O operador densidade reduzido para o
sistema A ´e definido por
ρ
A
:= tr
B
(ρ
AB
),
onde tr
B
´e o tra¸co parcial sobre B, definido por
tr
B
(|a
1
a
2
| |b
1
b
2
|) := |a
1
a
2
|tr(|b
1
b
2
|)
onde |a
1
e |a
2
ao vetores no espa¸co de estados de A e |b
1
e |b
2
ao vetores
no espa¸co de estados de B. O operador tra¸co aparecendo no lado direito ´e o
operador tra¸co usual para o sistema B, e logo, tr(|b
1
b
2
|) = b
2
|b
1
.
Defini¸ao Dizemos que sistema quˆantico encontra-se em um estado
puro quando ao h´a incerteza quanto ao conhecimento do estado do sistema.
Ou seja, seu operador densidade ´e dado simplesmente por ρ = |ψψ|. Cos-
tumamos dizer tamb´em que o operador ρ ´e um estado puro. Caso contr´ario,
o estado ´e dito misturado (mixed).
O seguinte crit´erio nos permite dizer se um estado ´e puro:
Lema 4.3.2 Seja ρ um operador densidade. Ent˜ao tr(ρ
2
) 1 e vale a
igualdade se e somente se ρ ´e um estado puro.
Prova Um alculo simples mostra que ρ
2
=
n
i=1
p
2
i
|ii| se ρ =
n
i=1
p
i
|ii|.
Da´ı tr(ρ
2
) =
p
2
i
1, claramente.
´
E igual a 1 se e somente se existe k tal
que p
k
= 1 (e portanto, p
i
= 0, i = k), ou seja, se e somente se ρ = |kk|
63
4.4 Postulados da mecˆanica quˆantica
Enunciamos a seguir os postulados da mecˆanica quˆantica. Mais detalhes
podem ser vistos em [32]. Veremos que os postulados tamb´em possuem uma
formula¸ao interessante em termos de operadores densidade.
Postulado 1. Associado a cada sistema f´ısico existe um espa¸co vetorial
complexo com produto interno, chamado espa¸co de estados do sistema. O
sistema ´e completamente descrito pelo seu vetor de estado, que ´e um vetor
unit´ario no espa¸co de estados do sistema.
Em termos de operadores densidade, o postulado 1 pode ser escrito da
seguinte maneira:
Postulado 1’. Associado a cada sistema f´ısico isolado existe um espa¸co
vetorial complexo com produto interno, dito espa¸co de estados do sistema.
O sistema ´e completamente descrito pelo seu operador densidade. Se um
sistema quˆantico est´a no estado ρ
i
com probabilidade p
i
, enao o operador
densidade para o sistema ´e
i
p
i
ρ
i
.
O postulado a seguir se refere `a evolu¸ao temporal do sistema.
Postulado 2. A evolu¸ao de um sistema quˆantico fechado ´e dada por
uma transforma¸ao unit´aria, ou seja, o estado |ψ do sistema no tempo t
1
est´a relacionado com o estado |ψ
do sistema no tempo t
2
por um operador
unit´ario U que depende apenas dos tempos t
1
e t
2
:
|ψ
= U|ψ
Em termos de operadores densidade, temos:
Postulado 2’. A evolu¸ao de um sistema quˆantico fechado ´e dada por
uma transforma¸ao unit´aria, ou seja, o estado ρ do sistema no tempo t
1
est´a
relacionado com o estado ρ
no tempo t
2
por um operador unit´ario U que
depende apenas dos tempos t
1
e t
2
:
ρ
= UρU
Este postulado descreve como os estados de um sistema quˆantico fechado
em dois tempos diferentes est˜ao relacionados. Podemos postular, de maneira
mais refinada, como ocorre a evolu¸ao do sistema em tempo cont´ınuo.
Postulado 2”. A evolu¸ao no tempo de um estado de um sistema
quˆantico fechado ´e descrita pela equa¸ao de Schr¨odinger
i
d|ψ
dt
= H|ψ
64
O fator ´e a constante de Planck. O termo H ´e um operador hermitiano
fixado, que chamamos de Hamiltoniano do sistema fechado.
Vemos a rela¸ao entre os postulados 2 e 2

quando escrevemos a solu¸ao
da equa¸ao de Schr¨odinger
|ψ(t
2
) = exp
iH(t
2
t
1
)
|ψ(t
1
) = U(t
1
, t
2
)|ψ(t
1
),
onde
U(t
1
, t
2
) := exp
iH(t
2
t
1
)
Vale que U definido desta forma ´e unit´ario e que todo operador unit´ario pode
ser escrito na forma U = exp(iK) para algum operador hermitiano K.
Postulado 3. Medi¸oes quˆanticas ao descritas por uma cole¸ao {M
m
}
de operadores de medi¸ao, que ao operadores agindo no espa¸co de estados
do sistema. O ´ındice m se refere aos resultados das medi¸oes que podem
ocorrer. Se o estado do sistema quˆantico ´e |ψ antes que a medi¸ao seja
realizada, enao a probabilidade de que o resultado m ocorra ´e dado por
p(m) = ψ|M
m
M
m
|ψ
Em termos de operadores densidade, se o estado do sistema quˆantico ´e ρ,
temos
p(m) = tr(M
m
M
m
ρ)
O estado do sistema ap´os a medi¸ao ´e
M
m
|ψ
ψ|M
m
M
m
|ψ
ou enao
M
m
ρM
m
tr(M
m
M
m
ρ)
em termos de operadores densidade. Ainda, os operadores de medi¸ao satis-
fazem a equa¸ao de completude
m
M
m
M
m
= I.
Um sistema quˆantico ´e dito composto quando ´e formado por subsistemas
quˆanticos.
65
Postulado 4. O espa¸co de estados de um sistema composto ´e dado
pelo produto tensorial dos espa¸cos de estados dos subsistemas componentes.
Al´em disso, se temos sistemas numerados de 1 a n, e o sistema i encontra-se
no estado |ψ
i
, ent˜ao o estado do sistema total ´e |ψ
1
|ψ
2
··· |ψ
n
(em termos de operadores densidade, se o sistema i encontra-se no estado ρ
i
,
enao o estado do sistema total ´e ρ
1
ρ
2
··· ρ
n
).
4.5 Estados emaranhados
Defini¸ao Considere um sistema composto e seja |ψ um estado desse sis-
tema. Sabemos da se¸ao 4.2 que |ψ pode ser escrito como uma soma de
produtos tensoriais. Se |ψ ao pode ser escrito como um ´unico produto dos
seus estados componentes, ent˜ao dizemos que |ψ ´e um estado emaranhado
(entangled).
Um exemplo de estado emaranhado ´e
|ψ =
|01 + |10
2
=
1
2
|0 |1 + |1 |0
,
ou seja, ao existem estados |a e |b tais que |ψ = |a |b.
Veremos agora uma decomposi¸ao que nos permite medir, em um certo
sentido, a quantidade de emaranhamento entre dois sistemas.
Teorema 4.5.1 (Decomposi¸ao de Schmidt) Suponha que |ψ ´e um estado
puro de um sistema composto AB. Ent˜ao existem estados ortonormais |i
A
para o sistema A, e estados ortonormais |i
B
para o sistema B tais que
|ψ =
i
λ
i
|i
A
|i
B
,
onde os λ
i
ao umeros reais ao negativos satisfazendo
i
λ
2
i
= 1, chama-
dos coeficientes de Schmidt.
Observe a seguinte aplica¸ao deste teorema. Seja |ψ um estado puro
de um sistema composto AB. Enao pela decomposi¸ao de Schmidt, ρ
A
=
i
λ
2
i
|i
A
i
A
| e ρ
B
=
i
λ
2
i
|i
B
i
B
| e portanto os autovalores de ρ
A
e ρ
B
ao
iguais, ou seja, λ
2
i
para os dois operadores densidade. Muitas propriedades
de sistemas quˆanticos ao descritas completamente pelos autovalores do op-
erador densidade reduzido e no caso de um estado puro de um sistema com-
posto, tais propriedades continuar˜ao valendo para os seus subsistemas. Por
exemplo, considere o estado de dois q-bits
(|00 + |01 + |11)/
3
66
Este estado n˜ao possui nenhuma simetria evidente, mas no entanto, vale que
tr((ρ
A
)
2
) = tr((ρ
B
)
2
) = 7/9. Isso ´e uma conseq¨uˆencia simples da decom-
posi¸ao de Schmidt.
Para provar a decomposi¸ao de Schmidt, precisamos dos seguintes resul-
tados. Lembramos que um operador linear ´e dito normal se AA
= A
A.
Teorema 4.5.2 (Decomposi¸ao espectral) Todo operador normal M em um
espco vetorial V de dimens˜ao finita ´e diagonal com respeito a uma base
ortonormal para V . Reciprocamente, todo operador diagonaliz´avel ´e normal.
A decomposi¸ao espectral ´e um resultado conhecido de ´algebra linear e
sua prova pode ser vista, por exemplo, em [32].
Teorema 4.5.3 (Decomposi¸ao Polar) Seja A um operador linear em um
espco vetorial V de dimens˜ao finita. Ent˜ao existe um operador unit´ario U
e operadores positivos J e K tais que
A = UJ = KU
onde os ´unicos operadores positivos J e K satisfazendo estas equa¸ao ao
J :=
A
A e K :=
AA
. Al´em disso, se A ´e invers´ıvel ent˜ao U ´e ´unico.
A decomposi¸ao A = UJ ´e dita decomposi¸ao polar `a esquerda de A e
A = KU ´e a decomposi¸ao polar `a direita de A.
Prova Note que J :=
A
A ´e um operador positivo, e enao admite uma
decomposi¸ao espectral J =
i
λ
i
|ii|, λ
i
0. Defina |ψ
i
:= A|i. Pela
defini¸ao, vemos que ψ
i
|ψ
i
= λ
2
i
. Considerando apenas os i tais que λ
i
= 0,
defina |e
i
:= |ψ
i
i
. Desta forma os |e
i
est˜ao normalizados e al´em disso,
tais vetores ao ortogonais, pois se i = j, enao e
i
|e
j
= i|A
A|j
i
λ
j
=
i|J
2
|j
i
λ
j
= 0.
Acima consideramos os i tais que λ
i
= 0. Agora use o procedimento de
Gram-Schmidt para extender o conjunto ortonormal |e
i
para obter uma base
ortonormal, que tamb´em chamaremos de |e
i
. Defina um operador unit´ario
U :=
i
|e
i
i|. Quando λ
i
= 0, temos UJ|i = λ
i
|e
i
= |ψ
i
= A|i. Quando
λ
i
= 0 temos UJ|i = 0 = |ψ
i
. Com isso provamos que a ao de A e de UJ
´e a mesma na base |i e portanto, obtemos A = UJ.
O operador J ´e ´unico, pois multiplicando A = UJ `a esquerda pela equa¸ao
adjunta A
= JU
fornece J
2
= A
A, donde obtemos que J =
A
A. Um
alculo simples mostra que se A ´e invers´ıvel enao J tamem ´e e ent˜ao U ´e
unicamente determinado pela equa¸ao U = AJ
1
. A prova da decomposi¸ao
polar `a direita segue pois A = UJ = UJU
U = KU, onde K := UJU
´e um operador positivo. Como AA
= KUU
K = K
2
, devemos ter que
K =
AA
, o que conclui a prova.
67
Corol´ario 4.5.4 (Decomposi¸ao em valores singulares) Seja A uma matriz
quadrada. Ent˜ao existem matrizes unit´arias U e V e uma matriz diagonal
D com entradas ao negativas tais que
A = UDV
Os elementos na diagonal de D ao ditos valores singulares de A.
Prova Pela decomposi¸ao polar, A = SJ para S unit´aria e J positiva. Pelo
teorema espectral, J = T DT
, para T unit´aria e D diagonal com entradas
ao-negativas. Fazendo U := ST e V := T
, o resultado segue.
Prova do teorema 4.5.1 Faremos a prova no caso em que os sistemas
A e B tem espa¸cos de estado de mesma dimens˜ao. O caso geral ´e an´alogo.
Sejam |j e |k bases ortonormais para os sistemas A e B, respectivamente.
Enao |ψ pode ser escrito como
|ψ =
jk
c
jk
|j|k
para uma certa matriz complexa C com entradas c
jk
. Pela decomposi¸ao em
valores singulares, C = UDV , onde D = (d
ij
) ´e uma matriz diagonal com
entradas n˜ao negativas, e U = (u
ij
) e V = (v
ij
) s˜ao matrizes unit´arias. Ent˜ao
|ψ =
ijk
u
ji
d
ii
v
ik
|j|k
Definindo |i
A
:=
j
u
ji
|j , |i
B
:=
k
v
ik
|k e λ
i
:= d
ii
, vemos que
|ψ =
i
λ
i
|i
A
|i
B
Vale que |i
A
´e um conjunto ortonormal, pelo fato de que U ´e unit´aria e
pela ortonormalidade de |j, e analogamente vale que |i
B
´e um conjunto
ortonormal.
68
As bases |i
A
e |i
B
ao chamadas bases de Schmidt para A e B, res-
pectivamente, e o n´umero de coeficientes de Schmidt λ
i
ao nulos ´e dito
n´umero de Schmidt para o estado |ψ. O n´umero de Schmidt ´e uma pro-
priedade importante de um sistema quˆantico composto que, em um certo
sentido, quantifica o emaranhamento entre os sistemas A e B. Para entender
como, considere a seguinte propriedade: o n´umero de Schmidt ´e preservado
por transforma¸oes unit´arias no sistema A ou no sistema B individualmente.
Para ver porque, note que se
i
λ
i
|i
A
|i
B
´e a decomposi¸ao de Schmidt para
|ψ enao
i
λ
i
(U|i
A
)|i
B
´e a decomposi¸ao de Schmidt para U|ψ, onde U
´e um operador unit´ario agindo apenas no sistema A. Com isso, podemos
provar o seguinte:
Proposi¸ao 4.5.5 Seja |ψ um estado de um sistema composto AB. ao
equivalentes:
1. |ψ ´e um estado produto.
2. |ψ possui umero de Schmidt igual a 1.
3. ρ
A
(e portanto ρ
B
) ao estados puros.
Prova A equivalˆencia entre 1 e 2 ´e evidente pois o n´umero de Schmidt de
|ψ ser igual a 1 equivale a dizer |ψ = |k
A
|k
B
para algum k {1, . . . , n}
A equivalˆencia entre 1 e 3, por exemplo, segue direto da defini¸ao de tra¸co
parcial, pois
|ψ = |i
A
|i
B
ρ
AB
= |i
A
i
A
| |i
B
i
B
| ρ
A
= |i
A
i
A
| , ρ
B
= |i
B
i
B
|
Outra t´ecnica relacionada com o emaranhamento de estados ´e a seguinte.
Seja ρ
A
uma estado de um sistema quˆantico A.
´
E poss´ıvel introduzir um
outro sistema, denotado por R, e definir um estado puro |AR para o sis-
tema conjunto AR tal que ρ
A
= tr
R
(|ARAR|). Ou seja, o estado puro
|AR se reduz a ρ
A
quando olhamos apenas para o sistema A. Este processo
´e chamado purifica¸ao, e nos permite associar estados puros a estados mis-
turados de maneira natural. O sistema R ´e dito sistema de referˆencia.
Dado um estado ρ
A
qualquer, mostraremos como construir um sistema
R e e uma purifica¸ao |AR. Suponha que ρ
A
possui uma decomposi¸ao
ortonormal ρ
A
=
i
p
i
|i
A
i
A
|. Para purificar ρ
A
introduzimos um sistema
R que possui o mesmo espa¸co de estados que o sistema A, com estados
ortonormais |i
R
e definimos um estado puro para o sistema combinado
|AR :=
i
p
i
|i
A
|i
R
.
69
Agora calculamos o operador densidade reduzido para o sistema A corres-
pondente ao estado |AR:
tr
R
(|ARAR|) =
ij
p
i
p
j
|i
A
j
A
|tr(|i
R
j
R
|) =
ij
p
i
p
j
|i
A
j
A
|δ
ij
=
i
p
i
|i
A
i
A
| = ρ
A
Portanto, |AR ´e uma purifica¸ao de ρ
A
.
Note a rela¸ao entre a decomposi¸ao de Schmidt e o etodo de pu-
rifica¸ao: o procedimento usado para se purificar um estado misturado do
sistema A ´e definir um estado puro cuja base de Schmidt para o sistema
A ´e simplesmente a base em que o estado misturado ´e diagonal, com os
coeficientes de Schmidt sendo a raiz quadrada dos autovalores do operador
densidade que est´a sendo purificado.
70
Cap´ıtulo 5
Entropia
5.1 Entropia de Shannon
Observao Neste texto, escrevemos log x para denotar o logaritmo de x
na base 2. O logaritmo natural ser´a denotado por ln x.
A incerteza de uma cole¸ao de estados poss´ıveis a
i
com uma distribui¸ao
de probabilidade p(a
i
) ´e dada pela sua entropia,
H(p) :=
i
p(a
i
) log p(a
i
),
chamada entropia de Shannon. Estamos interessados em comparar duas
distribui¸oes de probabilidade distintas, e para este fim, introduzimos a no¸ao
de entropia relativa.
Defini¸ao Suponha que temos dois conjuntos de eventos discretos a
i
e b
j
com distribui¸oes de probabilidade correspondentes p(a
i
) e p(b
j
). A
entropia relativa (de Shannon) entre estas duas distribui¸oes ´e dada por
H(p(a)p(b)) :=
i
p(a
i
) log
p(a
i
)
p(b
i
)
A entropia relativa ´e ao negativa, H(p(x)q(x)) 0, e vale a igualdade
se e somente se p(x) = q(x), para todo x, e se X ´e uma vari´avel aleat´oria
com d resultados poss´ıveis, ent˜ao H(X) d, e vale a igualdade se e somente
se X ´e uniformemente distribu´ıda.
Temos que
H(p(x, y)p(x)p(y)) = H(p(x)) + H(p(y)) H(p(x, y))
71
Um conceito importante derivado da entropia relativa est´a relacionado
com a obten¸ao de informa¸ao. Quando um sistema aprende alguma in-
forma¸ao a partir de outro, dizemos que seus estados est˜ao correlacionados.
A grandeza que mede a correla¸ao entre esses estados ´e a informa¸ao m´utua.
Defini¸ao A informa¸ao m´utua (de Shannon) entre duas vari´aveis
aleat´orias A e B que possuem uma distribui¸ao de probabilidade conjunta
p(a
i
, b
j
), e portanto distribui¸oes de probabilidade marginais p(a
i
) =
j
p(a
i
, b
j
)
e p(b
j
) =
i
p(a
i
, b
j
) ´e definida por
I
H
(A : B) := H(p(a)) + H(p(b)) H(p(a, b))
Podemos escrever I
H
em termos da entropia relativa de Shannon. Neste
sentido, ela representa uma distˆancia entre a distribui¸ao p(a, b) e o produto
das marginais p(a) × p(b). Vale que
I
H
(A : B) = H(p(a, b)p(a) × p(b))
Com respeito a entropia m´utua de Shannon, vemos que ela descreve a
correla¸ao de dois observ´aveis, ou seja, tal grandeza ´e inerentemente cl´assica.
A entropia conjunta (de Shannon) de X e Y ´e definida de maneira
natural por
H(X, Y ) :=
x,y
p(x, y) log p(x, y)
Vale tamb´em uma propriedade subaditiva, ou seja,
H(X, Y ) H(X) + H(Y )
com igualdade se e somente se X e Y ao vari´aveis independentes.
A entropia condicional (de Shannon) ´e definida por
H(X|Y ) := H(X, Y ) H(Y )
e a informa¸ao m´utua de X e Y ´e
H(X : Y ) := H(X) + H(Y ) H(X, Y )
Nestes moldes, uma cadeia de Markov ´e uma seq¨encia {X
i
} de vari´aveis
aleat´orias tais que X
n+1
independe de X
1
, X
2
, . . . X
n1
, dado X
n
. Formal-
mente,
p(X
n+1
= x
n+1
|X
n
= x
n
, . . . , X
1
= x
1
) = p(X
n+1
= x
n+1
|X
n
= x
n
)
72
Proposi¸ao 5.1.1 Valem as seguintes propriedades da entropia de Shannon:
1. H(X, Y ) = H(Y, X) , H(X : Y ) = H(Y : X)
2. H(Y |X) 0, e portanto H(X : Y ) H(Y ) com igualdade se e so-
mente se Y ´e fun¸ao de X (isto ´e, se Y ocorre sempre que X ocorre).
3. H(X) H(X, Y ), com igualdade se e somente se Y ´e fun¸ao de X.
4. H(X, Y ) H(X) + H(Y ) com igualdade se e somente se X e Y ao
vari´aveis aleat´orias independentes (subaditividade).
5. H(Y |X) H(Y ) e portanto H(X : Y ) 0 com igualdade se e somente
se X e Y ao vari´aveis independentes.
6. H(X
1
, X
2
, X
3
) + H(X
2
) H(X
1
, X
2
) + H(X
2
, X
3
), com igualdade se
e somente se {X
3
, X
2
, X
1
} formam uma cadeia de Markov (subaditivi-
dade forte).
7. H(X|Y, Z) H(X|Y ) (condicionamento diminui a entropia).
Prova
1. Evidente.
2. Como p(x, y) = p(x)p(y|x), temos
H(X, Y ) =
xy
p(x, y) log p(x)p(y|x)
=
x
p(x) log p(x)
xy
p(x, y) log p(y|x)
= H(X)
xy
p(x, y) log p(y|x)
Logo, H(Y |X) =
xy
p(x, y) log p(y|x). Mas log p(y|x) 0 e por-
tanto H(Y |X) 0 com igualdade se e somente se Y ´e uma fun¸ao de
X.
3. Segue do item anterior.
4. Usaremos o fato de que log (x) ln 2 x 1 para todo x positivo, com
igualdade se e somente se x = 1. Assim,
x,y
p(x, y) log
p(x)p(y)
p(x, y)
1
ln 2
x,y
p(x, y)
p(x)p(y)
p(x, y)
1
73
=
1
ln 2
xy
p(x)p(y) p(x, y) =
1 1
ln 2
= 0
A desigualdade segue. Note que a igualdade vale se e somente se
p(x, y) = p(x)p(y) para todo x e y.
5. Segue do item anterior.
6. Como na prova de subaditividade, usaremos o fato de que log (x) ln 2
x1 para todo x positivo, com igualdade se e somente se x = 1. Assim,
x
1
,x
2
,x
3
p(x
1
, x
2
, x
3
) log
p(x
1
, x
2
)p(x
2
, x
3
)
p(x
2
)p(x
1
, x
2
, x
3
)
1
ln 2
x
1
,x
2
,x
3
p(x
1
, x
2
, x
3
)
p(x
1
, x
2
)p(x
2
, x
3
)
p(x
2
)p(x
1
, x
2
, x
3
)
1
=
1
ln 2
x
1
,x
2
,x
3
p(x
1
, x
2
)p(x
2
, x
3
)
p(x
2
)
p(x
1
, x
2
, x
3
)
=
1
ln 2
x
1
,x
2
p(x
1
, x
2
)
x
1
,x
2
,x
3
p(x
1
, x
2
, x
3
)
= 0
e a desigualdade segue. E note que a igualdade vale se e somente se
p(x
1
, x
2
)p(x
2
, x
3
)
p(x
2
)p(x
1
, x
2
, x
3
)
= 1
p(x
1
, x
2
, x
3
)
p(x
2
, x
3
)
=
p(x
1
, x
2
)
p(x
2
)
p(x
1
|x
2
, x
3
) = p(x
1
|x
2
)
ou seja, se e somente se {X
3
, X
2
, X
1
} ´e uma cadeia de Markov.
7. Basta observar que
H(X|Y, Z) H(X|Y ) H(X, Y, Z) H(Y, Z) H(X, Y ) H(Y )
que ´e a subaditividade forte.
O seguinte teorema nos diz como uma cadeia de Markov perde informa¸ao
sobre os seus valores anteriores, `a medida que o tempo cresce.
Teorema 5.1.2 Suponha que {X
i
} ´e uma cadeia de Markov. Ent˜ao
H(X
i
: X
i+2
) H(X
i
: X
i+1
) H(X
i
)
74
Prova A segunda desigualdade ´e o item 2 da proposi¸ao 5.1.1. Pelas
defini¸oes, temos que H(X
1
: X
3
) H(X
1
: X
2
) ´e equivalente a H(X
1
|X
2
)
H(X
1
|X
3
). Se {X
i
} ´e uma cadeia de Markov, enao a seq¨uˆencia inversa
tamb´em ´e, ou seja, para k 1,
p(X
n+1
= x
n+1
|X
n
= x
n
, . . . , X
1
= x
1
) = p(X
n+1
= x
n+1
|X
n
= x
n
)
p(X
n
= x
n
|X
n+1
= x
n+1
, . . . , X
n+k
= x
n+k
) = p(X
n
= x
n
|X
n+1
= x
n+1
)
e portanto H(X
1
|X
2
) = H(X
1
|X
2
, X
3
). Ent˜ao o problema ´e reduzido a
mostrar que
H(X
1
, X
2
, X
3
)H(X
2
, X
3
) = H(X
1
|X
2
, X
3
) H(X
1
|X
3
) = H(X
1
, X
3
)H(X
3
)
Ora, mas essa desigualdade ´e apenas a subaditividade forte (item 6, proposi¸ao
5.1.1).
Como um corol´ario do teorema acima, temos que se {X
i
} ´e cadeia de Markov,
enao
H(X
i+2
: X
i
) H(X
i+2
: X
i+1
)
Intuitivamente, isso significa que qualquer informa¸ao de X
i+2
compartilhada
com X
i
deve ser uma informa¸ao que X
i+2
compartilha com X
i+1
.
5.2 Entropia de von Neumann
Dada uma fun¸ao f : C C, ´e poss´ıvel definir uma fun¸ao matricial da
seguinte maneira. Seja A =
a
a|aa| a decomposi¸ao espectral para um
operador normal A. Defina
f(A) :=
a
f(a)|aa|
Desta forma, vale que f(A) est´a unicamente determinado. Assim podemos
definir, por exemplo, o logaritmo de operadores positivo-definidos e a expo-
nencial de operadores normais. Usaremos este tipo de constru¸ao para definir
a entropia de von Neumann.
Vamos considerar os an´alogos quˆanticos da se¸ao anterior. A grandeza
que est´a associada com as correla¸oes de todo o sistema ´e a informa¸ao
m´utua de von Neumann, que definiremos a seguir. Devido a sua natureza
global, ao ´e dif´ıcil imaginar que esse valor depende da matriz densidade.
75
Come¸camos definindo a entropia quˆantica, mais conhecida como entropia de
von Neumann.
Defini¸ao A entropia de von Neumann de um sistema quˆantico
descrito por uma matriz densidade ρ ´e definida por
S(ρ) := tr(ρ log ρ)
Se λ
i
ao os autovalores de ρ enao a entropia de von Neumann pode ser
escrita como
S(ρ) =
i
λ
i
log λ
i
(5.1)
Para provar esta afirma¸ao, note que se
ρ =
λ
i
|ii|,
enao
log ρ =
log λ
i
|ii|
e
ρ log ρ(v) = ρ(
log λ
i
|ii|v) =
log λ
i
i|vρ(|i) =
λ
i
log λ
i
i|v
Portanto,
tr(ρ log ρ) = tr(
λ
i
log λ
i
i|) =
λ
i
log λ
i
tr(i|) =
λ
i
log λ
i
A entropia de von Neumann pode ser considerado o an´alogo quˆantico da
entropia de Shannon [34]. Para provar algumas de suas propriedades, iremos
introduzir primeiro a entropia relativa associada.
Defini¸ao A entropia relativa (de von Neumann) entre dois estados
σ e ρ ´e dada por
S(ρσ) := tr(ρ log ρ) tr(ρ log σ)
A propriedade asica ´e a seguinte desigualdade:
Lema 5.2.1 (Desigualdade de Klein). A entropia relativa quˆantica ´e ao
negativa:
S(ρσ) 0,
e vale a igualdade se e somente se ρ = σ.
76
Prova Sejam ρ =
i
p
i
|ii| e σ =
j
q
j
|jj| decomposi¸oes ortonormais
para ρ e σ. Pela defini¸ao de entropia relativa, temos
S(ρσ) =
i
p
i
log p
i
i
i|ρ log σ|i
Nesta ´ultima equa¸ao, usamos as equa¸oes i|ρ = p
i
i| e
i|log σ|i = i|
j
log (q
j
)|jj|
|i =
j
log (q
j
)P
ij
,
onde P
ij
= i|jj|i 0, e da´ı obtemos
S(ρσ) =
i
p
i
log p
i
j
P
ij
log (q
j
)
.
Note que P
ij
satisfaz P
ij
0,
i
P
ij
= 1 e
j
P
ij
= 1 (a matriz com entradas
P
ij
´e duplamente estoastica). Como log (.) ´e uma fun¸ao estritamente con-
cava, segue que
j
P
ij
log q
j
log (
j
P
ij
q
j
) com igualdade se e somente se
existe um valor de j para o qual P
ij
= 1. Portanto,
S(ρσ)
i
p
i
log
p
i
j
P
ij
q
j
com igualdade se e somente se existe um valor de j para o qual P
ij
= 1, ou
seja, se e somente se P
ij
´e uma matriz de permuta¸ao. Esta express˜ao tem a
mesma forma da entropia relativa cl´assica. Portanto deduzimos que
S(ρσ) 0
com igualdade se e somente se p
i
=
j
P
ij
q
j
, para todo i e P
ij
´e uma matriz
de permuta¸ao. Para simplificar essa condi¸ao de igualdade, note que tro-
cando os nomes dos autoestados de σ se necess´ario, podemos supor que P
ij
´e
a matriz identidade e enao σ e ρ ao diagonais na mesma base. A condi¸ao
p
i
=
j
P
ij
q
j
nos diz que os autovalores correspondentes a ρ e σ ao idˆenticos
e portanto a condi¸ao de igualdade se reduz a afirmar que ρ = σ.
Proposi¸ao 5.2.2
S(ρ
A
σ
A
) S(ρ
AB
σ
AB
)
A prova usa o seguinte lema:
77
Lema 5.2.3 Existe um conjunto de matrizes unit´arias U
j
e uma distribui¸ao
de probabilidade p
j
tal que para qualquer matriz A,
i
p
i
U
i
AU
i
= tr(A)
I
d
,
onde d ´e a dimens˜ao do espco de Hilbert onde o operador A est´a definido.
Juntamente com a concavidade estrita da entropia, este lema pode ser usado
para provar que o estado I/d em um espa¸co de dimens˜ao d ´e o ´unico estado
de axima entropia.
Prova da proposi¸ao 5.2.2 Pelo lema, existem transforma¸oes unit´arias
U
j
no espa¸co B e probabilidades p
j
tais que
ρ
A
I
d
=
j
p
j
U
j
ρ
AB
U
j
para todo ρ
AB
. Pela convexidade de entropia relativa, obtemos
S
ρ
A
I
d
σ
A
I
d
j
p
j
S
U
j
ρ
AB
U
j
U
j
σ
AB
U
j
Mas a entropia relativa ´e invariante por conjuga¸ao unit´aria, ent˜ao
S
ρ
A
I
d
σ
A
I
d
j
p
j
S
ρ
AB
σ
AB
= S(ρ
AB
σ
AB
)
Esta desigualdade juntamente com o fato de que
S
ρ
A
I
d
σ
A
I
d
= S(ρ
A
σ
A
)
fornece a monotonicidade da entropia relativa.
Prosseguimos na an´alise da entropia de von Neumann.
Defini¸ao A entropia conjunta (de von Neumann) S(A, B) para um
sistema composto com duas componentes A e B ´e definido de maneira natural
por
S(A, B) := tr(ρ
AB
log ρ
AB
)
onde ρ
AB
´e a matriz densidade do sistema AB.
78
Proposi¸ao 5.2.4 Suponha que A e B ao sistemas quˆanticos distintos que
possuem um estado conjunto ρ
AB
. Ent˜ao a entropia conjunta para os dois
sistemas satisfaz as desigualdades
|S(A) S(B)| S(A, B) S(A) + S(B)
A primeira desigualdade ´e chamada desigualdade triangular, ou desigual-
dade de Araki-Lieb.
´
E o an´alogo quˆantico da desigualdade H(X, Y )
H(X) para a entropia de Shannon. A segunda desigualdade ´e dita desigual-
dade subaditiva, e vale a igualdade se e somente se os sistemas A e B ao
est˜ao correlacionados, ou seja, se ρ
AB
= ρ
A
ρ
B
.
Prova da proposi¸ao 5.2.4 A prova da desigualdade subaditiva ´e uma
aplica¸ao simples da desigualdade de Klein, que podemos escrever como
S(ρ) tr(ρ log σ)
Fazendo ρ = ρ
AB
e σ = ρ
A
ρ
B
, note que
tr(ρ log σ) = tr(ρ
AB
(log ρ
A
+ log ρ
B
))
= tr(ρ
A
log ρ
A
) tr(ρ
B
log ρ
B
) = S(A) + S(B)
A desigualdade de Klein nos fornece S(A, B) S(A)+S(B), como quer´ıamos.
A condi¸ao de igualdade σ = ρ para a desigualdade de Klein nos fornece
condi¸oes de igualdade ρ
AB
= ρ
A
ρ
B
para a subaditividade.
Para provar a desigualdade de Araki-Lieb, introduza um sistema auxiliar
R que purifica os sistemas A e B (vimos purifica¸ao na se¸ao 4.5). Aplicando
a subaditividade, obtemos
S(R) + S(A) S(A, R)
Como ABR encontra-se em um estado puro, S(A, R) = S(B) e S(R) =
S(A, B). A desigualdade anterior pode ser reescrita como
S(A, B) S(B) S(A)
Pela simetria entre os sistemas A e B, obtemos tamem S(A, B) S(A)
S(B).
79
Suponha que os ρ
i
ao estados de um sistema A. Introduza o sistema
auxiliar B cujo espa¸co de estados possui uma base ortonormal |i correspon-
dente ao ´ındice i dos operadores densidade ρ
i
. Defina um estado conjunto de
AB por
ρ
AB
:=
i
p
i
ρ
i
|ii|
Para provar a concavidade de S, usaremos a propriedade subaditiva. Note
que para a matriz densidade ρ
AB
, temos
S(A) = S
i
p
i
ρ
i
S(B) = S
i
p
i
|ii|
= H(p
i
)
S(A, B) = H(p
i
) +
i
p
i
S(ρ
i
)
Aplicando a desigualdade subaditiva S(A, B) S(A) + S(B), obtemos
i
p
i
S(ρ
i
) S
i
p
i
ρ
i
ou seja, S ´e concava. O etodo de se introduzir um sistema auxiliar, como
foi usado aqui, e na prova da desigualdade de Araki-Lieb, ´e freq¨uentemente
aplicado em teoria da informa¸ao quˆantica.
Teorema 5.2.5 Suponha que P
i
´e um conjunto completo de projetores orto-
gonais e ρ um operador densidade. Ent˜ao a entropia do estado ρ
:=
i
P
i
ρP
i
do sistema ap´os a medi¸ao ´e tal que
S(ρ
) S(ρ)
e vale a igualdade se e somente se ρ = ρ
. Em outras palavras, medi¸oes
projetivas aumentam a entropia.
Prova Aplique a desigualdade de Klein para ρ e ρ
.
0 S(ρ
ρ) = S(ρ) tr(ρ log ρ
)
O resultado segue se provarmos que tr(ρ log ρ
) = S(ρ
). Para isso, apli-
camos as rela¸oes
i
P
i
= I, P
2
i
= P
i
e a propriedade c´ıclica do tra¸co para
obter
tr(ρ log ρ
) = tr
i
P
i
ρ log ρ
= tr
i
P
i
ρ log ρ
P
i
80
Note que ρ
P
i
= P
i
ρP
i
= P
i
ρ
, ou seja, P
i
comuta com ρ
e portanto com
log ρ
e da´ı
tr(ρ log ρ
) = tr
i
P
i
ρP
i
log ρ
= tr(ρ
log ρ
) = S(ρ
)
Teorema 5.2.6 Suponha que ρ =
i
p
i
ρ
i
, onde p
i
´e um conjunto de proba-
bilidades e ρ
i
ao operadores densidade. Ent˜ao
S(ρ)
i
p
i
S(ρ
i
) + H(p
i
)
com igualdade se e somente se os estados ρ
i
tem suporte em subespcos or-
togonais.
Prova Primeiro suponha que temos um estado puro ρ
i
= |ψ
i
ψ
i
|. Suponha
que os ρ
i
ao estados de um sistema A e introduza um sistema auxiliar B
com uma base ortonormal |i correspondendo ao ´ındice i nas probabilidades
p
i
. Defina
|AB :=
i
p
i
|ψ
i
|i
Como |AB ´e um estado puro, temos
S(B) = S(A) = S
i
p
i
|ψ
i
ψ
i
|
= S(ρ)
Suponha que realizamos uma medi¸ao projetiva no sistema B na base |i
Ap´os a medi¸ao, o estado do sistema B ´e
ρ
B
=
i
p
i
|ii|
Mas pelo teorema anterior, medi¸oes projetivas nunca diminuem a entropia
e portanto, S(ρ) = S(B) S(B
) = H(p
i
). Observando que S(ρ
i
) = 0 para
o caso de estado puro, provamos que
S(ρ) H(p
i
) +
i
p
i
S(ρ
i
)
onde os estados ρ
i
ao estados puros. Al´em disso vale a igualdade se e somente
se B = B
, que ocorre se e somente se os estados |ψ
i
ao ortogonais.
81
Considere agora o caso de estados misturados. Se ρ
i
=
j
p
i
j
|e
i
j
e
i
j
| ao as
decomposi¸oes ortonormais para os estados ρ
i
, temos que ρ =
ij
p
i
p
i
j
|e
i
j
e
i
j
|.
Aplicando o resultado para estados puros e a observao de que
j
p
i
j
= 1
para cada i, temos
S(ρ)
ij
p
i
p
i
j
log (p
i
p
i
j
) =
i
p
i
log p
i
i
p
i
j
p
i
j
log p
i
j
= H(p
i
) +
i
p
i
S(ρ
i
)
A condi¸ao de igualdade para o estado misturado segue direto da condi¸ao
do caso de estados puros.
Corol´ario 5.2.7 Suponha que p
i
ao probabilidades, |i ao estados ortogo-
nais para um sistema A e ρ
i
´e um conjunto de operadores densidade para um
outro sistema B. Ent˜ao
S
i
p
i
|ii| ρ
i
= H(p
i
) +
i
p
i
S(ρ
i
)
e portanto
S(ρ σ) = S(ρ) + S(σ)
para quaisquer operadores densidade ρ e σ.
Defini¸ao A informa¸ao m´utua (de von Neumann) entre dois subsis-
temas ρ
U
e ρ
V
de um sistema conjunto ρ
UV
´e definido por
I
S
(ρ
U
: ρ
V
; ρ
UV
) := S(ρ
U
) + S(ρ
V
) S(ρ
UV
)
Algumas propriedades da entropia de Shannon n˜ao valem para a entropia
de von Neumann e isso acarreta algumas conseq¨uˆencias. Por exemplo, para
vari´aveis aleat´orias X e Y , vale a desigualdade H(X) H(X, Y ). Esta
desigualdade ´e intuitiva, ou seja, ´e natural imaginar que a menos incerteza
quanto ao estado de X do que incerteza quanto ao estado do sistema conjunto
formado por X e Y .
No entanto, esta intui¸ao falha para estados quˆanticos. Considere um
sistema AB de dois q-bits no estado emaranhado (|00 + |11)/
2. Este ´e
um estado puro e portanto, S(A, B) = 0. Por outro lado, o sistema A possui
operador densidade I/2 e portanto possui entropia igual a 1.
82
5.3 Subaditividade forte
Esta se¸ao ´e baseada em [32]. Mostraremos a desigualdade chamada suba-
ditividade forte para a entropia de von Neumann.
Teorema 5.3.1 Sejam A, B e C estados quˆanticos. Ent˜ao
S(A, B, C) + S(B) S(A, B) + S(B, C)
Para provar este resultado, precisamos saber alguns fatos sobre concavi-
dade de fun¸oes.
Defini¸ao Sejam A e B matrizes e f (A, B) uma fun¸ao real. Dizemos
que f ´e conjuntamente concava em A e B se para todo 0 λ 1,
f(λA
1
+ (1 λ)A
2
, λB
1
+ (1 λ)B
2
) λf(A
1
, B
1
) + (1 λ)f(A
2
, B
2
)
Toda fun¸ao conjuntamente concava ´e concava em cada uma das vari´aveis,
mas a reciproca ao vale.
Teorema 5.3.2 (Lieb) Seja X uma matriz, e 0 t 1. Ent˜ao a fun¸ao
f(A, B) := tr(X
A
t
XB
1t
)
´e conjuntamente concava sobre matrizes positivas A e B.
Proposi¸ao 5.3.3 A entropia relativa S(ρσ) ´e conjuntamente convexa em
seus argumentos.
Prova Para matrizes A e X quaisquer no mesmo espa¸co, defina
I
t
(A, X) := tr(X
A
t
XA
1t
) tr(X
XA)
O primeiro termo nesta express˜ao ´e concavo em A, pelo teorema de Lieb, e
o segundo termo ´e linear em A. Portanto, I
t
(A, X) ´e concavo em A. Defina
I(A, X) :=
d
dt
|
t=0
I
t
(A, X) = tr(X
(log A)XA) tr(X
X(log A)A)
Observando que I
0
(A, X) = 0 e usando a concavidade de I
t
(A, X) em A,
temos
I(λA
1
+ (1 λ)A
2
, X) = lim
δ0
I
δ
(λA
1
+ (1 λ)A
2
, X)
δ
83
λ lim
δ0
I
δ
(A
1
, X)
δ
+ (1 λ) lim
δ0
I
δ
(A
2
, X)
δ
= λI(A
1
, X) + (1 λ)I(A
2
, X)
Ou seja, I(A, X) ´e uma fun¸ao concava de A. Definindo as matrizes em bloco
A :=
ρ 0
0 σ
X :=
0 0
I 0
vemos que I(A, X) = S(ρσ) = (tr(ρ log ρ) tr(ρ log σ)). A convexidade
conjunta de S(ρσ) segue da concavidade de I(A, X) em A.
Defini¸ao A entropia condicional (de von Neumann) ´e
S(A|B) := S(A, B) S(B)
Corol´ario 5.3.4 Seja AB um sistema composto com componentes A e B.
Ent˜ao a entropia condicional S(A|B) ´e concava no estado ρ
AB
de AB.
Prova Seja d a dimens˜ao do sistema A. Note que
S
ρ
AB
I
d
ρ
B
= S(A, B) tr
ρ
AB
log
I
d
ρ
B

= S(A, B) tr(ρ
B
log ρ
B
) + log d = S(A|B) + log d
Portanto, S(A|B) = log d S(ρ
AB
I/d ρ
B
). A concavidade de S(A|B)
segue da convexidade conjunta da entropia relativa.
Prova do teorema (5.3.1) Mostraremos que para quaisquer sistemas
quˆanticos,
S(A) + S(B) S(A, C) + S(B, C)
S(A, B, C) + S(B) S(A, B) + S(B, C)
Estas desigualdades ao equivalentes. Usaremos a concavidade da en-
tropia condicional para provar a primeira, e a seguir mostramos que isso
implica a validade da segunda. Defina a seguinte fun¸ao de operadores den-
sidade no sistema ABC:
T (ρ
ABC
) := S(A) + S(B) S(A, C) S(B, C) = S(C|A) S(C|B)
Pela concavidade da entropia condicional, vemos que T (ρ
ABC
) ´e uma fun¸ao
convexa de ρ
ABC
. Seja ρ
ABC
=
i
p
i
|ii| uma decomposi¸ao espectral de
84
ρ
ABC
. Pela convexidade de T , T (ρ
ABC
)
i
p
i
T (|ii|). Mas T (|ii|) = 0
pois para estados puros vale que S(A, C) = S(B) e S(B, C) = S(A). Segue
que T (ρ
ABC
) 0 e portanto
S(A) + S(B) S(A, C) S(B, C) 0
que ´e a primeira desigualdade que queriamos provar.
Para obter a segunda desigualdade, introduza um sistema auxiliar R pu-
rificando o sistema ABC. Usando a desigualdade rec´em provada, temos
S(R) + S(B) S(R, C) + S(B, C) (5.2)
Como ABCR ´e um estado puro, S(R) = S(ABC) e S(R, C) = S(A, B) e
portanto (5.2) se torna
S(A, B, C) + S(B) S(A, B) + S(B, C)
o que conclui a prova.
5.4 Cadeias quˆanticas: entropia de Shannon
Relembrando: seja Λ uma σalgebra de subconjuntos de e seja A:
Λ C uma medida complexa com A(Ω) = 1. O n´umero complexo A(∆) ´e
dito amplitude quˆantica do evento ∆ Λ. Al´em disso, estaremos supondo
que A ´e σ-aditiva. A probabilidade P de que um evento Λ ocorra
´e definida por P (∆) := |A(∆)|
2
. Lembre que de fato tal P ao ´e uma
probabilidade sobre Ω.
Iremos supor que = {s
0
, s
1
, . . . , s
n
} , ou seja, cada elemento ω
´e o resultado de uma seq¨uˆencia de medi¸oes. Se (X
t
)
t
´e tal seq¨uˆencia,
escreveremos
a
0
a
1
···a
t
:= {ω |X
0
(ω) = a
0
, X
1
(ω) = a
1
, . . . , X
t
(ω) = a
t
} (5.3)
Estamos interessados em calcular algum tipo de entropia para as cadeias
quˆanticas, de maneira an´aloga a que ´e feita ao se calcular a entropia associada
a uma cadeia de Markov usual.
Seja
X
t
= (A(X
1
t
(s
0
)), . . . , A(X
1
t
(s
n1
))) C
n
e
A
jk
= A(X
1
2
(s
j
)|X
1
1
(s
k
))
85
A amplitude de (5.3) ´e
A(s
j(0)
s
j(1)
···s
j(t)
) = A
j(t)j(t1)
···A
j(2)j(1)
A
j(1)j(0)
(
X
0
)
j(0)
Vamos calcular a entropia da probabilidade associada a uma cadeia de
Markov quˆantica. Como no caso usual de entropia para o shift, podemos
definir σ : Ω Ω, σ(ω
1
ω
2
···) = (ω
2
ω
3
···), a parti¸ao α = {s
0
, s
1
, . . . , s
n
} de
Ω e a entropia (de Shannon) desta parti¸ao, que no caso de cadeias quˆanticas
tem como express˜ao, fazendo µ = |A|
2
,
H
t1
k=0
σ
k
α
=
s
0
s
1
...s
t1
µ(s
0
s
1
···s
t1
) log µ(s
0
s
1
···s
t1
)
=
s
0
s
1
...s
t1
|A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
|
2
×log
A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
2
=
s
0
s
1
...s
t1
|A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
|
2
×
log |A
s
t1
s
t2
|
2
+ ··· + log |A
s
2
s
1
|
2
+ log |A
s
1
s
0
|
2
+ log |(
X
0
)
s
0
|
2
=
n1
i=1
|(
X
0
)
s
i
|
2
log |(
X
0
)
s
i
|
2
(t 1)
n1
k,l=1
|A
s
k
s
l
(
X
0
)
s
l
|
2
log |A
s
k
s
l
|
2
Portanto,
h
µ
(σ) = h
|A|
2
(σ) = lim
t→∞
1
t
H
t1
k=0
σ
k
α
=
n1
k,l=1
|A
s
k
s
l
(
X
0
)
s
l
|
2
log |A
s
k
s
l
|
2
Observao: uma poss´ıvel defini¸ao de entropia complexa. Podemos
nos perguntar: por que ao considerar uma “entropia complexa”? Uma cons-
tru¸ao desse tipo ´e poss´ıvel, mas veremos que a dificuldade para a obten¸ao
de uma express˜ao simples reside no fato de que o argumento de um n´umero
complexo ´e linear apenas sobre certas condi¸oes. Para entender isso mel-
hor, analisemos a seguinte constru¸ao. Seja U
0
= C {x R : x 0}.
86
Podemos definir em U
0
um ramo do argumento da seguinte maneira: seja
a : (π, π) S
1
{−1}, a(t) = e
it
. Vale que tal aplica¸ao ´e uma bije¸ao
sobre S
1
{−1}. Seja b : S
1
{−1} (π, π) a inversa de a. Vale que b ´e
cont´ınua e limitada. Defina Arg : U
0
(π, π) por Arg(z) = b(z/|z|), que
´e um ramo do argumento em U
0
, o ramo principal do argumento. O ramo
do logaritmo associado a Arg ´e
Log(z) := log |z| + iArg(z) , z U
0
,
que ´e o ramo principal do logaritmo.
Fazendo o alculo de entropia an´alogo ao feito acima, temos:
H
t1
k=0
σ
k
α
=
s
0
s
1
...s
t1
A(s
0
s
1
···s
t1
)LogA(s
0
s
1
···s
t1
)
=
s
0
s
1
...s
t1
A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
LogA
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
=
s
0
s
1
...s
t1
A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
×
log |(A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
|+ iArg(A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
)
=
s
0
s
1
...s
t1
A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
×
log |A
s
t1
s
t2
| + ··· + log |A
s
2
s
1
| + log |A
s
1
s
0
| + log |(
X
0
)
s
0
|
+iArg(A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
)
=
n1
i=1
(
X
0
)
s
i
log |(
X
0
)
s
i
| (t 1)
n1
k,l=1
A
s
k
s
l
(
X
0
)
s
l
log |A
s
k
s
l
|
i
s
0
s
1
...s
t1
A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
Arg(A
s
t1
s
t2
···A
s
2
s
1
A
s
1
s
0
(
X
0
)
s
0
)
87
Se z
1
, . . . z
n
ao n´umeros complexos tais que Re(z
i
) > 0 e Re(z
1
z
2
···z
n
) >
0, 1 i n, enao o argumento ´e aditivo, ou seja, Arg(z
1
···z
n
) = Arg(z
1
)+
··· + Arg(z
n
). Em particular, Log(z
1
···z
n
) = Log(z
1
) + ··· + Log(z
n
).
Em geral, matrizes de Dirichlet ao satisfazem o crit´erio dado acima. Por
exemplo, se
M(j, k) =
1
n
e
iaπ(jk)
2
/n
,
fazendo a = 1 e n = 3, podemos escrever
M(3, 1) =
1
3
(cos(4π/3) + i sin(4π/3)),
mas Re(M(3, 1)) = (1/
3) cos(4π/3) < 0.
Supondo que as entradas de A satisfazem a hip´otese observada acima,
temos:
h
A
(σ) = lim
t→∞
1
t
H
t1
k=0
σ
k
α
=
n1
k,l=1
A
s
k
s
l
(
X
0
)
s
l
( log |A
s
k
s
l
| + iArgA
s
k
s
l
)
5.5 Cadeias quˆanticas: entropia de von Neu-
mann
Pelo que vimos nas se¸oes 2.2 e 4.3, podemos facilmente obter a entropia
de von Neumann de uma cadeia de Markov quˆantica. Vamos considerar um
ensemble para cada tempo t, ou seja, se
S = {s
0
, s
1
, . . . s
n1
} = {|s
0
, |s
1
, . . . , |s
n1
}
´e o conjunto de estados poss´ıveis, e P
t
(k) = P
t
(s
k
) denota a probabilidade de
ocorrer o estado s
k
no tempo t, consideramos os pares {P
t
(k), |s
k
}, t N.
O operador densidade associado `a cadeia de Markov quˆantica no tempo t ´e
ρ
t
=
n1
k=0
P
t
(k)|s
k
s
k
| =
n1
k=0
|(A
t
X
0
)
k
|
2
|s
k
s
k
|
=
n1
k=0
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
2
|s
k
s
k
|, (5.4)
onde, lembramos, {X
t
} ´e uma N-cadeia quˆantica,
X
t
= (A[X
t
= s
0
], . . . , A[X
t
= s
n1
]) C
n
,
88
λ
0
, . . . , λ
n1
ao os autovalores da matriz de amplitude de transi¸ao A
jk
=
A[X
2
= s
j
|X
1
= s
k
] e ψ
0
, . . . , ψ
n1
a base ortonormal de autovetores corres-
pondente.
Calculando a entropia de von Neumann, temos
S(ρ
t
) = tr(ρ
t
log ρ
t
) =
n1
k=0
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
2
log
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
2
=
n1
k=0
(A
t
X
0
)
k
2
log
(A
t
X
0
)
k
2
Observao Note que a express˜ao para (A
t
X
0
)
k
usada na equa¸ao (5.4)
acima,
(A
t
X
0
)
k
=
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
´e alida apenas fazendo a suposi¸ao de que
X
0
= (1, 0, ···, 0), conforme
obtida no final da se¸ao 2.2. Para o caso geral de um
X
0
qualquer, pro-
cedemos da seguinte maneira. Fazemos os alculos em dimens˜ao 2, o caso
geral ´e an´alogo, com uma nota¸ao mais complicada.
Sejam λ
0
, λ
1
os autovalores de A e sejam ψ
0
, ψ
1
a base ortonormal de
autovetores correspondente. Ent˜ao,
A
t
X
0
= A
t
j=0,1
X
0
, ψ
j
ψ
j
=
j=0,1
A(X
0
= 0)(ψ
j
)
0
+ A(X
0
= 1)(ψ
j
)
1
A
t
ψ
j
=
A(X
0
= 0)(ψ
0
)
0
+ A(X
0
= 1)(ψ
0
)
1
λ
t
0
ψ
0
+
A(X
0
= 0)(ψ
1
)
0
+ A(X
0
= 1)(ψ
1
)
1
λ
t
1
ψ
1
No caso particular em que
X
0
= (1, 0), obtemos a express˜ao vista em [1],
agina 37, que em dimens˜ao 2 ´e
A
t
(1, 0) = (ψ
0
)
0
λ
t
0
ψ
0
+ (ψ
1
)
0
λ
t
1
ψ
1
o que implica
P (X
t
= k) = |(ψ
0
)
0
λ
t
0
(ψ
0
)
k
+ (ψ
1
)
0
λ
t
1
(ψ
1
)
k
|
2
, k = 0, 1.
e em dimens˜ao n,
P (X
t
= k) = |
j
(ψ
j
)
0
λ
t
j
(ψ
j
)
k
|
2
, k = 0, 1, . . . , n 1.
89
Mas no caso geral para
X
0
qualquer, em dimens˜ao n, temos apenas que
A
t
X
0
=
n1
j=0
n1
k=0
A(X
0
= k)(ψ
j
)
k
λ
t
j
ψ
j
.
90
Cap´ıtulo 6
Formalismo Termodinˆamico
Neste cap´ıtulo analisamos um problema variacional para cadeias de Markov
finitas. Se H denota a entropia, U ´e um potencial, e λ ´e um certo autovalor
associado a U, temos um princ´ıpio variacional para energia livre:
H(µ)
U log λ
onde vale a igualdade se e somente se µ for uma determinada medida especial
ν = ν
(U)
, que chamamos medida de Markov (faremos os detalhes a seguir).
Dado este teorema para cadeias de Markov reais, podemos nos perguntar se
existe algum an´alogo para cadeias quˆanticas.
6.1 Introdu¸ao
Apresentamos aqui um teorema de O. E. Lanford e D. Ruelle [26] numa
vers˜ao de F. Spitzer [38] que caracteriza (em uma caso simplificado) o estado
de Gibbs (no reticulado unidimensional Z) como sendo aquele que maximiza
a energia livre. Essa energia ´e baseada em um potencial U que descreve de
alguma forma a intera¸ao entre elementos vizinhos no reticulado Z. Vamos
assumir aqui que esta U tem uma express˜ao simples (um elemento no retic-
ulado depende da intera¸ao de um n´umero finito fixo de vizinhos) e assim
ela determina uma matriz de transi¸ao M de uma cadeia de Markov [33] e
esta define uma certa probabilidade estacion´aria sobre o espa¸co de Bernoulli.
Esta probabilidade ν ser´a o estado de Gibbs associado a U. Deste modo,
ser´a poss´ıvel apresentar ao leitor uma vers˜ao matematicamente rigorosa de
algumas id´eias asicas e resultados fundamentais que aparecem em certos
problemas simples de Mecˆanica Estat´ıstica. Esta exposi¸ao ´e baseada em
[38].
91
6.2 Caracteriza¸ao variacional
6.2.1 Introdu¸ao
A entropia ´e uma grandeza que mede a caoticidade, ou complexidade de um
sistema: quanto maior for a entropia, mais ca´otico ´e o sistema. Esse conceito
aparece na F´ısica e est´a associado com o princ´ıpio de que a natureza tende
a maximizar a entropia. Se em um tempo inicial t
0
consideramos part´ıculas
de as concentradas em um dos cantos de uma caixa fechada, ent˜ao ap´os
algum tempo (ap´os o equil´ıbrio) as part´ıculas tender˜ao a uma situa¸ao, onde
elas estar˜ao espalhadas na forma mais aleat´oria poss´ıvel. Isso significa que
decorrido algum tempo, o as ter´a uma distribui¸ao uniforme na caixa.
Um sistema de part´ıculas ´e muito mais aleat´orio (tem mais entropia) se
estiver uniformemente distribu´ıdo na caixa do que se estivesse concentrado
em um dos cantos. Vemos assim que o equil´ıbrio ´e atingido em configura¸oes
de axima entropia.
A entropia tamem est´a relacionada com a Teoria de Informa¸ao, a partir
dos trabalhos de Shannon. Se quisermos transmitir uma mensagem atrav´es
de um certo meio de comunica¸ao usando um determinado alfabeto de n
s´ımbolos {1, . . . , n}, cada s´ımbolo com uma certa probabilidade p
1
, . . . , p
n
de ocorrer,
n
i=1
p
i
= 1 (suponha que a ocorrˆencia dos s´ımbolos seja inde-
pendente), enao a entropia deste sistema ´e a entropia do shift de Bernoulli
B(p
1
, p
2
, . . . , p
n
), ou seja,
n
i=1
p
i
log p
i
.
A valor da entropia para medidas mais gerais tem uma express˜ao mais
complexa. Nosso proposta aqui ´e a de usar a entropia de Shannon-Kolomogrov
como uma ferramenta matem´atica para se estudar a Mecˆanica Estat´ıstica.
O que apresentamos aqui ´e baseado na abordagem de Bowen-Ruelle-Sinai
para entender reticulados em uma dimens˜ao e veremos que essa proposta
inclui estudar a press˜ao topol´ogica do shift. Tal teoria ´e o que chamamos
atualmente de Formalismo Termodinˆamico. Uma dos objetos desta teoria
´e o operador de Ruelle-Perron-Frobenius, que ´e uma generaliza¸ao natural
(para o espa¸co de fun¸oes cont´ınuas) de uma matriz com todas as entradas
positivas. No caso de dimens˜ao finita, o teorema de Perron-Frobenius agindo
em R
n
basta para se obter o que se necessita. O operador de Ruelle-Perron-
Frobenius possui diversas aplica¸oes em outras ´areas da matem´atica, como
por exemplo Geometria e Teoria dos N´umeros. Algumas vezes, na F´ısica,
este operador ´e denominado matriz de transferˆencia.
92
6.2.2 Energia livre
Para motivar o problema que vamos analisar em breve vamos apresentar ini-
cialmente o modelo mais simples possivel. Considere um sistema f´ısico com
estados {1, . . . , n}, e sejam U
1
, . . . U
n
as energias desses estados, respecti-
vamente. Suponha que colocamos o sistema em contato com uma fonte de
calor muito maior, que est´a a uma temperatura T . Sendo assim, a energia ir´a
transitar entre o sistema original e a fonte de calor, e a temperatura T per-
manecer´a constante, pois a fonte ´e muito maior que o nosso sistema. O pro-
blema f´ısico que estamos considerando ao ´e determin´ıstico, e os podemos
apenas falar da probabilidade de um certo estado fixo, digamos j, ocorrer,
onde j {1, 2, .., n}. Apos esperar que o sistema se encontre em equilibrio,
se realizarmos uma sequˆencia de observoes, notaremos que o estado j ir´a
ocorrer numa determinda propor¸ao de vezes.
Por exemplo, se fizermos 1000 observoes e em 112 delas aparece o estado
2, diremos que existe evidˆencia de que 2 tem probabilidade P
2
=
112
1000
.
Enao o que queremos saber, para cada j, ´e o valor dessa propor¸ao
quando o n´umero de observoes vai a infinito.
´
E um fato conhecido da
Mecˆanica Estat´ıstica (a partir de observoes) que a probabilidade P
j
de que
o estado j ocorra ´e dado pela distribui¸ao de Gibbs:
P
j
=
e
BU
j
n
i=1
e
BU
i
, j {1, . . . , n},
onde B =
1
kT
e k ´e uma constante, chamada constante de Boltzmann.
Uma formula¸ao variacional do que foi dito acima pode ser feita da
seguinte maneira. Seja
F (p
1
, . . . , p
n
) =
n
i=1
p
i
log p
i
n
i=1
p
i
BU
i
definida no simplexo em R
n
dado por
(p
1
, . . . , p
n
) : p
i
0, i {1, . . . n},
n
i=1
p
i
= 1
Usando multiplicadores de Lagrange, podemos mostrar que o aximo de F
no simplexo ´e obtido em
P
j
=
e
BU
j
n
i=1
e
BU
i
, j {1, . . . , n},
93
ou seja, de acordo com o valor P
j
dado acima.
A fun¸ao
S(p
1
, . . . , p
n
) =
n
i=1
p
i
log p
i
´e a entropia da distribui¸ao (p
1
, . . . , p
n
). Defina U(p
1
, . . . , p
n
) =
n
i=1
p
i
U
i
como sendo a energia m´edia. Ent˜ao podemos dizer que a distribui¸ao de
Gibbs maximiza o valor
S(p
1
, . . . , p
n
) + BU(p
1
, . . . , p
n
)
Nesse contexto, a express˜ao S + BU ´e o que chamaremos de energia livre.
Logo, podemos dizer que a natureza minimiza a energia livre. Quando faze-
mos a temperatura T tender a +, isto ´e, se B tender a 0, maximizamos a
entropia.
Ap´os a an´alise do sistema mais simples descrito acima, vamos considerar
um caso um pouco mais complexo.
O modelo proposto por Ruelle ´e o seguinte (usaremos um modelo seme-
lhante na pr´oxima se¸ao). Considere um reticulado unidimensional Z. Cada
inteiro est´a associado a um estado 1, . . . , n e uma configura¸ao do sistema ´e
uma sequˆencia ω
i
{1, . . . , n}, i Z. O nosso espa¸co de configura¸oes ´e,
enao, = {1, . . . , n} . Seja σ : a aplica¸ao shift, ˜ω = σ(ω), dada
por ˜ω
k
= (σ(ω))
k
= ω
k+1
, ω = (..., ω
1
, ω
0
, ω
1
, ω
2
, . . .), k Z.
Em outras palavras, se ω = (..., ω
2
, ω
1
, ω
0
, ω
1
, ω
2
, ω
3
, ...), onde na posi¸ao
zero do reticulado Z temos o valor ω
0
, enao
˜ω = σ(ω) = (..., ˜ω
2
, ˜ω
1
, ˜ω
0
, ˜ω
1
, ˜ω
2
, ˜ω
3
, ...),
onde na posi¸ao zero do reticulado Z temos o valor ˜ω
0
, e ˜ω
k
= ω
k+1
.
Seja T o espa¸co de probabilidades invariantes para o shift, i.e., µ T
µ(A) = µ(σ
1
(A)), A conjunto de Borel. Este ´e o modelo da Mecˆanica Es-
tat´ıstica no reticulado Z via o shift de Bernoulli. Um modelo mais apropriado
seria sobre o reticulado tridimensional Z
3
, mas aqui vamos evitar situa¸oes
mais complexas.
Seja U : R uma fun¸ao cont´ınua, que cont´em a informa¸ao rela-
cionada com alguma grandeza f´ısica (energia, temperatura, campo magn´etico,
etc.). Queremos obter agora uma maneira de determinar a distribui¸ao de
Gibbs no reticulado unidimensional infinito de uma forma semelhante a usada
no caso finito que vimos acima.
94
A distribui¸ao de Gibbs associado a U ser´a uma probabilidade ν sobre o
espa¸co Ω = {1, . . . , n} .
Por exemplo, considere uma determinada distribui¸ao de spins + ou
de part´ıculas no reticulado unidimensional Z (poder´ıamos ter escrito 0 e 1
no lugar de + e , por exemplo). Devemos considerar o espa¸co de Bernoulli
de dois s´ımbolos = {+, −} , e probabilidades µ em Ω. fixado U, qual
probabilidade ν ´e a de Gibbs asociada a U?
´
E apropriado considerar ape-
nas probabilidades em T porque ao a uma raz˜ao natural para destacar
um determinado ponto do reticulado como sendo o valor i = 0. Assim, a
probabilidade de Gibbs deve ser invariante por transla¸ao.
Vamos denotar por ++ = {ω = (. . . , ω
1
, ω
0
, ω
1
, ω
2
, ω
3
, ...)| tal que ω
1
=
+, ω
2
= +}. Da mesma forma, + + = {ω = (. . . , ω
1
, ω
0
, ω
1
, ω
2
, ω
3
, ...)|
tal que ω
1
= +, ω
2
= , ω
3
= +}, e assim por diante...
O estado de Gibbs ν vai dizer, por exemplo, qual a probabilidade de
ocorrer no reticulado o arranjo ω
1
= +, ω
2
= , ω
3
= +, atraes de ν(+ +).
Na verdade, vamos considerar o espa¸co Ω = {+, −} e ao {+, −} .
Exemplo. Seja = {+, −} . Suponha que U ´e constante em cada um
dos cilindros ++, +, + e −−. Vamos identificar + com 2 e com 1.
Sejam p
11
0, p
12
0, p
21
0, p
22
0, p
11
+ p
12
= 1, p
21
+ p
22
= 1 e defina
U da seguinte maneira:
U(ω) =
log p
22
, se ω ++
log p
21
, se ω +
log p
12
, se ω +
log p
11
, se ω −−
Neste caso, assumimos que no reticulado Z existe uma probabilidade p
22
de
obter um + `a direita de um + e uma probabilidade p
21
de obter um `a
direita de um +.
Qual seria o estado de Gibbs ν associado a tal U?
Voltemos agora ao caso geral.
Dada uma fun¸ao U cont´ınua em Ω, vamos analisar o seguinte problema
variacional. Seja
P (U) = sup
µ∈T
S(µ) +
U
,
onde S(µ) ´e a entropia da probabilidade µ (ver defini¸ao na pr´oxima se¸ao).
Diremos que P (U) ´e a press˜ao topol´ogica associada a U.
Gostar´ıamos de encontrar um probabilidade ν, definida em todo o espa¸co
Ω, que assuma o supremo mencionado acima. Tal probabilidade ser´a chamada
95
de estado de equil´ıbrio, ou estado de Gibbs associado ao potencial U.
Em outras palavras,
P (U) = S(ν) +
U S(µ) +
Udµ, µ T .
O estado de equil´ıbrio ν ser´a definido, portanto, por meio de um princ´ıpio
de aximo, ou seja, ν maximiza algo. O potencial U do exemplo particular
acima mencionado descreve uma certa intera¸ao entre spins no reticulado,
mas o problema faz sentido para U qualquer, ao necessariamente como no
exemplo. Poderia, por exemplo, depender de mais coordenadas, ao ape-
nas duas. Vamos considerar na pr´oxima se¸ao o caso simples em que U(ω)
depende apenas de duas, ou seja de ω
0
e ω
1
, onde ω = (···ω
1
ω
0
ω
1
···),
ou seja, cada spin depende apenas do vizinho `a direita. No exemplo dado
abaixo, a solu¸ao pode ser obtida atrav´es de
´
Algebra Linear, ou seja, pela
teoria de Cadeias de Markov e pelo Teorema de de Perron-Frobenius (de-
scrito no Apˆendice deste cap´ıtulo). Se o U depende de infinitas coordenadas,
a´ı o procedimento via
´
Algebra Linear ao resolve o problema; ´e necess´ario
utilizar [35].
Ruelle mostrou que o que os f´ısicos denominam de estado de Gibbs, no
caso do reticulado Z, pode ser obtido via o procedimento acima atrav´es de
uma escolha correta de U. Diferentes problemas de Mecˆanica Estat´ıstica
requerem diferentes U.
A an´alise de quest˜oes mais gerais em Mecˆanica Estat´ıstica pode ser en-
contrada em [10] [40].
6.2.3 Caracteriza¸ao variacional
Para simplificar, no lugar de Ω = {1, ···, n} , vamos considerar
Ω = {1, ···, n} .
O problema para um U geral definido em = {1, ···, n} pode ser re-
duzido a este {1, ···, n} (ver Proposition 1.2 [35]).
Seja uma fun¸ao potencial do tipo U : {1, ···, n} R, com U(ω) =
U(ω
1
, ω
2
), onde ω = (ω
1
ω
2
ω
3
···), isto ´e, U o depende de duas coordenadas.
Observe que se consideramos um potencial U que depende de n coordenadas,
com 2 < n < , podemos modificar o espa¸co de modo a fazer com que U
dependa de apenas duas coordenadas.
Por exemplo, suponha que = {1, 2} e que temos um potencial U que
depende de 3 coordenadas, isto ´e, U(ω) = U(ω
1
, ω
2
, ω
3
). Considere ent˜ao o
96
espa¸co
ˆ
Ω = {1
, 2
, 3
, 4
} e o relacionamos com fazendo as identifica¸oes
11 1
12 2
21 3
22 4
Note agora que certas rela¸oes est˜ao proibidas. O par 1
3
ao ´e permi-
tido. O par 1
2
´e permitido.
Podemos pensar que U est´a definido em
ˆ
Ω como uma certa V . De fato, V
definida de maneira natural em
ˆ
depende apenas de duas coordenadas, pois,
por exemplo U(1, 1, 2, . . .) = U(1, 1, 2) = V (1
, 2
), ainda U(1, 2, 2, . . .) =
U(1, 2, 2) = V (2
, 4
) e assim por diante.
Desta maneira se pode fazer recair o caso em que U depende de finitas
coordenadas no espa¸co de Bernoulli ao caso em que dependa de apenas duas,
como ser´a analisado a seguir.
Tal procedimento ao pode ser feito se o potencial considerado depende
de infinitas coordenadas.
Um cilindro de de comprimento k ´e um conjunto A da seguinte forma:
fixe (a
1
, ···, a
k
) {1, ···, n}
k
.
A = {ω = (ω
1
, ···, ω
k
, ω
k+1
, .., ω
n
, ...) : (ω
1
, ···, ω
k
) = (a
1
, ···, a
k
)}
Iremos denotar tal cilindro por
A = a
1
···a
k
Seja F a σalgebra gerada pelos cilindros de de todos os comprimentos
poss´ıveis.
Seja σ : a aplica¸ao shift dada por (σω)
k
= ω
k+1
, k N.
Em outras palavras, se ω = (ω
1
, ω
2
, ω
3
, ...),
σ(ω) = (ω
2
, ω
3
, ω
4
, ...).
Por exemplo, em Ω = {1, 2, 3} , temos que
σ(1, 2, 1, 1, 3, 2, ..) = (2, 1, 1, 3, 2, ..).
Iremos a seguir considerar medidas µ sobre a σalgebra F. Diremos que
µ T (Ω, F, µ) ´e espa¸co de probabilidade, com µ invariante pelo shift
(i.e., µ(σ
1
(A)) = µ(A), A F), e diremos que T ´e o conjunto das medidas
invariantes por transla¸ao. Sabe-se que T ´e compacto se consideramos a
convergˆencia fraca de medidas [7] [6].
97
Seja k fixo e A
k
o conjunto dos cilindros de comprimento k, k 1, que ´e
uma parti¸ao de Ω. Defina a entropia da parti¸ao por
S(A
k
) =
aA
k
µ(a) log µ(a)
onde escrevemos a = a
1
a
2
, . . . a
k
A
k
.
Definimos a entropia da medida (com rela¸ao ao shift) por
s(µ) = lim
n+
S(A
n
)
n
, µ T , (6.1)
Definindo a fun¸ao potencial U : Ω R, diremos que U(i, j), 1 i, j n
´e a energia de intera¸ao entre ω
k
e ω
k+1
se ω
k
= i, ω
k+1
= j. Defina a energia
m´edia da parti¸ao A
k
como sendo
E(A
k
) =
aA
k
µ(a)
j
U(a
j
, a
j+1
)
A energia espec´ıfica da parti¸ao com respeito a U ´e
e
U
(µ) = lim
n+
E(A
n
)
n
(6.2)
que ´e uma fun¸ao cont´ınua e afim. Afirmamos que
e
U
(µ) =
U
De fato, pelo teorema erg´odico de Birkhoff (proposi¸ao 6.4.3) e aplicando o
teorema da convergˆencia dominada para a sequˆencia de fun¸oes
1
N
N1
k=1
U
σ
k
, temos:
U =
lim
N+
1
N
N1
j=1
U(σ
j
(ω))(ω) = lim
N+
1
N
N1
j=1
U(σ
j
(ω))(ω) =
= lim
N+
1
N
N1
j=1
U(σ
j
(ω))(ω) = lim
N+
1
N
j
aA
k
µ(a)U(σ
j
(a)) =
= lim
N+
1
N
aA
k
µ(a)
j
U(a
j
, a
j+1
) = e
U
(µ)
98
Assim, se a energia livre em A
k
´e
F (A
k
) = S(A
k
) E(A
k
),
definimos a energia livre espec´ıfica como sendo
f
U
(µ) = s(µ) e
U
(µ) = s(µ)
U (6.3)
Vamos estar interessados nas medidas µ que maximizam tal valor.
O conjunto M T das medidas de Markov ser´a definido da seguinte
maneira. Diremos que µ M matriz n×n linha estoastica M = M
ij
(i.e.,
j
M
ij
= 1) estritamente positiva tal que
µ(a
1
, ···a
N
) = ϕ
a
1
M(a
1
, a
2
)M(a
2
, a
3
) ···M(a
N1
, a
N
) , a
1
, . . . , a
N
{1, . . . , n}
(6.4)
onde ϕ ´e o ´unico vetor de probabilidade invariante `a esquerda para M (ou
seja, ϕ
k
> 0, 1 k n,
ϕ
i
= 1 e ϕM = ϕ). Definindo µ sobre os
cilindros, fica determinada de maneira ´unica, pelo teorema de Kolmogorov,
uma medida de probabilidade sobre a σalgebra gerada pelos cilindros.
Voltando `a fun¸ao potencial U dada acima, seja a matriz Q = Q
U
definida
por
Q(i, j) = e
U(i,j)
, 1 i, j n (6.5)
Seja λ = λ(U) o maior autovalor (positivo) de Q e sejam l, r os autove-
tores `a esquerda e `a direita de Q correspondentes a λ, e normalizados de
modo que l
i
> 0, r
i
> 0, 1 i n e l, r =
i
l
i
r
i
= 1 (proposi¸ao 6.4.1).
Defina a seguinte matriz:
M(i, j) =
1
λ
Q(i, j)
r
j
r
i
, 1 i, j n (6.6)
A matriz M = M(U) ´e positiva e ´e linha estoastica. De fato:
Qr = λr Q
r
1
.
.
.
r
n
= λ(r
1
, ···, r
n
)
j
Q(i, j)r
j
= λr
i
Enao
j
M(i, j) =
j
1
λ
Q(i, j)
r
j
r
i
=
1
λr
i
j
Q(i, j)r
j
=
1
λr
i
λr
i
= 1
99
Observe que M tem um vetor de probabilidade invariante
ϕ
i
= l
i
r
i
, 1 i n (6.7)
De fato,
ϕM = (l
1
r
1
, ···, l
n
r
n
)M
(ϕM)
i
=
k
l
k
r
k
M(k, i) =
k
l
k
r
k
1
λ
Q(k, i)
r
i
r
k
=
=
r
i
λ
k
l
k
Q(k, i) =
r
i
λ
λl
i
= r
i
l
i
= ϕ
i
ϕM = ϕ
Note que l
i
e r
i
ao definidos a menos de constante multiplicativa e acima
escolhemos ϕ = (ϕ
1
, ···, ϕ
n
) como sendo ϕ
i
= l
i
r
i
, i = 1, . . . , n e
ϕ
i
= 1,
ϕ
i
> 0.
Vamos formular a caracteriza¸ao variacional de ν. Para U fixo, seja ν =
ν
(U)
a medida de Markov definida pela matriz de transi¸ao M = M(U) obtida
acima, isto ´e,
ν(a) = ϕ
a
1
M(a
1
, a
2
)M(a
2
, a
3
) ···M(a
k1
, a
k
) , a A
k
Dizemos que σ ´e erg´odica para µ (invariante) se σ
1
(A) = A implica
µ(A) = 0 ou 1. Pode-se mostrar que a probabilidade ν acima ´e invariante e
erg´odica para o shift σ se¸ao 11.6 [36].
Afirmamos que sup
µ∈T
f
U
(µ) = f
U
(ν). Mais precisamente, temos o seguinte:
Teorema 6.2.1 Seja U : Ω R cont´ınua. Ent˜ao:
f
U
(µ) log λ(U) = log(λ) , µ T (6.8)
e vale a igualdade se e somente se µ for a medida de Markov ν = ν
(U)
definida
acima.
Uma maneira de provar o teorema consiste em 3 passos:
1. Mostrar a desigualdade, e que vale a igualdade se µ = ν
(U)
.
2. Mostrar a desigualdade estrita se µ = ν
(U)
, µ erg´odica.
3. Mostrar a desigualdade estrita se µ = ν
(U)
, µ qualquer.
100
Na demonstra¸ao a seguir, escreveremos ν
(U)
= ν.
Prova Mostremos o primeiro passo. Seja ν a medida de Markov definida
por M, e µ T qualquer. Sejam M e ϕ definidos por (5), (6), (7), ν(a) =
ϕ
a
1
M(a
1
, a
2
)M(a
2
, a
3
) ···M(a
k1
, a
k
).
Suponha ainda que os cilindros considerados tem comprimento N,isto ´e,
consideramos os cilindros de A
N
. Enao
E(A
N
) =
aA
N
µ(a)
N1
k=1
U(a
k
, a
k+1
)
Escrevendo λ(U) = λ, temos:
N1
k=1
U(a
k
, a
k+1
) =
N1
k=1
log Q(a
k
, a
k+1
) = log
N1
k=1
Q(a
k
, a
k+1
) =
= log
N1
k=1
M(a
k
, a
k+1
)λ
r
a
k
r
a
k+1
=
=
log
N1
k=1
M(a
k
, a
k+1
) + log
N1
k=1
λ + log
N1
k=1
r
a
k
log
N1
k=1
r
a
k+1
=
= (N 1) log λ log
N1
k=1
M(a
k
, a
k+1
)
log r
a
1
+ log r
a
N
=
= (N 1) log λ log
ν(a)
ϕ
a
1
log r
a
1
+ log r
a
N
= (N 1) log λ log ν(a) + log l
a
1
r
a
1
log r
a
1
+ log r
a
N
= (N 1) log λ log ν(a) + log l
a
1
+ log r
a
N
.
Calculando a energia m´edia com respeito a µ obtemos
E(A
N
) =
aA
N
µ(a)
N1
k=1
U(a
k
, a
k+1
) =
=
aA
N
µ(a)((N 1) log λ log ν(a) + log l
a
1
+ log r
a
N
)
101
Como o n´umero de a
i
{1, 2, .., n} ´e finito e os r
a
i
e l
a
i
ao positivos,
enao existe c
1
e c
2
tal que para todo i vale c
1
< log r
a
i
, log l
a
i
< c
2
.
Sendo assim,
aA
N
µ(a)((N 1) log λ log ν(a) + 2 c
1
)
E
N
(µ) =
aA
N
µ(a)((N 1) log λ log ν(a) + log l
a
1
+ log r
a
N
)
aA
N
µ(a)((N 1) log λ log ν(a) + 2 c
2
).
Observando que o somat´orio
aA
N
µ(a) log
ν(a)
µ(a)
(6.9)
´e negativo (veja a proposi¸ao 6.4.2), temos
1
N
F (A
N
) =
1
N
(S(A
N
) E(A
N
)) = (6.10)
=
1
N
aA
N
µ(a) log
ν(a)
µ(a)
+ log λ
log λ
N
(log l
a
1
+ log r
a
N
)
N
(6.11)
log λ
log λ
N
2
c
1
N
(6.12)
Fazendo N +, obtemos a desigualdade procurada, isto ´e, f
U
(µ)
log λ. Para mostrar a igualdade, observe que o somat´orio (6.9) ´e igual a zero
se µ = ν. Segue da´ı que
log λ
log λ
N
2
c
2
N
1
N
F (A
N
) log λ
log λ
N
2
c
1
N
(6.13)
Fazendo N +, obtemos a igualdade, ou seja, f
U
(µ) = log λ se µ =
ν
(U)
(isto ´e, se µ for a medida de Markov). Isso prova o primeiro passo.
Agora vamos supor provado o segundo passo (ou seja, suponha que vale a
desigualdade estrita se µ = ν
(U)
, µ erg´odica). Este segundo passo ´e bastante
t´ecnico e referimos o leitor para uma prova geral em [35].
Mostremos o terceiro passo, ou seja, que vale a desigualdade estrita se
µ = ν
(U)
, µ qualquer.
102
Primeiro, observamos que T ´e convexo [39]. De fato, se µ
1
, µ
2
T , enao
µ = (1 λ)µ
1
+ λµ
2
´e tal que
µ(σ
1
(A)) = (1λ)µ
1
(σ
1
(A))+λµ
2
(σ
1
(A)) = (1λ)µ
1
(A)+λµ
2
(A) = µ(A)
e enao µ T , logo T ´e convexo.
Vale que s ´e semicont´ınua superiormente (ver [42]), e como e
U
´e cont´ınua,
f
U
= s e
U
´e uma fun¸ao semicont´ınua superiormente. Seja
K = K
U
= {µ T : f
U
(µ) assume o valor aximo M}
(Sabemos que T ´e compacto e f
U
´e semicont´ınua superiormente; isto implica
que f
U
assume um aximo em T , conforme [27]). Vimos no primeiro passo
que ν K. Afirmo que K ´e fechado. De fato, seja µ = lim µ
n
, µ
n
K. Ent˜ao
M = lim sup
n→∞
f
U
(µ
n
) f
U
(µ)
e logo, f
U
(µ) assume o aximo µ K. Logo, K ´e fechado. Segue da´ı que
K ´e compacto, pela compacidade de T .
Como f
U
´e uma aplica¸ao afim, vale que K ´e convexo [39]. Com efeito,
sejam µ
1
, µ
2
K. Se µ = (1 λ)µ
1
+ λµ
2
, temos
f
U
(µ) = f
U
((1λ)µ
1
+λµ
2
) = (1λ)f
U
(µ
1
)+λf
U
(µ
2
) = (1λ)M +λM = M
e logo, (1 λ)µ
1
+ λµ
2
K K ´e convexo.
Para mostrar a desigualdade estrita, ´e suficiente mostrar que K = {ν}.
Como K ´e compacto e convexo, pelo teorema de Krein-Milman (ver o Apˆendice
deste cap´ıtulo), isso ocorrer´a se e somente se K tem um ´unico ponto extremo.
Afirmamos que todo ponto extremo de K ´e um ponto extremo de T . Com
efeito, suponha por absurdo que η ´e ponto extremo de K que ao ´e ponto
extremo de T . Enao η pode ser escrito como
η = λµ
1
+ (1 λ)µ
2
, 0 < λ < 1 , µ
1
/ K ou µ
2
/ K
Suponha que µ
1
/ K. Ent˜ao, f
U
(µ
1
) < M e assim,
M = f
U
(η) = f
U
(λµ
1
+ (1 λ)µ
2
) = λf
U
(µ
1
) + (1 λ)f
U
(µ
2
) <
< λM + (1 λ)f
U
(µ
2
) λM + (1 λ)M = M,
absurdo. Logo, todo ponto extremo de K ´e um ponto extremo de T .
103
Um fato conhecido sobre o conjunto T ´e que os seus pontos extremos
ao justamente as medidas erg´odicas [42]. Ent˜ao o problema ´e reduzido a
mostrar que K ao conem outras medidas erg´odicas al´em de ν. Ora, mas
pelo segundo passo, se supomos que a medida µ = ν considerada ´e erg´odica,
enao vale a desigualdade estrita, ou seja, µ ao ´e tal que f
U
assume um
aximo. Isso completa a prova.
6.3 Observoes sobre processos quˆanticos
Sabemos de [15] que a matriz de amplitude [A
jk
] ´e uma matriz unit´aria, suas
entradas ao ao-nulas e ´e coluna-estoastica, ou seja
j
A
jk
= 1.
Seja A a matriz de amplitude de transi¸ao de uma N-cadeia. Defina a
matriz de amplitude de transi¸ao com um potencial por A
V
: S ×S C,
A
V
q
q
=
A
V
(
q, q
) :=
e
iV (q)
A
(
q, q
) =
e
iV (q)
A
q
q
Interpretamos que A
V
q
q
´e, como no caso de cadeias de Markov, a amplitude
de transi¸ao de q at´e q
. Supomos que o potencial depende apenas da posi¸ao
onde a part´ıcula se encontra, ou seja, V = V (q).
Dizemos que A
V
´e a amplitude correspondente a uma part´ıcula evoluindo
sob a influˆencia de um potencial. Note que se V = 0, A
V
se reduz `a fun¸ao
de amplitude livre A.
A seguir, escreveremos S = {s
0
, . . . , s
n1
} e V (s
k
) = V (k).
Lema 6.3.1 Vale que A
V
´e uma matriz unit´aria com entradas ao nulas.
Aem disso, A
V
´e coluna-estoastica apenas quando consideramos potenciais
V do tipo
V (s
k
) = 2πc
k
, c
k
Z , k = 0, . . . n 1.
Prova De fato,
(A
V
A
V
)
jk
=
r
(A
V
)
T
jr
(A
V
)
rk
=
r
A
V
rj
A
V
rk
=
r
e
iV (j)
A
rj
e
iV (k)
A
rk
= e
i(V (j)V (k))
r
A
rj
A
rk
=
0 , se j = k
1 , se j = k
104
onde a ´ultima igualdade, no caso j = k, segue do fato que A ´e N-cadeia
quˆantica (e portanto unit´aria) e, no caso em que j = k, do fato que
r
|A
rj
|
2
=
r
|A(X
1
2
(s
r
) X
1
1
(s
k
))|
2
= 1
Como A tem entradas ao nulas, ´e claro que A
V
tamb´em.
Vale que A
V
´e coluna-estoastica apenas quando consideramos potenciais
V do tipo
V (s
k
) = 2πc
k
, c
k
Z , k = 0, . . . n 1,
pois
j
A
V
jk
=
j
e
iV (k)
A
jk
= e
iV (k)
j
A
jk
= e
iV (k)
A seguir, fazemos outras observoes.
1) Considere as matrizes de Dirichlet
M(n, a) =
1
n
e
a(jk)
2
/n
, j, k = 0, 1, . . . , n 1
vistas na se¸ao 2.3. Ali, mostra-se uma maneira de transformar tal matriz
em uma outra, M
(n, a), que ´e estoastica desde que na seja par. O etodo
visto ali ao funciona para M(3, 1) por exemplo. Para resolver esse caso,
tentamos usar uma id´eia baseada em [38], onde se usa o maior autovalor de
uma dada matriz positiva A e o seu autovetor `a direita para transform´a-la em
estoastica. Mas aqui temos apenas matrizes complexas, ent˜ao necessitamos
de algumas adapta¸oes.
A matriz M(3, 1) ´e
M(3, 1) =
1
3
1
1+i
3
2
1i
3
2
1+i
3
2
1
1+i
3
2
1i
3
2
1+i
3
2
1
Os autovalores e autovetores ao, respectivamente,
i , (1, 1, 1);
i +
3
2
, (1, 1, 0), (1, 0, 1).
Gostar´ıamos de escolher de alguma maneira natural um dos autovalores de
M(3, 1). Note que a norma dos dois autovalores ´e 1.
105
Defina T : M(3, C) M(3, R) a aplica¸ao
A
T
→ A ,
onde (A )
ij
= Re(A
ij
).
Defina a aplica¸ao t
max
: M(3, R) R dada por
A
t
max
→ maior autovalor de A.
A id´eia ´e associar `a matriz M(3, 1), uma outra, T (M(3, 1)), que possui
coeficientes reais e tomar o seu maior autovalor. Esse autovalor est´a associado
de maneira natural com um dos autovalores da matriz original M(3, 1) da
seguinte maneira. Definindo
λ
0
:= t
max
(T (M(3, 1))),
tomamos o autovalor λ
1
de M(3, 1), onde λ
1
= γ(1), e γ : C C ´e o ´unico
caminho que leva um autovalor de M(3, 1) at´e λ
0
= γ(0). Vamos explicar
com mais precis˜ao esta ´ultima id´eia.
Defina a fam´ılia de matrizes M(3, 1; t), t [0, 1] dada por
M(3, 1; t) =
1
3
1
1+ti
3
2
1ti
3
2
1+ti
3
2
1
1+ti
3
2
1ti
3
2
1+ti
3
2
1
´
E claro que M(3, 1; 1) = M(3, 1) e que M(3, 1; 0) = T (M(3, 1)). O espectro
da fam´ılia M(3, 1; t) ´e formado por trˆes curvas, η, ζ e γ, onde uma delas
(que chamamos de γ acima) tem como um de seus extremos o maior dos
autovalores de T (M(3, 1)), que chamamos λ
0
= γ(0). Enao o que fazemos ´e
escolher o autovalor no outro extremo desta curva, ou seja λ
1
= γ(1).
Continuando, obtemos
T (M(3, 1)) =
1
3
1
1
2
1
2
1
2
1
1
2
1
2
1
2
1
Da´ı, alguns alculos simples mostram que λ
0
=
3/2 e que λ
1
= (i +
3)/2 ´e o autovalor de M(3, 1) encontrado de acordo com a regra postu-
lada acima. Um autovetor r com entradas positivas, e tal que
r
2
j
= 1, ´e
r = (
6/6,
6/3,
6/6). Agora, procedendo de maneira an´aloga ao etodo
em [38], definimos
M
(3, 1)(i, j) :=
1
λ
1
M(3, 1)
r
j
r
i
106
Escreva α = (1 + i
3)/2. Enao
M
(3, 1)(1, 1) = M
(3, 1)(2, 2) = M
(3, 1)(3, 3) = 2/(3 + i
3)
Mais algumas contas simples nos fornecem
M
(3, 1) =
1
3 + i
3
2 4α 2α
α 2 α
2α 4α 2
que ´e linha estoastica, mas ao ´e unit´aria.
2) Considere o seguinte lema [14]:
Lema 6.3.2 (Wielandt) seja A = (a
ij
) matriz irredut´ıvel ao negativa de
ordem n e C = (c
ij
) uma matriz quadrada complexa de ordem n. Suponha
que
C
+
A. (6.14)
Ent˜ao para todo autovalor γ de C vale que
|γ| r, (6.15)
onde r ´e o maior autovalor de A. Al´em disso, vale a igualdade se e somente
se
C = e
DAD
1
, (6.16)
onde e
= γ/r e D ´e uma matriz diagonal cujos elementos ao nulos tem
odulo 1 (vale que D
+
= I).
A prova deste lema encontra-se no Apˆendice deste cap´ıtulo. Um poss´ıvel
trabalho futuro baseado neste lema ´e o seguinte: dada uma matriz complexa,
obter um etodo de normaliza¸ao a partir da matriz odulo associada, o
que pode fornecer um m´etodo mais geral do que o obtido no ´ıtem 1).
3) Para que uma matriz estoastica com entradas ao nulas seja a matriz
de uma cadeia de Markov quˆantica, precisamos ainda que ela seja unit´aria.
Para este fim, devemos determinar se ´e poss´ıvel adaptar o etodo acima de
modo a fornecer a propriedade unit´aria.
Podemos obter uma condi¸ao para que uma matriz normalizada na forma
do item anterior seja unit´aria:
Lema 6.3.3 Seja
A(i, j) =
1
λ
M(i, j)
r
j
r
i
onde M ´e uma matriz complexa, λ ´e um autovalor ao nulo de M e r um
autovetor associado a λ com entradas ao nulas. Se vale que A ´e unit´aria,
temos:
107
1. Para todo i,
k
|M(i, k)|
2
r
2
k
= |λ|
2
r
2
i
2. Para i = j,
k
M(i, k)M(j, k)r
2
k
= 0
Prova Temos:
n
k=1
A
ik
A
kj
=
k
A
ik
A
jk
=
k
(1)M(i, k)
r
k
r
i
(1)M(j, k)
r
k
r
j
=
1
|λ|
2
r
i
r
j
k
M(i, k)M(j, k)r
2
k
Se A ´e unit´aria enao para i = j, vale a seguinte condi¸ao:
k
|M(i, k)|
2
r
2
k
= |λ|
2
r
2
i
E se i = j, vale
k
M(i, k)M(j, k)r
2
k
= 0
6.4 Apˆendice
Proposi¸ao 6.4.1 (Perron-Frobenius) Seja A = a
ij
uma matriz com
entradas estritamente positivas, 1 i, j n. Ent˜ao existem λ > 0 e vetores
u = (u
1
, ···, u
n
) e v = (v
1
, ···, v
n
) tais que
1. u
i
> 0, v
i
> 0 , 1 i n
2.
n
j=1
a
ij
u
j
= λu
i
, 1 i n e
n
i=1
v
i
a
ij
= λv
j
, 1 j n
(i.e., u ´e autovetor `a direita de A e v ´e autovetor `a esquerda de A).
108
Prova Esta prova segue [37]. Seja A matriz com entradas positivas. Mostremos
que existe pelo menos um vetor u com coordenadas positivas, e λ 0, tais
que
n
j=1
a
ij
u
j
= λu
i
, 1 i n.
Considere o conjunto convexo H de vetores h = (h
1
, ···, h
n
) tais que h
i
0,
1 i n e
n
i=1
h
i
= 1. A matriz A determina uma transforma¸ao cont´ınua
A : H H, dada por Ah = h
, onde
h
i
=
n
j=1
a
ij
h
j
n
i=1
n
j=1
a
ij
h
j
O teorema do ponto fixo de Brouwer [27] nos diz que tal aplica¸ao possui
pelo menos um ponto fixo. Se u ´e tal ponto fixo ent˜ao Au = u, ou seja,
u
i
=
n
j=1
a
ij
u
j
n
i=1
n
j=1
a
ij
u
j
Fazendo λ =
n
i=1
n
j=1
a
ij
u
j
, obtemos o que quer´ıamos.
Considere a matriz A
t
= a
t
ij
, a
t
ij
= a
ji
. Pela primeira parte do lema,
podemos obter λ
e v tais que A
t
v = λ
v, ou seja,
n
j=1
a
ji
v
j
= λ
v
i
e v
i
> 0. Al´em disso,
λu, v = Au, v = u, A
t
v = λ
u, v
o que implica λ = λ
.
Proposi¸ao 6.4.2 Se p
1
, ···, p
k
e q
1
, ···, q
k
ao distribui¸oes de probabili-
dade, com p
i
> 0, i = 1, ···, k, ent˜ao
k
i=1
q
i
log
q
i
p
i
0
com igualdade valendo se e somente se p
i
= q
i
, i = 1 ···, k (por conven¸ao,
escrevemos 0 log 0 = 0).
109
Prova a desigualdade ´e evidente no caso em que p
i
= q
i
porque log 1 = 0.
No caso geral, observe que a fun¸ao ϕ(x) = x log x ´e estritamente oncava,
pois ϕ

(x) < 0. Como
ϕ(
k
i=1
p
i
q
i
p
i
) = ϕ(
k
i=1
q
i
) = ϕ(1) = 0,
enao
ϕ(
k
i=1
q
i
) >
k
i=1
p
i
ϕ(
q
i
p
i
) =
k
i=1
p
i
q
i
p
i
log
q
i
p
i
k
i=1
q
i
log
q
i
p
i
> 0.
Uma fun¸ao f ´e dita T -invariante se f(T (ω)) = f(ω). Diremos que uma
propriedade vale em quase toda parte (q.t.p.), ou com probabilidade 1,
se o conjunto dos elementos onde ao vale a propriedade tem medida nula.
Proposi¸ao 6.4.3 (Teorema Erg´odico de Birkhoff) [42] Seja T uma
transforma¸ao que preserva medida em (Ω, F, µ). Seja f fun¸ao mensur´avel
e integr´avel. Ent˜ao existe K, µ(K) = 1 tal que para todo ω K,
lim
n+
1
n
n
k=1
f(T
k1
ω) =
ˆ
f(ω)
(i.e., o limite existe q.t.p.), onde
ˆ
f ´e T -invariante e vale que
ˆ
f =
f
Se T ´e erodica para µ ent˜ao
ˆ
f =
f q.t.p.
Um espa¸co vetorial X com uma topologia T ´e um espa¸co vetorial
topol´ogico se a soma ´e uma fun¸ao cont´ınua de X × X em X e se a mul-
tiplica¸ao por escalar ´e uma fun¸ao cont´ınua de R × X em X. Um espa¸co
vetorial topol´ogico ´e dito localmente convexo se podemos obter uma base
para a topologia formada por conjuntos convexos.
Proposi¸ao 6.4.4 (Krein-Milman)[39][6][10] Seja K um conjunto con-
vexo compacto em um espco vetorial topol´ogico localmente convexo. Ent˜ao
a interseao de todos os conjuntos convexos fechados contendo os pontos
extremos de K ´e o pr´oprio K.
110
6.4.1 Prova do lema de Wielandt
Aqui provamos o lema de Wielandt. Esta exposi¸ao ´e baseada em [14].
Sejam A e B matrizes reais retangulares de mesma dimens˜ao m × n,
A = (a
ij
), B = (b
ij
). Escrevemos A B (ou B A) se
a
ij
b
ij
, i = 1, . . . m , j = 1 . . . n.
Em particular, quando A 0, diremos que A ´e ao-negativa. Se o sinal de
igualdade puder ser omitido em todas as desigualdades acima, escreveremos
A < B (analogamente, quando A > 0, diremos que A ´e positiva).
Denotamos por C
+
a matriz odulo C, obtida a partir de C quando
todos os seus elementos ao trocados pelos seus respectivos odulos.
Diremos que A ´e redut´ıvel se pudermos escrever o conjunto de ´ındices
{1, . . . , n} como sendo uma uni˜ao de conjuntos complementares {i
1
, . . . , i
µ
}
e {j
1
, . . . , j
ν
} (com µ + ν = n) tais que
a
i
α
j
β
= 0 , α = 1, . . . µ , β = 1, . . . ν.
Caso contr´ario, diremos que A ´e irredut´ıvel.
Vamos obter outra caracteriza¸ao para matrizes irredut´ıveis. Uma per-
muta¸ao de uma matriz quadrada A significa uma permuta¸ao das linhas de
A juntamente com a mesma permuta¸ao de colunas. Podemos enao definir
matriz redut´ıvel da seguinte forma: a matriz A ser´a redut´ıvel se existir uma
permuta¸ao que transforma A em um operador da forma
A =
B 0
C D
onde B e D ao matrizes quadradas. Caso contr´ario, diremos que A ´e ir-
redut´ıvel. Um subespa¸co coordenado ν-dimensional de R
n
´e um subespa¸co
de R
n
que possui uma base {e
k
1
. . . , e
k
ν
} (1 k
1
< k
2
··· < k
ν
n).
Existem
n
ν
subespa¸cos coordenados ν-dimensionais associados a uma base
{e
1
. . . , e
n
} dada. Assim, podemos definir matriz redut´ıvel de outra forma:
uma matriz A ´e redut´ıvel se e somente se possui um subespa¸co coordenado
invariante ν-dimensional com ν < n.
De agora em diante, a menos que seja especificado, iremos considerar
matrizes A ao negativas (i.e., A 0).
111
Lema 6.4.5 Se A 0 ´e uma matriz irredut´ıvel de ordem n ent˜ao
(I + A)
n1
> 0
Prova
´
E suficiente mostrar que para todo vetor y 0, y = 0, vale
(I + A)
n1
y > 0.
Provaremos a desigualdade acima se mostrarmos que se y 0, y = 0, o vetor
z = (I + A)y possui menos coordenadas nulas que y. Vamos supor que isso
ao vale. Como z = y + Ay e Ay 0, vale que a coordenadas positivas de y
correspondem coordenadas positivas de z. E segue da express˜ao acima que
z ao pode ter mais coordenadas nulas que y. Ent˜ao y e z tem as mesmas
coordenadas nulas. Sem perda de generalidade, suponha que
y = (u, 0) , z = (v, 0) u > 0, v > 0.
(com u e v ao colunas de mesma dimens˜ao). Escrevendo
A =
A
11
A
12
A
21
A
22
temos
y + Ay = z
u
0
+
A
11
A
12
A
21
A
22
u
0
=
v
0
e logo, A
21
u = 0. Como u > 0, segue que A
21
= 0, o que contradiz a
irredutibilidade de A. Isso prova o lema.
Um corol´ario conhecido ´e a seguinte defini¸ao equivalente para matrizes
irredut´ıveis.
Corol´ario 6.4.6 Se A 0 ´e irredut´ıvel ent˜ao para todo i, j existe p N tal
que (a
p
ij
) > 0. Al´em disso, p pode ser escolhido de maneira que p m 1 se
i = j ou ent˜ao de maneira que p m se i = j, onde m ´e o grau do polinˆomio
minimal de A.
Vamos enunciar o teorema de Frobenius.
Teorema 6.4.7 (Frobenius): Toda matriz irredut´ıvel ao negativa A de
ordem n possui um autovalor positivo r que ´e uma raiz simples da equa¸ao
caracter´ıstica, e a ele corresponde um autovetor com entradas positivas. O
odulo dos demais autovalores ´e menor ou igual a r.
112
Aem disso, se A tem h autovalores λ
1
= r, λ
2
, . . . , λ
h
de odulo r ent˜ao
esses valores ao todos distintos, ao ra´ızes da equa¸ao
λ
h
r
h
= 0,
e o espectro de A ´e invariante por rota¸ao de ˆangulo 2π/h.
Este ´e um importante teorema cuja demonstra¸ao pode ser encontrada
em [14]. Estamos interessados em uma caracteriza¸ao de matrizes complexas
(limitadas em um certo sentido por uma matriz irredut´ıvel) em termos dos
seus autovalores e que ser´a dada de forma mais precisa a seguir (lema 6.4.10).
Tal formula¸ao est´a relacionada com o teorema de Frobenius.
Dado um vetor real x = (x
1
, . . . , x
n
), x 0 fixado, definimos
r
x
= min
i∈{1,...,n}
(Ax)
i
x
i
onde
(Ax)
i
=
n
j=1
a
ij
x
j
, i = 1, . . . n.
Nesta defini¸ao de m´ınimo, excluimos os valores de i onde x
i
= 0. Segue
diretamente da defini¸ao que r
x
0 e ´e o maior n´umero η tal que
ηx Ax.
Lema 6.4.8 Existe z 0 tal que o valor aximo r da fun¸ao r
x
´e atingido,
ou seja:
r = r
z
= max
x0
r
x
= max
x0
min
i∈{1,...,n}
(Ax)
i
x
i
. (6.17)
Prova Pela defini¸ao de r
x
, segue que ao multiplicarmos um vetor x 0,
x = 0, por um n´umero λ, o valor de r
x
ao se altera. Enao, para calcularmos
o aximo de r
x
, podemos nos restringir ao conjunto fechado
M = {x : x 0,
n
i=1
x
2
i
= 1}.
Se a fun¸ao r
x
fosse cont´ınua em M, poder´ıamos obter um aximo. Entre-
tanto, esta fun¸ao pode ser descont´ınua nos pontos de fronteira de M onde
uma das coordenadas do vetor se anula. Sendo assim, vamos considerar o
conjunto
N = {y : y = (I + A)
n1
x, x M}.
113
Este conjunto ´e fechado e limitado, e pelo lema 6.4.5, consiste apenas de
vetores positivos.
Multiplicando a desigualdade
r
x
x Ax
por (I + A)
n1
, obtemos
r
x
y Ay,
onde y = (I + A)
n1
x. Enao, pela defini¸ao de r
y
, obtemos
r
x
r
y
.
Assim, ao calcularmos o aximo de r
x
, podemos nos restringir ao conjunto N
que consiste apenas de vetores positivos. E em N, que ´e fechado e limitado,
a fun¸ao r
x
´e cont´ınua e portanto assume um valor m´aximo para algum vetor
z 0.
Diremos que um vetor z 0 tal que r
z
= r ´e um vetor extremal.
Lema 6.4.9 O valor r definido no lema anterior ´e positivo, e ´e um autovalor
de A (´e o valor r mencionado no teorema de Frobenius). Todo vetor extremal
z ´e positivo e ´e um autovetor de A para o autovalor r. Isto ´e,
r > 0 , z > 0 , Az = rz.
Prova Seja u = (1, 1, . . . , 1). Enao
r
u
= min
i∈{1,...n}
n
k=1
a
ik
.
Da´ı, r
u
> 0, porque nenhuma coluna de uma matriz irredut´ıvel pode ser
formada por zeros apenas. Logo, como r r
u
, obtemos r > 0.
Agora, considere
x = (I + A)
n1
z,
onde z ´e um vetor extremal. Pelo lema 6.4.5, x > 0. Suponha por absurdo
que Az rz = 0. Enao obtemos que
Az rz > 0 (I + A)
n1
(Az rz) > 0 Ax rx > 0.
A ´ultima desigualdade contradiz a defini¸ao de r porque ela implicaria que
Ax (r + ε)x > 0 para ε > 0 suficientemente pequeno, ou seja, obter´ıamos
r
x
r + ε > r. Logo, Az = rz. Enao
0 < x = (I + A)
n1
z = (1 + r)
n1
z,
e portanto, z > 0.
114
Lema 6.4.10 seja A = (a
ij
) matriz irredut´ıvel ao negativa de ordem n e
C = (c
ij
) uma matriz quadrada complexa de ordem n. Suponha que
C
+
A. (6.18)
Ent˜ao para todo autovalor γ de C vale que
|γ| r, (6.19)
onde r ´e o maior autovalor de A. Al´em disso, vale a igualdade se e somente
se
C = e
DAD
1
, (6.20)
onde e
= γ/r e D ´e uma matriz diagonal cujos elementos ao nulos tem
odulo 1 (vale que D
+
= I).
Prova Considere y um autovetor de C correspondente ao autovalor γ:
Cy = γy , γ = 0. (6.21)
Como C
+
A, vale que C
+
y
+
Ay
+
. Al´em disso,
Cy = (
i
c
1i
y
i
, . . . ,
i
c
ni
y
i
) , γy = (γy
1
, . . . , γy
n
)
C
+
y
+
= (
i
|c
1i
y
i
|, . . . ,
i
|c
ni
y
i
|) , |γ|y
+
= (|γy
1
|, . . . , |γy
n
|)
De Cy = γy, obtemos:
|γy
j
| = |
n
i=1
c
ji
y
i
|
n
i=1
|c
ji
y
i
| , j = 1, . . . n
o que implica
|γ|y
+
C
+
y
+
. (6.22)
Logo,
|γ|y
+
C
+
y
+
Ay
+
(6.23)
pelo que vimos antes. Como por defini¸ao r
y
+
´e o maior n´umero tal que
r
y
+
y
+
Ay
+
,
concluimos de (6.23) que
|γ| r
y
+
r.
115
(a segunda desigualdade acima segue de (6.17)). Isso prova a desigualdade
(6.19) que enunciamos.
Analisemos agora o caso em que |γ| = r. A ´ultima desigualdade nos
fornece r
y
+
= r = max
x0
r
x
. Segue da´ı que y
+
´e um vetor extremal para A,
y
+
> 0 e que y
+
´e autovetor de A para o autovalor r. Ent˜ao ry
+
= Ay
+
e a
desigualdade (6.23) se transforma em
|γ|y
+
= ry
+
= Ay
+
= C
+
y
+
. (6.24)
Enao como C
+
A e y
+
> 0, segue de Ay
+
= C
+
y
+
(A C
+
)y
+
= 0
que
C
+
= A. (6.25)
Seja y = (y
1
, . . . , y
n
), onde y
j
= |y
j
|e
j
, j = 1, . . . n. Defina a seguinte
matriz diagonal
D = {e
1
, . . . , e
n
}.
Enao, vale que
y = Dy
+
.
Escrevendo
γ
=
re
e substituindo a express˜ao acima em (6.21), obtemos
F y
+
= ry
+
, (6.26)
onde
F = e
D
1
CD. (6.27)
Comparando (6.24) com (6.26), obtemos
F y
+
= C
+
y
+
= Ay
+
. (6.28)
Mas por (6.27) e (6.25),
F
+
= C
+
= A.
Logo, obtemos a partir de (6.28) que
F y
+
= F
+
y
+
.
Como y
+
> 0, afirmamos que isso implica que
F = F
+
Provamos esta ´ultima afirma¸ao no caso de dimens˜ao 2. Seja
F =
a b
c d
F
+
=
|a| |b|
|c| |d|
116
Enao
F y
+
= F
+
y
+
(F F
+
)y
+
= 0
a |a| b |b|
c |c| d |d|
y
1
y
2
=
0
0
Da´ı escrevendo a = x + iy, b = z + iw,
(a |a|)y
1
+ (b |b|)y
2
= 0 (x + iy |a|)y
1
+ (z + iw |b|)y
2
= 0
o que implica, em particular, que
(x |a|)y
1
+ (z |b|)y
2
= 0 (x
x
2
+ y
2
)y
1
+ (z
z
2
+ w
2
)y
2
= 0
Os termos entre parenteses na ´ultima express˜ao s˜ao menores ou iguais a zero,
claramente. Mas ao podem ser estritamente menores que zero (pois o fato
de que y
1
, y
2
> 0 implicaria que a express˜ao acima ´e negativa). Logo,
x
x
2
+ y
2
= 0 x = |a| e y = 0 a = |a|
z
z
2
+ w
2
= 0 z = |b| e w = 0 b = |b|
Analogamente para c e d. Logo, F = F
+
.
Mas
F = F
+
e
D
1
CD = A.
Logo,
C = e
DAD
1
117
Cap´ıtulo 7
C
algebras e cadeias de
Markov quˆanticas
Faremos aqui uma descri¸ao breve de cadeias de Markov quˆanticas no con-
texto de ´algebra de operadores. Essa formula¸ao ´e baseada na constru¸ao
original feita por L. Accardi em [1] e [2], por exemplo.
A vantagem de se estudar cadeias de Markov quˆanticas no contexto de
´algebras reside no fato de que podemos fazer uso do instrumental constru´ıdo
nesse ambiente para se tentar descobrir estados de equil´ıbrio, um problema
importante em mecˆanica estat´ıstica quˆantica. Discutiremos brevemente a
rela¸ao entre os estados KMS e os estados de Gibbs, mencionados no cap´ıtulo
anterior.
7.1 C
algebras
Defini¸ao 7.1.1 Uma ´algebra A sobre C ´e um espco vetorial complexo
equipado com uma operao bilinear e associativa : A × A A, dita
multiplicao. Para a, b A, denotaremos (a, b) simplesmente por ab.
Defini¸ao 7.1.2 Uma ´algebra normada ´e uma ´algebra A sobre C equipada
com uma fun¸ao norma a A → a R, que torna A um espco normado,
ou seja, para a, b A e λ C, temos
1. a 0, e a = 0 a = 0
2. λa = |λ|a, onde |λ| denota o odulo do umero complexo λ
3. a + b a + b,
e que al´em disso obedece a seguinte propriedade:
118
4. ab ab
Naturalmente, podemos nos referir `a distˆancia entre dois elementos de
uma ´algebra normada, bastando para isso considerar a m´etrica induzida pela
norma.
Defini¸ao 7.1.3 Uma ´algebra de Banach ´e uma ´algebra normada com-
pleta.
Defini¸ao 7.1.4 Seja A uma ´algebra de Banach. Uma involu¸ao em A ´e
uma fun¸ao : A A tal que para todo a, b A, λ C, e denotando
c
:= (c), c A, temos
1. (a + b)
= a
+ b
2. (λa)
= λa
3. (ab)
= b
a
4. (a
)
= a
5. a
= a
Defini¸ao 7.1.5 Uma C
algebra ´e uma ´algebra de Banach equipada com
uma involu¸ao para o qual vale
a
a = a
2
, a A.
Por exemplo, a ´algebra M
n
da matrizes de ordem n sobre C ´e uma
C
algebra se considerarmos as matrizes como sendo operadores no espa¸co
euclideano C
n
e se tomarmos a norma de operadores · sobre matrizes. A
involu¸ao ´e dada pela matriz transposta conjugada.
7.2 Cadeias de Markov quˆanticas
A descri¸ao de cadeias de Markov quˆanticas dada aqui segue [1] e [28], que
´e uma constru¸ao conhecida em ´algebra de operadores. Nesse contexto, um
estado em B ´e simplesmente um funcional φ : B C tal que φ(1) = 1.
Seja B = B(H) uma C
algebra para um certo espa¸co de Hilbert fixado
H e seja
A := B B B ···
onde ´e o C
-produto tensorial induzido pelo produto tensorial usual de
espa¸cos de Hilbert.
119
Defini¸ao 7.2.1 Uma aplicao bilinear E : B B B ´e dita esperan¸ca
de transi¸ao se for completamente positiva e preservar a identidade.
Defini¸ao 7.2.2 (Cadeia de Markov quˆantica associada a um es-
tado) Um estado φ em A ´e uma cadeia de Markov quˆantica se existir
um estado φ
0
em B e uma esperan¸ca de transi¸ao E tais que
φ(a
0
a
1
··· a
n
1 ···)
= φ
0
(E(a
0
E(a
1
··· E(a
n1
E(a
n
1)) ···)), (7.1)
para quaisquer a
i
B, i = 0, 1, . . . n.
Prova-se em [2] que toda esperan¸ca de transi¸ao tem a forma
E(x) = tr
2
(
j
K
j
xK
j
) (7.2)
onde x, K
j
B B, j = 1, 2, . . . e tr
2
´e o tra¸co parcial com respeito ao
segundo fator. O ´ındice j percorrer´a apenas um subconjunto finito de N se
H for de dimens˜ao finita, e esse ser´a o caso considerado aqui.
Seja dim(H) = d < e seja {e
i
}
d
n=1
uma base ortonormal para H. Neste
caso, B(H)
=
M
d
, onde M
d
´e a ´algebra das matrizes d ×d. Para simplificar,
iremos supor B(H) = M
d
.
Para cada K B B, temos a express˜ao
K =
n,n
|e
n
e
n
| K
n,n
, (7.3)
onde |e
n
e
n
| ´e a matriz cuja posi¸ao (n, n
) ´e igual a 1, e as outras posi¸oes
ao nulas. Denotaremos por D a sub-´algebra diagonal de M
d
correspondente
`a base {e
i
}
d
n=1
.
Mostraremos agora como uma cadeia de Markov cl´assica {X
n
}
n=1
, com
valores no conjunto {1, . . . , d}, em um espa¸co de probabilidade (Ω, P) com
distribui¸ao inicial p e matriz de transi¸ao P = (p
ij
) pode ser vista como
sendo uma cadeia de Markov quˆantica. Procedemos da seguinte maneira:
1. Defina
K
1,n,n
:=
p
n,1
0 ··· 0
0
p
n,2
··· 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 ···
p
n,d
(7.4)
120
K
1,n,n
:= 0 , se n = n
, (7.5)
K
m,n,n
:= 0 , m 2. (7.6)
2. Defina φ
0
em D B por
φ
0
(·) := tr
p
1
0 ··· 0
0 p
2
··· 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 ··· p
d
·
(7.7)
´
E acil verificar que
E
1
(x) := tr
2
(K
1
xK
1
), (7.8)
onde K
1
:=
n
|e
n
e
n
| K
1,n,n
, ´e uma esperan¸ca de transi¸ao, e ´e tal que
E
1
(f g) = fE
1
(1 g) , f, g D (7.9)
e vale que φ
0
´e um estado em M
d
. Portanto (φ
0
, E
1
) ´e uma cadeia de Markov
quˆantica e al´em disso tal cadeia quˆantica restrita `a sub-´algebra diagonal D
´e simplesmente a cadeia de Markov cl´assica dada inicialmente.
Observe que a escolha de (φ
0
, E) ao ´e ´unica. De fato, podemos trocar a
matriz
p
1
0 ··· 0
0 p
2
··· 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 ··· p
d
por qualquer outra matriz densidade ω
0
que possua na diagonal os elementos
{p
1
, . . . , p
d
}. Al´em disso, podemos trocar K
1,n,n
por qualquer K
n,n
que possua
a propriedade
K
n,n
K
n,n
(j, j) = p
n,j
, j = 1, . . . d.
Denote por
K
0
:=
n
|e
n
e
n
| K
n,n
e defina
E
0
(·) := tr
2
(K
0
· K
0
).
Enao, (tr(ω
0
·), E
0
(·)) tamb´em ´e uma cadeia de Markov quˆantica obtida a
partir da mesma cadeia cl´assica (p, P = (p
ij
)) e al´em disso, restringindo as
121
duas cadeias quˆanticas (tr(ω
0
·), E
0
(·)) e (φ
0
, E
1
) ao conjunto D, obtemos a
mesma cadeia de Markov cl´assica (p, P = (p
ij
)).
Observao Note que se
E(D D) D, (7.10)
enao podemos considerar a matriz densidade inicial ω
0
como sendo diagonal,
a que os elementos fora da diagonal ao ao usados neste caso.
Proposi¸ao 7.2.3 [28] Uma esperan¸ca de transi¸ao E leva DD em D se e
somente se para cada r, r
, n {1, . . . , d}, com r = r
, a matriz
j
K
j,n,r
K
j,n,r
´e tal que os elementos de sua diagonal ao iguais a zero.
Defini¸ao 7.2.4 (Cadeia de Markov quˆantica associada a um processo
estoastico cl´assico) Dizemos que um processo estoastico cl´assico {X
n
}
n=0
,
que toma valores em {1, . . . , d} em um espco de probabilidade (Ω, P) ´e uma
cadeia de Markov quˆantica (φ
0
, E) se E satisfaz (7.10) e se as distribui¸oes
conjuntas ao as mesmas, ou seja, para cada n N, i
k
{1, . . . , d}, k =
1, . . . n, temos
P (X
0
= i
0
, X
1
= i
1
, . . . , X
n
= i
n
)
= φ(|e
i
0
e
i
0
| |e
i
1
e
i
1
| ··· |e
i
n
e
i
n
|) (7.11)
= φ
0
(E(|e
i
0
e
i
0
|E(|e
i
1
e
i
1
|···E(|e
i
n1
e
i
n1
|E(|e
i
n
e
i
n
|1)) ···))
Defini¸ao 7.2.5 (Cadeia de Markov cl´assica associada a uma cadeia
quˆantica) Uma cadeia de Markov quˆantica (φ
0
, E) ´e uma cadeia de Markov
cl´assica na sub-´algebra diagonal D se (7.10) vale e se
E(a b) = a E(1 b), a, b D. (7.12)
Teorema 7.2.6 Seja {X
n
}
n=1
um processo estoastico cl´assico {X
n
}
n=0
,
que toma valores em {1, . . . , n} em um espco de probabilidade (Ω, P). Ent˜ao
{X
n
}
n=1
´e uma cadeia de Markov quˆantica se e somente se existe uma me-
dida de probabilidade p
0
em {1, . . . d} e uma matriz c´ubica (de 3 ´ındices)
T = (T
j,i,k
) com as seguintes propriedades:
T
j,i,k
0, j, i, k {1, . . . d} (7.13)
i,k
T
j,i,k
= 1, j {1, . . . d} (7.14)
P(X
0
= j) =
i,k
p
0
(i)T
j,i,k
, j {1, . . . d}, (7.15)
122
e tal que a distribui¸ao conjunta ´e dada por
P(X
0
= i
0
, X
1
= i
1
, . . . , X
n
= i
n
)
=
j,j
0
,j
1
,...,j
n
p
0
(j)T
j,i
0
,j
0
T
j
0
,i
1
,j
1
···T
j
n2
i
n1
j
n1
T
j
n1
i
n
j
n
. (7.16)
Em [28], temos ainda a prova do seguinte:
Teorema 7.2.7 Seja {X
n
}
n=1
um processo estoastico cl´assico {X
n
}
n=0
,
que toma valores em {1, . . . , n} em um espco de probabilidade (Ω, P). Ent˜ao
temos que {X
n
}
n=1
´e uma cadeia de Markov quˆantica se e somente se existir
uma cadeia de Markov cl´assica {(Z
n
, Y
n
)}
n=1
tomando valores em {1, . . . , d}
2
em um espco de probabilidade (P
,
) com as seguintes propriedades:
1. A probabilidade de transi¸ao
p
(j,i),(j
,i
)
:= P
((Z
n
, Y
n
) = (j
, i
)|(Z
n1
, Y
n1
) = (j, i)) (7.17)
´e independente de i.
2. Existe uma distribui¸ao de probabilidade p
0
em {1, . . . , d} e uma dis-
tribui¸ao inicial para {(Z
n
, Y
n
)}
n=0
dada por
P
((Z
0
, Y
0
) = (j, i)) =
k
p
0
(k)T
k,i,j
(7.18)
(onde T
k,i,j
foi determinado no teorema 7.2.6), tais que
P(X
0
= i
0
, X
1
= i
1
, . . . , X
n
= i
n
) = P
(Y
0
= i
0
, Y
1
= i
1
, . . . , Y
n
= i
n
).
(7.19)
Corol´ario 7.2.8 Se a cadeia de Markov quˆantica (φ
0
, E) em
M
d
tem a
propriedade de que E leva D D em D ent˜ao o processo estoastico cl´assico
obtido pela restri¸ao de (φ
0
, E) `a sub-´algebra diagonal D ´e estocasticamente
equivalente `a segunda componente de uma cadeia de Markov cl´assica
{(Z
n
, Y
n
)}
n=0
,
que toma valores em {1, . . . , d}, e que possui as propriedades 1 e 2 do teorema
7.2.7.
123
Teorema 7.2.9 A cadeia de Markov quˆantica (φ
0
, E) ´e uma cadeia de Markov
cl´assica sobre a sub-´algebra diagonal se e somente se os operadores K
j
, dados
por
K
j
=
n,n
|e
n
e
n
| K
j,n,n
,
tem a forma
K
j
=
n
|e
n
e
n
| K
j,n,n
, j = 1, . . . , d. (7.20)
Observao A ormula (7.20) significa que cada um dos K
j
´e diagonal
em blocos de ordem d
2
, ou seja,
K
j,1,1
0 ··· 0
0 K
j,2,2
··· 0
.
.
.
.
.
.
.
.
.
.
.
.
0 0 ··· K
j,d,d
,
onde cada K
j,l,l
, l = 1, . . . , d, ´e uma matriz de ordem d.
7.3 CAR C
algebras e estados KMS
Fazemos aqui uma breve introdu¸ao `as CAR C
algebras e aos estados KMS.
Uma referˆencia asica para o assunto ´e [8].
Defini¸ao 7.3.1 Uma algebra A ´e uma ´algebra associativa sobre os com-
plexos, munida de uma involu¸ao que ´e um antiautomorfismo antilinear, ou
seja,
1. (u
)
= u
2. (u + v)
= u
+ v
3. (cv)
= cv
4. (uv)
= v
u
,
para todo u, v A, c C.
Um homomorfismo entre ´algebras f : A B ´e um -homomorfismo se
for compat´ıvel com as involu¸oes de A e B, ou seja, se
f(a
) = f(a)
, a A.
E f ser´a um -isomorfismo se for uma aplica¸ao bijetora.
124
Defini¸ao 7.3.2 Uma C
algebra A tal que seus elementos satisfazem as
rela¸oes de anticomutatividade canˆonicas
{a
k
, a
j
} = 0
{a
k
, a
j
} = δ
ij
,
onde a
k
, etc. ao elementos de A, e , ·} ´e o anticomutador, ´e dita CAR
C
algebra.
O pr´oximo teorema, cuja prova pode ser vista em [8], ´e a base de estudo
de tais ´algebras.
Teorema 7.3.3 Seja H um espco de Hilbert e sejam H
i
, i = 1, 2 duas
C
algebras geradas pela identidade 1 e elementos a
i
(v), v H satisfazendo:
1. v → a
i
(v) ´e linear,
2. {a
i
(v), a
i
(w)} = 0,
3. {a
i
(v), a
i
(w)
} = (v, w)1,
para todo v, w H, i = 1, 2. Ent˜ao existe um ´unico -isomorfismo α : H
1
H
2
tal que
α(a
1
(v)) = a
2
(v),
para todo v H. Portanto, existe uma ´unica C
algebra A = A(H) = A(H),
a menos de -isomorfismo, satisfazendo as rela¸oes de anticomutatividade
canˆonicas sobre H. Al´em disso, se H tem dimens˜ao n, temos que A(H) ´e
isomorfa `a C
algebra das matrizes complexas 2
n
× 2
n
.
Seja U a CAR-´algebra com geradores a
i
e respectivos adjuntos a
i
, i I,
onde o conjunto de ´ındices I ´e discreto, enumer´avel e totalmente ordenado,
contendo possivelmente um menor elemento j
e/ou um maior elemento j
+
.
Se I ao conem nem j
+
e nem j
enao podemos fazer a identifica¸ao I Z.
Se cont´em apenas j
+
enao I Z
; se cont´em apenas j
enao I Z
+
.
Os geradores {a
j
, a
+
j
}
jI
satisfazem as rela¸oes
{a
+
j
, a
k
} = δ
jk
, {a
j
, a
k
} = {a
+
j
, a
+
k
} = 0, j, k I
O automorfismo de paridade de U ´e denotado por Θ. Para qualquer subcon-
junto Λ I, a C
-sub-´algebra de U gerada por a
j
, a
+
j
, para j Λ ´e denotada
por U
Λ
. Sabemos que U ´e uma ´algebra Z
2
-graduada, com Θ sendo o auto-
morfismo da gradua¸ao. Sabemos tamem que a CAR-´algebra ´e isomorfa ao
produto C
-tensorial infinito
I
M
2
(C).
125
A fim de obter estados peri´odicos ou invariantes por transla¸ao, consi-
deramos apenas esperan¸cas quase-condicionais (ver defini¸ao a seguir) Θ-
invariantes, a menos que especificado em contr´ario.
Uma nota¸ao comum em ´algebra de operadores ´e a seguinte. Se A
n
, B
ao ´algebras, n N, escrevemos
A
n)
B A
(n
:= A
1
A
2
··· A
n1
B A
n+1
A
n+2
···
Vale uma nota¸ao an´aloga para operadores.
Defini¸ao 7.3.4 Sejam W V U C
algebras com unidade. Uma es-
peran¸ca quase-condicional com respeito `a essa tripla ´e uma aplicao
E : U V tal que ´e completamente positiva, preserva a identidade e
E(wu) = wE(u), u U , w W
Defini¸ao 7.3.5 Um estado φ em U ´e dito estado de Markov se para cada
j
j j
+
existe uma esperan¸ca quase-condicional E
n
com respeito `a tripla
U
n1)
U
n)
U
n+1)
satisfazendo
φ
n+1)
E
n
= φ
n)
E
n
(U
[n,n+1]
) = U
{n}
.
Defini¸ao 7.3.6 Uma esperan¸ca condicional (de Umegaki) E : A
B A ´e uma proje¸ao de norma 1 da C
´algebra A em uma C
-sub-´algebra
B (com a mesma identidade I).
Quando A ´e uma ´algebra de matrizes, a estrutura de tal esperan¸ca condi-
cional ´e bem conhecida [3]. A prova da seguinte proposi¸ao pode ser vista
em [3]:
Proposi¸ao 7.3.7 Seja φ um estado da CAR-´algebra. ao equivalentes:
1. φ ´e um estado de Markov.
2. as propriedades listadas na defini¸ao 7.3.5 ao satisfeitas se trocarmos
as esperan¸cas quase-condicionais E
n
por esperan¸cas condicionais de
Umegaki E
n
.
3. Para cada j < j
+
, existe uma esperan¸ca condicional E
n)
: U R(E
n)
)
U
n)
satisfazendo
φ E
n)
= φ
E
n)
(U
(n
) U
{n}
(7.21)
126
4. As propriedades listadas no item 3 ao satisfeitas se trocarmos as es-
peran¸cas condicionais E
n)
por esperan¸cas quase-condicionais E
n)
.
Na prova desta proposi¸ao, consideramos a restri¸ao e
n
:= E
n
|
U
[n,n+1]
, que
´e uma aplica¸ao completamente positiva, que preserva a identidade. Fazendo
uso de um limite
ε
n
:= lim
k
1
k
k1
t=0
(e
n
)
t
,
obtemos uma esperan¸ca condicional que deixa invariante o estado φ. Com
isso, chegamos ao seguinte lema [3]:
Lema 7.3.8 Seja φ um estado de Markov na CAR-´algebra e {ε
j
}
j
jj
+
a
seencia associada de esperan¸cas condicionais. Ent˜ao
φ(x
k
···x
l
) = φ((ε
k
(x
k
ε
k+1
(x
k+1
···ε
l1
(x
l1
x
l
) ···)))
para todo k, l I com k < l e x
k
x
k+1
···x
l1
x
l
qualquer gerador linear de
U
[k,l]
.
Defini¸ao 7.3.9 Seja A uma C
algebra, β R e seja α : R Aut(A)
uma ao fortemente cont´ınua. Um estado φ satisfaz a condi¸ao KMS
para α `a temperatura inversa β se
φ(vα
(u)) = φ(uv)
para todo u,v A, com u inteira para α.
Em teoria quˆantica de campos descreve-se um sistema f´ısico a partir de
uma C
algebra A com unidade. Os elementos autoadjuntos de A (tais que
u
= u) ao ditos observ´aveis do sistema. Como vimos antes, um estado do
sistema ´e definido com sendo um funcional C-linear φ : A C, com φ(uu
) >
0, tal que φ(1) = 1. Determinar a existˆencia e a unicidade de estados KMS
´e importante para se estudar a mecˆanica estat´ıstica de uma teoria quˆantica
de campos. Por exemplo, considerando o espa¸co dos operadores compactos
em um espa¸co de Hilbert dado, pode-se mostrar que o ´unico estado sobre
esse espa¸co que satisfaz a condi¸ao KMS acima com respeito ao valor β ´e o
estado de equil´ıbrio canˆonico de Gibbs
ω
βµ
(A) =
tr(e
βK
A)
tr(e
βK
)
,
onde K = H µN, H ´e o hamiltoniano autoadjunto e N ´e o operador
n´umero, respectivamente. Para mais detalhes, veja [8].
127
7.4 Moeda quˆantica revisitada
Consideremos aqui a moeda quˆantica (ver se¸ao 8.2). Tal sistema ´e bastante
simples em dimens˜ao 2, dependendo de um ´unico parˆametro real x (0, 1).
Como antes, sejam u, v C tais que u +v = 1, |u|
2
+|v|
2
= 1. Vimos que
as probabilidades de transi¸ao independem do tempo, e mais especificamente
que P
t
(0) = |u|
2
, P
t
(1) = |v|
2
. Vamos mostrar que a moeda quˆantica, vista
como uma cadeia de Markov quˆantica alg´ebrica (i.e., via ´algebra de opera-
dores) nos permite obter, como ´e desej´avel, estas mesmas probabilidades de
transi¸ao.
Seguimos a constru¸ao feita no in´ıcio da se¸ao 7.2. Se p
ij
´e a probabilidade
de transi¸ao do estado i para o estado j, temos que p
00
= p
10
= |u|
2
, p
01
=
p
11
= 1 |u|
2
= |v|
2
e portanto,
K
0,0,0
= K
0,1,1
=
p
00
0
0
p
01
=
p
10
0
0
p
11
=
|u| 0
0 |v|
Para ilustrar os alculos envolvidos mostremos, por exemplo, que
P (X
0
= 0) = φ(|e
0
e
0
|) = |u|
2
,
e
P (X
0
= 0, X
1
= 1) = φ(|e
0
e
0
| |e
1
e
1
|) = |u|
2
|v|
2
.
Temos:
φ(|e
0
e
0
|) = φ
0
(E(|e
0
e
0
| 1))
Mas
E(|e
0
e
0
| 1) = tr
2
(K
1
(|e
0
e
0
| 1)K
1
)
= tr
2
((|e
0
e
0
| K
0,0,0
)
(|e
0
e
0
| 1)(|e
0
e
0
| K
0,0,0
))
= tr
2
((|e
0
e
0
| K
0,0,0
)(|e
0
e
0
| K
0,0,0
))
= tr
2
(|e
0
e
0
| K
2
0,0,0
)
= |e
0
e
0
|tr
|u|
2
0
0 |v|
2
= |e
0
e
0
|.
Logo,
φ(|e
0
e
0
|) = φ
0
(|e
0
e
0
|)
= tr
|u|
2
0
0 |v|
2
1 0
0 0
= tr
|u|
2
0
0 0
= |u|
2
,
como era de se esperar.
128
Analogamente,
P (X
0
= 0, X
1
= 1) = φ(|e
0
e
0
| |e
1
e
1
|)
= φ
0
(E(|e
0
e
0
| E(|e
1
e
1
| 1)))
Mas
E(|e
1
e
1
| 1)
= tr
2
((|e
0
e
0
| K
0,0,0
+ |e
1
e
1
| K
0,1,1
)
(|e
1
e
1
| 1)(|e
0
e
0
| K
0,0,0
+
+|e
1
e
1
| K
0,1,1
))
= tr
2
((|e
0
e
0
| K
0,0,0
+ |e
1
e
1
| K
0,1,1
)
(|e
1
e
1
| K
0,1,1
))
= tr
2
(|e
1
e
1
| K
2
0,1,1
) = |e
1
e
1
|.
Enao
P (X
0
= 0, X
1
= 1) = φ
0
(E(|e
0
e
0
| |e
1
e
1
|))
Mas
E(|e
0
e
0
| |e
1
e
1
|)
= tr
2
((|e
0
e
0
|K
0,0,0
+|e
1
e
1
|K
0,1,1
)
(|e
0
e
0
||e
1
e
1
|)(|e
0
e
0
|K
0,0,0
+
+|e
1
e
1
| K
0,1,1
))
= tr
2
((|e
0
e
0
| K
0,0,0
+ |e
1
e
1
| K
0,1,1
)
(|e
0
e
0
| |e
1
e
1
|K
0,0,0
))
= tr
2
(|e
0
e
0
| K
2
0,0,0
|e
1
e
1
|) = |e
0
e
0
|tr(K
2
0,0,0
|e
1
e
1
|)
= |v|
2
|e
0
e
0
|.
Logo,
P (X
0
= 0, X
1
= 1) = φ
0
(E(|e
0
e
0
| |e
1
e
1
|))
= φ
0
(|v|
2
|e
0
e
0
|) = tr
|u|
2
0
0 |v|
2
|v|
2
0
0 0
= tr
|u|
2
|v|
2
0
0 0
= |u|
2
|v|
2
.
129
Cap´ıtulo 8
Apˆendice: Processos de
Markov quˆanticos
Neste apˆendice fazemos uma descri¸ao de processos de Markov quˆanticos. Tal
constru¸ao ´e mais elaborada do que a usada para cadeias de Markov quˆanticas
e permite o estudo de sistemas mais complicados. Mostramos ainda como a
moeda quˆantica ´e descrita nesse contexto. Esta exposi¸ao segue [16].
8.1 Nota¸oes e defini¸oes
Um espa¸co de medida pontual ´e um espa¸co de medida em que conjuntos
pontuais (isto ´e, com um elemento apenas) ao mensur´aveis. Seja um
conjunto ao vazio, chamado espa¸co amostral.
Defini¸ao Uma aplica¸ao mensur´avel X : Ω S com imagem R(X) S
´e uma medi¸ao se:
1. R(X) ´e o espa¸co base de um espa¸co de medida pontual (R(X), Σ
X
, µ
X
),
onde Σ
X
´e uma σalgebra de R(X) e µ
X
´e uma medida real sobre Σ
X
.
2. para cada x R(X), X
1
(x) ´e o espa¸co base de um espa¸co de medida
(X
1
(x), Σ
x
X
, µ
x
X
), onde Σ
x
X
´e uma σalgebra de X
1
(x) e µ
x
X
´e uma
medida real sobre Σ
x
X
.
Observao Em processos estoasticos e em aplica¸oes de mecˆanica
quˆantica baseadas em amplitudes de transi¸ao, estamos interessados nos ele-
mentos de R(X) (os resultados das medi¸oes), e ao no conjunto ou nas
fibras X
1
(x), x R(X). Entretanto, seguiremos a descri¸ao dada em [16]
porque ela ´e ´util para se descrever a interferˆencia entre medi¸oes.
130
No caso de N-cadeias quˆanticas, supomos que S = {s
0
, . . . , s
n1
} ´e um
conjunto finito, = S
n
, e que naquele caso uma medi¸ao X : S
´e uma aplica¸ao tal que X
1
(s
j
) Λ (onde Λ ´e uma σalgebra fixada de
Ω),
j
P (X
1
(s
j
)) = 1. A menos que seja especificado, iremos supor que
Ω = S
n
para algum n. Ainda, iremos supor em geral que S = R(X) ´e finito
ou enumer´avel.
Alguns exemplos:
1. Moeda quˆantica. Neste caso, = {0, 1}
n
, S = {0, 1}, X
k
: {0, 1}
n
{0, 1} ´e X
k
(x
1
, . . . , x
n
) = x
k
, R(X) = {0, 1} e µ
X
, µ
x
X
ao medidas da
contagem.
2. Mecˆanica quˆantica discreta. Neste caso, S = {s
0
, . . . , s
k
} onde s
i
´e
um estado que o sistema pode assumir, = S
n+1
, X
j
: S,
X
j
(s
0
, . . . , s
n
) = s
j
, R(X
j
) = {s
0
, . . . s
k
} e µ
j
, µ
s
j
ao medidas da con-
tagem em S e em X
1
j
(s), respectivamente. Vemos que este exemplo
possui uma estrutura semelhante ao da moeda quˆantica mencionada
acima.
3. Mecˆanica quˆantica discreta com amplitudes de Feynman. Este ´e um
caso particular do anterior. Sejam a, m Z. Seja α = 2π/m e para
i = 0, . . . , m 1, defina k
i
R
2
, k
i
= 1, (k
i+1
, k
i
) = α. Seja
V = {v R
2
: v =
n
j=1
e
j
, e
j
{k
0
, . . . , k
m1
}, n N}
Pensamos em V como sendo um espa¸co de configura¸ao discreto, e que
est´a associado a um espa¸co de fase discreto
S = {(v, k
j
) : v V, j = 0, . . . , m 1}
Enao, = S
n+1
, e X
j
: S, X
j
((v
0
, k
i(0)
), . . . , (v
n
, k
i(n)
)) =
(v
j
, k
i(j)
).
Defini¸ao Se X ´e mensur´avel, o conjunto de eventos de X ´e definido por
E(X) := {X
1
(B) : B Σ
X
},
o qual ´e uma σalgebra de subconjuntos de Ω.
Defini¸ao Uma fun¸ao a : C ´e uma densidade de amplitude
(para a medi¸ao X) se
A
X
(x) :=
X
1
(x)
adµ
x
X
L
2
(R(X), Σ
X
, µ
X
) (8.1)
131
onde, ´e claro, supomos que a|X
1
(x) L
1
(X
1
(x), Σ
x
X
, µ
x
X
), para cada x
R(X) e ainda que
A
X
2
:=
|A
X
|
2
X
= 1 (8.2)
Veremos no exemplo da moeda quˆantica que se u, v C, com u + v = 1,
|u|
2
+ |v|
2
= 1, ent˜ao definindo a : C, a(ω) = u
k
v
nk
, onde n ´e o
comprimento de ω e k ´e o n´umero de “caras”(ou zeros) na seq¨uˆencia, vale
que a ´e uma densidade de amplitude para X
j
(x
1
, x
2
, . . . , x
n
) = x
j
.
Defini¸ao O espa¸co de probabilidade quˆantica, denotado por A(Ω, a),
´e o conjunto das medi¸oes para os quais a : Ω C ´e uma densidade de am-
plitude.
Defini¸ao Seja X A(Ω, a) uma medi¸ao. Um (X, a)-evento ´e um
conjunto C tal que
A
X
(C)(x) :=
CX
1
(x)
adµ
x
X
L
2
(R(X), Σ
X
, µ
X
) (8.3)
onde supomos que C X
1
(x) Σ
x
X
, para todo x R(X). Dizemos que
A
X
(C) ´e a densidade de amplitude de C determinada por X. Note
que A
X
(Ω) = A
X
. Denotaremos o conjunto dos (X, a)-eventos por E(X, a).
Vale que E(X) E(X, a). Com efeito, seja C E(X), ent˜ao C =
X
1
(B), B Σ
X
. Da´ı,
C X
1
(x) = X
1
(B) X
1
(x) =
X
1
(x) se x B
se x / B
Em qualquer caso, C X
1
(x) Σ
x
X
. E ´e claro que a aplica¸ao A
X
(C)
L
2
(R(X), Σ
X
, µ
X
). Logo, E(X) E(X, a).
Defini¸ao Seja C E(X, a). Definimos a (X, a)-probabilidade de C
como sendo
P
X,a
(C) :=
|A
X
(C)|
2
X
= A
X
(C)
2
Lema 8.1.1 Seja C E(X, a), B Σ
X
. Ent˜ao X
1
(B) C E(X, a) e
A
X
(X
1
(B) C) = 1
B
A
X
(C).
Prova
´
E claro que X
1
(B) C Σ
x
X
, para todo x R(X), e al´em disso,
X
1
(B) C X
1
(x) =
C X
1
(x) se x B
se x / B
132
Portanto,
A
X
(X
1
(B) C) =
X
1
(B)CX
1
(x)
adµ
x
X
= 1
B
A
X
(C)
Como A
X
(C) L
2
(R(X), Σ
X
, µ
X
), temos que 1
B
A
X
(C) L
2
(R(X), Σ
X
, µ
X
)
e portanto (8.3) vale.
Aplicando o lema 8.1.1, obtemos
A
X
(X
1
(B)) = A
X
(X
1
(B) Ω) = 1
B
A
X
(Ω) = 1
B
A
X
P
X,a
(X
1
(B)) =
X
1
(B)
|A
X
|
2
X
=
X
1
(B)
X
1
(x)
adµ
x
X
2
X
(x) (8.4)
Concluimos de (8.2) e (8.4) que P
X,a
´e uma medida de probabilidade em Σ
X
que chamamos de distribui¸ao de X.
Defini¸ao Seja X, Y A(Ω, a). Dizemos que X ao interfere em Y se
E(Y ) E(X, a), e para cada B Σ
Y
,
P
X,a
(Y
1
(B)) = P
Y,a
(Y
1
(B))
Nesse caso, a distribui¸ao de Y ´e determinada quando realizamos a medi¸ao
X.
´
E f´acil mostrar que n˜ao ´e uma rela¸ao sim´etrica em geral. Para ver como
esta defini¸ao extende a de cadeias de Markov quˆanticas, considere X e Y
medi¸oes. Pela primeira defini¸ao, temos que se X ao interfere em Y , ent˜ao
P [Y = s
j
] =
n1
k=0
P [Y = s
j
, X = r
k
]
O lado esquerdo da igualdade pode ser escrito como
P [Y = s
j
] =
Y
1
(s
j
)
|A
Y
|
2
Y
= P
Y,a
(Y
1
(s
j
))
E o lado direito como
x
Y
1
(s
j
)X
1
(x)
|A
X
|
2
x
X
=
Y
1
(s
j
)
|A
X
|
2
X
= P
X,a
(Y
1
(s
j
))
133
Defini¸ao Dizemos que X ´e independente de Y se E(Y ) E(X, a) e
para cada B Σ
X
e C Σ
Y
,
P
X,a
(X
1
(B), Y
1
(C)) = P
X,a
(X
1
(B))P
X,a
(Y
1
(C))
Se X for independente de Y enao P
X,a
(B|Y
1
(C)) = P
X,a
(X
1
(B)) para
todo B Σ
Y
e C Σ
Y
com P
X,a
(Y
1
(C)) = 0.
Seja T um subconjunto n˜ao vazio de R e suponha que existe uma medi¸ao
X
t
A(Ω, a) para cada t T .
Defini¸ao Dizemos que (X
t
)
tT
´e um processo estoastico quˆantico
(QSP) se para cada t, s
1
, . . . , s
n
T , com s
j
t, j = 1, . . . n e para cada
B
j
Σ
s(j)
(onde s(j) = s
j
), temos
X
1
s(j)
(B
j
) E(X
t
, a) (8.5)
A equa¸ao (8.5) afirma que uma medi¸ao no presente pode ser usada
para se obter uma informa¸ao sobre o passado. Isso ´e mais fraco do que a
afirma¸ao
X
1
s(j)
(B
j
) E(X
t
),
ou seja, que a informa¸ao do passado est´a contida no presente.
Seja (X
t
)
tT
um QSP em A(Ω, a). Para t
1
, . . . , t
n
T com t
1
< . . . < t
n
e x
j
R
j
, j = 1, . . . n, definimos (onde t(n) = t
n
):
A
X
t(n)
[x
n
|X
t(n1)
= x
n1
, . . . , X
t(1)
= x
1
]
:=
A
X
t(n)
[X
t(n1)
= x
n1
, . . . , X
t(1)
= x
1
](x
n
)
A
X
t(n1)
[X
t(n2)
= x
n2
, . . . , X
t(1)
= x
1
](x
n1
)
quando o denominador ao se anula; caso contr´ario, definimos o lado es-
querdo como sendo igual a zero.
Defini¸ao Dizemos que (X
t
)
tT
´e um processo de Markov quˆantico
(QMP) quase-discreto se
1.
A
X
t(n)
[x
n
|X
t(n1)
= x
n1
, . . . , X
t(1)
= x
1
]
= A
X
t(n)
[x
n
|X
t(n1)
= x
n1
] (8.6)
2.
A
X
t
[X
s
= x] L
1
(R
t
, Σ
t
, µ
t
), s, t T , s t (8.7)
134
3.
x → A
X
t
[C X
1
s
(x)](y) L
1,2
(R
s
, Σ
s
, µ
s
), s t , y R
t
,
C E(X
u
), u t, e
A
X
t
[C X
1
s
(x)](y)
s
(x) = A
X
t
(C)(y)
(8.8)
A seguir analisamos exemplos de QSP’s quase-discretos.
8.2 Exemplos
Para analisar os exemplos desta se¸ao, resumimos as express˜oes para ampli-
tude e probabilidade obtidas na se¸ao anterior.
A (X, a)-probabilidade de um conjunto C ´e
P
X,a
(C) =
CX
1
(x)
adµ
x
X
2
X
(x) (8.9)
e definimos tamb´em as amplitudes
A
X
(x) =
X
1
(x)
adµ
x
X
(8.10)
e
A
X
(C)(x) =
CX
1
(x)
adµ
x
X
(8.11)
Iremos dar aten¸ao maior para o exemplo da moeda quˆantica descrito
a seguir. Primeiro, faremos a constru¸ao de acordo com [16], adotando a
nota¸ao usada ali (isto ´e, com as ormulas de amplitude e de probabilidade
enunciadas acima). Depois, enunciaremos a constru¸ao em uma forma que ´e
mais usual em teoria da medida. Existem outras constru¸oes na literatura,
tamb´em ditas moedas quˆanticas, que ao usadas com mais frequˆencia [23].
Exemplo 1 Moeda quˆantica. Sejam u, v C tais que u + v = 1 e |u|
2
+
|v|
2
= 1. Uma condi¸ao necess´aria e suficiente para que essas propriedades
sejam satisfeitas ´e que u = 1 v, 0 Re(u) 1 e Im(u) = ±(Re(u))
1/2
(1
Re(u))
1/2
. Enao, vemos que o n´umero real 0 Re(u) 1 determina u e v
a menos de conjuga¸ao. Por exemplo, se Re(u) = 1/2, temos u = (1 ± i)/2,
v = (1 i)/2.
Seja n N e seja = {0, 1}
n
. Para ω = (x
1
, x
2
, . . . , x
n
) , defina
X
j
(ω) = x
j
, j = 1, . . . n. Considerando a medida da contagem na imagem
e nas fibras de X
j
, vemos que X
j
´e uma medi¸ao, j = 1, . . . , n (para con-
sidera¸oes sobre cilindros em = {0, 1}
n
, veja observao abaixo). Enao
135
representa n jogadas de moeda e X
j
mede o resultado da j-´esima jogada.
Defina a densidade de amplitude a : C por a(ω) = u
k
v
nk
, onde k ´e
o n´umero de zeros na seq¨uˆencia ω. Pela defini¸ao (8.10), as fun¸oes A
X
j
,
j = 1, . . . n assumem os valores
A
X
j
(0) =
X
1
j
(0)
adµ
0
X
j
= u
n1
k=0
n 1
k
u
k
v
nk1
= u(u + v)
n1
= u
A
X
j
(1) = v(u + v)
n1
= v
Como
A
X
j
2
=
|A
X
j
|
2
X
j
= |A
X
j
(0)|
2
+ |A
X
j
(1)|
2
= |u|
2
+ |v|
2
= 1,
segue que a : {0, 1}
n
C ´e uma densidade de amplitude para X
j
, e X
j
A(Ω, a), j = 1, . . . n. Vale que (X
j
)
n
j=1
´e um QSP.
A distribui¸ao de X
j
´e dada por
P
X
j
(X
1
j
(0)) =
X
1
j
(0)X
1
j
(x)
adµ
x
X
j
2
X
j
(x)
=
X
1
j
(0)X
1
j
(0)
adµ
x
X
j
2
= |A
X
j
(0)|
2
= |u|
2
P
X
j
(X
1
j
(1)) = |A
X
j
(1)|
2
= |v|
2
Logo, os X
j
ao identicamente distribu´ıdos.
Vale que os X
j
ao interferem entre si. Por exemplo,
P
X
j
(X
1
k
(0)) =
X
1
k
(0)X
1
j
(x)
adµ
x
X
j
X
j
= |A
X
j
(X
1
k
(0))(0)|
2
+ |A
j
(X
1
k
(0))(1)|
2
= |u
2
|
2
+ |uv|
2
= |u|
2
= P
X
k
(X
1
k
(0))
e
P
X
j
(X
1
k
(1)) = |A
X
j
(X
1
k
(1))(0)|
2
+ |A
X
j
(X
1
k
(1))(1)|
2
= |uv|
2
+ |v
2
|
2
= |v|
2
= P
X
k
(X
1
k
(1))
Vale tamem que os X
j
ao independentes no sentido que definimos acima,
pois por exemplo,
P
X
j
(X
j
= 0, X
k
= 1) =
uv
n1
i=0
n 2
i
u
i
v
ni2
2
= |u|
2
|v|
2
136
Finalmente, vale que (X
j
) ´e um processo de Markov. De fato, as equa¸oes
(8.7) e (8.8) claramente valem. Para verificar (8.6), temos
A
X
t(m)
(X
t(m1)
= x
m1
, . . . , X
t(1)
= x
1
)(x
m
) = u
k
v
mk
onde k ´e o n´umero de zeros na seq¨encia (x
1
, . . . , x
m
). Portanto,
A
X
t(m)
(x
m
|X
t(m1)
= x
m1
, . . . , X
t(1)
= x
1
) =
u se x
m
= 0
v se x
m
= 1
E ´e claro que A
X
t(m)
(x
m
|X
t(m1)
= x
m1
) tem o mesmo valor.
Observao 1 Em teoria da medida, o exemplo acima admite uma cons-
tru¸ao muito mais simples. Seja B a ´algebra gerada pelos cilindros em {0, 1} .
Fixe n N e defina
B
k,n
= {ω = (x
1
, x
2
, . . .) {0, 1} : o n´umero de 0’s em (x
1
, . . . , x
n
) ´e k}
Vale que B
k,n
´e uma uni˜ao de cilindros, e portanto B
k,n
B. Ent˜ao a
densidade de amplitude de B
k,n
,
a(B
k,n
) = u
k
v
nk
pode ser vista como sendo uma medida complexa a : B C, e enao obtemos
uma ´unica extens˜ao para a σalgebra gerada pelos cilindros, pelo teorema da
extens˜ao de Kolmogorov. A probabilidade ´e obtida tomando o odulo ao
quadrado desta medida, o que est´a de acordo com os alculos de amplitudes
feitos acima. Ainda, ao precisamos nos preocupar em definir uma medida
e uma σalgebra na imagem e nas fibras das medi¸oes.
Exemplo 2 Moeda quˆantica de 3 lados. Sejam u, v, w C tais que
u + v + w = 1 e |u|
2
+ |v|
2
+ |w|
2
= 1. Seja n N e defina = {0, 1, 2}
n
.
Para ω = (x
1
, . . . , x
n
) Ω, defina X
j
(ω) = x
j
, j = 1, . . . n. Considerando
a medida da contagem na imagem e nas fibras de X
j
, temos que X
j
´e uma
medi¸ao, j = 1, . . . n. Defina a densidade de amplitude a : C, a(ω) =
u
j
0
v
j
1
w
j
2
, onde j
k
´e o n´umero de k’s na seq¨uˆencia ω. As fun¸oes A
X
j
, j =
1, . . . n tem os valores
A
X
j
(0) =
X
1
j
(0)
adµ
x
X
= u
{
n 1
j
1
j
2
j
3
u
j
0
v
j
1
w
j
2
: j
1
+ j
2
+ j
3
= n 1}
= u(u + v + w)
n1
= u
137
A
X
j
(1) = v(u + v + w)
n1
= v
A
X
j
(2) = w(u + v + w)
n1
= w
Como
|A
X
j
(0)|
2
+ |A
X
j
(1)|
2
+ |A
X
j
(2)|
2
= |u|
2
+ |v|
2
+ |w|
2
= 1,
temos que X
j
A(Ω, a), j = 1, . . . n, e ´e claro que (X
j
)
n
j=1
´e um QSP. A
distribui¸ao de X
j
´e dada por
P
X
j
(X
1
j
(0)) =
X
1
j
(0)X
1
(x)
adµ
x
X
2
X
(x)
=
X
1
j
(0)X
1
j
(0)
adµ
0
X
2
+
X
1
j
(0)X
1
j
(1)
adµ
1
X
2
+
X
1
j
(0)X
1
j
(2)
adµ
2
X
2
= |A
X
j
(X
1
j
(0))(0)|
2
+ 0 + 0 = |A
X
j
(0)|
2
= |u|
2
Analogamente,
P
X
j
(X
1
j
(1)) = |A
X
j
(1)|
2
= |v|
2
P
X
j
(X
1
j
(2)) = |A
X
j
(2)|
2
= |w|
2
Logo, os X
j
ao identicamente distribuidos, e como no exemplo 1, eles ao
mutuamente independentes e formam um QMP. Entretanto, ao contr´ario do
exemplo 1, os X
j
interferem entre si. Para mostrar isso, seja j, k {1, . . . n},
com j = k. Enao
A
X
j
(X
k
{0, 1})(0) =
(X
1
k
(0)X
1
k
(1))X
1
j
(0)
adµ
0
X
j
= u(u + v)
A
X
j
(X
k
{0, 1})(1) =
(X
1
k
(0)X
1
k
(1))X
1
j
(1)
adµ
1
X
j
= v(u + v)
A
X
j
(X
k
{0, 1})(2) =
(X
1
k
(0)X
1
k
(1))X
1
j
(2)
adµ
2
X
j
= w(u + v)
Logo,
P
X
j
(X
k
{0, 1}) =
X
1
j
(x)(X
1
k
(0)X
1
k
(1))
adµ
x
X
2
X
j
(x)
=
X
1
j
(0)(X
1
k
(0)X
1
k
(1))
adµ
0
X
j
2
+
X
1
j
(1)(X
1
k
(0)X
1
k
(1))
adµ
1
X
j
2
+
138
+
X
1
j
(2)(X
1
k
(0)X
1
k
(1))
adµ
2
X
j
2
= |u(u + v)|
2
+ |v(u + v)|
2
+ |w(u + v)|
2
= |u + v|
2
(|u|
2
+ |v|
2
+ |w|
2
)
= |u + v|
2
´
E claro que em geral, isso ao ´e igual a
P
X
k
(X
k
{0, 1}) =
X
1
k
(x)(X
1
k
(0)X
1
k
(1))
adµ
x
X
2
X
j
(x)
=
X
1
k
(0)(X
1
k
(0)X
1
k
(1))
adµ
0
X
k
2
+
X
1
k
(1)(X
1
k
(0)X
1
k
(1))
adµ
1
X
k
2
+
+
X
1
k
(2)(X
1
k
(0)X
1
k
(1))
adµ
2
X
k
2
|A
X
k
(0)|
2
+ |A
X
k
(1)|
2
+ 0 = |u|
2
+ |v|
2
Logo, como X
1
k
({0, 1}) Σ
X
k
segue pela defini¸ao de ao interferˆencia
que X
j
interfere em X
k
.
Exemplo 3 Mecˆanica quˆantica discreta. Seja S um conjunto ao vazio
de estados que uma part´ıcula pode assumir.
Defini¸ao Uma fun¸ao A
1
: S ×S C ´e uma amplitude de transi¸ao
estoastica em um passo se para cada s
1
, s
2
S, temos
s
A
1
(s
1
, s)A
1
(s
2
, s) =
s
A
1
(s, s
1
)A
1
(s, s
2
) = δ
s
1
s
2
e
s
A
1
(s
1
, s) = 1
onde a soma converge absolutamente.
Uma matriz de amplitude de transi¸ao de uma cadeia de Markov quˆantica
induz uma fun¸ao de amplitude de transi¸ao estoastica (a fun¸ao induzida
´e simplesmente A : S × S C, A(s
j
, s
k
) = A
kj
). Denote o conjunto das
fun¸oes de amplitude de transi¸ao estoastica por T (S).
Fixemos Ω = S
n+1
= {(s
0
, s
1
, . . . , s
n
) : s
i
S}. Seja a
0
l
2
(S) um vetor
unit´ario representando a distribui¸ao inicial de uma part´ıcula quˆantica. Fixe
A
1
T (S). Para ω = (s
0
, s
1
, . . . s
n
) Ω, defina a densidade de amplitude
a(w) := a
0
(s
0
)A
1
(s
0
, s
1
) ···A
1
(s
n1
, s
n
)
139
Para j = 0, 1, . . . , n, defina X
j
: Ω S por
X
j
(s
0
, s
1
, . . . , s
n
) = s
j
Seja µ
j
e µ
s
j
a medida da contagem em S e em X
1
j
(s), respectivamente.
Equipado com essa estrutura, X
j
´e uma medi¸ao, j = 0, 1, . . . n e vale que
X
j
A(Ω, a),j = 0, . . . , n. Se j < k, vale que X
k
ao interfere em X
j
(ver
[16]). Mas exemplos simples mostram que X
j
pode interferir em X
k
. Al´em
disso, X
j
e X
k
ao s˜ao independentes em geral. Finalmente, vale que (X
j
)
n
j=0
´e um QMP quase-discreto (ver [16]).
Vamos analisar um modelo concreto para a mecˆanica quˆantica discreta
em 2 dimens˜oes. Sejam a e m inteiros positivos relativamente primos, m par.
Seja α = 2π/m e sejam k
0
, k
1
, . . . , k
m1
vetores unit´arios em R
2
tais que cada
um forma um ˆangulo α com o anterior. Seja
V = {v R
2
: v =
n
j=1
e
j
, e
j
{k
0
, . . . , k
m1
}, n N}
Pensamos em V como sendo um espa¸co de configura¸ao discreto, e que est´a
associado a um espa¸co de fase discreto
S = {(v, k
j
) : v V, j = 0, . . . , m 1}
Defini¸ao A amplitude de transi¸ao de Feynman discreta em um passo
´e a aplica¸ao A
1
: S ×S C dada por
A
1
((v, k
r
), (v + k
r
, k
t
)) = n
1/2
exp
imπ(t r)
2
n
e A
1
´e zero, caso contr´ario.
Pode-se mostrar que um m´ultiplo constante de A
1
, de odulo 1, est´a
contido em T (S). Como tal m´ultiplo ao afeta as probabilidades, iremos
assumir que A
1
T (S).
Seja n N e seja = S
n+1
= {(s
0
, s
1
, . . . , s
n
) : s
i
S}. Defina a
densidade de amplitude a : C e as medi¸oes X
j
: S como antes.
Neste caso, para
ω = ((v
0
, k
i(0)
), . . . , (v
n
, k
i(n)
))
temos que X
j
(ω) = (v
j
, k
i(j)
), j = 0, . . . n. Pelo que fizemos acima, con-
cluimos que (X
j
)
n
j=0
´e um QMP em A(Ω, a).
140
Vamos mostrar que se n , A
1
se aproxima, em um certo sentido, da
amplitude de Feynman usual para uma part´ıcula livre. Seja
p = {(x
0
, k
j
0
), . . . , (x
r
, k
j
r
)},
tal que x
s
+k
j
s
= x
s+1
, s = 0, . . . r1. Seja β
s
= 2π(j
s
j
s1
)/n, s = 1, . . . , r
e suponha que os β
s
ao pequenos (ou pr´oximos de 2π). Ent˜ao a distˆancia
entre x
s+1
e x
s1
´e
x
s+1
x
s1
2
= x
s
+ k
j
s1
+ k
j
s
x
s
2
= k
j
s1
+ k
j
s
2
= 2 + 2k
j
s
.k
j
s1
= 2 + 2 cos β
s
2 + 2
1
β
2
s
2
= 4 β
2
s
.
Portanto, β
2
s
4 x
s+1
x
s1
2
. Se v
s
denota a “velocidade”da part´ıcula
no tempo s, temos v
2
s
x
s+1
x
s1
2
/4. Logo, β
2
s
4(1v
2
s
) e a amplitude
do caminho p ´e
A(p) = n
r/2
exp
imπn
1
r
s=1
(j
s
j
s1
)
2
= n
r/2
exp
imn(4π)
1
r
s=1
β
2
s
n
r/2
exp
imnπ
1
r
s=1
(1 v
2
s
)
= n
r/2
e
imnr/π
exp
i2
1
r
s=1
mv
2
s
2
.
Se fizermos com que o n´umero m corresponda `a massa da part´ıcula, enao o
somat´orio corresponde `a integral da energia cin´etica sobre o caminho. Desta
forma, A
1
(p) se aproxima da amplitude de Feynman usual (cont´ınua) para
uma part´ıcula livre.
Exemplo 4 Ainda, de maneira an´aloga a feita para cadeias quˆanticas,
podemos tamb´em calcular a entropia de processos de Markov. Usando a
express˜ao para a probabilidade de um evento B Σ
X
, que repetimos aqui,
P
X,a
(B) =
B
|A|
2
X
=
|1
B
A|
2
X
=
|A(X
1
(B)|
2
X
=
X
1
(B)X
1
(x)
adµ
x
X
2
X
(x),
141
podemos calcular a entropia de Shannon e a de von Neumann dos exemplos
que consideramos nas se¸oes 8.1 e 8.2. No caso da moeda quˆantica, os dois
casos que consideramos (n´umero finito ou arbitr´ario de medi¸oes) possuiam a
mesma distribui¸ao estacion´aria, a saber, P
j
(0) = |A
j
(0)|
2
= |u|
2
, e P
j
(1) =
|A
j
(1)|
2
= |v|
2
. O operador densidade associado ´e ρ = |u|
2
|00| + |v|
2
|11|
e portanto, por (5.1) (ap´os defini¸ao de entropia de von Neumann),
S(ρ) = tr(ρ log ρ) = −|u|
2
log |u|
2
|v|
2
log |v|
2
8.3 Processos de Markov quˆanticos
quase-discretos
Nesta se¸ao, X
t
, t T R ser´a um QMP quase-discreto sobre A(Ω, a). Para
s, t T , defina F
s,t
: R
s
× R
t
C por
F
s,t
(x, y) = A
t
(y|X
s
= x)
Se A
s
(x) = 0 ent˜ao
F
s,t
(x, y) =
A
t
(X
s
= x)(y)
A
s
(x)
= A
s
(x)
1
X
1
s
(x)X
1
t
(y)
adµ
y
X
t
e F
s,t
(x, y) = 0, caso contr´ario. Podemos aplicar o item 3 da defini¸ao de
QMP quase-discreto para calcular A
t
em termos de A
s
, para s t:
A
t
(y) =
A
t
(X
s
= x)(y)
s
(x) =
A
s
(x)F
s,t
(x, y)
s
(x) (8.12)
Defini¸ao O kernel de amplitude de transi¸ao K
s,t
: R
s
× Σ
t
C para
s, t T , s t ´e dado por
K
s,t
(x, B) =
B
F
s,t
(x, y)
t
(y)
Segue do item 2 da defini¸ao de QMP quase-discreto que K
s,t
existe e ´e finito,
e pelo item 3 vale que F
s,t
´e mensur´avel em ambas as vari´aveis. Fazendo
uma analogia com um ucleo de Markov, vemos que K
s,t
(x, .) ´e uma medida
complexa limitada em Σ
t
e que K
s,t
(., B) ´e mensur´avel em R
s
. Al´em disso,
K
s,t
(x, .) µ
t
e
dK
s,t
(x, .)
t
(y) = F
s,t
(x, y)
Agora provamos uma vers˜ao do teorema de Chapman-Kolmogorov neste con-
texto.
142
Teorema 8.3.1 Para s, u, t T , s u t e x R
s
, z R
t
, B Σ
t
,
temos
F
s,t
(x, z) =
F
u,t
(y, z)F
s,u
(x, y)
u
(y) =
F
u,t
(y, z)K
s,u
(x, dy)
K
s,t
(x, B) =
K
u,t
(y, B)K
s,u
(x, dy)
Prova Se A
s
(x) = 0, a desigualdade vale claramente, enao assumimos que
A
s
(x) = 0. Aplicando (8.6) e (8.8), temos
F
u,t
(y, z)K
s,u
(x, dy) =
F
u,t
(y, z)F
s,u
(x, y)
u
(y)
=
A
t
(z|X
u
= y)A
u
(y|X
s
= x)
u
(y)
=
A
t
(z|X
u
= y, X
s
= x)A
u
(y|X
s
= x)(y)
=
A
t
(X
u
= y, X
s
= x)(z)
A
u
(X
s
= x)(y)
A
u
(X
s
= x)(y)
A
s
(x)
u
(y)
=
1
A
s
(x)
A
t
(X
u
= y, X
s
= x)(z)
u
(y)
=
1
A
s
(x)
A
t
(X
s
= x)(z) = F
s,t
(x, z)
Integrando a primeira igualdade, obtemos a segunda.
Agora assumimos que os contradom´ınios coincidem, ou seja,
(R
t
, Σ
t
, µ
t
) = (R, Σ, µ), t T
Seja H = L
2
(R, Σ, µ). Diremos que (X
t
)
tT
´e estacion´ario (homogˆeneo no
tempo) se F
s+u,t+u
= F
s,t
sempre que s, t, s + u, t + u T , s t. Assuma
que (X
t
)
tT
´e estacion´ario e que T = [0, a], 0 < a < ou T = [0, ). Enao
definimos F
t
: R × R C por F
t
= F
0,t
, t T . Da´ı, temos F
s,t
= F
ts
.
Analogamente, definimos K
t
: R × Σ C por K
t
= K
0,t
e da´ı K
s,t
= K
ts
.
Enao
K
t
(x, B) =
B
F
t
(x, y)(y)
143
Assim, podemos reescrever (8.12) na forma
F
t
(y) =
F
0
(x)F
t
(x, y)(x) (8.13)
Al´em disso, fazendo s = 0 e trocando t por s + t e u por s, a equa¸ao de
Chapman-Kolmogorov se torna
F
s+t
(x, z) =
F
s
(x, y)F
t
(y, z)(y) (8.14)
K
s+t
(x, B) =
K
t
(y, B)K
s
(x, dy) (8.15)
Para t T defina a aplica¸ao K
t
: Σ × R C por
K
t
(B, y) =
B
F
t
(x, y)(x)
Segue dos itens 2 e 3 da defini¸ao de QMP que K
t
(B, x) ´e mensur´avel na
segunda vari´avel e ´e uma medida complexa limitada na primeira vari´avel.
Al´em disso, K
t
(., y) µ e
dK
t
(., y)
(x) = F
t
(x, y)
Diremos que (X
t
)
tT
´e unit´ario se para cada t T se para cada t T ,
y R, B Σ com µ(B) < , temos
K
t
(x, B)F
t
(x, y)(x) =
K
t
(B, x)F
t
(y, x)(x) = 1
B
(y), µ q.t.p.
Defina o operador linear U
t
: H H por
U
t
g(y) =
g(x)F
1
(x, y)(x) =
g(x)K
t
(dx, y)
Aplicando (8.13) temos A
t
= U
t
A
0
, t T . Agora mostraremos que neste caso
t → U
t
´e um semigrupo unit´ario a um parˆametro. Mostraremos tamb´em que
(X
t
)
tT
´e unit´ario se e somente se U
t
´e unit´ario para todo t T .
Teorema 8.3.2 1. Se (X
t
)
tT
´e unit´ario ent˜ao U
t
´e um operador unit´ario,
t T e U
s+t
= U
s
U
t
para todo s, t T com s + t T .
2. Se U
t
´e unit´ario, t T ent˜ao (X
t
)
tT
´e unit´ario.
144
Prova 1. Suponha que (X
t
)
tT
´e unit´ario. Primeiro mostraremos que U
t
´e limitado, t T . Seja g H uma fun¸ao simples. Enao existe B
i
Σ,
i = 1, . . . , n com B
i
B
j
= se i = j, µ(B
i
) < e c
i
C, i = 1, . . . , n tais
que g =
c
i
1
B(i)
. Da´ı,
U
t
g
2
=
|U
t
g(y)|
2
(y) =
g(x)K
t
(dx, y)

g(z)K
t
(dz, y)
(y)
=
g(x)F
t
(x, t)(x)
[
c
i
K
t
(B
i
, y)](y)
=
c
i
g(x)
K
t
(B
i
, y)F
t
(x, y)(y)
(x)
c
i
g(x)1
B(i)
(x)(x) =
|c
i
|
2
µ(B
i
) = g
2
Portanto, U
t
restrita ao subespa¸co denso S de fun¸oes simples possui norma
1. Logo, esta restri¸ao possui uma ´unica extens˜ao linear e limitada
ˆ
U
t
para
H de norma 1. Agora seja g H qualquer. Enao existe uma seq¨uˆencia
g
i
S tal que |g
i
(x)| |g(x)| para todo x R e g
i
g na convergˆencia da
norma. Segue que existe uma subseq¨uˆencia, que tamb´em denotaremos por g
i
tal que g
i
g, µ-q.t.p.. Como g, F
t
(., y) H, temos gF
t
(., y) L
1
(R, Σ, µ)
e al´em disso,
|g
i
(x)F
t
(x, y)| |g(x)F
t
(x, y)|
para todo x R. Aplicando o teorema da convergˆencia dominada, temos
ˆ
U
t
g(y) = lim
ˆ
U
t
g
i
(y) = lim
g
i
(x)F
y
(x, y)(x)
=
g(x)F
t
(x, y)(x) = U
t
g(y)
Logo, U
t
=
ˆ
U
t
e portanto U
t
´e limitada.
Mostremos que U
t
´e unit´aria. Note que a adjunta de U
t
´e dada por
U
t
g(y) =
g(x)F
t
(y, x)(x) =
g(x)K
t
(y, dx)
Novamente, se g =
c
i
1
B(i)
´e uma fun¸ao simples, temos
U
t
U
t
g(y) =
U
t
g(x)F
t
(x, y)(x)
=
g(z)K
t
(x, dz)
F
t
(x, y)(x)
145
=
c
i
K
t
(x, B
i
)F
t
(x, y)(x) =
c
i
1
B(i)
(y) = g(y)
Analogamente,
U
t
U
t
g(y) =
U
t
g(x)F
t
(y, x)(x)
=
g(z)K
t
(dz, x)
F
t
(y, x)(x)
=
c
i
K
t
(B
i
, x)F
t
(y, x)(x) =
c
i
1
B(i)
(y) = g(y)
Logo, U
t
U
t
= U
t
U
t
= 1 em S e portanto U
t
´e unit´aria. Finalmente, se s, t,
s + t T , temos por (8.14) que
U
s+t
g(y) =
g(x)F
s+t
(x, y)(x)
=
g(x)
F
s
(x, z)F
t
(z, y)(z)
(x)
=
g(x)F
s
(x, z)(x)
F
t
(z, y)(z) = U
t
U
s
g(y)
2. Suponha que U
t
, t T ´e unit´ario. Se B Σ com µ(B) < ent˜ao
1
B
H. Logo,
1
B
(x) = U
t
U
t
1
B
(x) =
1
B
(z)K
t
(x, dz)
F
t
(x, y)(x)
=
K
t
(x, B)F
t
(x, y)(x)
e
1
B
(x) = U
t
U
t
1
B
(x) =
1
B
(z)K
t
(dz, x)
F
t
(y, x)(x)
=
K
t
(B, x)F
t
(y, x)(x)
Seja (X
t
)
tT
unit´ario com T = [0, ). Definindo U
t
= U
t
, temos que t → U
t
´e um grupo unit´ario a um parˆametro em R. Note que F
t
(x, .) F
0
(x, .) H
e F
t
(x, .) F
0
(x, .) ´e mensur´avel. Dizemos que (X
t
)
tT
´e cont´ınuo se para
todo > 0 existe δ > 0 tal que |t| < δ implica que
F
t
(x, .) F
0
(x, .)
2
(x) <
146
Teorema 8.3.3 Se (X
t
)
tT
´e cont´ınuo, unit´ario e estacion´ario, ent˜ao t →
U
t
´e fortemente cont´ınuo.
Prova Mostraremos que t U
t
´e fracamente cont´ınuo em 0, donde o
resultado segue. Para g, h H temos, aplicando a desigualdade de Schwarz,
que
|(U
t
I)g, h| =
g(x)[F
t
(x, y) F
0
(x, y)](x)h(y)(y)
|g(x)|
|F
t
(x, y) F
0
(x, y)||h(y)|(y)(x)
h
|g(x)|F
t
(x, .) F
0
(x, .)(x)
hg
F
t
(x, .) F
0
(x, .)
2
(x)
1/2
Logo, dado > 0, existe δ > 0 tal que |t| < δ implica
|(U
t
I)g, h| hg
Sob as condi¸oes do teorema anterior, temos que t → U
t
´e um grupo unit´ario
a um parˆametro cont´ınuo. Portanto, pelo teorema de Stone, U
t
= e
itH
para
um ´unico operador auto-adjunto H. Chamamos tal processo de processo
Hamiltoniano.
Teorema 8.3.4 Se (X
t
)
tT
´e estacion´ario e unit´ario ent˜ao X
t
ao interfere
em X
s
para s t.
Prova Para B Σ, temos por (8.8) e pela unitaridade de U
ts
que
P
t
(X
s
B) =
|A
t
(X
s
B)(y)|
2
(y)
=
A
t
[X
1
s
(B) X
1
s
(x)](y)(x)
2
(y)
=
1
B
(x)A
t
(X
s
= x)(y)(x)
2
(y)
=
1
B
(x)A
s
(x)F
ts
(x, y)(x)
2
(y)
=
|U
ts
1
B
A
s
(y)|
2
(y) = U
ts
1
B
A
s
2
= 1
B
A
s
2
=
B
|A
s
|
2
= P
s
(B)
147
Referˆencias Bibliogr´aficas
[1] Accardi, L. A. Nonrelativistic quantum mechanics as a non-commutative
Markov process. Adv. Math, Vol. 20, 1976.
[2] Accardi, L. Topics in quantum probability, Phys. Reports, 77, No. 3
(1981), 169-192.
[3] Accardi, L., Fidaleo, F., Mukhamedov, F. Markov states on the CAR
algebra. Math-ph/0411035.
[4] Arveson, W. The canonical anticommutation relations. Lecture Notes
for Mathematics 208. November 1998.
[5] Atiyah, M.F., Macdonald, I.G. Introduction to Commutative Algebra.
Addison-Wesley, 1969.
[6] Balakrishnan, A. V. Applied Functional Analysis. Springer-Verlag, 1976.
[7] Billingsley, P. Probability and Measure. John Wiley & Sons, Inc., 1995.
[8] Bratteli, O., Robinson, D. Operator algebras and quantum statistical
mechanics, vols. 1 e 2. Second edition. Springer-Verlag, 1997.
[9] Brin, M. Stuck, G. Introduction to Dynamical Systems. Cambridge Uni-
versity Press, 2002.
[10] Ellis, R. S. Entropy, Large Deviations, and Statistical Mechanics.
Springer-Verlag, 1985.
[11] Fernandez, P. Medida e Integra¸ao. Projeto Euclides, 1996.
[12] Feynman, R., Hibbs, A. Quantum mechanics and path integrals.
McGraw-Hill, New York, N.Y., 1965.
[13] Feynman, R. QED: The Strange Theory of Light and Matter. Princeton
University Press, Princeton, New Jersey, 1985.
148
[14] Gantmacher, F.R. The Theory of Matrices, vol. 2. Chelsea Publishing
Company, New York, N.Y., 1959.
[15] Gudder, S., Marbeau, J. Analysis of a Quantum Markov Chain. Annales
de l’Institut Henri Poincar´e - Physique Th´eorique, Vol 52, no. 1, 1990,
p. 31-50.
[16] Gudder, S., Schindler, C. Quasi-discrete Quantum Markov Processes.
Annales de l’Institut Henri Poincar´e - Physique Th´eorique, Vol 56, no.
2, 1992, p. 123-142.
[17] Gudder, S., Marbeau, J. A quantum random walk. Annales de la Foun-
dation Louis de Broglie, Vol. 14, no. 4, 1989.
[18] Gudder, S. Quantum Probability. Academic Press, Inc., Boston, 1988.
[19] Gudder, S. Discrete Quantum Mechanics. J. Math. Physics, 27 (7), 1986,
p. 1782-1790.
[20] Gustafson, S., Sigal, I. Mathematical Concepts of Quantum Mechanics.
Springer-Verlag, 2003.
[21] Isham, C. J. Lectures on Quantum Theory. Imperial College Press, 1995.
[22] Karlin, S., Taylor, H. A first course in stochastic processes. Academic
Press, Inc. 1975.
[23] Kempe, J. Quantum random walks: an introductory overview. Contem-
porary Physics, vol. 44, number 4, july-august 2003.
[24] Kitaev, A. Yu., Shen, A. H., Vyalyi, M. N. Classical and Quantum Com-
putation. Graduate Studies in Mathematics, vol. 47. American Mathe-
matical Society, 2002.
[25] Kumjian, A., Renault, J. KMS states on C
-algebras associated to ex-
pansive maps. Math.OA/0305044.
[26] Lanford, O. E., Ruelle, D. Observables at infinity and states with short
range correlation in statistical mechanics. Comm. Math. Phys. Vol. 13,
194-215, 1969.
[27] Lima, E. L. Espa¸cos M´etricos. Projeto Euclides, 1996.
[28] Lu, Y-G. Quantum Markov Chains and classical random sequences.
Nagoya Math. Journal. Vol. 139 (1995), pp. 173-183.
149
[29] Madsen, I., Tornehave, J. From calculus to cohomology: De Rham co-
homology and characteristic classes. Cambridge University Press, 1997.
[30] Nelson, E. Construction of quantum fields from Markov fields. Journal
of Functional Analysis, Vol. 12, 1973.
[31] Neshveyev, S., Stormer, E. The variational principle for a class of as-
ymptotically abelian C
-algebras.
http://www.math.uio.no/eprint/pure math/2000/11-00.ps.
[32] Nielsen, M., Chuang, I. Quantum computation and quantum informa-
tion. Cambridge University Press, 2000.
[33] Norris, J. R. Markov Chains. Cambridge University Press, 1998.
[34] Ohya, M., Petz, D. Quantum entropy and its use, Texts and monographs
in physics. Springer-Verlag, Berlin. 1993.
[35] Parry, W., Pollicott, M. Zeta Functions and the Periodic Orbit Struc-
ture of Hyperbolic Dynamics. Soci´et´e Math´ematique de France. 187-188,
Ast´erisque, 1990.
[36] Pollicott, M. Yuri, M. Dynamical Systems and Ergodic Theory. Cam-
bridge University Press, 1998.
[37] Sinai, Ya. Probability Theory. Springer-Verlag, 1992.
[38] Spitzer, F. A variational characterization of finite Markov chains. Annals
of Math. Statistics, Vol 43, No. 1, 1972, p. 303-307.
[39] Urruty, J. B. H. Fundamentals of Convex Analysis. Springer-Verlag,
2001.
[40] van Enter, A. C. C., Fernandez R. and Sokal, A. D. Regularity proper-
ties and pathologies of position-space renormalization-group transforma-
tions: Scope and limitations of Gibbsian theory, Journ. of Stat. Phys.,
Vol 72, N 5/6, 1993 pp 879-1187.
[41] Vedral, V. The role of relative entropy in quantum information theory.
Reviews of modern physics, Vol. 74, January 2002.
[42] Walters, P. An Introduction to Ergodic Theory. Springer-Verlag, New
York, 1982.
150
´
Indice Remissivo
(X, a)-evento, 132
(X, a)-probabilidade, 132, 135
algebra, 124
C
algebra, 4, 119
´
Algebra, 118
´
Algebra de Banach, 119
´
Algebra normada, 118
Amplitude de transi¸ao, 8
Bit, 54
Cadeia de Markov, 12
Cadeia de Markov quˆantica, 13, 120,
122
Conjunto de eventos, 131
Decomposi¸ao espectral, 67
Decomposi¸ao polar, 67
Decomposi¸ao de Schmidt, 66
Decomposi¸ao em valores singulares,
68
Densidade de amplitude, 131, 132
Desigualdade de Araki-Lieb, 79
Desigualdade de Klein, 76
Distribui¸ao de Gibbs, 93
Energia espec´ıfica, 98
Energia livre, 99
Energia m´edia, 98
Ensemble, 62
Entropia condicional de Shannon, 72
Entropia condicional de von Neumann,
84
Entropia de Shannon, 71
Entropia de uma medida, 98
Entropia de uma parti¸ao, 98
Entropia de von Neumann, 76
Entropia quˆantica, 76
Entropia relativa de Shannon, 71
Entropia relativa de von Neumann,
76
Equa¸ao de Schr¨odinger, 5, 64
Espa¸co de probabilidade quˆantica, 132
Esperan¸ca condicional (de Umegaki),
126
Esperan¸ca de transi¸ao, 120
Esperan¸ca quase-condicional, 126
Estado (funcional), 119
Estado (vetor-estado), 54
Estado de Markov, 126
Estado emaranhado, 60, 66
Estado KMS, 127
Estado misturado, 63
Estado puro, 63
Estados correlacionados, 72, 79
Informa¸ao m´utua de Shannon, 72
Informa¸ao m´utua de von Neumann,
82
Involu¸ao, 119
Lema de Wielandt, 107
Matriz densidade, 62
Matriz irredut´ıvel, 111
Matriz redut´ıvel, 111
Mecˆanica estat´ıstica quˆantica, 118
Mecˆanica quˆantica discreta, 139
151
Medi¸ao, 10, 130
Medi¸oes independentes, 134
Medida erg´odica, 100
Moeda quˆantica, 127, 135
Moeda quˆantica de 3 lados, 137
N-cadeia, 11
N-cadeia quˆantica, 13
N-cadeia unit´aria, 13
N´umero de Schmidt, 69
ao-interferˆencia, 12, 133
Operador densidade, 62
Operador densidade reduzido, 63
Press˜ao topol´ogica, 95
Processo de Markov quˆantico, 134
Processo estacion´ario, 143
Processo estoastico quˆantico, 134
Processo unit´ario, 144
Produto de Kronecker, 61
Purifica¸ao de um estado, 69
Q-bit, 54
Rela¸oes de anticomutatividade canˆonicas
(CAR), 125
Teorema de Birkhoff, 110
Teorema de Krein-Milman, 110
Teorema de Lieb, 83
Teorema de Perron-Frobenius, 108
Teoria quˆantica de campos, 127
Tra¸co parcial, 63
152
Livros Grátis
( http://www.livrosgratis.com.br )
Milhares de Livros para Download:
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas
Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo