( PDF ) Cadeias de Markov clássicas e quânticas

Download PDF

ads:

Universidade Federal do Rio Grande do Sul

Instituto de Matem´atica

Programa de P´os-Gradua¸c˜ao em Matem´atica

CADEIAS DE MARKOV CL

ASSICAS E QU

ANTICAS

por

CARLOS FELIPE LARDIZ

ABAL RODRIGUES

Porto Alegre, Mar¸co de 2006

ads:

Livros Grátis

http://www.livrosgratis.com.br

Milhares de livros grátis para download.

Disserta¸c˜ao submetida por Carlos Felipe Lardiz´abal Rodrigues

como re-

quisito parcial para a obten¸c˜ao do grau de Mestre em Matem´atica pelo Pro-

grama de P´os-Gradua¸c˜ao em Matem´atica do Instituto de Matem´atica da

Universidade Federal do Rio Grande do Sul.

Professor Orientador: Dr. Artur Oscar Lopes

Banca Examinadora:

Dr. Artur Oscar Lopes

Dr. Alexandre Tavares Baraviera

Dr. Jairo da Silva Bochi

Dr. Rafael Rig˜ao Souza (UNISINOS)

Data de Defesa: 10 de mar¸co de 2006.

Bolsista do Conselho Nacional de Desenvolvimento Cient´ıﬁco e Tecnol´ogico - CNPq

ads:

Resumo: seguindo o trabalho de S. Gudder, fazemos uma constru¸c˜ao

de cadeias de Markov quˆanticas a partir de matrizes complexas, unit´arias,

estoc´asticas e analisamos o conceito de interferˆencia nesse contexto, dando

aten¸c˜ao para uma cadeia que chamamos de moeda quˆantica. Estamos in-

teressados na entropia de cadeias de Markov reais, no princ´ıpio variacional

para energia livre associado e em uma poss´ıvel constru¸c˜ao an´aloga no caso

complexo. Este trabalho visa tamb´em dar uma introdu¸c˜ao matematicamente

rigorosa de certos aspectos de mecˆanica quˆantica.

Abstract: following the work of S. Gudder we make a construction of

quantum Markov chains via complex, unitary, stochastic matrices and we

analyse the concept of interference in that context, with emphasis on a certain

chain we call the quantum coin. We are interested in the entropy of real

Markov chains, in the associated variational principle for free energy and

in analogous constructions in the complex case. This work also aims to

be a mathematically rigorous introduction to certain aspects of quantum

mechanics.

Agradecimentos

Esta disserta¸c˜ao de mestrado foi criada a partir de algumas notas sim-

ples que escrevi durante minha gradua¸c˜ao e que serviram como um primeiro

trabalho de inicia¸c˜ao cient´ıﬁca.

E claro que com o passar dos semestres, tais

notas melhoraram em extens˜ao e principalmente em profundidade. Aproveito

para agradecer a meu orientador Artur Oscar Lopes pela orienta¸c˜ao e pelas

in´umeras sugest˜oes para melhorar este trabalho, e mais geralmente pelo per-

manente incentivo, desde os tempos em que eu era um aluno da computa¸c˜ao

at´e os dias de hoje, ao concluir o bacharelado e mestrado em matem´atica.

Agrade¸co ainda aos professores Alexandre Baraviera, Rafael Rig˜ao Souza

e Jairo Bochi pelas diversas sugest˜oes e apoio durante a elabora¸c˜ao deste tra-

balho. Agrade¸co aos meus colegas e `a minha fam´ılia pela generosa paciˆencia

na vida cotidiana.

Porto Alegre, mar¸co de 2006.

Sum´ario

1 Introdu¸c˜ao 3

1.1 Sobre medi¸c˜oes em um sistema quˆantico . . . . . . . . . . . . 4

2 Cadeias de Markov quˆanticas 7

2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 7

2.2 N-cadeias quˆanticas . . . . . . . . . . . . . . . . . . . . . . . . 8

2.3 Matrizes de Dirichlet . . . . . . . . . . . . . . . . . . . . . . . 17

2.4 Distribui¸c˜oes de Probabilidade . . . . . . . . . . . . . . . . . . 23

2.5 Alguns c´alculos . . . . . . . . . . . . . . . . . . . . . . . . . . 33

2.6 Apˆendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 37

3 Integrais de Feynman 43

3.1 O formalismo das integrais de Feynman . . . . . . . . . . . . . 43

3.2 Distribui¸c˜ao de Probabilidade . . . . . . . . . . . . . . . . . . 47

3.3 Sobre a amplitude de Feynman . . . . . . . . . . . . . . . . . 50

4 Operadores densidade e mecˆanica quˆantica 54

4.1 Nota¸c˜ao de Dirac . . . . . . . . . . . . . . . . . . . . . . . . . 55

4.2 Produto tensorial . . . . . . . . . . . . . . . . . . . . . . . . . 57

4.3 Operador densidade . . . . . . . . . . . . . . . . . . . . . . . . 62

4.4 Postulados da mecˆanica quˆantica . . . . . . . . . . . . . . . . 64

4.5 Estados emaranhados . . . . . . . . . . . . . . . . . . . . . . . 66

5 Entropia 71

5.1 Entropia de Shannon . . . . . . . . . . . . . . . . . . . . . . . 71

5.2 Entropia de von Neumann . . . . . . . . . . . . . . . . . . . . 75

5.3 Subaditividade forte . . . . . . . . . . . . . . . . . . . . . . . 83

5.4 Cadeias quˆanticas: entropia de Shannon . . . . . . . . . . . . 85

5.5 Cadeias quˆanticas: entropia de von Neumann . . . . . . . . . 88

6 Formalismo Termodinˆamico 91

6.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 91

6.2 Caracteriza¸c˜ao variacional . . . . . . . . . . . . . . . . . . . . 92

6.2.1 Introdu¸c˜ao . . . . . . . . . . . . . . . . . . . . . . . . . 92

6.2.2 Energia livre . . . . . . . . . . . . . . . . . . . . . . . . 93

6.2.3 Caracteriza¸c˜ao variacional . . . . . . . . . . . . . . . . 96

6.3 Observa¸c˜oes sobre processos quˆanticos . . . . . . . . . . . . . 104

6.4 Apˆendice . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 108

6.4.1 Prova do lema de Wielandt . . . . . . . . . . . . . . . 111

7 C

∗

-´algebras e cadeias de Markov quˆanticas 118

7.1 C

∗

-´algebras . . . . . . . . . . . . . . . . . . . . . . . . . . . . 118

7.2 Cadeias de Markov quˆanticas . . . . . . . . . . . . . . . . . . 119

7.3 CAR C

∗

-´algebras e estados KMS . . . . . . . . . . . . . . . . 124

7.4 Moeda quˆantica revisitada . . . . . . . . . . . . . . . . . . . . 128

8 Apˆendice: Processos de Markov quˆanticos 130

8.1 Nota¸c˜oes e deﬁni¸c˜oes . . . . . . . . . . . . . . . . . . . . . . . 130

8.2 Exemplos . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 135

8.3 Processos de Markov quˆanticos

quase-discretos . . . . . . . . . . . . . . . . . . . . . . . . . . 142

Cap´ıtulo 1

Introdu¸c˜ao

Um princ´ıpio fundamental da mecˆanica quˆantica diz que a evolu¸c˜ao tem-

poral de um sistema f´ısico isolado pode ser colocada em correspondˆencia com

um espa¸co vetorial de dimens˜ao inﬁnita de tal modo que os estados do sistema

s˜ao representados por vetores e uma medi¸c˜ao f´ısica qualquer corresponde a

um operador linear. Com o intuito de simpliﬁcar o problema, vamos analisar

um modelo onde o tempo ´e discreto, o espa¸co vetorial ´e de dimens˜ao ﬁnita

e a cadeia de Markov cl´assica ´e modiﬁcada pela introdu¸c˜ao de uma matriz

complexa.

As cadeias de Markov quˆanticas s˜ao ´uteis para obter um comportamento

aproximado do problema em dimens˜ao inﬁnita da mecˆanica quˆantica (que

´e muito mais complexo). Esta aproxima¸c˜ao (assim como outras abordagens

discretas) ´e motivada n˜ao apenas pela necessidade de se estudar uma simpli-

ﬁca¸c˜ao do problema maior, mas tamb´em pela possibilidade de que o pr´oprio

tempo seja discreto (quest˜ao complicada).

E razo´avel tamb´em especular que

o problema real com espa¸co de estados continuo possa ser aproximado por

um com espa¸co de estados discreto.

Inicialmente analisamos o trabalho feito por J. Marbeau e S. Gudder em

[15], onde consideramos uma matriz de amplitude de transi¸c˜ao que tem a

forma de uma matriz de Dirichlet. Tais matrizes geram um an´alogo discreto

da amplitude de Feynman cont´ınua. Depois, calculamos a distribui¸c˜ao de

probabilidade para estas cadeias.

A seguir, estaremos interessados em ferramentas que permitam descre-

ver outros processos, ditos discretos ou quase-discretos, seguindo a descri¸c˜ao

dada em [16]. Vamos considerar uma medida complexa sobre um espa¸co,

onde tamb´em deﬁniremos certos tipos de medi¸c˜oes.

Como estamos interessados em estudar processos de natureza quˆantica,

ser´a ´util ter em mente os postulados da mecˆanica quˆantica, que s˜ao discuti-

dos com detalhe em uma formula¸c˜ao via operadores densidade. A nota¸c˜ao

de Dirac, de uso corrente em mecˆanica quˆantica, tamb´em ´e introduzida. Es-

tudaremos tamb´em as entropias de Shannon e von Neumann e analisamos a

entropia de certos processos de Markov quˆanticos.

No cap´ıtulo 6, analisamos um problema variacional para cadeias de Markov

ﬁnitas. Mais especiﬁcamente, se H denota a entropia, U ´e um potencial, e λ

´e um certo autovalor associado a U, temos o conhecido princ´ıpio variacional

para energia livre:

H(µ) −



Udµ ≤ log λ

onde vale a igualdade se e somente se µ for uma determinada medida especial

ν = ν

(U)

, que chamamos medida de Markov.

Dado este teorema para cadeias de Markov (reais), podemos nos per-

guntar se existe algum an´alogo para cadeias quˆanticas. Neste trabalho, n˜ao

propomos uma solu¸c˜ao para esse problema, mas fornecemos algumas ferra-

mentas que podem ajudar na sua resolu¸c˜ao.

Na literatura, uma cadeia de Markov quˆantica normalmente est´a asso-

ciada a uma importante constru¸c˜ao via ´algebra de operadores, devida a L.

Accardi ([1], veja tamb´em [30]). Nossa abordagem inicial difere bastante de

tal contexto, mas no cap´ıtulo 7 faremos uma breve introdu¸c˜ao `as cadeias

quˆanticas, fazendo uso de C

∗

-´algebras.

1.1 Sobre medi¸c˜oes em um sistema quˆantico

Em processos estoc´asticos, estamos interessados nos resultados obtidos por

uma fam´ılia, ou seq¨uˆencia, de fun¸c˜oes mensur´aveis. Podemos considerar, por

exemplo, que o processo representa o resultado de se jogar uma moeda um

n´umero arbitr´ario de vezes, ou ent˜ao a quantidade de chamadas telefˆonicas

em um certo intervalo de tempo, ou mais geralmente, um fenˆomeno tal que

sua evolu¸c˜ao depende da probabilidade de ocorrˆencia de um determinado

evento. Tais problemas fazem parte de uma quantidade consider´avel de

pesquisa em matem´atica.

Como a mecˆanica quˆantica possui um car´ater probabilistico, ´e natural

perguntar de que forma podemos descrever o movimento de uma part´ıcula

microsc´opica nos moldes de um processo estoc´astico. Veremos que a mecˆanica

quˆantica imp˜oe restri¸c˜oes severas quanto a evolu¸c˜ao dos objetos que descreve.

Dito de maneira geral, estaremos interessados em operadores que fornecem

amplitudes de transi¸c˜ao. No caso discreto, isso signiﬁca considerar ma-

trizes unit´arias agindo sobre os vetores estados que descrevem a evolu¸c˜ao das

part´ıculas; no caso cont´ınuo, isso signiﬁca que a evolu¸c˜ao de tal vetor estado

satisfaz a equa¸c˜ao de Schr¨odinger:

i

d|ψ

= H|ψ

No entanto, descrever fenˆomenos quˆanticos ´e um problema substancial-

mente mais dif´ıcil do que modelar problemas cl´assicos. A id´eia de realizar

uma seq¨uˆencia de medi¸c˜oes sobre um el´etron, como em um experimento co-

mum com objetos macrosc´opicos, ´e no m´ınimo problem´atica. Surge ent˜ao a

necessidade de se construir um formalismo de interferˆencia entre medi¸c˜oes.

Uma parte importante de nosso trabalho consistir´a da constru¸c˜ao matem´atica

dessa id´eia. Aqui X

vai descrever a evolu¸c˜ao temporal de amplitude quˆantica

de um sistema. O processo X

, t ∈ N, vai tomar valores num conjunto ﬁnito

S = {0, 1, ..., n − 1}.

E natural tentar encontrar um ”setting quˆantico sobre um conjunto de

estados S = {0, 1, ..., n−1}” que seja de alguma forma semelhante ao ”setting

probabil´ıstico sobre um conjunto de estados S = {0, 1, ..., n − 1}”. Neste

´ultimo caso, se analisa P (X

= s) ∈ [0, 1], onde X

´e um processo estoc´astico e

s ∈ S. Sendo assim, se espera que no primeiro ”setting”intervenha de alguma

forma uma medida complexa A e se deseja entender a evolu¸c˜ao A(X

= s) ∈

C, onde X

´e um processo estoc´astico e s ∈ S. Vamos assumir que de alguma

forma natural a hip´otese markoviana apare¸ca no problema. Desejamos que

uma matriz A, do tipo n por n, descreva a ”amplitude de transi¸c˜ao”. Como

veremos, neste formalismo nos deparamos com o conceito de interferˆencia e

com a quest˜ao do futuro (eventualmente poder) interferir no passado, o que

nos parece indesejado (embora talvez ﬁsicamente poss´ıvel).

Dois resultados importantes que veremos nesse sentido s˜ao:

Teorema 1 Em uma N-cadeia quˆantica {X

}, X



n˜ao interfere em X

, para

todo 0 ≤ t ≤ t



≤ N.

Teorema 2 Se (X

)

t∈T

´e unit´ario ent˜ao X

n˜ao interfere em X

para s ≤ t.

Em outras palavras, estes teoremas nos dizem que o futuro n˜ao inter-

fere no passado. Esta ´e uma propriedade desej´avel da teoria que iremos

desenvolver. O primeiro teorema se refere a um sistema discreto, e o outro

a sistema cont´ınuos ou quase-discretos. Provaremos estes dois teoremas no

pr´oximo cap´ıtulo. A mecˆanica quˆantica, como teoria f´ısica (ou matem´atica)

da natureza, ´e incompleta e desaﬁa muitas das caracter´ısticas que conside-

ramos senso comum no mundo cl´assico. Iremos explorar apenas algumas

propriedades de tal teoria.

Em geral, n˜ao iremos discutir a validade experimental implicada pelo

formalismo matem´atico que discutiremos aqui, mas em alguns casos parti-

culares importantes, como os sistemas descritos pelas matrizes de Dirichlet

que veremos no pr´oximo cap´ıtulo, sabemos que existe tal conﬁrma¸c˜ao com a

realidade (as matrizes de Dirichlet s˜ao um an´alogo discreto das amplitudes

de Feynman calculadas em eletrodinˆamica quˆantica (QED)).

Cap´ıtulo 2

Cadeias de Markov quˆanticas

2.1 Introdu¸c˜ao

Nesta se¸c˜ao consideramos apenas t ∈ N e S = {0, 1, 2..., n − 1}. O

grupo das transforma¸c˜oes lineares unit´arias B, agindo sobre C

´e dito grupo

unit´ario de ordem n. A evolu¸c˜ao de um sistema quˆantico ´e descrita pela

a¸c˜ao de t no grupo unit´ario, denotada por U(t), onde t ∈ N ´e um parˆametro

temporal. Este semigrupo indexado por t ∈ N pode ser usado para calcular o

estado do sistema em qualquer tempo dado, bem como encontrar amplitudes

de transi¸c˜ao.

Suponha que temos um operador unit´ario U em um espa¸co de Hilbert

(sobre os corpo de escalares complexos) H de dimens˜ao n que gera um grupo

unit´ario discreto U(t) = U

, t ∈ N. Dizemos que se o sistema encontra-se no

estado ψ em um certo tempo ent˜ao φ, U(t)ψ ´e a amplitude de transi¸c˜ao do

estado ψ para o estado φ ap´os t unidades de tempo. Se ψ

, j = 0, 1, . . . , n −1

´e uma base ortonormal para H, deﬁnimos a n × n matriz de amplitude de

transi¸c˜ao A relativa a esta base por A

= ψ

, Uψ

.

E claro que A ´e

uma matriz unit´aria (e possivelmente com entradas complexas) A

, onde

j, k ∈ S. Ent˜ao no nosso caso, identiﬁcamos U = A e H = C

. Esta de-

scri¸c˜ao simples da mecˆanica quˆantica ser´a suﬁciente para o que estudaremos

neste cap´ıtulo. Iremos formular mais precisamente o que entendemos por

um sistema quˆantico no cap´ıtulo 4, quando considerarmos os postulados da

mecˆanica quˆantica.

Como temos uma interpreta¸c˜ao probabil´ıstica desta cadeia, podemos per-

guntar se ela est´a associada a um processo estoc´astico que gera estas ampli-

tudes de transi¸c˜ao. A resposta ´e aﬁrmativa, e as fun¸c˜oes X

do processo

podem ser interpretadas como observa¸c˜oes quˆanticas, ou como chamaremos,

medi¸c˜oes. Como a matriz A ´e unit´aria, dizemos que X

´e um processo

unit´ario; queremos, al´em disso, que os processos considerados tenham a pro-

priedade de Markov. Para que isso ocorra, A n˜ao deve ser apenas unit´aria,

mas tamb´em estoc´astica. Diremos que X

satisfazendo a isto ´e uma cadeia

quˆantica.

2.2 N-cadeias quˆanticas

Um aspecto essencial da teoria quˆantica ´e o conceito de interferˆencia. Um

observador que realiza uma medi¸c˜ao em um sistema ir´a em geral modiﬁc´a-lo.

Ainda, distintas possibilidades (e probabilidades) interferem uma nas outras.

Come¸caremos descrevendo matematicamente o que signiﬁca interferˆencia en-

tre eventos e suas medi¸c˜oes. Consideramos inicialmente uma medida com-

plexa A denominada amplitude. Esta medida ser´a usada posteriormente para

medir probabilidades (do mesmo modo como uma medida em uma cadeia de

Markov cl´assica).

Seja Ω = S (ou, ent˜ao Ω = S

, onde N ∈ N est´a ﬁxo) que chamaremos

espa¸co amostral. Os elementos w de Ω s˜ao ditos pontos amostrais e cada

ponto representa uma determinada conﬁgura¸c˜ao de um sistema f´ısico. Seja

Λ uma σ-´algebra ﬁxada de subconjuntos de Ω e seja A: Λ → C uma medida

complexa com A(Ω) =



Ω

dA = 1. Quando Ω = S , ent˜ao Λ ´e a sigma-

algebra gerada pelos cilindros, ou seja, a sigma-algebra de Borel. Para ∆ ∈

Λ, o n´umero complexo A(∆) =



∆

dA ´e dito amplitude quˆantica (ou

amplitude de transi¸c˜ao, ou amplitude de probabilidade) do evento ∆ ∈ Λ.

Assumimos acima que A ´e σ-aditiva, e tal propriedade ser´a necess´aria na

prova de alguns teoremas, como por exemplo na proposi¸c˜ao (2.2.3).

A probabilidade P de que um evento ∆ ∈ Λ ocorra ´e deﬁnida por

P (∆) := |A(∆)|

Observa¸c˜ao Em geral, P = |A|

n˜ao ´e uma probabilidade no sentido

de teoria da medida se supormos que A ´e uma medida complexa. O motivo

´e que a σ-aditividade n˜ao vale em geral: para C

, C

conjuntos disjuntos,

P (C

∪ C

) = |A(C

∪ C

= |A(C

) + A(C

= |A(C

+ |A(C

+ 2Re(A(C

)A(C

))

Os dois primeiros termos da ´ultima igualdade fornecem o resultado cl´assico

e o ´ultimo ´e um termo de interferˆencia, que contribui com uma soma ou

subtra¸c˜ao `a parte cl´assica (veja tamb´em a se¸c˜ao 3.2). Um lema b´asico (e

negativo) relacionado com esta quest˜ao ´e o seguinte (o leitor pode omitir a

demonstra¸c˜ao numa primeira leitura):

Lema 2.2.1 Seja Ω = {1, 2, 3} , Λ uma σ-´algebra de subconjuntos de Ω,

A : Λ → C, A = µ

+ iµ

uma medida complexa, onde µ

, µ

: Λ → R

s˜ao medidas com sinal. Ent˜ao P : Λ → R, P = |A|

´e uma medida real

aditiva (sobre os cilindros de tamanho 1) se e somente se pelo menos um dos

cilindros 1, 2, 3 ∈ Λ (mas n˜ao todos),

1 :=

{

∈

Ω :

= (

, ω

, . . .

)

, ω

= 1

}

2 := {ω ∈ Ω : ω = (ω

, ω

, . . .), ω

= 2}

3 := {ω ∈ Ω : ω = (ω

, ω

, . . .), ω

= 3}

tem medida nula (i.e., A(1) = 0 ou A(2) = 0 ou A(3) = 0).

Prova Como A ´e medida, vale a aditividade para os conjuntos disjuntos

1 e 2:

P (1 ∪ 2) = |A(1 ∪ 2)|

= |A(1) + A(2)|

Como A(1), A(2) ∈ C,

|A(1) + A(2)|

= |A(1)|

+ |A(2)|

+ 2Re(A(1)A(2)) (2.1)

e portanto,

P (1 ∪ 2) = P (1) + P (2) ⇔ Re(A(1)A(2)) = 0.

Mas

Re(A(1)A(2)) = 0 ⇔ µ

(1)µ

(2) + µ

(1)µ

(2) = 0

e analogamente para os pares de cilindros 1, 3 e 2, 3:

Re(A(1)A(3)) = 0 ⇔ µ

(1)µ

(3) + µ

(1)µ

(3) = 0

Re(A(2)A(3)) = 0 ⇔ µ

(2)µ

(3) + µ

(2)µ

(3) = 0

Temos o sistema







(1)µ

(2) + µ

(1)µ

(2) = 0

(1)µ

(3) + µ

(1)µ

(3) = 0

(2)µ

(3) + µ

(2)µ

(3) = 0

Suponha que a medida de um dos cilindros seja n˜ao nula, digamos a do

cilindro 1. Ent˜ao ao menos µ

(1) = 0 ou µ

(1) = 0. Suponha sem perda

de generalidade que µ

(1) = 0. Da´ı, a primeira e a segunda equa¸c˜ao nos

fornecem

(2) = −

(1)µ

(2)

(1)

, µ

(3) = −

(1)µ

(3)

(1)

Substituindo essas express˜oes na terceira equa¸c˜ao, temos

(2)µ

(3) +

(1)µ

(2)

(1)

(1)µ

(3)

(1)

= 0 ⇔

⇔ µ

(2)µ

(3)



1 +

(1)



= 0

Logo, µ

(2)=0 ou µ

(3) = 0. Se µ

(2) = 0 ent˜ao µ

(2) = 0 pois

(2) = −

(1)µ

(2)

(1)

= 0

Se µ

(3) = 0 ent˜ao µ

(3) = 0 pois

(3) = −

(1)µ

(3)

(1)

= 0.

Portanto, em qualquer caso, um dos cilindros b´asicos deve ter medida nula.



A demonstra¸c˜ao deste lema vale para qualquer espa¸co mensur´avel que

admita uma cobertura ﬁnita.

Vamos fazer agora a constru¸c˜ao de N-cadeias quˆanticas. Come¸camos com

o conceito de medi¸c˜ao.

Deﬁni¸c˜ao Seja S = {s

, s

, . . . , s

} um conjunto ﬁnito e seja X : Ω → S.

Dizemos que X ´e uma medi¸c˜ao se X

−1

) ∈ Λ, j = 0, . . . , n − 1, ou seja,

que X ´e mensur´avel.

Note que se P e probabilidade sobre Ω ent˜ao:



P (X

−1

)) = 1 onde

−1

) ´e o conjunto de eventos que produzem o resultado s

Usaremos a nota¸c˜ao [X = s

] para o conjnto X

−1

). Ainda, P(X =

) = P (X

−1

)).

A menos que seja especiﬁcado, podemos supor que Ω = S

para algum

N ou ent˜ao Ω = S .

Nota¸c˜ao Escreveremos

···a

:= {ω ∈ Ω|X

(ω) = a

, X

(ω) = a

, . . . , X

(ω) = a

onde a

∈ S para todo j ∈ {0, 1, 2..., t}. Com esta nota¸c˜ao, podemos aplicar

a σ-aditividade de A para escrever

A[X

= s

] = A





,...i

t−1

···s

t−1





,...i

t−1

A[s

···s

t−1

]

Outra nota¸c˜ao que usaremos ´e i(t) := i

Deﬁni¸c˜ao Dizemos que a seq¨uˆencia {X

}, 0 ≤ t ≤ N, com X

: Ω →

S e com todas as medi¸c˜oes sobre o mesmo conjunto de resultados S =

, . . . , s

n−1

}, ´e uma N-cadeia se, para todo t = 1, . . . , N e

j(1)

, s

j(2)

, . . . , s

j(t−1)

, s

j(t)

temos

A[X

= s

j(t)

, X

t−1

= s

j(t−1)

, ···, X

= s

j(1)

] = 0

onde s

j(k)

s˜ao eventos que ocorrem no tempo k.

Observa¸c˜ao Em [15], a deﬁni¸c˜ao de N-cadeia inclui ainda a seguinte

condi¸c˜ao:

= s

] = Ω

ou seja, temos um certo estado inicial ﬁxado s

. Em geral n˜ao vamos supor

que essa condi¸c˜ao vale.

A partir de agora as medi¸c˜oes X

: Ω = S

→ S serˆao sempre da forma

(w) = w

, onde w = (w

, w

, .., w

) ∈ S

Ou ent˜ao, X

: Ω = S → S serˆao sempre da forma

(w) = w

, onde w = (w

, w

, .., w

, ...) ∈ S .

Deﬁni¸c˜ao A amplitude do evento ∆

condicionada ao evento ∆

´e

A(∆

|∆

) :=

A(∆

∩ ∆

)

A(∆

)

se A(∆

) = 0 e vale 0 caso contr´ario.

Deﬁni¸c˜ao Uma N-cadeia {X

} ´e homogˆenea no tempo se

A[X

t+1

= s

] = A[X

= s

]

para todo j, k = 1, . . . , n − 1 e t = 1, 2, . . . N − 1.

Deﬁni¸c˜ao Fixada uma medida complexa A, uma N-cadeia {X

} homo-

genea no tempo ´e uma cadeia de Markov se

A[X

t+1

= s

j(t)

, X

t−1

= s

j(t−1)

, ···, X

= s

j(1)

] = A[X

t+1

= s

j(t)

]

para todo t = 1, . . . , N − 1 e j, j(t), . . . , j(1) = 0, . . . , n − 1.

A matriz A da forma n por n associada a tal medida complexa A (que

deﬁne uma cadeia de Markov homogenea no tempo X

como deﬁnida acima)

sobre Ω = S

´e dada por

= A[X

= s

i, j ∈ {0, 1, 2, ..., n − 1}.

Os conceitos an´alogos para X

: Ω = S → S, com t ∈ N, s˜ao deﬁnidos

de maneira semelhante.

Deﬁni¸c˜ao Sejam X e Y medi¸c˜oes, X : Ω → R, Y : Ω → S, R =

, . . . r

m−1

}, S = {s

, . . . , s

n−1

}. Dizemos que Y n˜ao interfere em X se,

∀j, k, j = 0, . . . , m − 1:

P [X = r

] =

n−1



k=0

P [X = r

, Y = s

]

A probabilidade do evento ∆

condicionada a ∆

´e dada por P (∆

|∆

) =

P (∆

∩ ∆

)/P (∆

), P (∆

) = 0. Dizemos que A[X

= s

] ´e a

amplitude de transi¸c˜ao do sistema do estado s

para o estado s

em uma

unidade de tempo. Interpretamos o conjugado complexo A[X

= s

]

como sendo a amplitude de transi¸c˜ao de s

para s

em −1 unidades de tempo.

Esta propriedade ser´a ´util para indicarmos que na cadeia em que estivermos

trabalhando, o sistema n˜ao pode dar saltos em acr´escimos de tempo t = 0,

ou seja, se j = k ent˜ao ela satisfaz a seguinte condi¸c˜ao:

n−1



r=0

A[X

= s

]A[X

= s

] = 0. (2.2)

Diremos que

= |A[X

= s

´e a probabilidade de transi¸c˜ao de s

para s

. Se X

n˜ao interfere em X

ent˜ao

n−1



j=0

P [X

)]

n−1



j=0

P [X

), X

)] = 1

ou seja, dado um estado ﬁxo s

em t = 1, as somas das probabilidades de

transi¸c˜ao para qualquer outro estado vale 1. Logo, dizer que X

n˜ao interfere

em X

signiﬁca que para qualquer s

ﬁxado

n−1



j=0

P [X

= s

] = 1 (2.3)

Deﬁni¸c˜ao Uma N-cadeia ´e unit´aria se X

n˜ao interfere em X

(o que

implica



= 1) e se satisfaz a equa¸c˜ao (2.2).

Deﬁni¸c˜ao Uma N-cadeia homogˆenea no tempo, unit´aria e Markov ´e

chamada N-cadeia quˆantica.

Conceitos similares podem ser considerados para o caso de Ω = S e X

Ω → S, medi¸c˜oes com t ∈ N. Neste caso ter´ıamos uma N-cadeia quˆantica,

ou, cadeia quˆantica para simpliﬁcar.

A matriz A da forma n × n com entradas

= A[X

= s

]

´e a matriz de amplitude quˆantica de transi¸c˜ao para {X

}. Desta

maneira, a evolu¸c˜ao do processo ﬁca determinada por uma matriz A com

valores complexos. Associada a esta matriz temos uma matriz estoc´astica P

real. Examinemos com mais detalhes as propriedades da matriz de ampli-

tude.

Primeiro, A ´e uma matriz unit´aria, pois da equa¸c˜ao (2.2),



= 0 se j = k; se j = k, temos pela equa¸c˜ao (2.3) (que ´e v´alida

neste caso pois estamos supondo que {X

} ´e N-cadeia quˆantica, e portanto

n˜ao interfere em X

), que



|A[X

= s

= 1.

Segundo, pela deﬁni¸c˜ao de N-cadeia, temos que os valores A

s˜ao difer-

entes de zero, j, k = 0, . . . , n − 1.

Terceiro, A

´e uma matriz coluna-estoc´astica, pois



A[X

= s

]



A[X

= s

, X

= s

] = 1.

Observe que a primeira propriedade que citamos vale para qualquer N-

cadeia unit´aria, e as outras duas valem para qualquer N-cadeia. Em resumo,

A descreve a evolu¸c˜ao com probabilidades complexas (ondulat´oria) e P ´e a

evolu¸c˜ao correspondente com probabilidades reais.

Resumindo, mostramos que a cada N-cadeia quˆantica corresponde uma

matriz estoc´astica, unit´aria e com entradas n˜ao nulas. Reciprocamente, toda

matriz n × n com essas propriedades ´e a matriz de amplitude de transi¸c˜ao

de uma N-cadeia quˆantica [15]. De fato:

Observa¸c˜ao O processo acima pode se revertido a partir de uma matriz

complexa A do tipo n por n que seja estoc´astica e unit´aria. Dada a matriz

A, temos uma maneira natural de deﬁnir a medida de amplitude complexa

A sobre S . Isso ´e an´alogo ao que ´e feito no caso real [36]. Seja

−→

p =

, . . . , p

n−1

) uma distribui¸c˜ao de probabilidade inicial, isto ´e, um vetor tal

que p

+···+p

n−1

= 1. Podemos deﬁnir uma probabilidade sobre os cilindros

de S = {s

, . . . , s

n−1

} por

A(a

···a

) = A

t−1

t−2

···A

(

−→

p )

Isto deﬁne a medida complexa sobre toda a σ-´algebra gerada pelos cilin-

dros, pelo teorema da extens˜ao de Kolmogorov. Esta A ´e sigma aditiva.

Chamamos A de medida complexa de Markov.

Seja agora X

: S → S, onde X

(w) = w

, e w = (w

, w

, .., w

, ...), com

t ∈ N.

E f´acil ver que X

, t ∈ N, e A satisfazem a hip´otese de ser uma cadeia

quˆantica.

−→

p ´e tal que A

−→

p =

−→

p , ent˜ao o processo X

ser´a A- estacion´ario, ou

seja,

A(X

= a

, X

= a

, ...X

= a

) = A(X

= a

, X

= a

, ..., X

= a

)

para todos t ≥ 0, e 0 ≤ t

< t

< .. < t

, e a

, a

, ..., a

∈ S .

Teorema 2.2.2 Em uma N-cadeia quˆantica {X

}, X



n˜ao interfere em X

para todo 0 ≤ t ≤ t



≤ N. Em outras palavras, o futuro n˜ao interfere no

passado.

Prova Usaremos a nota¸c˜ao j(t) := j

. Podemos assumir que t ≥ 1. Pela

propriedade de Markov e pela estacionariedade, temos:

A[X

−1

) ∩ X

−1



)]



j(1),...,j(t



−1)

A[X

−1



) ∩ X

−1



−1

j(t



−1)

) ∩ ··· ∩ X

−1

) ∩ ··· ∩ X

−1

j(1)

)]



j(1),...,j(t



−1)

A[X

−1



−1

j(t



−1)

) ∩ ··· ∩ X

−1

j(1)

)]A[X

−1



)|X

−1



−1

j(t



−1)

)]



j(t



−1)

A[X

−1

) ∩ X

−1



−1

j(t



−1)

)]A

kj(t



−1)

(2.4)

Iterando esta equa¸c˜ao obtemos

A[X

−1

) ∩ X

−1



)]



j(t



−1)



j(t



−2)

A[X

−1

) ∩ X

−1



−2

j(t



−2)

)]A

kj(t



−1)

j(t



−1)j(t



−2)



j(t



−2)

A[X

−1

) ∩ X

−1



−2

j(t



−2)

)]A

kj(t



−2)

= ···

= ··· =



j(t)

A[X

−1

) ∩ X

−1

j(t)

)](A



−t

)

kj(t)

= A[X

−1

)](A



−t

)

Como A ´e unit´aria, A



−t

tamb´em ´e, e portanto



P [X

−1

) ∩ X

−1



)] = P [X

−1

)]





−t

= P [X

−1

)]

o que conclui a prova.



Note que no ´ultimo passo da demonstra¸c˜ao ﬁca clara a importˆancia da

matriz A ser unit´aria: esse fato ´e essencial para garantir a n˜ao interferˆencia

entre as medi¸c˜oes da N-cadeia. Note que podemos analisar uma teoria de

amplitudes associadas a matrizes complexas estoc´asticas, sem levar em conta

a unitariedade das matrizes, mas nesse caso a demonstra¸c˜ao que ﬁzemos do

teorema acima n˜ao ´e v´alida.

Suponha uma N-cadeia {X

} com matriz de amplitude de transi¸c˜ao A =

(A)

, j, k ∈ S. A amplitude e a distribui¸c˜ao dos estados s

, s

, . . . s

n−1

∈

S no tempo t = 0, . . . , N s˜ao dados, respectivamente, por

−→

= (A[X

= s

], . . . , A[X

= s

n−1

]) ∈ C

que ´e um vetor unit´ario (ou seja,



|A|

= 1) e

(k) = P [X

= s

] = |A[X

= s

= |(

−→

)

Teorema 2.2.3 Em uma N-cadeia quˆantica {X

−→

= A

−→

p(X

= k) = P

(k) = |(A

−→

)

. (2.5)

Prova Por ser uma cadeia de Markov e pela homogeneidade, temos

A[X

−1

) ∩ X

−1

t−1

j(t−1)

) ∩ ··· ∩ X

−1

j(0)

)]

= A[X

−1

t−1

j(t−1)

) ∩ ··· ∩ X

−1

j(0)

)]A[X

−1

)|X

−1

t−1

j(t−1)

)]

= A

kj(t−1)

A[X

−1

t−1

j(t−1)

) ∩ ··· ∩ X

−1

j(0)

)]

= A

kj(t−1)

j(t−1)j(t−2)

···A

j(2)j(1)

A[X

−1

j(1)

)|X

−1

j(0)

)]

= A

kj(t−1)

j(t−1)j(t−2)

···A

j(1)j(0)

(

−→

)

j(0)

Portanto,

(

−→

)

= A[X

= s

]



j(t−1),...,j(0)

kj(t−1)

j(t−1)j(t−2)

···A

j(1)j(0)

(

−→

)

j(0)

= (A

−→

)

Segue que

−→

= A

−→

e que P

(k) = |(A

−→

)



Este teorema ilustra o fato de que temos dois sistemas evoluindo com

o tempo em paralelo: um complexo dado por A

−→

e outro real dado por

−→

. O sistema deﬁnido por P ´e a cadeia de Markov cl´assica e o deﬁnido

por A ´e a cadeia de Markov quˆantica.

Uma maneira mais simples de se obter a evolu¸c˜ao da cadeia quˆantica

´e atrav´es dos autovalores e autovetores de A. Desta forma obtemos uma

express˜ao expl´ıcita para o c´alculo de probabilidades P (X

= k).

Sejam λ

, . . . , λ

n−1

autovalores (possivelmente repetidos) de uma matriz

unit´aria A e seja ψ

, . . . , ψ

n−1

a base ortonormal de autovetores correspon-

dente. Como ´e feito em [15], supondo que

−→

= (1, 0, . . . , 0), temos:

−→

= A





−→

, ψ

ψ



(ψ

)



(ψ

)

E da equa¸c˜ao (2.5), obtemos

(k) = |



(ψ

)

(ψ

)

. (2.6)

Usaremos esta express˜ao para calcular probabilidades de transi¸c˜ao, mas

em alguns exemplos iremos considerar o caso geral em que

−→

´e qualquer.

2.3 Matrizes de Dirichlet

Nesta se¸c˜ao vamos exibir uma grande classe de matrizes A satisfazendo a

hip´otese de ser matriz quˆantica.

Deﬁni¸c˜ao Sejam n, a inteiros positivos, (n, a) = 1. A matriz de Dirichlet

M(n, a) ´e a matriz n × n com entradas

√

iπa(j−k)

, j, k = 0, 1, . . . , n − 1

E poss´ıvel mostrar que M(n, a) gera um an´alogo discreto da amplitude de

Feynman para uma part´ıcula livre, e que se n → ∞, esse an´alogo se aproxima

da amplitude de Feynman.

Queremos saber quando a matriz M(n, a) ´e unit´aria. Precisamos do

seguinte lema, cuja prova ´e imediata.

Lema Dois inteiros positivos n e a s˜ao relativamente primos se e somente

se al = nm, para quaisquer inteiros l, m, com 0 < |l| < n.

Teorema A matriz M(n, a) ´e unit´aria se e somente se n e a s˜ao relativa-

mente primos.

-Prova Como

n−1



k=0

= 1

para j = 0, . . . n − 1, ´e claro que M(n, a) ´e unit´aria se e somente se

n−1



k=0



= 0

para j = j



. Nesse caso, temos

n−1



k=0



n−1



k=0

exp



iπa

[(j − k)

− (j



− k)

]



= e

iπa(j

−j

2

)/n

n−1



k=0

i2πa(j



−j)k/n

Se n e a s˜ao relativamente primos temos, aplicando o lema, que a soma

geom´etrica na ´ultima express˜ao satisfaz

n−1



k=0



i2πa(j



−j)/n



1 − e

i2πa(j



−j)

1 − e

i2πa(j



−j)/n

= 0

e portanto M(n, a) ´e unit´aria. Se n e a n˜ao s˜ao relativamente primos ent˜ao

pelo lema, existe j = j



tal que a(j −j



) = nm para algum inteiro m. Nesse

caso, a s´erie geom´etrica tem soma n e portanto M(n, a) n˜ao ´e unit´aria, o que

conclui a prova.



Deﬁni¸c˜ao A soma de Dirichlet ´e dada por

S(n, a) =

n−1



j=0

iπaj

A distribui¸c˜ao de probabilidades gerada pela matriz de Dirichlet depende

da paridade de na. O seguinte lema ilustra o problema.

Lema 2.3.1 1. Se na ´e par ent˜ao

n−1



j=0

iπa(j−k)

= S(n, a), 0 ≤ k ≤ 2n − 2

2. Se na ´e ´ımpar ent˜ao

n−1



j=0

iπa(j−k−1/2)

S(4n, a), 0 ≤ k ≤ 2n − 2

Prova 1. Primeiro suponha que j ≤ n − 1. Ent˜ao

S :=

n−1



k=0

iπa(k−j)

j−1



k=0

iπa(k−j)

n−1



k=j

iπa(k−j)

Fazendo r = j −k no primeiro somat´orio e r = n−k +j no segundo, obtemos

S =



r=1

iπar



r=j+1

iπa(n−r)

Como na ´e par, obtemos

S =



r=1

iπar

n−1



r=0

iπar

= S(n, a)

A seguir, suponha que n ≤ j ≤ 2n − 2. Ent˜ao j = n + r para algum inteiro

0 ≤ r ≤ n − 2. Novamente, como na ´e par, temos

S =

n−1



k=0

iπa(k−n−r)

n−1



k=0

iπa(k−r)

Mas este ´ultimo somat´orio ´e igual a S(n, a) pelo resultado anterior.

2. Considere a soma

T :=

4n−1



k=0

iπa(k−2j)

/4n

Vale que T ´e a soma de suas somas parciais T = U + E, onde

U :=



k=1

iπa(2k−1−2j)

/4n

E :=

2n−1



k=0

iπa(2k−2j)

/4n

Podemos escrever E como

E =

n−1



k=0

iπa(k−j)

2n−1



k=n

iπa(k−j)

Fazendo r = k −n no segundo somat´orio e usando o fato de que na ´e ´ımpar,

obtemos

2n−1



k=n

iπa(k−j)

n−1



r=0

iπa(r+n−j)

= −

n−1



r=0

iπa(r−j)

Portanto, E = 0. Como

iπa(4n−1−2j)

/4n

= e

iπa(1+2j)

/4n

temos

U =

n−1



k=0

iπa(2k−1−2j)

/4n

2n−1



k=n

iπa(2k−1−2j)

/4n

Novamente, fazendo r = k −n no segundo somat´orio e usando o fato de que

na ´e ´ımpar, obtemos

2n−1



k=n

iπa(2k−1−2j)

/4n

n−1



r=0

iπa(2r+2n−1−2j)

/4n

n−1



r=0

iπa(2r−1−2j)

/4n

Segue que

T = U = 2

n−1



k=0

iπa(k−j−1/2)

Mas como 4na ´e par, segue da parte 1 que T = S(4n, a).



Uma conseq¨uˆencia deste lema ´e que se na ´e par ent˜ao a soma das linhas e

das colunas de M(n, a) vale n

−1/2

S(n, a); al´em disso, ´e mostrado em [15],[17]

que |S(n, a)| = n

1/2

. Podemos concluir da´ı que a matriz

A = M



(n, a) =

S(n, a)

√

M(n, a)

´e estoc´astica. Ela tamb´em tem entradas n˜ao nulas e ´e unit´aria.

Desta forma obtemos uma grande classe de matrizes A satisfazendo o que

foi exigido anteriormente. Por exemplo, vamos supor n = 4, a = 1. Ent˜ao

iπ(j−k)

, j, k = 0, . . . , 3

1) = 1 +

iπ/4

−

1 +

iπ/4

= 2

iπ/4

Da´ı, a matriz M



´e

A = M



(4, 1) =

−iπ/4







1 e

iπ/4

−1 e

iπ/4

1 e

iπ/4

−1

−1 e

iπ/4

1 e

iπ/4

−1 e

iπ/4







Entretanto, se na ´e ´ımpar ent˜ao a matriz de Dirichlet n˜ao pode se tornar

estoc´astica desta forma. Por exemplo, se n = 3 e a = 1, temos:

M(3, 1) =

√





1 e

iπ/3

iπ4/3

iπ/3

1 e

iπ/3

iπ4/3

iπ/3





A soma da primeira e terceira colunas difere da segunda e ent˜ao nenhum

m´ultiplo de M(3, 1) pode se tornar estoc´astica.

Para que possamos usar a equa¸c˜ao (2.6) obtida na se¸c˜ao anterior, pre-

cisamos dos autovalores e autovetores de M(n, a).

Teorema 2.3.2 1. Se na ´e par ent˜ao, para r = 0, . . . , n −1, os autoval-

ores de M(n, a) s˜ao

= n

−1/2

S(n, a)e

−iπar

e uma base ortonormal de autovetores correspondente ´e ψ

, onde

(ψ

)

= n

−1/2

−i2πark/n

, k = 0, . . . , n − 1

2. Se na ´e ´ımpar ent˜ao, para r = 0, . . . , n − 1, os autovalores de M(n, a)

s˜ao

1/2

S(4n, a)e

−iπa(r+1/2)

e uma base ortonormal de autovetores correspondente ´e ψ

, onde

(ψ

)

= n

−1/2

−i2πa(r+(1/2))k/n

, k = 0, . . . , n − 1

Prova 1. A j-´esima coordenada de M(n, a)ψ

´e

[M(n, a)ψ

]

= n

−1/2

n−1



k=0

iπa(j−k)

−i2πark/n

Mas

−i2πarj/n

exp



iπa[(j −k)

− 2rk + 2rj]/n



= (ψ

)

−iπar

iπa(k−(j+r))

Aplicando o lema 2.3.1, item 1, obtemos

[M(n, a)ψ

]

= (ψ

)

−1/2

−iπar

n−1



k=0

iπa(k−(j+r))

= n

−1/2

S(n, a)e

−iπar

(ψ

)

= λ

(ψ

)

2. A j-´esima coordenada de M(n, a)ψ

´e

[M(n, a)ψ

]

= n

−1/2

n−1



k=0

iπa(j−k)

−iπa(2r+1)k/n

Mas

−iπa(2r+1)j/n

exp



iπa[(j −k)

− (2r + 1)k + (2r + 1)j]/n



= (ψ

)

−iπa(r+1/2)

iπa(k−(j+r+1/2))

Aplicando o lema 2.3.1, item 2, obtemos

[M(n, a)ψ

]

= (ψ

)

−1/2

−iπa(r+1/2)

n−1



k=0

iπa(k−(j+r+1/2))

−1/2

S(4n, a)e

−iπa(r+1/2)

(ψ

)

= λ

(ψ

)



Apliquemos a equa¸c˜ao acima usando o teorema anterior, e obtemos para

na par que



(ψ

)

(ψ

)

S(n, a)

t/2+1



−iπatj

−i2πajk/n

e para na ´ımpar obtemos



(ψ

)

(ψ

)

S(4n, a)

3/2



−iπat(j+1/2)

−i2πa(j+1/2)k/n

Mas como |S(n, a)| =

√

n, obtemos da equa¸c˜ao (2.6), para t > 0 e na par

que

P (X

= k) = P

(k) =



n−1



j=0

−iπa(tj+k)

/nt



, (2.7)

e para na ´ımpar que

P (X

= k) =



n−1



j=0

−iπa(t(j+1/2)+k)

/nt



(2.8)

Acima assumimos que a a matriz de transi¸c˜ao estoc´astica P ´e tal que

= |A

, para todo i, j, e ainda que o vetor de probabilidade inicial ´e a

delta de Dirac em s

, ou seja, (1, 0, 0, ...0).

Estas equa¸c˜oes nos fornecem express˜oes expl´ıcitas para P

, mas elas n˜ao

est˜ao em uma forma fechada e portanto n˜ao nos mostram muita informa¸c˜ao

sobre a dinˆamica do sistema. Faremos o trabalho t´ecnico de calcular tais

somas na pr´oxima se¸c˜ao.

2.4 Distribui¸c˜oes de Probabilidade

Agora vamos calcular as probabilidades fornecidas pelas equa¸c˜oes (2.7) e

(2.8) dadas na se¸c˜ao anterior. Vamos analisar tamb´em alguns exemplos de

outros tipos (n˜ao Dirichlet).

Nota¸c˜ao Sejam a, b inteiros. Denotaremos por a

(2)

o n´umero de vezes

em que o fator 2 aparece na decomposi¸c˜ao prima de a. Ainda, o m´aximo

divisor comum entre a e b ´e dado por (a, b).

Note que estamos usando as distribui¸c˜oes obtidas pela express˜ao (2.6)

da se¸c˜ao anterior, que foi obtida tomando como distribui¸c˜ao inicial o vetor

(1, 0, ···, 0).

Temos o seguinte teorema:

Teorema 2.4.1 Sejam n e t inteiros, com (n, t) = d, t > 0.

1. Se n ´e par, ent˜ao P (X

= k) = d/n se t

(2)

= n

(2)

e d|k, ou, se t

(2)

= n

(2)

e 2k/d ´e impar. Caso contr´ario, P (X

= k) = 0.

2. Se n ´e ´ımpar ent˜ao P (X

= k)=d/n se d|k. Caso contr´ario, P (X

k) = 0.

Prova 1. Aplicando (2.7) e o lema 2.6.1, ´ıtem 1

, temos

P (X

= k) =



d−1



m=0

(−1)

amnt/d

−i2πakm/d



n/d−1



j=0

−iaπ(tj+k)

/nt



Suponha que t

(2)

= n

(2)

. Ent˜ao nt/d

´e par, e da´ı

d−1



m=0

(−1)

amnt/d

−i2πakm/d

d−1



m=0

−i2πak/d

)

A soma geom´etrica vale d se d|k e vale 0 caso contr´ario. Suponha que t

(2)

. Ent˜ao nt/d

´e ´ımpar e da´ı

d−1



m=0

(−1)

amnt/d

−i2πakm/d

d−1



m=0

(−e

−i2πak/d

)

ver os lemas 2.6.1 e 2.6.2 no Apˆendice deste cap´ıtulo

Se 2k/d ´e um inteiro ´ımpar ent˜ao a soma geom´etrica vale d. Caso contr´ario,

temos

d−1



m=0

(−e

−i2πak/d

)

1 − (−1)

1 + e

−i2πak/d

Como t

(2)

= n

(2)

e n ´e par, temos que d ´e par e portanto a ´ultima express˜ao

vale zero. Concluimos que quando P (X

= k) n˜ao ´e zero, temos

P (X

= k) =



n/d−1



j=0

−iπa(tj+k)

/nt





−1



j=0

−iπa(t



j+1/2)

/nt



onde n



= n/d e t



= t/d. Segue que (n



, t



) = 1. Se t

(2)

= n

(2)

e d|k, vale que

nt/d

´e par e n



= ant/d

´e par. Aplicando o lema 2.6.2, parte 1 obtemos





−1



j=0

−iπa(t



j+k/d)/n





= |S(n



, at



= n



Logo,

P (X

= k) =



Se t

(2)

= n

(2)

e 2k/d ´e ´ımpar ent˜ao nt/d

´e ´ımpar e n



= ant/d

´e ´ımpar.

Fazendo 2k/d = 2µ + 1 e aplicando o lema 2.6.1, ´ıtem 2, obtemos





−1



j=0

−iπa(t



j+µ+1/2)





|S(4n



, at



= n



Novamente,

P (X

= k) =



2. Seja n ´ımpar e a par. Aplicando (2.7) e o lema 2.6.1, parte 1, obtemos

P (X

= k) como no item 1 deste teorema. Se t

(2)

= n

(2)

ent˜ao nt/d

´e par

e ent˜ao como no item 1, a s´erie geom´etrica tem soma d se d|k e vale 0 caso

contr´ario. Se t

(2)

= n

(2)

ent˜ao nt/d

´e ´ımpar. Como a ´e par, temos

d−1



m=0

(−1)

amnt/d

−i2πakm/d

d−1



m=0

−i2πak/d

)

Como antes, a s´erie geom´etrica tem soma d se d|k e vale 0 caso contr´ario.

Como no item 1, P(X

= k) = d/n quando tal valor n˜ao se anula. Final-

mente, seja na ´ımpar. Aplicando (2.8), e o lema 2.6.1, parte 2, temos

P (X

= k) =



d−1



m=0

−i2πakm/d



n/d−1



j=0

−iπa(t(j+1/2)+k)

/nt



A soma geom´etrica tem soma d se d|k e vale zero caso contr´ario. Quando

P (X

= k) n˜ao se anula, temos

P (X

= k) =





−1



j=0

−iπa(t



(j+1/2)+k/d)





onde n



= n/d e t



= t/d. Novamente, temos (n



, t



) = 1. Aplicando o lema

2.6.2, partes 3 e 4, concluimos que

P (X

= k) =





Este teorema nos fornece o fato interessante de que P (X

= k) independe

de a. Alguns corol´arios seguem a partir deste teorema.

Corol´ario 2.4.2 Temos os seguintes casos:

1. Suponha n par. Ent˜ao P (X

= k) = P (X

= k) se e somente se

(n, t) = (n, s) e t

(2)

, s

(2)

= n

(2)

ou t

(2)

= s

(2)

= n

(2)

2. Suponha n ´ımpar. Ent˜ao P (X

= k) = P (X

= k) se e somente se

(n, t) = (n, s).

Prova Seja d

= (n, t) e d

= (n, s).

E claro que a condi¸c˜ao ´e suﬁciente. Para ver que ´e necess´aria, vemos

que existe k tal que P (X

= k) = 0. Ent˜ao

= P (X

= k) = P (X

= k) =

Ent˜ao d

= d

E claro que a condi¸c˜ao ´e suﬁciente. Para ver que ´e necess´aria, suponha

que

(

) =

(

(2)



(2)

. Ent˜ao, como antes,

= P (X

= k) = P (X

= k) =

e ent˜ao d

= d

. Se s

(2)

= n

(2)

, ent˜ao como P (X

= k) = 0, temos que

2k/d ´e ´ımpar. Mas da´ı 2(k/d

) ´e ´ımpar, o que ´e uma contradi¸c˜ao. Portanto,

(2)

= n

(2)

, e portanto t

(2)

, s

(2)

= n

(2)

. Suponha que t

(2)

= n

(2)

e que 2k/d

´e ´ımpar. Ent˜ao, como antes, d

= d

. Se s

(2)

= n

(2)

, ent˜ao como P (X

k) = 0, temos que d

|k. Mas da´ı 2(k/d

) ´e ´ımpar, o que ´e uma contradi¸c˜ao.

Portanto, t

(2)

= s

(2)

= n

(2)



Dizemos que z ´e o per´ıodo de x(t) ∈ R

, t ≥ 0, se z ´e o menor inteiro

positivo tal que x(t + z) = x(t) para todo t ≥ 0. Vamos considerar assim

x(t) = (P (X

= s

), P (X

= s

), ..., P (X

= s

n−1

)) e observar que estamos

assumindo neste momento que x(0) = (1, 0, 0..., 0). Ent˜ao z ´e o per´ıodo de

x(t) se P (X

t+z

= k) = P (X

= k), para todo t e para todo k.

Corol´ario 2.4.3 Temos os seguintes casos:

1. Se n ´e ´ımpar o per´ıodo de x(t) (acima deﬁnido) ´e n.

2. Se n ´e par ent˜ao o per´ıodo de de x(t) (acima deﬁnido) ´e 2n.

Prova 1. Como (n, t) = (n, n+t), pelo corol´ario 2.4.2, vale que P (X

= k) =

P (X

t+n

= k) para cada t. O menor inteiro positivo tal que n = (n, 0) = (n, p)

´e p = n. Portanto, n ´e o menor inteiro positivo tal que P (X

= k) = P (X

k). Ent˜ao n ´e o per´ıodo de probabilidade.

2. Primeiro, (n, t) = (n, 2n + t). Suponha que t

(2)

= n

(2)

= m. Ent˜ao

t = 2

p, n = 2

q, onde p e q s˜ao ´ımpares. Portanto,

2n + t = 2

m+1

q + 2

p = 2

(2q + p)

Como 2q +p ´e ´ımpar, (2n +t)

(2)

= m. A seguir, suponha que (2n+ t)

(2)

= m.

Ent˜ao 2n + t = 2

p, n = 2

q, onde p e q s˜ao ´ımpares. Portanto,

t = 2

p = 2

m+1

q = 2

(p − 2q)

Como p−2q ´e ´ımpar, t

(2)

= m. Pelo corol´ario 2.4.2, P (X

= k) = P (X

t+2n

k) para todo t. Agora suponha que p > 0 e que P (X

= k) = P (X

= k).

Pelo corol´ario 2.4.2, n = (n, 0) = (n, p). Portanto, n|p e ent˜ao p = rn para

algum inteiro positivo r. Se r = 1 ent˜ao p

(2)

= n

(2)

, mas 0

(2)

= n

(2)

o que

contradiz o corol´ario 2.4.2. Logo, r = 1. Segue que 2n ´e o menor inteiro

positivo que satisfaz P(X

= k) = P (X

= k). Logo, 2n ´e o per´ıodo de

probabilidade.



Isso mostra que n˜ao precisamos calcular P (X

= k) para t ≥ 2n, n par e

para t ≥ n, n ´ımpar. O pr´oximo corol´ario nos diz que para n par tamb´em

n˜ao ´e necess´ario calcular P (X

= k), t ≥ n.

Corol´ario 2.4.4 Temos:

1. P (X

= k) = δ

0,k

2. Se n ´e par ent˜ao P (X

= k) = δ

n/2,k

e P (X

= k) = P (X

2n−t

= k),

0 ≤ t ≤ 2n.

Prova A prova de 1 ´e evidente. Provemos o item 2. Pelo teorema 2.4.1,

P (X

= k) = 1 se e somente se 2k/n ´e ´ımpar. Mas 2k/n ´ımpar ´e equivalente

a 2k = nr, onde r ´e ´ımpar, e ent˜ao k = (n/2)r. Como 0 ≤ k ≤ n−1, isso vale

se e somente se k = n/2. Para a segunda parte, (n, t) = (n, 2n −t). Suponha

que t

(2)

= n

(2)

= m. Ent˜ao t = 2

p, n = 2

q, onde p e q s˜ao ´ımpares. Logo,

2n − t = 2

(2q − p)

Como 2q − p ´e ´ımpar, (2n − t)

(2)

= m. A seguir, suponha que (2n − t)

(2)

= m. Por um argumento semelhante, t

(2)

= m. Pelo corol´ario 2.4.2,

P (X

= k) = P (X

2n−t

= k).



Este ´ultimo corol´ario signiﬁca que o sistema inicia em s

e que a seq¨uˆencia

de probabilidades para t = 0, 1, 2, . . . , n ´e a mesma para 2n, 2n − 1, 2n −

2, . . . , n, nesta ordem.

Lembre que assumimos at´e agora nesta se¸c˜ao que o vetor de probabilidade

inicial ´e p = (1, 0, 0, ..., 0) e n˜ao um p tal que Ap = p. Assim, com n˜ao poderia

deixar de ser, a matriz de Dirichlet (com tal vetor inicial) n˜ao determina

um Processo Estoc´astico Estacion´ario, mas sim uma seq¨uˆencia peri´odica de

probabilidades de estado.

Abaixo temos a tabela de P

(k) = P (X

= k), para n = 12.

t/k 0 1 2 3 4 5 6 7 8 9 10 11

0 1 0 0 0 0 0 0 0 0 0 0 0

1 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

2 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0

3 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0

4 0 0 1/3 0 0 0 1/3 0 0 0 1/3 0

5 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

6 1/2 0 0 0 0 0 1/2 0 0 0 0 0

7 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

8 1/3 0 0 0 1/3 0 0 0 1/3 0 0 0

9 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0

10 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0

11 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

12 0 0 0 0 0 0 1 0 0 0 0 0

13 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

14 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0

15 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0

16 1/3 0 0 0 1/3 0 0 0 1/3 0 0 0

17 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

18 1/2 0 0 0 0 0 1/2 0 0 0 0 0

19 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

20 0 0 1/3 0 0 0 1/3 0 0 0 1/3 0

21 1/4 0 0 1/4 0 0 1/4 0 0 1/4 0 0

22 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0 1/6 0

23 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12 1/12

24 1 0 0 0 0 0 0 0 0 0 0 0

Pelo corol´ario acima, para t de 13 a 24, a tabela ´e a mesma, mas em ordem

inversa. Obtemos uma seq¨uˆencia de probabilidades de per´ıodo 2n. Podemos

dizer que em um tempo t, existem certas transi¸c˜oes imposs´ıveis (i.e., P

(k) =

0 para certos k) e as que podem ocorrem, tem todas a mesma probabilidade.

Como temos um n´umero ﬁnito de estados (ou alternativamente, um n´umero

ﬁnito de vetores unit´arios que diferem de um ˆangulo constante), o n´umero

de caminhos poss´ıveis para uma part´ıcula ´e ﬁnito, e s˜ao todos igualmente

prov´aveis no in´ıcio de um processo.

Outra tabela, para n=4 (ver [17]):

t/k 0 1 2 3

0 1 0 0 0

1 1/4 1/4 1/4 1/4

2 1/2 0 1/2 0

3 1/4 1/4 1/4 1/4

4 0 0 1 0

5 1/4 1/4 1/4 1/4

6 1/2 0 1/2 0

7 1/4 1/4 1/4 1/4

8 1 0 0 0

Vamos mostrar abaixo que existem certos p ∈ C

tais que para certas

matrizes de Dirichlet A vale Ap = p.

O seguinte exemplo ´e inspirado pela moeda quˆantica que ´e descrita no

exemplo 1 da se¸c˜ao 8.2.

Exemplo Matrizes Quˆanticas A dois por dois n˜ao necessariamente do

tipo Dirichlet. Sejam u, v ∈ C tais que u + v = 1 e |u|

+ |v|

= 1. Uma

condi¸c˜ao necess´aria e suﬁciente para que essas propriedades sejam satisfeitas

´e que u = 1 − v, 0 ≤ Re(u) ≤ 1 e Im(u) = ±(Re(u))

1/2

(1 − Re(u))

1/2

Ent˜ao, vemos que o n´umero real 0 ≤ Re(u) ≤ 1 determina u e v a menos de

conjuga¸c˜ao. Por exemplo, se Re(u) = 1/2, temos u = (1±i)/2, v = (1∓i)/2.

Vamos construir uma matriz quˆantica complexa A a partir do seguinte.

Sejam u

, v

e u

, v

dois pares de n´umeros complexos tais que

+ v

= 1 , |u

+ |v

= 1

+ v

= 1 , |u

+ |v

= 1

Pelo que vimos acima, tais n´umeros tem a forma

= x

± i



(1 − x

) , v

= 1 − x

∓ i



(1 − x

)

= x

± i



(1 − x

) , v

= 1 − x

∓ i



(1 − x

)

onde x

e x

∈ [0, 1].

Seja a matriz



1 − u





± i



(1 − x

) x

± i



(1 − x

)

1 − x

∓ i



(1 − x

) 1 − x

∓ i



(1 − x

)



Observe que, com respeito aos sinais da parte imagin´aria, devemos fazer

duas escolhas independentes, ou seja, uma para a primeira coluna e outra

para a segunda. Portanto, se queremos determinar sob quais condi¸c˜oes a

matriz A ´e unit´aria, devemos resolver o sistema AA

∗

= I em quatro casos:

1. Caso (+, +), ou seja,

A =



+ i



(1 − x

) x

+ i



(1 − x

)

1 − x

− i



(1 − x

) 1 − x

− i



(1 − x

)



Resolvendo uma das equa¸c˜oes de AA

∗

= I (que ´e um sistema de duas

equa¸c˜oes independentes), conclu´ımos primeiro que x

+ x

= 1, e por-

tanto A tem a forma

A =



+ i



(1 − x

) 1 − x

+ i



(1 − x

)

1 − x

− i



(1 − x

) x

− i



(1 − x

)



E resolvendo a outra equa¸c˜ao, obtemos que x

= 0 ou 1, e portanto,

neste caso,

A =



1 0

0 1





0 1

1 0



Para a primeira matriz (identidade), o autovalor ´e 1, com autovetores

(1, 0) e (0, 1). Para a segunda, um autovalor ´e 1 com autovetor associ-

ado (1, 1) e o outro ´e −1 com autovetor 1/

√

2(−1, 1).

2. Caso (−, −), ou seja,

A =



− i



(1 − x

) x

− i



(1 − x

)

1 − x

+ i



(1 − x

) 1 − x

+ i



(1 − x

)



Aqui obtemos as mesmas solu¸c˜oes do caso 1.

3. Caso (+, −),

A =



+ i



(1 − x

) x

− i



(1 − x

)

1 − x

− i



(1 − x

) 1 − x

+ i



(1 − x

)



Resolvendo uma das equa¸c˜oes de AA

∗

= I, conclu´ımos que x

= 1,

e portanto A ´e sim´etrica da forma

A =



+ i



(1 − x

) 1 − x

− i



(1 − x

)

1 − x

− i



(1 − x

) x

+ i



(1 − x

)



A outra equa¸c˜ao ´e uma identidade e n˜ao imp˜oe restri¸c˜oes sobre x

. Um autovalor ´e 2x

− 1 + 2i



(1 − x

) com autovetor associado

√

2(1, −1) e o outro autovalor ´e 1 com autovetor 1/

√

2(1, 1).

4. O caso (−, +) ´e semelhante ao caso (+, −):

A =



− i



(1 − x

) x

+ i



(1 − x

)

1 − x

+ i



(1 − x

) 1 − x

− i



(1 − x

)



Resolvendo AA

∗

= I, temos que x

+ x

= 1, e portanto

A =



− i



(1 − x

) 1 − x

+ i



(1 − x

)

1 − x

+ i



(1 − x

) x

− i



(1 − x

)



Um autovalor ´e 2x

− 1 − 2i



(1 − x

) com autovetor associado

√

2(−1, 1) e o outro autovalor ´e 1 com autovetor 1/

√

2(1, 1).

Assim obtemos condi¸c˜oes para que as matrizes sejam unit´arias. Se x =

0, 1, temos que possuem entradas n˜ao-nulas e portanto A

´e a matriz de

amplitude de transi¸c˜ao de uma N-cadeia quˆantica. Como ﬁzemos na se¸c˜ao

de cadeias quˆanticas, vamos calcular as probabilidades de transi¸c˜ao. Para

isso, precisamos dos autovalores e autovetores de A

. Pelo que vimos nos

casos acima, podemos construir uma medida de Markov estacion´aria (vista na

se¸c˜ao 2.2) escolhendo como vetor estacion´ario o vetor associado ao autovalor

1 (que sempre ´e um autovalor para a moeda quˆantica, ao menos no caso de

ordem 2).

Observa¸c˜ao Supondo que temos um vetor de distribui¸c˜ao inicial

−→

(1, 0, . . . , 0), podemos usar a express˜ao para probabilidades

P (X

= k) = P

(k) = |



(ψ

)

(ψ

)

obtido na se¸c˜ao 2.2 para cadeias quˆanticas. Fazendo S = {s

, s

} = {0, 1} e

escrevendo P

(k) = P (f

−1

)), temos

(0) =



(ψ

)

(ψ

)

+ (ψ

)

(ψ

)



1 + λ



(1) =



(ψ

)

(ψ

)

+ (ψ

)

(ψ

)



1 − λ



Para mostrar um exemplo, observe o caso particular em que x = Re(u) =

1/2. Ent˜ao temos a matriz

A =



1 + i 1 − i

1 − i 1 + i



Os autovalores s˜ao

= i , λ

= 1

e os respectivos autovetores s˜ao

= (−

√

) , ψ

= (

√

)

Como antes, S = {s

, s

} = {0, 1}. Temos

(0) =



(ψ

)

(ψ

)

+ (ψ

)

(ψ

)



1 + i



(1) =



(ψ

)

(ψ

)

+ (ψ

)

(ψ

)



1 − i



Ent˜ao obtemos uma seq¨uˆencia peri´odica de probabilidades:

t/k 0 1

0 1 0

1 1/2 1/2

2 0 1

3 1/2 1/2

4 1 0

Observa¸c˜ao Considere o teorema cl´assico de convergˆencia de cadeias de

Markov reais:

Teorema 2.4.5 Seja P uma matriz estoc´astica (real) e regular e seja S =

{1, 2, 3, . . . , d}. Ent˜ao:

1. P tem um ´unico vetor de probabilidade ﬁxo π e os componentes de π

s˜ao todos positivos, ou seja ´e ´unico o vetor de probabilidade π tal que

Pπ = π e



s∈S

= 1 e π

> 0,∀s ∈ S.

2. Se p ´e qualquer vetor de probabilidade, ent˜ao a seq¨uˆencia de vetores

Pp, P

p, P

p, ... converge para o ponto ﬁxo π, isto ´e,

lim

n→∞

p = π.

Como conseq¨uˆencia, as entradas das matrizes P, P

, P

, . . . obtidas

a partir de P convergem para as entradas correspondentes da matriz

cujas colunas s˜ao iguais ao vetor ﬁxo π. Ou seja,

lim

n→∞







. . . π

... π







Lembramos que uma matriz estoc´astica real P ´e regular se existir alguma

potˆencia de P tal que todas as suas entradas sejam positivas.

Note que este teorema n˜ao vale, em geral, para cadeias de Markov quˆanticas

(considerando que a condi¸c˜ao de entradas positivas ´e substitu´ıda pela condi¸c˜ao

de possuir entradas n˜ao nulas). Por exemplo, considere o item 2 do teorema.

Um c´alculo simples mostra que se

A =



1 + i 1 − i

1 − i 1 + i



ent˜ao a seq¨uˆencia de matrizes (A

)

n∈

´e uma seq¨uˆencia peri´odica, e portanto

n˜ao ocorre convergˆencia para a matriz cujas colunas s˜ao o vetor estacion´ario

(1/

√

2, 1/

√

2) de A.

2.5 Alguns c´alculos

Exemplo 1: Matriz de Dirichlet Seja M(n, a) a matriz de Dirichlet,

dada por

√

iπa(j−k)

onde n ∈ N e a ∈ Z, j, k ∈ {0, . . . , n − 1}. Por (1) sabemos que M(n, a) ´e

unit´aria se e somente se n e a s˜ao relativamente primos (i.e., (n, a) = 1) e

que se o produto na for par ent˜ao tal matriz pode ser tornada estoc´astica.

Denotamos o vetor de probabilidade inicial por

−→

= (a

, ···, a

n−1

Escrevemos abaixo alguns exemplos de matrizes onde (n, a) = 1 e na par,

com os seus respectivos autovalores, autovetores e processo estoc´astico real

P associado. O processo P ´e dado pela matriz |M|

(P )

= (|M|

)

= |M

e o vetor de probabilidade inicial real associado ´e

p = |

−→

= (|a

, ···, |a

n−1

)

Se na ´e par, a renormaliza¸c˜ao



(n, a) =

S(n, a)

√

M(n, a)

´e estoc´astica, onde S(n, a) ´e a soma de Dirichlet:

S(n, a) =

n−1



j=0

iπaj

Vamos analisar os casos M(2, 1), M(3, 2) e M(4, 1) e tentar determinar

se existem autovetores complexos associados ao autovalor 1. Temos:

1. Matriz M(2, 1).

M(2, 1) =

√



1 i

i 1



No trabalho de J. Kempe [23], tal matriz ´e vista como a de uma moeda

quˆantica balanceada (p´ag. 312), onde cara e coroa s˜ao tratados da

mesma forma e o passeio n˜ao ´e inﬂuenciado pelo seu estado inicial [23].

Os autovalores e autovetores de M(2, 1) s˜ao

√

(1 − i), com autovetor (−1, 1)

√

(1 + i), com autovetor (1, 1)

Ainda,

S(2, 1) = 1 + i

e portanto,



(2, 1) =



1 − i 1 + i

1 + i 1 − i



Os autovalores e autovetores de M



(2, 1) s˜ao

−i, com autovetor (−1, 1)

1, com autovetor (1, 1)

O processo estoc´astico real associado ´e

P (2, 1) =



1 1



Os autovalores e autovetores de P (2, 1) s˜ao

0, com autovetor (−1, 1)

1, com autovetor (1, 1)

2. Matriz M(3, 2).

M(3, 2) =

√







1 −

+ i

√

−

+ i

√

−

+ i

√

1 −

+ i

√

−

+ i

√

−

+ i

√







Os autovalores e autovetores de M(3, 2) s˜ao

√

3 − i

, com autovetores (−1, 1, 0), (−1, 0, 1)

i, com autovetor (1, 1, 1)

Ainda,

S(3, 2) = i

√

e portanto,



(3, 2) = −

√







1 −

+ i

√

−

+ i

√

−

+ i

√

1 −

+ i

√

−

+ i

√

−

+ i

√







Os autovalores e autovetores de M



(3, 2) s˜ao

−

− i

√

, com autovetores (−1, 1, 0), (−1, 0, 1)

1, com autovetor (1, 1, 1)

O processo estoc´astico real associado ´e

P (3, 2) =





1 1 1





Os autovalores e autovetores de P (3, 2) s˜ao

0, com autovetores (−1, 1, 0), (−1, 0, 1)

1, com autovetor (1, 1, 1)

3. Matriz M(4, 1).

M(4, 1) =







√

(1 + i) −1

√

(1 + i)

√

(1 + i) 1

√

(1 + i) −1

−1

√

(1 + i) 1

√

(1 + i)

√

(1 + i) −1

√

(1 + i) 1







Os autovalores e autovetores de M(4, 1) s˜ao

1, com autovetores (−1, 0, 1, 0), (0, 1, 0, −1)

−

√

(1 + i), com autovetor (−1, 1, −1, 1)

√

(1 + i), com autovetor (1, 1, 1, 1)

Ainda,

S(4, 1) =

√

2(1 + i)

e portanto,



(4, 1) =

√

(1 −i)







√

(1 + i) −1

√

(1 + i)

√

(1 + i) 1

√

(1 + i) −1

−1

√

(1 + i) 1

√

(1 + i)

√

(1 + i) −1

√

(1 + i) 1







Os autovalores e autovetores de M



(4, 1) s˜ao

√

(1 − i), com autovetores (−1, 0, 1, 0), (0, 1, 0, −1)

−1, com autovetor (−1, 1, −1, 1)

1, com autovetor (1, 1, 1, 1)

O processo estoc´astico real associado ´e

P (4, 1) =







1 1 1 1







Os autovalores e autovetores de P (4, 1) s˜ao

0, com autovetores (0, 1, 0, −1), (0, 0, 1, −1), (1, 0, 0, −1)

1, com autovetor (1, 1, 1, 1)

Exemplo 2 Considere a matriz dada por



x + i



x(1 − x) 1 − x − i



x(1 − x)

1 − x − i



x(1 − x) x + i



x(1 − x)



para x ∈ (0, 1). Os autovalores e autovetores s˜ao

2x − 1 + i(2i



x(1 − x)), com autovetor (−1, 1)

1, com autovetor (1, 1)

O processo estoc´astico real associado ´e



x 1 − x

1 − x x



Os autovalores e autovetores s˜ao

2x − 1, com autovetor (−1, 1)

1, com autovetor (1, 1)

2.6 Apˆendice

Neste apˆendice provamos dois lemas t´ecnicos usados na prova do teorema

2.4.1. Esta se¸c˜ao segue [15]. Como antes, supomos que (n, a) = 1 e k =

0, . . . , n − 1.

Lema 2.6.1 Seja (n, t) = d.

1. Ent˜ao

n−1



j=0

−iπa(tj+k)

/nt

d−1



m=0

(−1)

amnt/d

−i2πakm/d

n/d−1



j=0

−iπa(tj+k)

/nt

2. Se na ´e ´ımpar ent˜ao

n−1



j=0

−iπa(t(j+1/2)+k)

/nt

d−1



m=0

−i2πakm/d

n/d−1



j=0

−iπa(t(j+1/2)+k)

/nt

Prova 1. Divida a soma S

em d partes para obter

d−1



m=0

(m+1)n/d−1



j=mn/d

−iπa(tj+k)

/nt

Deﬁnindo j = s + mn/d, obtemos

d−1



m=0

n/d−1



s=0

−iπa(t(s+mn/d)+k)

/nt

Como d|t e d

|nt, temos

−iπa(t(s+mn/d)+k)

/nt

= e

−iπa(ts+k)

/nt

(−1)

amnt/d

−i2πakm/d

e o resultado segue.

2. Novamente, separe a soma em d partes para obter

d−1



m=0

n/d−1



s=0

−iaπ(t(s+1/2)+k+mnt/d)

/nt

d−1



m=0

−iπam

nt/d

n/d−1



s=0

−iπa(t(s+1/2)+k)

/nt

−i2πam(t(s+1/2)+k)/d

Como d|t, a ´ultima exponencial ´e igual a

−iπamt/d

−i2πakm/d

= (−1)

amt/d

−i2πakm/d

Como na ´e ´ımpar, (−1)

amt/d

= (−1)

mt/d

−iπam

nt/d

= (−1)

mt/d

e portanto o produto destes dois termos vale 1. O resultado segue.



Lema 2.6.2 Seja (n, t) = 1, k = 0, . . . n − 1.

1. Se nat ´e par ent˜ao

n−1



j=0

−iπa(tj+k)

/nt

= e

−iπak

(αt−1)

/nt

S(n, at)

onde α ´e um inteiro deﬁnido por αt = 1(mod n), 0 ≤ α ≤ n − 1.

2. Se nat ´e ´ımpar ent˜ao

n−1



j=0

−iπa(tj+k+1/2)

/nt

−iπa(2k+1)

(αt−1)

/4nt

S(4n, at)

onde α satisfaz αt = 1(mod 4n), 0 ≤ α ≤ 4n − 1.

3. Se na ´e ´ımpar e t ´e par ent˜ao

n−1



j=0

−iπa(t(j+1/2)+k)

/nt

= e

−iπa((t/2+k)

−ρ

)/nt

−iπa(αt−1)

/nt

S(n, at)

onde ρ ´e o resto de 1/2 + k(mod n).

4. Se nat ´e ´ımpar ent˜ao

n−1



j=0

−iπa(t(j+1/2)+k)

/nt

−iπa(αt−1)

/nt

−iπa(αt−1)k/n

n, at

)

onde α satisfaz αt = 1(mod n), 0 ≤ α ≤ n − 1.

Prova 1. Como (n, t) = 1, pelo algoritmo euclideano existem e s˜ao ´unicos

os inteiros q e α tais que αt = 1 + qn, 0 ≤ α ≤ n − 1. Ent˜ao k = (αt − qn)k

e da´ı temos

S =

n−1



j=0

−iπa(tj+k)

/nt

n−1



j=0

−iπa((j+αk)t−qnk)

/nt

n−1



j=0

−iπat(j+αk)

−iπa(qn)

/nt

Mas (qn)

= (αt − 1)

e da´ı

S = e

−iπa(αt−1)

/nt

n−1



j=0

−iπat(j+αk)

Seja m o inteiro que satisfaz

ak = −m(mod n) , 0 ≤ m ≤ n − 1

Como nat ´e par,

−iπat(j+αk)

= e

−iπat(j−m)

Mas pelo lema 2.3.1, temos

n−1



j=0

iπat(j−m)

n−1



j=0

iπatj

= S(n, at)

para 0 ≤ m ≤ 2n − 1, o que prova o item 1.

2. A soma

S =

n−1



j=0

−iπa(tj+k+1/2)

/nt

n−1



j=0

−iπa(2tj+2k+1)

/4nt

´e uma soma parcial de

T =

4n−1



j=0

−iπa(tj+2k+1)

/4nt

Vale que 4nat ´e par e (4n, t) = 1 pois (n, t) = 1 e t ´e ´ımpar. Al´em disso,

0 ≤ 2k + 1 ≤ 4n − 1 e α satisfaz αt = 1(mod 4n), 0 ≤ α ≤ 4n −1. Segue do

item 1 que

T = e

−iπa(2k+1)

(αt−1)

S(4n, at)

Agora decompomos T em uma parte par e outra ´ımpar T = E + U onde

E =

2n−1



j=0

−iπa(tj+k+1/2)

/nt

n−1



j=0

−iπa(tj+k+1/2)

/nt

2n−1



j=n

−iπa(tj+k+1/2)

/nt

n−1



j=0

−iπa(tj+k+1/2)

/nt

n−1



j=0

−iπa(tj+k+1/2+nt)

/nt

Como nat ´e ´ımpar, o termo geral da ´ultima soma se torna

−iπa(tj+k+1/2)

/nt

Logo,

E = 2

n−1



j=0

−iπa(tj+k+1/2)

/nt

A parte ´ımpar ´e dada por

U =

2n−1



j=0

−iπa((2j+1)t+2k+1)

/4nt

Como nat ´e ´ımpar, temos que (2j + 1)t + (2k + 1) ´e par. Portanto,

2n−1



j=0

−iπa((2j+1)t+2k+1)

/4nt

n−1



j=0

−iπa((2j+1)t+2k+1+2nt)

/4nt

n−1



j=0

−iπa((2j+1)t+2k+1)

/4nt

−iπant

= −

n−1



j=0

−iπa((2j+1)t+2k+1)

/4nt

Portanto U = 0 e

n−1



j=0

−iπa(tj+k+1/2)

/nt

O resultado segue.

3. Deﬁna a soma

S =

n−1



j=0

−iπa(t(j+1/2)+k)

/nt

n−1



j=0

−iπa(tj+1/2)+k)

/nt

Como t ´e par, t/2+k ´e um inteiro e nat ´e par ent˜ao podemos usar o resultado

do item 1. Seja ρ o resto (mod n) de t/2 + k. Ent˜ao t/2 + k = ρ + µ. Segue

que

S = e

−iπaµ

/nt

−i2πaµρ/nt

n−1



j=0

−iπa(tj+ρ)

/nt

= e

−iπa(µ

+2µρ)/nt

−iπaρ

(at−1)

/nt

S(n, at)

= e

−iπa((1/2+k)

−ρ

)/nt

−iπaρ

(αt−1)

/nt

S(4n, at)

4. Deﬁna S como no item 3 e troque k por (αt − qn)k como no item 1

para obter

S =

n−1



j=0

−iπa(t(j+1/2)+αk)−qnk)

/nt

= e

−iπa(αt−1)

/nt

−iπa(αt−1)k/n

n−1



j=0

−iπat(j+1/2)+αk)

Resta calcular a soma

T =

n−1



j=0

−iπat(j+αk+1/2)

Seja m o inteiro deﬁnido por

αk + 1 = −m + sn , 0 ≤ m ≤ n − 1

Ent˜ao

j + αk +

= j −m + sn −

−iπat(j+αk+1/2)

= e

−iπat(j−(m+1/2)+sn)

= e

−iπat(j−m−1/2)

−iπats

iπats

Como nat ´e ´ımpar temos e

iπats

= (−1)

−iπats

= (−1)

Portanto,

T =

n−1



j=0

−iπat(j−m−1/2)

Aplicando o lema 2.3.1 temos

T =

S(4n, at)

e o resultado segue.



Cap´ıtulo 3

Integrais de Feynman

Algumas referˆencias b´asicas para integrais de Feynman s˜ao [12],[20]. Uma

introdu¸c˜ao informal interessante ´e [13].

3.1 O formalismo das integrais de Feynman

A mecˆanica quˆantica tradicional teve bastante ˆexito tanto no que se

refere a compreens˜ao dos fenˆomenos quˆanticos como tamb´em nas previs˜oes

num´ericas de experimentos. Ela foi substanciada por muitos experimentos

feitos em laborat´orios e por observa¸c˜oes da natureza. Entretanto, a teoria

n˜ao tem respostas para certos problemas, como por exemplo, a descri¸c˜ao de

part´ıculas elementares e suas intera¸c˜oes. Isto pode ser devido ao fato de o

conceito de amplitude de transi¸c˜ao n˜ao estar na sua base axiom´atica (embora

possa ser deduzido a partir dos postulados, este conceito n˜ao est´a na base da

teoria). Esta opini˜ao est´a de acordo com [18].

Uma tentativa de resolver este problema ´e o formalismo das integrais de

caminhos, proposto por R. Feynman (ver referˆencias em [18]). Embora este

formalismo seja uma ferramenta ´util, traz consigo alguns problemas devido

a sua natureza matem´atica n˜ao rigorosa.

Para entender este formalismo, usaremos a formula¸c˜ao lagrangiana da

mecˆanica cl´assica, que descreveremos brevemente. Suponha que temos um

sistema mecˆanico com n graus de liberdade. Diremos que C = R

´e o

espa¸co de conﬁgura¸c˜oes. Um ponto q = (q

, . . . , q

) ∈ C descreve a con-

ﬁgura¸c˜ao do sistema e ´e chamado estado lagrangiano. A dinˆamica de um

sistema ´e descrita por um caminho, ou trajet´oria q(t) = (q

(t), . . . , q

(t)),

−∞ < t < ∞ em C. Na formula¸c˜ao hamiltoniana da mecˆanica cl´assica,

um estado s(t) ´e determinado para o tempo t desde que a condi¸c˜ao inicial

s(t

) seja dada. Como veremos, o estado lagrangiano q(t), t

≤ t ≤ t

´e

determinado desde que as condi¸c˜oes de contorno q(t

), q(t

) sejam dadas.

Ent˜ao deﬁnimos as fun¸c˜oes de velocidade v

= dq

/dt, i = 1, . . . , n e fazemos

v(t) = (v

(t), . . . , v

(t)). O lagrangiano do sistema ´e deﬁnido por

L(v, q) =







− V (q).

´e a massa associada a i-´esima coordenada). Logo, L ´e a energia cin´etica

menos a energia potencial.

A a¸c˜ao sobre um caminho q(t) entre os tempos t

, t

< t

´e deﬁnida

por

S[q(t)] =



L[v(t), q(t)]dt.

Suponha que o sistema se encontra no estado lagrangiano q

no tempo t

, isto ´e, q

= q(t

), q

= q(t

). Na formula¸c˜ao lagrangiana a

trajet´oria que o sistema percorre, chamada trajet´oria cl´assica, ´e determi-

nada pelo princ´ıpio da m´ınima a¸c˜ao. Este princ´ıpio nos diz que dentre

todos os caminhos poss´ıveis de q

a q

, a trajet´oria cl´assica ˆq(t) ´e aquela onde

S[q(t)] ´e um extremo. Isto ´e, o valor de S[ˆq(t)] n˜ao se modiﬁca se o caminho

ˆq(t) ´e alterado ligeiramente.

Voltemos agora `a discuss˜ao da amplitude de Feynman. Veremos que o

formalismo destas amplitudes n˜ao leva em considera¸c˜ao apenas a trajet´oria

cl´assica ˆq(t), mas sim todas as trajet´orias. Suponha que um el´etron encontra-

se na posi¸c˜ao x

no tempo t

e ent˜ao se move, sob a inﬂuˆencia de alguma

for¸ca. Queremos calcular a probabilidade P (a, b) de que a part´ıcula esteja

em um ponto x

no tempo t

. O el´etron ir´a se mover por um dos muitos

caminhos poss´ıveis, mas n˜ao seremos capazes de distinguir uma trajet´oria de

outra sem interferir no sistema. Se ﬁzermos uma medi¸c˜ao, sabemos que seu

movimento ir´a se modiﬁcar.

Na mecˆanica quˆantica, temos que todos os caminhos poss´ıveis devem ser

considerados. Cada caminho x(t) contribui com uma amplitude φ[x(t)] para

a amplitude total K(a, b) e P (a, b) = |K(a, b)|

. Em s´ımbolos:

K(a, b) =



φ[x(t)].

onde x(t) ´e todo caminho com x(t

) = x

e x(t

) = x

. Com isso, temos que

o axioma b´asico do formalismo das integrais de caminho ´e:

(P ) φ[x(t)] = Ae

(i/ )S[x(t)]

onde

S[x(t)] =



L[v(t), x(t)]dt (3.1)

´e a a¸c˜ao para o caminho x(t), A ´e uma constante de normaliza¸c˜ao e L ´e o

lagrangiano do sistema.

Resumindo, cada caminho poss´ıvel contribui com uma determinada am-

plitude φ e soma destas amplitudes nos fornece uma amplitude total K. Esta

amplitude K, que ´e a amplitude de Feynman que discretizaremos nas se¸c˜oes

seguintes, nos fornece a probabilidade de ocorrˆencia de um evento, fazendo

P (a, b) = |K(a, b)|

O axioma (P) nos diz que cada caminho contribui igualmente em m´odulo,

embora as suas fases variem. Ent˜ao n˜ao ´e claro se um caminho em parti-

cular ´e mais importante. Entretanto, na aproxima¸c˜ao cl´assica, S ´e grande

comparado com . Se um caminho arbitr´ario x(t) ´e modiﬁcado por uma

pequena quantidade δx(t), embora δS seja pequeno na escala cl´assica, n˜ao ´e

pequeno comparado com . Estas pequenas varia¸c˜oes no caminho ir˜ao, em

geral, variar bastante a fase, que ir´a oscilar rapidamente. Ent˜ao, se os cami-

nhos vizinhos de x(t) possuem uma a¸c˜ao diferente, suas contribui¸c˜oes para

K(a, b) ir˜ao se cancelar, sem fornecer nenhuma contribui¸c˜ao. Mas para o ca-

minho especial ˆx, onde S ´e um extremo, uma pequena mudan¸ca no caminho

fornecer´a praticamente nenhuma varia¸c˜ao em S. Assim, caminhos na vizin-

han¸ca de ˆx n˜ao fornecem fatores que se cancelam; desta forma, ˆx se destaca

e as leis cl´assicas do movimento surgem a partir das leis quˆanticas. No n´ıvel

atˆomico, quando S ´e compar´avel com , nenhum caminho se destaca. Neste

caso, todos os caminhos (mais precisamente, caminhos cont´ınuos) devem ser

considerados ao se calcular K(a, b).

Existem algumas diﬁculdades matem´aticas ao se tentar construir uma for-

mula¸c˜ao rigorosa para a amplitude total K. O problema principal ´e encontrar

uma medida adequada no espa¸co de caminhos a ﬁm de que a soma K possa

ser formulada em termos de uma integral sobre este espa¸co (ver [18] para

mais detalhes). Alguns casos especiais foram resolvidos, mas uma solu¸c˜ao

geral ainda n˜ao foi descoberta. Iremos seguir um argumento heur´ıstico.

Seja t

= t

< t

< ··· < t

= t

uma parti¸c˜ao de [t

, t

] onde

i+1

− t

=  =

− t

)

, i = 0, . . . , n − 1.

Seja P

o conjunto dos caminhos poligonais da forma x(t) onde

x(t

) = x

, x(t

) = x

, x(t

) = x

, i = 1, . . . , n − 1

e para t

< t < t

i+1

, (t, x(t)) ´e o segmento de reta de (t

, x

) para (t

i+1

, x

i+1

Tomamos uma constante de normaliza¸c˜ao A

como sendo



2πi



n/2

onde m ´e a massa da part´ıcula e deﬁna

(a, b) =



{φ[x(t)] : x(t) ∈ P

Se escrevermos esta integral sobre os valores de x

, i = 1, . . . , n −1, obtemos

(a, b) = A



···



(i/ )S[x(t)]

, . . . , dx

n−1

. (3.2)

E da´ı deﬁnimos K(a, b) como sendo

K(a, b) = lim

n→∞

(a, b)

N˜ao ´e garantido que este limite exista (e em muito casos n˜ao existe). Quando

o limite existe, n˜ao depende crucialmente da natureza poligonal dos cami-

nhos. Usaremos a seguinte nota¸c˜ao intuitiva:

K(a, b) =



(i/ )S[x(t)]

D[x(t)]

e diremos que a equa¸c˜ao acima ´e uma integral de caminho.

Apesar de a integral acima n˜ao possuir um sentido matem´atico rigoroso,

ela possui importante signiﬁcado f´ısico. Al´em disso, ela pode ser usada para

descobrir certas propriedades que K(a, b) deve ter se uma formula¸c˜ao rigorosa

for poss´ıvel. Por exemplo, seja t

= t

um certo tempo ﬁxado para um

i ∈ {1, . . . , n − 1} ﬁxo. Escrevendo a a¸c˜ao para os intervalos de tempo

, t

], [t

, t

] como S

[x(t)], S

[x(t)], respectivamente, obtemos a partir da

equa¸c˜ao 3.1 que

[x(t)] = S

[x(t)] + S

[x(t)].

Logo, a equa¸c˜ao 3.2 nos fornece

(a, b) =



i−1

(a, c)K

n−i+1

(c, b)dx

Fazendo n arbitrariamente grande obtemos a seguinte f´ormula

K(a, b) =



K(a, c)K(c, b)dx

. (3.3)

Agora, vamos calcular a integral para um caso simples. Para uma part´ıcula

livre, o lagrangiano ´e L = mv

/2. Para x(t) ∈ P

temos

S[x(t)] =



L[v(t), x(t)]dt =

2



i=1

− x

i−1

)

Ent˜ao,

(a, b) = A



···



exp



2



i=1

− x

i−1

)



, . . . , dx

n−1

Aqui temos um produto de integrais Gaussianas que podem ser resolvidas

individualmente para obter

(a, b) =



2πin



1/2

exp



2n

− x

)



Como n = t

− t

, os K

’s s˜ao iguais para todo n. Segue que

K(a, b) =



2πi(t

− t

)



1/2

exp



im(x

− x

)

2(t

− t

)



E poss´ıvel tamb´em mostrar que a equa¸c˜ao de Schr¨odinger pode ser obtida

(novamente, sem o rigor matem´atico exigido normalmente) a partir do for-

malismo das integrais de caminho (ver [18]).

3.2 Distribui¸c˜ao de Probabilidade

Os conceitos mais importantes tratados neste trabalho est˜ao baseados na

fun¸c˜ao da onda, que representa o aspecto ondulat´orio de uma part´ıcula, `a

medida que a posi¸c˜ao e o tempo variam. A fun¸c˜ao da onda desempenha um

papel central no c´alculo de probabilidades em experimentos que envolvem

part´ıculas atˆomicas.

Para ilustrar o problema de tais c´alculos, consideremos o seguinte expe-

rimento: de um lado, temos uma fonte emissora de part´ıculas (el´etrons, por

exemplo). Cada part´ıcula deve passar por um anteparo, que possui duas

fendas, e atingir um detector no outro lado. O detector pode ser deslocado

como quisermos, e assim podemos obter uma distribui¸c˜ao de probabilidade,

realizando o experimento sucessivas vezes (ﬁgura 1). Se fecharmos a fenda 2,

podemos calcular a probabilidade de o detector ser acionado por um el´etron

que passou pela fenda 1 (analogamente para a fenda 2). A soma destas

duas distribui¸c˜oes nos fornece a probabilidade de o detector ser acionado

por um el´etron que passou pela fenda 1 ou 2. Podemos concluir a partir

da´ı o seguinte: se analisarmos classicamente o problema, concluiremos que a

probabilidade de que uma part´ıcula atinja o detector ´e

P (x) = P

(x) + P

(x)

onde P

e P

s˜ao as probabilidades de a part´ıcula atingir o detector passando

pela fenda 1 ou 2, respectivamente.

Figura 3.1: Vers˜ao simpliﬁcada do experimento de Young. S ´e a fonte de el´etrons e D

´e um detector que se movimenta livremente na vertical.

A distribui¸c˜ao de probabilidade cl´assica seria uma curva gerada pela su-

perposi¸c˜ao das probabilidades via fenda 1 e 2 (ﬁguras 3.2a-c). Entretanto,

a experiˆencia nos mostra que este c´alculo n˜ao pode estar correto

. Deve-

mos ainda levar em conta a interferˆencia entre caminhos alternativos. A

distribui¸c˜ao real ter´a, na verdade, o aspecto aproximado de uma sen´oide

com amplitude decrescente `a medida que nos aproximamos dos extremos do

anteparo (ﬁgura 3.2d). Desta forma, obtemos os padr˜oes de interferˆencia e

difra¸c˜ao, tal como no experimento de Young, revelando o car´ater ondulat´orio

de part´ıculas como el´etrons.

Um resultado importante da mecˆanica quˆantica, sobre o qual est˜ao basea-

dos as deﬁni¸c˜oes neste texto ´e que a probabilidade de se encontrar uma

part´ıcula em qualquer ponto ´e proporcional ao quadrado do valor absoluto

da amplitude da onda de mat´eria nesse ponto. Este postulado baseia-se no

fato de que o c´alculo correto de probabilidades envolve uma fun¸c˜ao de onda

(i.e., uma fun¸c˜ao complexa).

Sendo assim, temos que o problema anterior pode ser resolvido da seguinte

maneira. Os padr˜oes de interferˆencia gerados no experimento sugerem que

O c´alculo estar´a correto no caso em que colocarmos um detector para se determinar

por qual fenda a part´ıcula passou. Ou seja, ao introduzir tal detector estaremos destruindo

o car´ater ondulat´orio do experimento.

Figura 3.2: (a) P

(x). (b) P

(x). (c) P

(x)+P

(x) (previs˜ao cl´assica). (d) A distribui¸c˜ao

de P

(x) + P

(x) que realmente ocorre.

representemos a nossa fun¸c˜ao de distribui¸c˜ao, com tempo ﬁxado, por uma

fun¸c˜ao complexa. Ent˜ao podemos postular que P (x) ´e proporcional ao

quadrado do valor absoluto de uma certa quantidade φ(x) e este valor ´e

a amplitude de probabilidade, ou como chamamos nas outras se¸c˜oes, ampli-

tude quˆantica. Al´em disso, temos o seguinte: φ(x) ser´a a soma de duas

contribui¸c˜oes, ψ

(x) e ψ

(x), as amplitudes de chegada via fenda 1 ou 2,

respectivamente. Ent˜ao, segue que

(x) = |ψ

(x)|

, P

(x) = |ψ

(x)|

P (x) = |ψ

(x) + ψ

(x)|

= P

(x) + P

(x) + 2Reψ

(x)ψ

(x).

Os dois primeiros termos do lado direito fornecem o resultado cl´assico; o

´ultimo termo ´e o correspondente `a interferˆencia quˆantica, que contribui como

uma soma ou subtra¸c˜ao ao termo cl´assico.

Na f´ısica cl´assica, os modelos matem´aticos nos fornecem informa¸c˜oes so-

bre os fenˆomenos que observamos, enquanto que na mecˆanica quˆantica, os

modelos n˜ao s˜ao observados sem que causemos alguma interferˆencia. Uma

abordagem dos fenˆomenos microsc´opicos consiste em descrever a evolu¸c˜ao

da fun¸c˜ao da onda, mas esta fun¸c˜ao nos permite apenas calcular a probabili-

dade de que certos eventos ocorram. Para relacion´a-la com os experimentos,

a fun¸c˜ao de onda deve ser interpretada de uma maneira apropriada.

3.3 Sobre a amplitude de Feynman

O formalismo de integrais de caminhos, sobre o qual as amplitudes de Feyn-

man est˜ao baseadas, nos permite imaginar algumas situa¸c˜oes interessantes.

Seja o seguinte experimento: temos um emissor de f´otons, um detector, e

abaixo um espelho (ﬁgura 3.3). Vamos supor v´alida a lei de incidˆencia e re-

ﬂex˜ao da luz. Supondo que temos uma barreira entre o emissor e o detector

(assim a luz emitida n˜ao pode ir diretamente para o detector) conclu´ımos,

ap´os uma an´alise cl´assica, que todo f´oton que atingiu o detector foi reﬂetido

pelo espelho, e al´em disso, deve ter sido no seu centro, pois o ˆangulo de

incidˆencia ´e igual ao ˆangulo de reﬂex˜ao, e tanto o emissor como o detector

est˜ao a uma mesma distˆancia da barreira. Isso ´e o que observamos quando

fazemos experimentos com um feixe de luz. Entretanto, quando temos ape-

nas uma part´ıcula, o formalismo das integrais nos mostra um outro aspecto

do fenˆomeno: devemos considerar todas as trajet´orias “poss´ıveis”para a luz;

em outras palavras, n˜ao devemos supor que a luz anda apenas em linha reta,

e muito menos que ela sabe qual o caminho mais curto! Mas para ﬁns de

simpliﬁca¸c˜ao, iremos supor que a luz percorre apenas linhas retas e a situa¸c˜ao

que iremos considerar ´e: um f´oton, incidindo e reﬂetindo em qualquer ˆangulo

e em qualquer ponto do espelho.

Figura 3.3: Dois caminhos para o f´oton. Sabe-se que o caminho em que o f´oton atinge o

espelho no centro nos fornece o menor tempo, mas ´e errado dizer que os outros pontos s˜ao

proibidos, ou que nunca ir˜ao ocorrer. Teoricamente, ´e poss´ıvel que um f´oton atinja outro

ponto do espelho (embora a probabilidade seja pequena, e, em grande escala, descobrimos

que as amplitudes de probabilidade destas alternativas se cancelam).

A princ´ıpio pode parecer estranho supor que um f´oton atinge uma parte

qualquer do espelho. Isso nos leva a uma pergunta: como poderia o f´oton

saber qual ´e o caminho mais curto e por que ele escolheria tal caminho? A

ﬁgura 3.4 nos fornece um gr´aﬁco que indica os tempos necess´arios para um

f´oton sair da fonte e chegar at´e o detector.

Daremos apenas uma explica¸c˜ao intuitiva do que acontece. A reﬂex˜ao da

luz ´e um fenˆomeno que envolve uma certa por¸c˜ao do espelho. O fato impor-

Figura 3.4: Vamos dividir o espelho em parti¸c˜oes de mesmo tamanho. (a) Todos os

caminhos poss´ıveis. (b) Tempos associados aos caminhos. O importante aqui ´e notar que

a diferen¸ca entre os tempos associados a dois pontos do centro, digamos F e G, ´e menor

do que a diferen¸ca entre os tempos associdos a dois pontos dos extremos, digamos A e B.

E exatamente isso que determina o fato de que apenas observamos a luz gerando ˆangulos

de incidˆencia e reﬂex˜ao iguais.

tante a ser observado ´e o seguinte: a diferen¸ca entre os tempos associados a

pontos pr´oximos do centro ´e menor do que a diferen¸ca entre os tempos asso-

ciados a pontos dos extremos do espelho. Isso signiﬁca que a diferen¸ca de fase

entre as exponenciais associadas `a amplitude de Feynman (ver equa¸c˜oes na

se¸c˜ao 1) ´e pequena para pontos pr´oximos ao centro, e logo temos amplitudes

de probabilidade que contribuem para uma amplitude maior e logo, uma

probabilidade maior; nos extremos, a varia¸c˜ao de fase ´e maior, e existe uma

contribui¸c˜ao menor de amplitudes, o que confere a esses pontos uma menor

probabilidade. Logo, o centro ´e a regi˜ao onde ocorrem pequenas varia¸c˜oes

de fase e onde ´e poss´ıvel obter uma amplitude consider´avel. E ´e por isso que

podemos dizer, aproximadamente, que a luz percorre a trajet´oria em que o

tempo ´e m´ınimo (tamb´em, n˜ao ´e dif´ıcil provar que no caminho onde o tempo

´e m´ınimo, o ˆangulo de incidˆencia ´e igual ao ˆangulo de reﬂex˜ao).

Vamos examinar um exemplo mais simples de fenˆomeno que pode ser

descrito por uma cadeia quˆantica. Imagine uma part´ıcula livre se movimen-

tando no espa¸co bidimensional. Queremos calcular a probabilidade de que

esta part´ıcula, saindo do ponto s

, chegue ao ponto s

. Como discutimos

anteriormente, se estiv´essemos considerando o fenˆomeno cont´ınuo, ter´ıamos

de calcular a integral sobre todos os caminhos poss´ıveis no espa¸co que tem

como origem o ponto s

e destino o ponto s

(ﬁgura 3.5). Dizemos que a

integral sobre cada caminho poss´ıvel ´e uma amplitude de probabilidade e a

soma destas amplitudes ´e a amplitude total. O quadrado do m´odulo desta

amplitude total nos fornece a probabilidade de que a part´ıcula saia de s

chegue a s

. Isto ´e o que o formalismo das integrais de caminhos nos diz.

Lembre que ﬁzemos n = 12 e na matriz de Dirichlet (de acordo com [2], o

parˆametro a pode ser considerado a massa da part´ıcula, e como j´a vimos, ela

n˜ao inﬂui na probabilidade). Como temos uma matriz com um parˆametro n

ﬁnito, estamos descrevendo uma aproxima¸c˜ao do fenˆomeno cont´ınuo. Ent˜ao

podemos supor que as trajet´orias poss´ıveis para a part´ıcula s˜ao poligonais.

Mas vamos tornar as coisas ainda mais simples e supor que as fra¸c˜oes de

caminhos poss´ıveis s˜ao as arestas de um reticulado.

Figura 3.5: Quando consideramos sistemas discretos, o an´alogo de se calcular a integral

sobre todos os caminhos de a a b ´e somar todas as amplitudes de transi¸c˜ao de um estado a

outro. Em particular, como est´avamos interessados na posi¸c˜ao de uma part´ıcula, a matriz

de transi¸c˜ao associada a cadeia quˆantica que usamos foi a matriz de Dirichlet, que gera

um an´alogo discreto para o movimento de uma part´ıcula livre.

Uma observa¸c˜ao importante. Lembre que em cadeias quˆanticas estamos

sempre supondo que o conjunto S de estados poss´ıveis do sistema ´e ﬁnito.

Ent˜ao, temos uma part´ıcula em um plano movendo-se em um reticulado

ﬁnito. Isso quer dizer a part´ıcula livre que consideramos pode se mover

apenas no reticulado, obviamente, e est´a de acordo com o c´alculo de prob-

abilidades que ﬁzemos antes, pois lembre que tinhamos uma lista peri´odica

de probabilidades (ou seja, isso deve-se tamb´em ao fato de que a part´ıcula

tem apenas um n´umero ﬁnito de estados que podem ser assumidos. Se o

conjunto de estados n˜ao fosse ﬁnito, n˜ao saber´ıamos, a priori, se existe uma

periodicidade nas transi¸c˜oes do sistema).

Dizemos que f

´e a medi¸c˜ao no tempo t e neste exemplo f representa

a posi¸c˜ao da part´ıcula. Por exemplo, se o sistema est´a em um estado s

no tempo t, realizando outra medi¸c˜ao, obtemos f(s

) = s

, onde s

´e uma

posi¸c˜ao adjacente no reticulado. Inversamente, se estamos em um estado

no tempo t, temos que f

−1

) ´e o conjunto de estados que o sistema

poderia estar no tempo t − 1, sabendo que passamos para s

no tempo t

(supomos que cada elemento deste conjunto deve necessariamente ser um

v´ertice adjacente).

E claro que neste exemplo, s

∈ f

−1

). Temos, tamb´em,

o vetor de amplitude

. Este vetor ´e unit´ario ou seja, |



A[f

−1

)]| = 1,

o que reﬂete a certeza de a part´ıcula estar no reticulado.

Queremos calcular a probabilidade de que a part´ıcula, saindo do estado

chegue ao estado s

em t unidades de tempo. Note que desta forma, esta-

mos considerando apenas as amplitudes de caminhos que levam t unidades

de tempo. (Mesmo assim, conseguimos uma boa aproxima¸c˜ao; usando o

formalismo das integrais de caminhos, dever´ıamos considerar todos os cami-

nhos, e n˜ao apenas os que duram t unidades de tempo). Logo, considerando

caminhos de s

a s

em um tempo t, vemos que o formalismo das integrais

(ou das somas de amplitudes sobre caminhos) se encaixa perfeitamente com

a cadeia quˆantica que estamos considerando: dado um estado inicial s

= s

quando queremos determinar P [f

−1

)], procedemos da seguinte maneira:

aplicando o estado inicial

´a matriz de transi¸c˜ao



A, podemos determinar

como a amplitude varia com o tempo; somamos todas as amplitudes de ca-

minhos que levam de s

a s

, calculamos o m´odulo e elevamos ao quadrado.

Esse ´e o prop´osito da cadeia: veriﬁcar todas as probabilidades sobre o espa¸co

de caminhos, exatamente como no formalismo das amplitudes de Feynman.

Cap´ıtulo 4

Operadores densidade e

mecˆanica quˆantica

Computadores cl´assicos operam com estados constru´ıdos a partir de um

n´umero ﬁnito n de bits. Cada bit pode existir em um de dois estados, 0 ou

1. O estado do sistema ´e determinado ao se especiﬁcar os valores de cada

um dos bits. Portanto, o conjunto de estados B

= {0, 1}

´e ﬁnito e tem

cardinalidade 2

Um computador quˆantico trabalha com um conjunto ﬁnito de objetos

chamados q-bits. Cada q-bit possui dois estados distintos, tamb´em denota-

dos por 0 e 1. As 2

combina¸c˜oes de estados para cada q-bit n˜ao consistem

de todos os estados poss´ıveis para o sistema, mas formam uma base para

o espa¸co de estados. Denotaremos os estados base por |x

, . . . , x

, onde

∈ B ou ent˜ao por |x onde x ∈ B

. Um estado arbitr´ario do sistema pode

ser representado na forma

|ψ =



,...,x

)∈

,...,x

, . . . , x

 , onde



,...,x

)∈

,...,x

= 1

Ainda, se multiplicamos o vetor |ψ =



|x por um fator de fase

iϕ

, ϕ ∈ R, obtemos um estado ﬁsicamente indistingu´ıvel e portanto o estado

em um computador quˆantico ´e um vetor unit´ario deﬁnido a menos de um

fator de fase.

Em um computador cl´assico, qualquer fun¸c˜ao f : B

→ B

´e permitida,

ou seja composi¸c˜oes e seq¨uˆencias quaisquer de tais fun¸c˜oes ´e o que enten-

demos como sendo computa¸c˜oes cl´assicas; em um computador quˆantico as

transforma¸c˜oes permitidas s˜ao os operadores unit´arios, ou seja, operadores

que preservam o comprimento



x∈

de cada vetor |ψ =



|x.

Neste cap´ıtulo estamos interessados em estudar alguns fundamentos de

mecˆanica quˆantica. Al´em disso, queremos entender a entropia de von Neu-

mann, o an´alogo quˆantico da entropia de Shannon da teoria cl´assica da in-

forma¸c˜ao. No pr´oximo cap´ıtulo, calcularemos tal entropia para as cadeias de

Markov quˆanticas que vimos no cap´ıtulo 2.

4.1 Nota¸c˜ao de Dirac

Estamos interessados em obter algum an´alogo quˆantico para a entropia usada

na teoria de informa¸c˜ao cl´assica (entropia de Shannon). Veremos que algumas

id´eias da teoria da informa¸c˜ao ser˜ao ´uteis para descrever os sistemas que nos

interessam aqui. Parte desta se¸c˜ao ´e baseada em [32] e [41].

Come¸camos introduzindo a nota¸c˜ao de Dirac, que ´e usual em mecˆanica

quˆantica. Um vetor ψ de um espa¸co vetorial com produto interno ser´a deno-

tado por

|ψ

Dados dois vetores |ψ e |ϕ, o produto interno ´e denotado por

(|ψ, |ϕ)

Escreveremos

ψ|

para denotar o vetor dual do vetor |ψ. O vetor dual ´e um operador linear

deﬁnido em um espa¸co vetorial com produto interno, toma valores em C, e

´e deﬁnido por

ψ|(|ϕ) := ψ|ϕ := (|ψ, |ϕ),

e tamb´em denotaremos o produto interno entre dois vetores |ψ e |ϕ por

ψ|ϕ. Por conven¸c˜ao, se |v ´e um vetor, deﬁnimos |v

†

:= v|. Suponha

que A ´e um operador linear em um espa¸co de Hilbert V de dimens˜ao ﬁnita.

Ent˜ao existe um ´unico operador linear A

†

em V , dito o adjunto de A tal

que para quaisquer |v, |w ∈ V ,

(|v, A|w) = (A

†

|v, |w)

E f´acil ver que (A|v)

†

= v|A

†

, pois

(A|v)

†

|w = (A|v, |w) = (|v, A

†

|w) = v|A

†

|w,

onde na ´ultima passagem acima, escrevemos o produto interno entre |v e

†

w como

v|A

†

|w

que, equivalentemente, denota o produto interno entre A|v e |w.

A elegˆancia e praticidade da nota¸c˜ao de Dirac ﬁca evidente na seguinte

deﬁni¸c˜ao. Seja |v um vetor num espa¸co vetorial com produto interno V e

|w um vetor num espa¸co vetorial com produto interno W . Deﬁna

|wv| : V → W

como sendo o operador linear cuja a¸c˜ao ´e deﬁnida por

(|wv|)(|v



) := |wv|v



 = v|v



|w

Tal operador ´e dito produto exterior. Note que a express˜ao |wv|v





pode ter as seguintes interpreta¸c˜oes: (1) o resultado obtido ao se aplicar o

operador |wv| no vetor |v



 ou (2) o resultado de se multiplicar |w pelo

n´umero complexo v|v



. As deﬁni¸c˜oes dadas acima s˜ao tais que essas duas

interpreta¸c˜oes coincidem. De fato, o que ﬁzemos aqui foi simplesmente deﬁnir

a primeira interpreta¸c˜ao em termos da segunda.

Seja |i uma base ortonormal qualquer para o espa¸co vetorial V . Um

vetor |v pode ser escrito como |v =



|i, onde v

= i|v. Ent˜ao temos





|ii|



|v =



|ii|v =



|i = |v

Logo,



|ii| = I

onde I ´e o operador identidade. Esta ´e a rela¸c˜ao de completude para

vetores ortonormais. Esta rela¸c˜ao nos permite mostrar que todo operador

linear pode ser escrito como uma combina¸c˜ao linear de produtos exteriores.

Suponha que A : V → W ´e um operador linear, |v

 ´e uma base ortonor-

mal para V e |w

 ´e uma base ortonormal para W . Usando a rela¸c˜ao de

completude, obtemos

A = I



w

|A|v

v

| =



w

|A|v

|w

v

que ´e a representa¸c˜ao em produto exterior de A. Note que a partir dessa

express˜ao, vemos tamb´em que a matriz A

associada ao operador A ´e tal

que A

= w

|A|v

 (a matriz A

sendo tomada com respeito as bases |v

 e

).

Seja ψ um vetor unit´ario e A : V → V um operador qualquer. A partir

de ψ, forme uma base ortonormal ordenada de modo que ψ seja o primeiro

elemento. Ent˜ao, pela express˜ao para A

que vimos acima,

tr(A|ψψ|) =



i|A|ψψ|i = ψ|A|ψ

que ´e uma express˜ao ´util para se calcular o tra¸co de operadores.

Suponha que W ´e um subespa¸co vetorial de dimens˜ao k do espa¸co ve-

torial V de dimens˜ao d. Usando o m´etodo de Gram-Schmidt, ´e poss´ıvel

construir uma base ortonormal |1, . . . , |d para V tal que |1, . . . , |k ´e uma

base ortonormal para W . Deﬁnimos o projetor sobre o subespa¸co W como

sendo

P :=



i=1

|ii|

4.2 Produto tensorial

Parte desta se¸c˜ao ´e baseada em [21]. Vamos considerar um sistema quˆantico

que consiste de uma part´ıcula de spin 1/2 e outra de spin 1. Se considerarmos

apenas as propriedades de spin (ou seja, ignorando os graus de liberdade as-

sociados com as propriedades espaciais das part´ıculas), os espa¸cos de estados

dos subsistemas s˜ao C

e C

, respectivamente, com bases t´ıpicas dadas pelos

autoestados {|+

, |−

} e {|+ 1, |0, |−1}. Uma suposi¸c˜ao f´ısica natural

´e assumir que o sistema composto inclui estados que assumem cada um dos

valores descritos acima. Ent˜ao existem seis estados, que ser˜ao denotados por

| +

, +1, | +

, 0, | +

, −1, | −

, +1, | −

, 0, | −

, −1 (4.1)

Como estamos considerando uma teoria quˆantica, esperamos que com-

bina¸c˜oes lineares dos estados acima sejam permitidos. Ent˜ao parece natural

supor que o estado mais geral pode ser escrito na forma

|ψ = c

, +1+c

, 0+c

, −1+c

|−

, +1+c

|−

, 0+c

|−

, −1

e portanto os vetores na equa¸c˜ao (4.1) formam uma base para o espa¸co de

Hilbert do sistema composto. Como temos seis vetores, o espa¸co ´e isomorfo

a C

Para um sistema composto em geral, a opera¸c˜ao matem´atica relevante

toma vetores ψ

e ψ

nos espa¸cos de Hilbert H

e H

,de dimens˜ao m e n

respectivamente, e os transforma em um vetor ψ

⊗ ψ

em um novo espa¸co

de Hilbert H

⊗ H

, chamado produto tensorial de H

e H

, que tem di-

mens˜ao mn. O espa¸co de estados quˆantico do sistema composto ´e, portanto,

o produto tensorial dos espa¸cos de estados quˆanticos dos subsistemas cons-

tituintes. No exemplo acima, o vetor | +

, +1 denota o produto tensorial

| +

 ⊗ | + 1. Em particular, temos que o produto tensorial C

⊗ C

´e

isomorfo a C

Se |v

 e |w

 s˜ao bases ortonormais para H

e H

, respectivamente, ent˜ao

 ⊗ |w

 ´e uma base para H

⊗ H

. Usaremos tamb´em as nota¸c˜oes

|v|w , |v, w e |vw

para denotar o produto |v⊗|w. Por exemplo, se H ´e um espa¸co de Hilbert

de dimens˜ao 2 com vetores base |0 e |1, ent˜ao |0⊗|0+ |1⊗|1 ∈ H⊗H.

Agora deﬁniremos formalmente o produto tensorial. Sejam V e W s˜ao

espa¸cos vetoriais, que iremos supor sempre sobre R, e ainda que s˜ao de di-

mens˜ao ﬁnita. A constru¸c˜ao mais geral para m´odulos sobre an´eis comuta-

tivos, que n˜ao precisaremos aqui, pode ser vista em [29] ou [5]. Denote por

R[V × W ] o conjunto de elementos que s˜ao combina¸c˜oes lineares formais de

elementos de V × W com coeﬁcientes em R, ou seja, express˜oes do tipo



i=1

.(v

, w

) , a

∈ R, v

∈ V, w

∈ W

Seja R(V, W ) o subespa¸co gerado por todos os elementos de R[V × W ]

da forma

+ v

, w) − (v

, w)

(v, w

+ w

) − (v, w

) (4.2)

(rv, w) − r(v, w)

(v, rw) − r(v, w)

onde v

∈ V , w

∈ W e r ∈ R.

Deﬁni¸c˜ao O produto tensorial de espa¸cos vetoriais V e W , deno-

tado por V ⊗ W ´e o espa¸co

V ⊗ W :=

R[V × W ]

R(V, W )

Seja π : R[V × W ] → V ⊗ W a proje¸c˜ao canˆonica e denote por v ⊗ w a

imagem de (v, w) ∈ R[V × W ], ou seja,

v ⊗ w := π(v, w)

Segue de (4.2) que π : V ×W → V ⊗W ´e bilinear. Al´em disso tal aplica¸c˜ao

´e universal no seguinte sentido:

Lema 4.2.1 Sejam U, V e W espa¸cos vetoriais, e seja f : V ×W → U uma

aplica¸c˜ao bilinear. Ent˜ao existe uma ´unica aplica¸c˜ao linear f : V ⊗ W → U

tal que f = f ◦ π.

Prova Como o conjunto V ×W ´e uma base para R[V ×W ], f se extende a

uma aplica¸c˜ao linear

f : R[V × W ] → U. A bilinearidade de f implica que

f(R(V, W )) = 0, e portanto

f induz uma aplica¸c˜ao f do quociente V ⊗ W

em U. Por constru¸c˜ao, f = f ◦π, f ´e linear e como π(V ×W ) gera V ⊗W ,

f ´e determinada de maneira ´unica por f.



Segue do lema anterior que o produto tensorial ´e um funtor. De fato, se

ϕ : V → V



e ψ : W → W



s˜ao aplica¸c˜oes lineares ent˜ao a composi¸c˜ao

V × W

ϕ×ψ

→ V



× W



→ V



⊗ W



´e bilinear, portanto induz uma ´unica aplica¸c˜ao

ϕ ⊗ ψ : V ⊗ W → V



⊗ W



A unicidade garante que (ϕ



⊗ ψ



) ◦ (ϕ ⊗ ψ) = ϕ



◦ ϕ ⊗ ψ



◦ ψ quando ϕ



→ V



, ψ



: W



→ W



Lema 4.2.2 Sejam V e V



espa¸cos vetoriais com bases B e B



, respectiva-

mente. Ent˜ao V ⊗ V



´e um espa¸co vetorial com base {b ⊗ b



|b ∈ B, b



∈ B



Prova A bilinearidade de π : V × V



→ V ⊗ V



mostra que o conjunto

enunciado acima gera V ⊗ V



. Suponha que



⊗ b



= 0 (4.3)

Sejam ϕ

: V → R e ϕ



→ R aplica¸c˜oes lineares com

) = 0 se i = i

, ϕ

) = 1



) = 0 se i = j

, ϕ



) = 1

onde (i

, j

) ´e um par de ´ındices que aparecem em (4.3). A composi¸c˜ao

V ⊗ V



⊗ϕ



→ R ⊗ R

mult

→ R

leva o lado esquerdo em (4.3) em r

que, portanto, deve ser zero.



Temos as seguintes rela¸c˜oes:

1. R ⊗ V

∼

V ⊗ R

2. V

⊗ V

∼

⊗ V

3. V

⊗ (V

⊗ V

)

∼

⊗ V

) ⊗ V

4. (V

⊕ V

) ⊗ V

∼

⊗ V

⊕ V

⊗ V

Existe uma generaliza¸c˜ao natural da deﬁni¸c˜ao de produto tensorial para

o caso de um n´umero maior de espa¸cos e um lema de propriedade universal

correspondente:

Lema 4.2.3 Para cada aplica¸c˜ao multilinear f : V

× ··· × V

→ W existe

uma ´unica aplica¸c˜ao linear f : V

⊗ ··· ⊗ V

→ W tal que f = f ◦ π.

Outras propriedades do produto tensorial s˜ao as seguintes:

1. O produto tensorial ´e linear em cada entrada, no sentido de que para

todo α, β ∈ C, ψ, φ ∈ H

e ξ ∈ H

(αψ + βφ) ⊗ ξ = (αψ) ⊗ ξ + (βφ) ⊗ ξ

e se ψ ∈ H

e φ, ξ ∈ H

ψ ⊗ (αφ + βξ) = ψ ⊗ (αφ) + ψ ⊗ (βξ)

α(ψ ⊗ φ) = (αψ) ⊗ φ = ψ ⊗(αφ)

2. Existem vetores em H

⊗H

que n˜ao podem ser escritos como um ´unico

produto ψ ⊗ φ, quaisquer que sejam ψ ∈ H

e φ ∈ H

. Um exemplo ´e

|ψ =

|00 + |11

√

ou seja, n˜ao existem estados |a e |b tais que |ψ = |a⊗|b. Quando tal

fato ocorrer, diremos que ψ ´e um estado emaranhado (discutiremos

emaranhamento (entanglement) na se¸c˜ao 4.5). Entretanto, todo vetor

em H

⊗ H

pode ser escrito como uma soma de tais produtos.

Em particular, se {e

, e

, . . . , e

} e {f

, f

, . . . , f

} s˜ao bases para H

e H

, respectivamente, ent˜ao uma base para H

⊗ H

´e o conjunto de

vetores e

⊗f

, i = 1, 2, . . . N

, j = 1, 2, . . . , N

. Portanto, o vetor mais

geral ψ ∈ H

⊗ H

tem a forma

ψ =



i=1



j=1

⊗ f

onde ψ

∈ C. Em particular, isso mostra que a dimens˜ao do espa¸co de

Hilbert H

⊗ H

´e o produto das dimens˜oes de H

e H

3. O produto interno ´e deﬁnido em vetores produto por

ψ

⊗ ψ

, φ

⊗ φ

 := ψ

, φ



ψ

, φ



onde os produtos no lado direito s˜ao calculados nos espa¸cos de Hilbert

indicados. A express˜ao ´e extendida para somas de vetores se deﬁnimos

ψ

⊗ ψ

, (αφ

⊗ φ

+ βφ

⊗ φ

)

:= αψ

, φ



ψ

, φ



+ βψ

, φ



ψ

, φ



4. O produto tensorial de operadores pode ser deﬁnido da seguinte

maneira. Sejam A

e A

operadores em H

e H

, respectivamente. O

produto A

⊗ A

´e deﬁnido primeiro em vetores produto

⊗ A

)ψ

⊗ ψ

:= (A

) ⊗ (A

)

e depois extendido para somas de produtos de maneira linear:

⊗ A

)ψ :=



i=1



j=1

) ⊗ (A

)

Da mesma forma que no caso de vetores, existem operadores em H

⊗

que n˜ao podem ser escritos na forma A

⊗ A

. Entretanto, todos

os operadores podem ser descritos por uma soma de tais operadores

produto.

Enunciamos a deﬁni¸c˜ao do produto tensorial apenas para obter uma ex-

posi¸c˜ao completa. N˜ao precisaremos lembrar da constru¸c˜ao formal que ﬁze-

mos anteriormente, apenas de suas propriedades operacionais. Em particular,

ser´a ´util deﬁnir uma representa¸c˜ao matricial, chamada produto de Kro-

necker. Sejam A uma matriz m × n e B uma matriz p × q. Ent˜ao temos a

seguinte representa¸c˜ao matricial:

A ⊗ B :=







B A

B ··· A

B A

B ··· A

B A

B ··· A







Ou seja, o termo A

B ´e o elemento A

da matriz A multiplicado pela matriz

B. Por exemplo, o produto tensorial dos vetores (2, 3) e (4, 5) ´e





⊗











2 × 4

2 × 5

3 × 4

3 × 5



















4.3 Operador densidade

Suponha que um sistema quˆantico est´a em um estado |ψ

 dentre v´arios

estados poss´ıveis, onde i ´e um ´ındice, com respectivas probabilidades p

Dizemos que {p

, |ψ

} ´e um conjunto (ensemble) de estados.

Deﬁni¸c˜ao O operador densidade, tamb´em chamado matriz densi-

dade de um sistema ´e deﬁnido pela equa¸c˜ao

ρ :=



|ψ

ψ

O seguinte teorema fornece uma caracteriza¸c˜ao de operadores densidade:

Teorema 4.3.1 Um operador ρ ´e o operador densidade associado a um en-

semble {p

, |ψ

} se e somente se satisfaz

1. tr(ρ) = 1

2. ρ ´e um operador positivo

Prova Suponha que ρ =



|ψψ

| ´e um operador densidade. Ent˜ao

tr(ρ) =



tr(|ψ

ψ

|) =



= 1

Suponha que |ϕ ´e um vetor qualquer no espa¸co de estados. Ent˜ao

ϕ|ρ|ϕ =



ϕ|ψ

ψ

|ϕ =



|ϕ|ψ

|

≥ 0

Reciprocamente, suponha que ρ ´e um operador satisfazendo a condi¸c˜ao

do tra¸co e de positividade dadas acima. Como ρ ´e positiva, ent˜ao possui uma

decomposi¸c˜ao espectral

ρ =



|jj|

onde os vetores |j s˜ao ortogonais e os λ

s˜ao autovalores reais n˜ao negativos

de ρ. Pela condi¸c˜ao do tra¸co, vemos que



= 1. Portanto, um sistema

no estado |j com probabilidade λ

ter´a ρ como o operador densidade corres-

pondente. Ou seja, o ensemble {λ

, |j} ´e um ensemble de estados que induz

o operador densidade ρ.



A utilidade do operador densidade ´e a de descrever subsistemas de um sis-

tema quˆantico composto. Para isso, deﬁnimos o operador densidade reduzido.

Suponha que temos dois sistemas f´ısicos A e B cujos estados s˜ao descritos

por um operador densidade ρ

. O operador densidade reduzido para o

sistema A ´e deﬁnido por

:= tr

(ρ

onde tr

´e o tra¸co parcial sobre B, deﬁnido por

(|a

a

| ⊗ |b

b

|) := |a

a

|tr(|b

b

onde |a

 e |a

 s˜ao vetores no espa¸co de estados de A e |b

 e |b

 s˜ao vetores

no espa¸co de estados de B. O operador tra¸co aparecendo no lado direito ´e o

operador tra¸co usual para o sistema B, e logo, tr(|b

b

|) = b

.

Deﬁni¸c˜ao Dizemos que sistema quˆantico encontra-se em um estado

puro quando n˜ao h´a incerteza quanto ao conhecimento do estado do sistema.

Ou seja, seu operador densidade ´e dado simplesmente por ρ = |ψψ|. Cos-

tumamos dizer tamb´em que o operador ρ ´e um estado puro. Caso contr´ario,

o estado ´e dito misturado (mixed).

O seguinte crit´erio nos permite dizer se um estado ´e puro:

Lema 4.3.2 Seja ρ um operador densidade. Ent˜ao tr(ρ

) ≤ 1 e vale a

igualdade se e somente se ρ ´e um estado puro.

Prova Um c´alculo simples mostra que ρ



i=1

|ii| se ρ =



i=1

|ii|.

Da´ı tr(ρ

) =



≤ 1, claramente.

E igual a 1 se e somente se existe k tal

que p

= 1 (e portanto, p

= 0, i = k), ou seja, se e somente se ρ = |kk|



4.4 Postulados da mecˆanica quˆantica

Enunciamos a seguir os postulados da mecˆanica quˆantica. Mais detalhes

podem ser vistos em [32]. Veremos que os postulados tamb´em possuem uma

formula¸c˜ao interessante em termos de operadores densidade.

Postulado 1. Associado a cada sistema f´ısico existe um espa¸co vetorial

complexo com produto interno, chamado espa¸co de estados do sistema. O

sistema ´e completamente descrito pelo seu vetor de estado, que ´e um vetor

unit´ario no espa¸co de estados do sistema.

Em termos de operadores densidade, o postulado 1 pode ser escrito da

seguinte maneira:

Postulado 1’. Associado a cada sistema f´ısico isolado existe um espa¸co

vetorial complexo com produto interno, dito espa¸co de estados do sistema.

O sistema ´e completamente descrito pelo seu operador densidade. Se um

sistema quˆantico est´a no estado ρ

com probabilidade p

, ent˜ao o operador

densidade para o sistema ´e



O postulado a seguir se refere `a evolu¸c˜ao temporal do sistema.

Postulado 2. A evolu¸c˜ao de um sistema quˆantico fechado ´e dada por

uma transforma¸c˜ao unit´aria, ou seja, o estado |ψ do sistema no tempo t

est´a relacionado com o estado |ψ



 do sistema no tempo t

por um operador

unit´ario U que depende apenas dos tempos t

e t

|ψ



 = U|ψ

Em termos de operadores densidade, temos:

Postulado 2’. A evolu¸c˜ao de um sistema quˆantico fechado ´e dada por

uma transforma¸c˜ao unit´aria, ou seja, o estado ρ do sistema no tempo t

est´a

relacionado com o estado ρ



no tempo t

por um operador unit´ario U que

depende apenas dos tempos t

e t



= UρU

†

Este postulado descreve como os estados de um sistema quˆantico fechado

em dois tempos diferentes est˜ao relacionados. Podemos postular, de maneira

mais reﬁnada, como ocorre a evolu¸c˜ao do sistema em tempo cont´ınuo.

Postulado 2”. A evolu¸c˜ao no tempo de um estado de um sistema

quˆantico fechado ´e descrita pela equa¸c˜ao de Schr¨odinger

i

d|ψ

= H|ψ

O fator  ´e a constante de Planck. O termo H ´e um operador hermitiano

ﬁxado, que chamamos de Hamiltoniano do sistema fechado.

Vemos a rela¸c˜ao entre os postulados 2 e 2



quando escrevemos a solu¸c˜ao

da equa¸c˜ao de Schr¨odinger

|ψ(t

) = exp



−iH(t

− t

)





|ψ(t

) = U(t

, t

)|ψ(t

),

onde

U(t

, t

) := exp



−iH(t

− t

)





Vale que U deﬁnido desta forma ´e unit´ario e que todo operador unit´ario pode

ser escrito na forma U = exp(iK) para algum operador hermitiano K.

Postulado 3. Medi¸c˜oes quˆanticas s˜ao descritas por uma cole¸c˜ao {M

}

de operadores de medi¸c˜ao, que s˜ao operadores agindo no espa¸co de estados

do sistema. O ´ındice m se refere aos resultados das medi¸c˜oes que podem

ocorrer. Se o estado do sistema quˆantico ´e |ψ antes que a medi¸c˜ao seja

realizada, ent˜ao a probabilidade de que o resultado m ocorra ´e dado por

p(m) = ψ|M

†

|ψ

Em termos de operadores densidade, se o estado do sistema quˆantico ´e ρ,

temos

p(m) = tr(M

†

ρ)

O estado do sistema ap´os a medi¸c˜ao ´e

|ψ



ψ|M

†

|ψ

ou ent˜ao

ρM

†

tr(M

†

ρ)

em termos de operadores densidade. Ainda, os operadores de medi¸c˜ao satis-

fazem a equa¸c˜ao de completude



†

= I.

Um sistema quˆantico ´e dito composto quando ´e formado por subsistemas

quˆanticos.

Postulado 4. O espa¸co de estados de um sistema composto ´e dado

pelo produto tensorial dos espa¸cos de estados dos subsistemas componentes.

Al´em disso, se temos sistemas numerados de 1 a n, e o sistema i encontra-se

no estado |ψ

, ent˜ao o estado do sistema total ´e |ψ

 ⊗ |ψ

 ⊗ ··· ⊗ |ψ



(em termos de operadores densidade, se o sistema i encontra-se no estado ρ

ent˜ao o estado do sistema total ´e ρ

⊗ ρ

⊗ ··· ⊗ ρ

4.5 Estados emaranhados

Deﬁni¸c˜ao Considere um sistema composto e seja |ψ um estado desse sis-

tema. Sabemos da se¸c˜ao 4.2 que |ψ pode ser escrito como uma soma de

produtos tensoriais. Se |ψ n˜ao pode ser escrito como um ´unico produto dos

seus estados componentes, ent˜ao dizemos que |ψ ´e um estado emaranhado

(entangled).

Um exemplo de estado emaranhado ´e

|ψ =

|01 + |10

√



|0 ⊗ |1 + |1 ⊗ |0



ou seja, n˜ao existem estados |a e |b tais que |ψ = |a⊗ |b.

Veremos agora uma decomposi¸c˜ao que nos permite medir, em um certo

sentido, a quantidade de emaranhamento entre dois sistemas.

Teorema 4.5.1 (Decomposi¸c˜ao de Schmidt) Suponha que |ψ ´e um estado

puro de um sistema composto AB. Ent˜ao existem estados ortonormais |i



para o sistema A, e estados ortonormais |i

 para o sistema B tais que

|ψ =



|i

,

onde os λ

s˜ao n´umeros reais n˜ao negativos satisfazendo



= 1, chama-

dos coeﬁcientes de Schmidt.

Observe a seguinte aplica¸c˜ao deste teorema. Seja |ψ um estado puro

de um sistema composto AB. Ent˜ao pela decomposi¸c˜ao de Schmidt, ρ



i

| e ρ



i

| e portanto os autovalores de ρ

e ρ

s˜ao

iguais, ou seja, λ

para os dois operadores densidade. Muitas propriedades

de sistemas quˆanticos s˜ao descritas completamente pelos autovalores do op-

erador densidade reduzido e no caso de um estado puro de um sistema com-

posto, tais propriedades continuar˜ao valendo para os seus subsistemas. Por

exemplo, considere o estado de dois q-bits

(|00 + |01 + |11)/

√

Este estado n˜ao possui nenhuma simetria evidente, mas no entanto, vale que

tr((ρ

)

) = tr((ρ

)

) = 7/9. Isso ´e uma conseq¨uˆencia simples da decom-

posi¸c˜ao de Schmidt.

Para provar a decomposi¸c˜ao de Schmidt, precisamos dos seguintes resul-

tados. Lembramos que um operador linear ´e dito normal se AA

∗

= A

∗

Teorema 4.5.2 (Decomposi¸c˜ao espectral) Todo operador normal M em um

espa¸co vetorial V de dimens˜ao ﬁnita ´e diagonal com respeito a uma base

ortonormal para V . Reciprocamente, todo operador diagonaliz´avel ´e normal.

A decomposi¸c˜ao espectral ´e um resultado conhecido de ´algebra linear e

sua prova pode ser vista, por exemplo, em [32].

Teorema 4.5.3 (Decomposi¸c˜ao Polar) Seja A um operador linear em um

espa¸co vetorial V de dimens˜ao ﬁnita. Ent˜ao existe um operador unit´ario U

e operadores positivos J e K tais que

A = UJ = KU

onde os ´unicos operadores positivos J e K satisfazendo estas equa¸c˜ao s˜ao

J :=

√

∗

A e K :=

√

∗

. Al´em disso, se A ´e invers´ıvel ent˜ao U ´e ´unico.

A decomposi¸c˜ao A = UJ ´e dita decomposi¸c˜ao polar `a esquerda de A e

A = KU ´e a decomposi¸c˜ao polar `a direita de A.

Prova Note que J :=

√

∗

A ´e um operador positivo, e ent˜ao admite uma

decomposi¸c˜ao espectral J =



|ii|, λ

≥ 0. Deﬁna |ψ

 := A|i. Pela

deﬁni¸c˜ao, vemos que ψ

|ψ

 = λ

. Considerando apenas os i tais que λ

= 0,

deﬁna |e

 := |ψ

/λ

. Desta forma os |e

 est˜ao normalizados e al´em disso,

tais vetores s˜ao ortogonais, pois se i = j, ent˜ao e

 = i|A

∗

A|j/λ

i|J

|j/λ

= 0.

Acima consideramos os i tais que λ

= 0. Agora use o procedimento de

Gram-Schmidt para extender o conjunto ortonormal |e

 para obter uma base

ortonormal, que tamb´em chamaremos de |e

. Deﬁna um operador unit´ario

U :=



i|. Quando λ

= 0, temos UJ|i = λ

 = |ψ

 = A|i. Quando

= 0 temos UJ|i = 0 = |ψ

. Com isso provamos que a a¸c˜ao de A e de UJ

´e a mesma na base |i e portanto, obtemos A = UJ.

O operador J ´e ´unico, pois multiplicando A = UJ `a esquerda pela equa¸c˜ao

adjunta A

∗

= JU

∗

fornece J

= A

∗

A, donde obtemos que J =

√

∗

A. Um

c´alculo simples mostra que se A ´e invers´ıvel ent˜ao J tamb´em ´e e ent˜ao U ´e

unicamente determinado pela equa¸c˜ao U = AJ

−1

. A prova da decomposi¸c˜ao

polar `a direita segue pois A = UJ = UJU

∗

U = KU, onde K := UJU

∗

´e um operador positivo. Como AA

∗

= KUU

∗

K = K

, devemos ter que

K =

√

∗

, o que conclui a prova.



Corol´ario 4.5.4 (Decomposi¸c˜ao em valores singulares) Seja A uma matriz

quadrada. Ent˜ao existem matrizes unit´arias U e V e uma matriz diagonal

D com entradas n˜ao negativas tais que

A = UDV

Os elementos na diagonal de D s˜ao ditos valores singulares de A.

Prova Pela decomposi¸c˜ao polar, A = SJ para S unit´aria e J positiva. Pelo

teorema espectral, J = T DT

∗

, para T unit´aria e D diagonal com entradas

n˜ao-negativas. Fazendo U := ST e V := T

∗

, o resultado segue.



Prova do teorema 4.5.1 Faremos a prova no caso em que os sistemas

A e B tem espa¸cos de estado de mesma dimens˜ao. O caso geral ´e an´alogo.

Sejam |j e |k bases ortonormais para os sistemas A e B, respectivamente.

Ent˜ao |ψ pode ser escrito como

|ψ =



|j|k

para uma certa matriz complexa C com entradas c

. Pela decomposi¸c˜ao em

valores singulares, C = UDV , onde D = (d

) ´e uma matriz diagonal com

entradas n˜ao negativas, e U = (u

) e V = (v

) s˜ao matrizes unit´arias. Ent˜ao

|ψ =



ijk

|j|k

Deﬁnindo |i

 :=



|j , |i

 :=



|k e λ

:= d

, vemos que

|ψ =



|i



Vale que |i

 ´e um conjunto ortonormal, pelo fato de que U ´e unit´aria e

pela ortonormalidade de |j, e analogamente vale que |i

 ´e um conjunto

ortonormal.



As bases |i

 e |i

 s˜ao chamadas bases de Schmidt para A e B, res-

pectivamente, e o n´umero de coeﬁcientes de Schmidt λ

n˜ao nulos ´e dito

n´umero de Schmidt para o estado |ψ. O n´umero de Schmidt ´e uma pro-

priedade importante de um sistema quˆantico composto que, em um certo

sentido, quantiﬁca o emaranhamento entre os sistemas A e B. Para entender

como, considere a seguinte propriedade: o n´umero de Schmidt ´e preservado

por transforma¸c˜oes unit´arias no sistema A ou no sistema B individualmente.

Para ver porque, note que se



|i

 ´e a decomposi¸c˜ao de Schmidt para

|ψ ent˜ao



(U|i

)|i

 ´e a decomposi¸c˜ao de Schmidt para U|ψ, onde U

´e um operador unit´ario agindo apenas no sistema A. Com isso, podemos

provar o seguinte:

Proposi¸c˜ao 4.5.5 Seja |ψ um estado de um sistema composto AB. S˜ao

equivalentes:

1. |ψ ´e um estado produto.

2. |ψ possui n´umero de Schmidt igual a 1.

3. ρ

(e portanto ρ

) s˜ao estados puros.

Prova A equivalˆencia entre 1 e 2 ´e evidente pois o n´umero de Schmidt de

|ψ ser igual a 1 equivale a dizer |ψ = |k

|k

 para algum k ∈ {1, . . . , n}

A equivalˆencia entre 1 e 3, por exemplo, segue direto da deﬁni¸c˜ao de tra¸co

parcial, pois

|ψ = |i

|i

 ⇔ ρ

= |i

i

| ⊗ |i

i

| ⇔ ρ

= |i

i

| , ρ

= |i

i



Outra t´ecnica relacionada com o emaranhamento de estados ´e a seguinte.

Seja ρ

uma estado de um sistema quˆantico A.

E poss´ıvel introduzir um

outro sistema, denotado por R, e deﬁnir um estado puro |AR para o sis-

tema conjunto AR tal que ρ

= tr

(|ARAR|). Ou seja, o estado puro

|AR se reduz a ρ

quando olhamos apenas para o sistema A. Este processo

´e chamado puriﬁca¸c˜ao, e nos permite associar estados puros a estados mis-

turados de maneira natural. O sistema R ´e dito sistema de referˆencia.

Dado um estado ρ

qualquer, mostraremos como construir um sistema

R e e uma puriﬁca¸c˜ao |AR. Suponha que ρ

possui uma decomposi¸c˜ao

ortonormal ρ



i

|. Para puriﬁcar ρ

introduzimos um sistema

R que possui o mesmo espa¸co de estados que o sistema A, com estados

ortonormais |i

 e deﬁnimos um estado puro para o sistema combinado

|AR :=



√

|i

.

Agora calculamos o operador densidade reduzido para o sistema A corres-

pondente ao estado |AR:

(|ARAR|) =



√

j

|tr(|i

j

|) =



√

j

|δ



i

| = ρ

Portanto, |AR ´e uma puriﬁca¸c˜ao de ρ

Note a rela¸c˜ao entre a decomposi¸c˜ao de Schmidt e o m´etodo de pu-

riﬁca¸c˜ao: o procedimento usado para se puriﬁcar um estado misturado do

sistema A ´e deﬁnir um estado puro cuja base de Schmidt para o sistema

A ´e simplesmente a base em que o estado misturado ´e diagonal, com os

coeﬁcientes de Schmidt sendo a raiz quadrada dos autovalores do operador

densidade que est´a sendo puriﬁcado.

Cap´ıtulo 5

Entropia

5.1 Entropia de Shannon

Observa¸c˜ao Neste texto, escrevemos log x para denotar o logaritmo de x

na base 2. O logaritmo natural ser´a denotado por ln x.

A incerteza de uma cole¸c˜ao de estados poss´ıveis a

com uma distribui¸c˜ao

de probabilidade p(a

) ´e dada pela sua entropia,

H(p) := −



p(a

) log p(a

chamada entropia de Shannon. Estamos interessados em comparar duas

distribui¸c˜oes de probabilidade distintas, e para este ﬁm, introduzimos a no¸c˜ao

de entropia relativa.

Deﬁni¸c˜ao Suponha que temos dois conjuntos de eventos discretos a

e b

com distribui¸c˜oes de probabilidade correspondentes p(a

) e p(b

). A

entropia relativa (de Shannon) entre estas duas distribui¸c˜oes ´e dada por

H(p(a)p(b)) :=



p(a

) log

p(a

)

p(b

)

A entropia relativa ´e n˜ao negativa, H(p(x)q(x)) ≥ 0, e vale a igualdade

se e somente se p(x) = q(x), para todo x, e se X ´e uma vari´avel aleat´oria

com d resultados poss´ıveis, ent˜ao H(X) ≤ d, e vale a igualdade se e somente

se X ´e uniformemente distribu´ıda.

Temos que

H(p(x, y)p(x)p(y)) = H(p(x)) + H(p(y)) − H(p(x, y))

Um conceito importante derivado da entropia relativa est´a relacionado

com a obten¸c˜ao de informa¸c˜ao. Quando um sistema aprende alguma in-

forma¸c˜ao a partir de outro, dizemos que seus estados est˜ao correlacionados.

A grandeza que mede a correla¸c˜ao entre esses estados ´e a informa¸c˜ao m´utua.

Deﬁni¸c˜ao A informa¸c˜ao m´utua (de Shannon) entre duas vari´aveis

aleat´orias A e B que possuem uma distribui¸c˜ao de probabilidade conjunta

p(a

, b

), e portanto distribui¸c˜oes de probabilidade marginais p(a

) =



p(a

, b

)

e p(b

) =



p(a

, b

) ´e deﬁnida por

(A : B) := H(p(a)) + H(p(b)) − H(p(a, b))

Podemos escrever I

em termos da entropia relativa de Shannon. Neste

sentido, ela representa uma distˆancia entre a distribui¸c˜ao p(a, b) e o produto

das marginais p(a) × p(b). Vale que

(A : B) = H(p(a, b)p(a) × p(b))

Com respeito a entropia m´utua de Shannon, vemos que ela descreve a

correla¸c˜ao de dois observ´aveis, ou seja, tal grandeza ´e inerentemente cl´assica.

A entropia conjunta (de Shannon) de X e Y ´e deﬁnida de maneira

natural por

H(X, Y ) := −



x,y

p(x, y) log p(x, y)

Vale tamb´em uma propriedade subaditiva, ou seja,

H(X, Y ) ≤ H(X) + H(Y )

com igualdade se e somente se X e Y s˜ao vari´aveis independentes.

A entropia condicional (de Shannon) ´e deﬁnida por

H(X|Y ) := H(X, Y ) − H(Y )

e a informa¸c˜ao m´utua de X e Y ´e

H(X : Y ) := H(X) + H(Y ) − H(X, Y )

Nestes moldes, uma cadeia de Markov ´e uma seq¨uˆencia {X

} de vari´aveis

aleat´orias tais que X

n+1

independe de X

, X

, . . . X

n−1

, dado X

. Formal-

mente,

p(X

n+1

= x

n+1

= x

, . . . , X

= x

) = p(X

n+1

= x

n+1

= x

)

Proposi¸c˜ao 5.1.1 Valem as seguintes propriedades da entropia de Shannon:

1. H(X, Y ) = H(Y, X) , H(X : Y ) = H(Y : X)

2. H(Y |X) ≥ 0, e portanto H(X : Y ) ≤ H(Y ) com igualdade se e so-

mente se Y ´e fun¸c˜ao de X (isto ´e, se Y ocorre sempre que X ocorre).

3. H(X) ≤ H(X, Y ), com igualdade se e somente se Y ´e fun¸c˜ao de X.

4. H(X, Y ) ≤ H(X) + H(Y ) com igualdade se e somente se X e Y s˜ao

vari´aveis aleat´orias independentes (subaditividade).

5. H(Y |X) ≤ H(Y ) e portanto H(X : Y ) ≥ 0 com igualdade se e somente

se X e Y s˜ao vari´aveis independentes.

6. H(X

, X

) + H(X

) ≤ H(X

, X

) + H(X

, X

), com igualdade se

e somente se {X

, X

} formam uma cadeia de Markov (subaditivi-

dade forte).

7. H(X|Y, Z) ≤ H(X|Y ) (condicionamento diminui a entropia).

Prova

1. Evidente.

2. Como p(x, y) = p(x)p(y|x), temos

H(X, Y ) = −



p(x, y) log p(x)p(y|x)

= −



p(x) log p(x) −



p(x, y) log p(y|x)

= H(X) −



p(x, y) log p(y|x)

Logo, H(Y |X) = −



p(x, y) log p(y|x). Mas −log p(y|x) ≥ 0 e por-

tanto H(Y |X) ≥ 0 com igualdade se e somente se Y ´e uma fun¸c˜ao de

3. Segue do item anterior.

4. Usaremos o fato de que log (x) ln 2 ≤ x − 1 para todo x positivo, com

igualdade se e somente se x = 1. Assim,



x,y

p(x, y) log

p(x)p(y)

p(x, y)

≤

ln 2



x,y

p(x, y)



p(x)p(y)

p(x, y)

− 1



ln 2



p(x)p(y) − p(x, y) =

1 − 1

ln 2

= 0

A desigualdade segue. Note que a igualdade vale se e somente se

p(x, y) = p(x)p(y) para todo x e y.

5. Segue do item anterior.

6. Como na prova de subaditividade, usaremos o fato de que log (x) ln 2 ≤

x−1 para todo x positivo, com igualdade se e somente se x = 1. Assim,



p(x

, x

) log

p(x

, x

)p(x

, x

)

p(x

)p(x

, x

)

≤

ln 2



p(x

, x

)



p(x

, x

)p(x

, x

)

p(x

)p(x

, x

)

− 1



ln 2





p(x

, x

)p(x

, x

)

p(x

)

− p(x

, x

)



ln 2





p(x

, x

) −



p(x

, x

)



= 0

e a desigualdade segue. E note que a igualdade vale se e somente se

p(x

, x

)p(x

, x

)

p(x

)p(x

, x

)

= 1 ⇔

p(x

, x

)

p(x

, x

)

p(x

, x

)

p(x

)

⇔ p(x

, x

) = p(x

)

ou seja, se e somente se {X

, X

} ´e uma cadeia de Markov.

7. Basta observar que

H(X|Y, Z) ≤ H(X|Y ) ⇔ H(X, Y, Z) − H(Y, Z) ≤ H(X, Y ) − H(Y )

que ´e a subaditividade forte.



O seguinte teorema nos diz como uma cadeia de Markov perde informa¸c˜ao

sobre os seus valores anteriores, `a medida que o tempo cresce.

Teorema 5.1.2 Suponha que {X

} ´e uma cadeia de Markov. Ent˜ao

H(X

: X

i+2

) ≤ H(X

: X

i+1

) ≤ H(X

)

Prova A segunda desigualdade ´e o item 2 da proposi¸c˜ao 5.1.1. Pelas

deﬁni¸c˜oes, temos que H(X

: X

) ≤ H(X

: X

) ´e equivalente a H(X

) ≤

H(X

). Se {X

} ´e uma cadeia de Markov, ent˜ao a seq¨uˆencia inversa

tamb´em ´e, ou seja, para k ≥ 1,

p(X

n+1

= x

n+1

= x

, . . . , X

= x

) = p(X

n+1

= x

n+1

= x

) ⇒

⇒ p(X

= x

n+1

= x

n+1

, . . . , X

n+k

= x

n+k

) = p(X

= x

n+1

= x

n+1

)

e portanto H(X

) = H(X

, X

). Ent˜ao o problema ´e reduzido a

mostrar que

H(X

, X

)−H(X

, X

) = H(X

, X

) ≤ H(X

) = H(X

, X

)−H(X

)

Ora, mas essa desigualdade ´e apenas a subaditividade forte (item 6, proposi¸c˜ao

5.1.1).



Como um corol´ario do teorema acima, temos que se {X

} ´e cadeia de Markov,

ent˜ao

H(X

i+2

: X

) ≤ H(X

i+2

: X

i+1

)

Intuitivamente, isso signiﬁca que qualquer informa¸c˜ao de X

i+2

compartilhada

com X

deve ser uma informa¸c˜ao que X

i+2

compartilha com X

i+1

5.2 Entropia de von Neumann

Dada uma fun¸c˜ao f : C → C, ´e poss´ıvel deﬁnir uma fun¸c˜ao matricial da

seguinte maneira. Seja A =



a|aa| a decomposi¸c˜ao espectral para um

operador normal A. Deﬁna

f(A) :=



f(a)|aa|

Desta forma, vale que f(A) est´a unicamente determinado. Assim podemos

deﬁnir, por exemplo, o logaritmo de operadores positivo-deﬁnidos e a expo-

nencial de operadores normais. Usaremos este tipo de constru¸c˜ao para deﬁnir

a entropia de von Neumann.

Vamos considerar os an´alogos quˆanticos da se¸c˜ao anterior. A grandeza

que est´a associada com as correla¸c˜oes de todo o sistema ´e a informa¸c˜ao

m´utua de von Neumann, que deﬁniremos a seguir. Devido a sua natureza

global, n˜ao ´e dif´ıcil imaginar que esse valor depende da matriz densidade.

Come¸camos deﬁnindo a entropia quˆantica, mais conhecida como entropia de

von Neumann.

Deﬁni¸c˜ao A entropia de von Neumann de um sistema quˆantico

descrito por uma matriz densidade ρ ´e deﬁnida por

S(ρ) := −tr(ρ log ρ)

Se λ

s˜ao os autovalores de ρ ent˜ao a entropia de von Neumann pode ser

escrita como

S(ρ) = −



log λ

(5.1)

Para provar esta aﬁrma¸c˜ao, note que se

ρ =



|ii|,

ent˜ao

log ρ =



log λ

|ii|

ρ log ρ(v) = ρ(



log λ

|ii|v) =



log λ

i|vρ(|i) =



log λ

i|v

Portanto,

−tr(ρ log ρ) = −tr(



log λ

i|) = −



log λ

tr(i|) = −



log λ

A entropia de von Neumann pode ser considerado o an´alogo quˆantico da

entropia de Shannon [34]. Para provar algumas de suas propriedades, iremos

introduzir primeiro a entropia relativa associada.

Deﬁni¸c˜ao A entropia relativa (de von Neumann) entre dois estados

σ e ρ ´e dada por

S(ρσ) := tr(ρ log ρ) − tr(ρ log σ)

A propriedade b´asica ´e a seguinte desigualdade:

Lema 5.2.1 (Desigualdade de Klein). A entropia relativa quˆantica ´e n˜ao

negativa:

S(ρσ) ≥ 0,

e vale a igualdade se e somente se ρ = σ.

Prova Sejam ρ =



|ii| e σ =



|jj| decomposi¸c˜oes ortonormais

para ρ e σ. Pela deﬁni¸c˜ao de entropia relativa, temos

S(ρσ) =



log p

−



i|ρ log σ|i

Nesta ´ultima equa¸c˜ao, usamos as equa¸c˜oes i|ρ = p

i| e

i|log σ|i = i|





log (q

)|jj|



|i =



log (q

onde P

= i|jj|i ≥ 0, e da´ı obtemos

S(ρσ) =





log p

−



log (q

)



Note que P

satisfaz P

≥ 0,



= 1 e



= 1 (a matriz com entradas

´e duplamente estoc´astica). Como log (.) ´e uma fun¸c˜ao estritamente con-

cava, segue que



log q

≤ log (



) com igualdade se e somente se

existe um valor de j para o qual P

= 1. Portanto,

S(ρσ) ≥



log



com igualdade se e somente se existe um valor de j para o qual P

= 1, ou

seja, se e somente se P

´e uma matriz de permuta¸c˜ao. Esta express˜ao tem a

mesma forma da entropia relativa cl´assica. Portanto deduzimos que

S(ρσ) ≥ 0

com igualdade se e somente se p



, para todo i e P

´e uma matriz

de permuta¸c˜ao. Para simpliﬁcar essa condi¸c˜ao de igualdade, note que tro-

cando os nomes dos autoestados de σ se necess´ario, podemos supor que P

´e

a matriz identidade e ent˜ao σ e ρ s˜ao diagonais na mesma base. A condi¸c˜ao



nos diz que os autovalores correspondentes a ρ e σ s˜ao idˆenticos

e portanto a condi¸c˜ao de igualdade se reduz a aﬁrmar que ρ = σ.



Proposi¸c˜ao 5.2.2

S(ρ

σ

) ≤ S(ρ

σ

)

A prova usa o seguinte lema:

Lema 5.2.3 Existe um conjunto de matrizes unit´arias U

e uma distribui¸c˜ao

de probabilidade p

tal que para qualquer matriz A,



†

= tr(A)

onde d ´e a dimens˜ao do espa¸co de Hilbert onde o operador A est´a deﬁnido.

Juntamente com a concavidade estrita da entropia, este lema pode ser usado

para provar que o estado I/d em um espa¸co de dimens˜ao d ´e o ´unico estado

de m´axima entropia.

Prova da proposi¸c˜ao 5.2.2 Pelo lema, existem transforma¸c˜oes unit´arias

no espa¸co B e probabilidades p

tais que

⊗



†

para todo ρ

. Pela convexidade de entropia relativa, obtemos



⊗



⊗



≤





†



†



Mas a entropia relativa ´e invariante por conjuga¸c˜ao unit´aria, ent˜ao



⊗



⊗



≤









= S(ρ

σ

)

Esta desigualdade juntamente com o fato de que



⊗



⊗



= S(ρ

σ

)

fornece a monotonicidade da entropia relativa.



Prosseguimos na an´alise da entropia de von Neumann.

Deﬁni¸c˜ao A entropia conjunta (de von Neumann) S(A, B) para um

sistema composto com duas componentes A e B ´e deﬁnido de maneira natural

por

S(A, B) := −tr(ρ

log ρ

)

onde ρ

´e a matriz densidade do sistema AB.

Proposi¸c˜ao 5.2.4 Suponha que A e B s˜ao sistemas quˆanticos distintos que

possuem um estado conjunto ρ

. Ent˜ao a entropia conjunta para os dois

sistemas satisfaz as desigualdades

|S(A) − S(B)| ≤ S(A, B) ≤ S(A) + S(B)

A primeira desigualdade ´e chamada desigualdade triangular, ou desigual-

dade de Araki-Lieb.

E o an´alogo quˆantico da desigualdade H(X, Y ) ≥

H(X) para a entropia de Shannon. A segunda desigualdade ´e dita desigual-

dade subaditiva, e vale a igualdade se e somente se os sistemas A e B n˜ao

est˜ao correlacionados, ou seja, se ρ

= ρ

⊗ ρ

Prova da proposi¸c˜ao 5.2.4 A prova da desigualdade subaditiva ´e uma

aplica¸c˜ao simples da desigualdade de Klein, que podemos escrever como

S(ρ) ≤ −tr(ρ log σ)

Fazendo ρ = ρ

e σ = ρ

⊗ ρ

, note que

−tr(ρ log σ) = −tr(ρ

(log ρ

+ log ρ

))

= −tr(ρ

log ρ

) − tr(ρ

log ρ

) = S(A) + S(B)

A desigualdade de Klein nos fornece S(A, B) ≤ S(A)+S(B), como quer´ıamos.

A condi¸c˜ao de igualdade σ = ρ para a desigualdade de Klein nos fornece

condi¸c˜oes de igualdade ρ

= ρ

⊗ ρ

para a subaditividade.

Para provar a desigualdade de Araki-Lieb, introduza um sistema auxiliar

R que puriﬁca os sistemas A e B (vimos puriﬁca¸c˜ao na se¸c˜ao 4.5). Aplicando

a subaditividade, obtemos

S(R) + S(A) ≥ S(A, R)

Como ABR encontra-se em um estado puro, S(A, R) = S(B) e S(R) =

S(A, B). A desigualdade anterior pode ser reescrita como

S(A, B) ≥ S(B) − S(A)

Pela simetria entre os sistemas A e B, obtemos tamb´em S(A, B) ≥ S(A) −

S(B).



Suponha que os ρ

s˜ao estados de um sistema A. Introduza o sistema

auxiliar B cujo espa¸co de estados possui uma base ortonormal |i correspon-

dente ao ´ındice i dos operadores densidade ρ

. Deﬁna um estado conjunto de

AB por



⊗ |ii|

Para provar a concavidade de S, usaremos a propriedade subaditiva. Note

que para a matriz densidade ρ

, temos

S(A) = S







S(B) = S





|ii|



= H(p

)

S(A, B) = H(p

) +



S(ρ

)

Aplicando a desigualdade subaditiva S(A, B) ≤ S(A) + S(B), obtemos



S(ρ

) ≤ S







ou seja, S ´e concava. O m´etodo de se introduzir um sistema auxiliar, como

foi usado aqui, e na prova da desigualdade de Araki-Lieb, ´e freq¨uentemente

aplicado em teoria da informa¸c˜ao quˆantica.

Teorema 5.2.5 Suponha que P

´e um conjunto completo de projetores orto-

gonais e ρ um operador densidade. Ent˜ao a entropia do estado ρ





ρP

do sistema ap´os a medi¸c˜ao ´e tal que

S(ρ



) ≥ S(ρ)

e vale a igualdade se e somente se ρ = ρ



. Em outras palavras, medi¸c˜oes

projetivas aumentam a entropia.

Prova Aplique a desigualdade de Klein para ρ e ρ



0 ≤ S(ρ



ρ) = −S(ρ) − tr(ρ log ρ



)

O resultado segue se provarmos que −tr(ρ log ρ



) = S(ρ



). Para isso, apli-

camos as rela¸c˜oes



= I, P

= P

e a propriedade c´ıclica do tra¸co para

obter

−tr(ρ log ρ



) = −tr





ρ log ρ





= −tr





ρ log ρ





Note que ρ



= P

ρP

= P



, ou seja, P

comuta com ρ



e portanto com

log ρ



e da´ı

−tr(ρ log ρ



) = −tr





ρP

log ρ





= −tr(ρ



log ρ



) = S(ρ



)



Teorema 5.2.6 Suponha que ρ =



, onde p

´e um conjunto de proba-

bilidades e ρ

s˜ao operadores densidade. Ent˜ao

S(ρ) ≤



S(ρ

) + H(p

)

com igualdade se e somente se os estados ρ

tem suporte em subespa¸cos or-

togonais.

Prova Primeiro suponha que temos um estado puro ρ

= |ψ

ψ

|. Suponha

que os ρ

s˜ao estados de um sistema A e introduza um sistema auxiliar B

com uma base ortonormal |i correspondendo ao ´ındice i nas probabilidades

. Deﬁna

|AB :=



√

|ψ

 ⊗ |i

Como |AB ´e um estado puro, temos

S(B) = S(A) = S





|ψ

ψ



= S(ρ)

Suponha que realizamos uma medi¸c˜ao projetiva no sistema B na base |i

Ap´os a medi¸c˜ao, o estado do sistema B ´e





|ii|

Mas pelo teorema anterior, medi¸c˜oes projetivas nunca diminuem a entropia

e portanto, S(ρ) = S(B) ≤ S(B



) = H(p

). Observando que S(ρ

) = 0 para

o caso de estado puro, provamos que

S(ρ) ≤ H(p

) +



S(ρ

)

onde os estados ρ

s˜ao estados puros. Al´em disso vale a igualdade se e somente

se B = B



, que ocorre se e somente se os estados |ψ

 s˜ao ortogonais.

Considere agora o caso de estados misturados. Se ρ



e

| s˜ao as

decomposi¸c˜oes ortonormais para os estados ρ

, temos que ρ =



e

Aplicando o resultado para estados puros e a observa¸c˜ao de que



= 1

para cada i, temos

S(ρ) ≤ −



log (p

) = −



log p

−



log p

= H(p

) +



S(ρ

)

A condi¸c˜ao de igualdade para o estado misturado segue direto da condi¸c˜ao

do caso de estados puros.



Corol´ario 5.2.7 Suponha que p

s˜ao probabilidades, |i s˜ao estados ortogo-

nais para um sistema A e ρ

´e um conjunto de operadores densidade para um

outro sistema B. Ent˜ao





|ii| ⊗ ρ



= H(p

) +



S(ρ

)

e portanto

S(ρ ⊗ σ) = S(ρ) + S(σ)

para quaisquer operadores densidade ρ e σ.

Deﬁni¸c˜ao A informa¸c˜ao m´utua (de von Neumann) entre dois subsis-

temas ρ

e ρ

de um sistema conjunto ρ

´e deﬁnido por

(ρ

: ρ

; ρ

) := S(ρ

) + S(ρ

) − S(ρ

)

Algumas propriedades da entropia de Shannon n˜ao valem para a entropia

de von Neumann e isso acarreta algumas conseq¨uˆencias. Por exemplo, para

vari´aveis aleat´orias X e Y , vale a desigualdade H(X) ≤ H(X, Y ). Esta

desigualdade ´e intuitiva, ou seja, ´e natural imaginar que h´a menos incerteza

quanto ao estado de X do que incerteza quanto ao estado do sistema conjunto

formado por X e Y .

No entanto, esta intui¸c˜ao falha para estados quˆanticos. Considere um

sistema AB de dois q-bits no estado emaranhado (|00 + |11)/

√

2. Este ´e

um estado puro e portanto, S(A, B) = 0. Por outro lado, o sistema A possui

operador densidade I/2 e portanto possui entropia igual a 1.

5.3 Subaditividade forte

Esta se¸c˜ao ´e baseada em [32]. Mostraremos a desigualdade chamada suba-

ditividade forte para a entropia de von Neumann.

Teorema 5.3.1 Sejam A, B e C estados quˆanticos. Ent˜ao

S(A, B, C) + S(B) ≤ S(A, B) + S(B, C)

Para provar este resultado, precisamos saber alguns fatos sobre concavi-

dade de fun¸c˜oes.

Deﬁni¸c˜ao Sejam A e B matrizes e f (A, B) uma fun¸c˜ao real. Dizemos

que f ´e conjuntamente concava em A e B se para todo 0 ≤ λ ≤ 1,

f(λA

+ (1 − λ)A

, λB

+ (1 − λ)B

) ≥ λf(A

, B

) + (1 − λ)f(A

, B

)

Toda fun¸c˜ao conjuntamente concava ´e concava em cada uma das vari´aveis,

mas a reciproca n˜ao vale.

Teorema 5.3.2 (Lieb) Seja X uma matriz, e 0 ≤ t ≤ 1. Ent˜ao a fun¸c˜ao

f(A, B) := tr(X

†

1−t

)

´e conjuntamente concava sobre matrizes positivas A e B.

Proposi¸c˜ao 5.3.3 A entropia relativa S(ρσ) ´e conjuntamente convexa em

seus argumentos.

Prova Para matrizes A e X quaisquer no mesmo espa¸co, deﬁna

(A, X) := tr(X

†

1−t

) − tr(X

†

XA)

O primeiro termo nesta express˜ao ´e concavo em A, pelo teorema de Lieb, e

o segundo termo ´e linear em A. Portanto, I

(A, X) ´e concavo em A. Deﬁna

I(A, X) :=

t=0

(A, X) = tr(X

†

(log A)XA) − tr(X

†

X(log A)A)

Observando que I

(A, X) = 0 e usando a concavidade de I

(A, X) em A,

temos

I(λA

+ (1 − λ)A

, X) = lim

δ→0

(λA

+ (1 − λ)A

, X)

≥

≥ λ lim

δ→0

, X)

+ (1 − λ) lim

δ→0

, X)

= λI(A

, X) + (1 − λ)I(A

, X)

Ou seja, I(A, X) ´e uma fun¸c˜ao concava de A. Deﬁnindo as matrizes em bloco

A :=



ρ 0

0 σ



X :=



0 0

I 0



vemos que I(A, X) = −S(ρσ) = −(tr(ρ log ρ) −tr(ρ log σ)). A convexidade

conjunta de S(ρσ) segue da concavidade de I(A, X) em A.



Deﬁni¸c˜ao A entropia condicional (de von Neumann) ´e

S(A|B) := S(A, B) − S(B)

Corol´ario 5.3.4 Seja AB um sistema composto com componentes A e B.

Ent˜ao a entropia condicional S(A|B) ´e concava no estado ρ

de AB.

Prova Seja d a dimens˜ao do sistema A. Note que





⊗ ρ



= −S(A, B) − tr



log



⊗ ρ



= −S(A, B) − tr(ρ

log ρ

) + log d = −S(A|B) + log d

Portanto, S(A|B) = log d − S(ρ

I/d ⊗ ρ

). A concavidade de S(A|B)

segue da convexidade conjunta da entropia relativa.



Prova do teorema (5.3.1) Mostraremos que para quaisquer sistemas

quˆanticos,

S(A) + S(B) ≤ S(A, C) + S(B, C)

S(A, B, C) + S(B) ≤ S(A, B) + S(B, C)

Estas desigualdades s˜ao equivalentes. Usaremos a concavidade da en-

tropia condicional para provar a primeira, e a seguir mostramos que isso

implica a validade da segunda. Deﬁna a seguinte fun¸c˜ao de operadores den-

sidade no sistema ABC:

T (ρ

ABC

) := S(A) + S(B) − S(A, C) − S(B, C) = −S(C|A) − S(C|B)

Pela concavidade da entropia condicional, vemos que T (ρ

ABC

) ´e uma fun¸c˜ao

convexa de ρ

ABC

. Seja ρ

ABC



|ii| uma decomposi¸c˜ao espectral de

ABC

. Pela convexidade de T , T (ρ

ABC

) ≤



T (|ii|). Mas T (|ii|) = 0

pois para estados puros vale que S(A, C) = S(B) e S(B, C) = S(A). Segue

que T (ρ

ABC

) ≤ 0 e portanto

S(A) + S(B) − S(A, C) − S(B, C) ≤ 0

que ´e a primeira desigualdade que queriamos provar.

Para obter a segunda desigualdade, introduza um sistema auxiliar R pu-

riﬁcando o sistema ABC. Usando a desigualdade rec´em provada, temos

S(R) + S(B) ≤ S(R, C) + S(B, C) (5.2)

Como ABCR ´e um estado puro, S(R) = S(ABC) e S(R, C) = S(A, B) e

portanto (5.2) se torna

S(A, B, C) + S(B) ≤ S(A, B) + S(B, C)

o que conclui a prova.



5.4 Cadeias quˆanticas: entropia de Shannon

Relembrando: seja Λ uma σ-´algebra de subconjuntos de Ω e seja A:

Λ → C uma medida complexa com A(Ω) = 1. O n´umero complexo A(∆) ´e

dito amplitude quˆantica do evento ∆ ∈ Λ. Al´em disso, estaremos supondo

que A ´e σ-aditiva. A probabilidade P de que um evento ∆ ∈ Λ ocorra

´e deﬁnida por P (∆) := |A(∆)|

. Lembre que de fato tal P n˜ao ´e uma

probabilidade sobre Ω.

Iremos supor que Ω = {s

, s

, . . . , s

} , ou seja, cada elemento ω ∈ Ω

´e o resultado de uma seq¨uˆencia de medi¸c˜oes. Se (X

)

t∈

´e tal seq¨uˆencia,

escreveremos

···a

:= {ω ∈ Ω|X

(ω) = a

, X

(ω) = a

, . . . , X

(ω) = a

} (5.3)

Estamos interessados em calcular algum tipo de entropia para as cadeias

quˆanticas, de maneira an´aloga a que ´e feita ao se calcular a entropia associada

a uma cadeia de Markov usual.

Seja

−→

= (A(X

−1

)), . . . , A(X

−1

n−1

))) ∈ C

= A(X

−1

)|X

−1

))

A amplitude de (5.3) ´e

A(s

j(0)

j(1)

···s

j(t)

) = A

j(t)j(t−1)

···A

j(2)j(1)

j(1)j(0)

(

−→

)

j(0)

Vamos calcular a entropia da probabilidade associada a uma cadeia de

Markov quˆantica. Como no caso usual de entropia para o shift, podemos

deﬁnir σ : Ω → Ω, σ(ω

···) = (ω

···), a parti¸c˜ao α = {s

, s

, . . . , s

} de

Ω e a entropia (de Shannon) desta parti¸c˜ao, que no caso de cadeias quˆanticas

tem como express˜ao, fazendo µ = |A|



t−1



k=0

−k



= −



...s

t−1

µ(s

···s

t−1

) log µ(s

···s

t−1

)

= −



...s

t−1

t−2

···A

(

−→

)

×log



t−1

t−2

···A

(

−→

)



= −



...s

t−1

t−2

···A

(

−→

)



log |A

t−1

t−2

+ ··· + log |A

+ log |A

+ log |(

−→

)



= −

n−1



i=1

−→

)

log |(

−→

)

− (t − 1)

n−1



k,l=1

(

−→

)

log |A

Portanto,

(σ) = h

|A|

(σ) = lim

t→∞



t−1



k=0

−k



= −

n−1



k,l=1

(

−→

)

log |A

Observa¸c˜ao: uma poss´ıvel deﬁni¸c˜ao de entropia complexa. Podemos

nos perguntar: por que n˜ao considerar uma “entropia complexa”? Uma cons-

tru¸c˜ao desse tipo ´e poss´ıvel, mas veremos que a diﬁculdade para a obten¸c˜ao

de uma express˜ao simples reside no fato de que o argumento de um n´umero

complexo ´e linear apenas sobre certas condi¸c˜oes. Para entender isso mel-

hor, analisemos a seguinte constru¸c˜ao. Seja U

= C − {x ∈ R : x ≤ 0}.

Podemos deﬁnir em U

um ramo do argumento da seguinte maneira: seja

a : (−π, π) → S

− {−1}, a(t) = e

. Vale que tal aplica¸c˜ao ´e uma bije¸c˜ao

sobre S

−{−1}. Seja b : S

−{−1} → (−π, π) a inversa de a. Vale que b ´e

cont´ınua e limitada. Deﬁna Arg : U

→ (−π, π) por Arg(z) = b(z/|z|), que

´e um ramo do argumento em U

, o ramo principal do argumento. O ramo

do logaritmo associado a Arg ´e

Log(z) := log |z| + iArg(z) , z ∈ U

que ´e o ramo principal do logaritmo.

Fazendo o c´alculo de entropia an´alogo ao feito acima, temos:



t−1



k=0

−k



= −



...s

t−1

A(s

···s

t−1

)LogA(s

···s

t−1

)

= −



...s

t−1

t−2

···A

(

−→

)

LogA

t−1

t−2

···A

(

−→

)

= −



...s

t−1

t−2

···A

(

−→

)



log |(A

t−1

t−2

···A

(

−→

)

|+ iArg(A

t−1

t−2

···A

(

−→

)



= −



...s

t−1

t−2

···A

(

−→

)



log |A

t−1

t−2

| + ··· + log |A

| + log |A

| + log |(

−→

)

+iArg(A

t−1

t−2

···A

(

−→

)



= −

n−1



i=1

(

−→

)

log |(

−→

)

| − (t − 1)

n−1



k,l=1

(

−→

)

log |A

−i



...s

t−1

t−2

···A

(

−→

)

Arg(A

t−1

t−2

···A

(

−→

)

Se z

, . . . z

s˜ao n´umeros complexos tais que Re(z

) > 0 e Re(z

···z

) >

0, 1 ≤ i ≤ n, ent˜ao o argumento ´e aditivo, ou seja, Arg(z

···z

) = Arg(z

··· + Arg(z

). Em particular, Log(z

···z

) = Log(z

) + ··· + Log(z

Em geral, matrizes de Dirichlet n˜ao satisfazem o crit´erio dado acima. Por

exemplo, se

M(j, k) =

√

iaπ(j−k)

fazendo a = 1 e n = 3, podemos escrever

M(3, 1) =

√

(cos(4π/3) + i sin(4π/3)),

mas Re(M(3, 1)) = (1/

√

3) cos(4π/3) < 0.

Supondo que as entradas de A satisfazem a hip´otese observada acima,

temos:

(σ) = lim

t→∞



t−1



k=0

−k



= −

n−1



k,l=1

(

−→

)

( log |A

| + iArgA

)

5.5 Cadeias quˆanticas: entropia de von Neu-

mann

Pelo que vimos nas se¸c˜oes 2.2 e 4.3, podemos facilmente obter a entropia

de von Neumann de uma cadeia de Markov quˆantica. Vamos considerar um

ensemble para cada tempo t, ou seja, se

S = {s

, s

, . . . s

n−1

} = {|s

, |s

, . . . , |s

n−1

}

´e o conjunto de estados poss´ıveis, e P

(k) = P

) denota a probabilidade de

ocorrer o estado s

no tempo t, consideramos os pares {P

(k), |s

}, t ∈ N.

O operador densidade associado `a cadeia de Markov quˆantica no tempo t ´e

n−1



k=0

(k)|s

s

| =

n−1



k=0

|(A

−→

)

s

n−1



k=0





(ψ

)

(ψ

)



s

|, (5.4)

onde, lembramos, {X

} ´e uma N-cadeia quˆantica,

−→

= (A[X

= s

], . . . , A[X

= s

n−1

]) ∈ C

, . . . , λ

n−1

s˜ao os autovalores da matriz de amplitude de transi¸c˜ao A

A[X

= s

] e ψ

, . . . , ψ

n−1

a base ortonormal de autovetores corres-

pondente.

Calculando a entropia de von Neumann, temos

S(ρ

) = −tr(ρ

log ρ

) = −

n−1



k=0





(ψ

)

(ψ

)



log





(ψ

)

(ψ

)



= −

n−1



k=0



−→

)



log



−→

)



Observa¸c˜ao Note que a express˜ao para (A

−→

)

usada na equa¸c˜ao (5.4)

acima,

−→

)



(ψ

)

(ψ

)

´e v´alida apenas fazendo a suposi¸c˜ao de que

−→

= (1, 0, ···, 0), conforme

obtida no ﬁnal da se¸c˜ao 2.2. Para o caso geral de um

−→

qualquer, pro-

cedemos da seguinte maneira. Fazemos os c´alculos em dimens˜ao 2, o caso

geral ´e an´alogo, com uma nota¸c˜ao mais complicada.

Sejam λ

, λ

os autovalores de A e sejam ψ

, ψ

a base ortonormal de

autovetores correspondente. Ent˜ao,

−→

= A



j=0,1



−→

, ψ

ψ



j=0,1



A(X

= 0)(ψ

)

+ A(X

= 1)(ψ

)





A(X

= 0)(ψ

)

+ A(X

= 1)(ψ

)





A(X

= 0)(ψ

)

+ A(X

= 1)(ψ

)



No caso particular em que

−→

= (1, 0), obtemos a express˜ao vista em [1],

p´agina 37, que em dimens˜ao 2 ´e

(1, 0) = (ψ

)

+ (ψ

)

o que implica

P (X

= k) = |(ψ

)

(ψ

)

+ (ψ

)

(ψ

)

, k = 0, 1.

e em dimens˜ao n,

P (X

= k) = |



(ψ

)

(ψ

)

, k = 0, 1, . . . , n − 1.

Mas no caso geral para

−→

qualquer, em dimens˜ao n, temos apenas que

−→

n−1



j=0



n−1



k=0

A(X

= k)(ψ

)



Cap´ıtulo 6

Formalismo Termodinˆamico

Neste cap´ıtulo analisamos um problema variacional para cadeias de Markov

ﬁnitas. Se H denota a entropia, U ´e um potencial, e λ ´e um certo autovalor

associado a U, temos um princ´ıpio variacional para energia livre:

H(µ) −



Udµ ≤ log λ

onde vale a igualdade se e somente se µ for uma determinada medida especial

ν = ν

(U)

, que chamamos medida de Markov (faremos os detalhes a seguir).

Dado este teorema para cadeias de Markov reais, podemos nos perguntar se

existe algum an´alogo para cadeias quˆanticas.

6.1 Introdu¸c˜ao

Apresentamos aqui um teorema de O. E. Lanford e D. Ruelle [26] numa

vers˜ao de F. Spitzer [38] que caracteriza (em uma caso simpliﬁcado) o estado

de Gibbs (no reticulado unidimensional Z) como sendo aquele que maximiza

a energia livre. Essa energia ´e baseada em um potencial U que descreve de

alguma forma a intera¸c˜ao entre elementos vizinhos no reticulado Z. Vamos

assumir aqui que esta U tem uma express˜ao simples (um elemento no retic-

ulado depende da intera¸c˜ao de um n´umero ﬁnito ﬁxo de vizinhos) e assim

ela determina uma matriz de transi¸c˜ao M de uma cadeia de Markov [33] e

esta deﬁne uma certa probabilidade estacion´aria sobre o espa¸co de Bernoulli.

Esta probabilidade ν ser´a o estado de Gibbs associado a U. Deste modo,

ser´a poss´ıvel apresentar ao leitor uma vers˜ao matematicamente rigorosa de

algumas id´eias b´asicas e resultados fundamentais que aparecem em certos

problemas simples de Mecˆanica Estat´ıstica. Esta exposi¸c˜ao ´e baseada em

[38].

6.2 Caracteriza¸c˜ao variacional

6.2.1 Introdu¸c˜ao

A entropia ´e uma grandeza que mede a caoticidade, ou complexidade de um

sistema: quanto maior for a entropia, mais ca´otico ´e o sistema. Esse conceito

aparece na F´ısica e est´a associado com o princ´ıpio de que a natureza tende

a maximizar a entropia. Se em um tempo inicial t

consideramos part´ıculas

de g´as concentradas em um dos cantos de uma caixa fechada, ent˜ao ap´os

algum tempo (ap´os o equil´ıbrio) as part´ıculas tender˜ao a uma situa¸c˜ao, onde

elas estar˜ao espalhadas na forma mais aleat´oria poss´ıvel. Isso signiﬁca que

decorrido algum tempo, o g´as ter´a uma distribui¸c˜ao uniforme na caixa.

Um sistema de part´ıculas ´e muito mais aleat´orio (tem mais entropia) se

estiver uniformemente distribu´ıdo na caixa do que se estivesse concentrado

em um dos cantos. Vemos assim que o equil´ıbrio ´e atingido em conﬁgura¸c˜oes

de m´axima entropia.

A entropia tamb´em est´a relacionada com a Teoria de Informa¸c˜ao, a partir

dos trabalhos de Shannon. Se quisermos transmitir uma mensagem atrav´es

de um certo meio de comunica¸c˜ao usando um determinado alfabeto de n

s´ımbolos {1, . . . , n}, cada s´ımbolo com uma certa probabilidade p

, . . . , p

de ocorrer,



i=1

= 1 (suponha que a ocorrˆencia dos s´ımbolos seja inde-

pendente), ent˜ao a entropia deste sistema ´e a entropia do shift de Bernoulli

B(p

, p

, . . . , p

), ou seja,



i=1

−p

log p

A valor da entropia para medidas mais gerais tem uma express˜ao mais

complexa. Nosso proposta aqui ´e a de usar a entropia de Shannon-Kolomogrov

como uma ferramenta matem´atica para se estudar a Mecˆanica Estat´ıstica.

O que apresentamos aqui ´e baseado na abordagem de Bowen-Ruelle-Sinai

para entender reticulados em uma dimens˜ao e veremos que essa proposta

inclui estudar a press˜ao topol´ogica do shift. Tal teoria ´e o que chamamos

atualmente de Formalismo Termodinˆamico. Uma dos objetos desta teoria

´e o operador de Ruelle-Perron-Frobenius, que ´e uma generaliza¸c˜ao natural

(para o espa¸co de fun¸c˜oes cont´ınuas) de uma matriz com todas as entradas

positivas. No caso de dimens˜ao ﬁnita, o teorema de Perron-Frobenius agindo

em R

basta para se obter o que se necessita. O operador de Ruelle-Perron-

Frobenius possui diversas aplica¸c˜oes em outras ´areas da matem´atica, como

por exemplo Geometria e Teoria dos N´umeros. Algumas vezes, na F´ısica,

este operador ´e denominado matriz de transferˆencia.

6.2.2 Energia livre

Para motivar o problema que vamos analisar em breve vamos apresentar ini-

cialmente o modelo mais simples possivel. Considere um sistema f´ısico com

estados {1, . . . , n}, e sejam U

, . . . U

as energias desses estados, respecti-

vamente. Suponha que colocamos o sistema em contato com uma fonte de

calor muito maior, que est´a a uma temperatura T . Sendo assim, a energia ir´a

transitar entre o sistema original e a fonte de calor, e a temperatura T per-

manecer´a constante, pois a fonte ´e muito maior que o nosso sistema. O pro-

blema f´ısico que estamos considerando n˜ao ´e determin´ıstico, e n´os podemos

apenas falar da probabilidade de um certo estado ﬁxo, digamos j, ocorrer,

onde j ∈ {1, 2, .., n}. Apos esperar que o sistema se encontre em equilibrio,

se realizarmos uma sequˆencia de observa¸c˜oes, notaremos que o estado j ir´a

ocorrer numa determinda propor¸c˜ao de vezes.

Por exemplo, se ﬁzermos 1000 observa¸c˜oes e em 112 delas aparece o estado

2, diremos que existe evidˆencia de que 2 tem probabilidade P

112

1000

Ent˜ao o que queremos saber, para cada j, ´e o valor dessa propor¸c˜ao

quando o n´umero de observa¸c˜oes vai a inﬁnito.

E um fato conhecido da

Mecˆanica Estat´ıstica (a partir de observa¸c˜oes) que a probabilidade P

de que

o estado j ocorra ´e dado pela distribui¸c˜ao de Gibbs:

−BU



i=1

−BU

, j ∈ {1, . . . , n},

onde B =

e k ´e uma constante, chamada constante de Boltzmann.

Uma formula¸c˜ao variacional do que foi dito acima pode ser feita da

seguinte maneira. Seja

F (p

, . . . , p

) = −



i=1

log p

−



i=1

deﬁnida no simplexo em R

dado por



, . . . , p

) : p

≥ 0, i ∈ {1, . . . n},



i=1

= 1



Usando multiplicadores de Lagrange, podemos mostrar que o m´aximo de F

no simplexo ´e obtido em

−BU



i=1

−BU

, j ∈ {1, . . . , n},

ou seja, de acordo com o valor P

dado acima.

A fun¸c˜ao

S(p

, . . . , p

) = −



i=1

log p

´e a entropia da distribui¸c˜ao (p

, . . . , p

). Deﬁna U(p

, . . . , p

) = −



i=1

como sendo a energia m´edia. Ent˜ao podemos dizer que a distribui¸c˜ao de

Gibbs maximiza o valor

S(p

, . . . , p

) + BU(p

, . . . , p

)

Nesse contexto, a express˜ao S + BU ´e o que chamaremos de energia livre.

Logo, podemos dizer que a natureza minimiza a energia livre. Quando faze-

mos a temperatura T tender a +∞, isto ´e, se B tender a 0, maximizamos a

entropia.

Ap´os a an´alise do sistema mais simples descrito acima, vamos considerar

um caso um pouco mais complexo.

O modelo proposto por Ruelle ´e o seguinte (usaremos um modelo seme-

lhante na pr´oxima se¸c˜ao). Considere um reticulado unidimensional Z. Cada

inteiro est´a associado a um estado 1, . . . , n e uma conﬁgura¸c˜ao do sistema ´e

uma sequˆencia ω

∈ {1, . . . , n}, i ∈ Z. O nosso espa¸co de conﬁgura¸c˜oes ´e,

ent˜ao, Ω = {1, . . . , n} . Seja σ : Ω → Ω a aplica¸c˜ao shift, ˜ω = σ(ω), dada

por ˜ω

= (σ(ω))

= ω

k+1

, ω = (..., ω

−1

, ω

, . . .), k ∈ Z.

Em outras palavras, se ω = (..., ω

−2

, ω

−1

, ω

, ...), onde na posi¸c˜ao

zero do reticulado Z temos o valor ω

, ent˜ao

˜ω = σ(ω) = (..., ˜ω

−2

, ˜ω

−1

, ˜ω

, ...),

onde na posi¸c˜ao zero do reticulado Z temos o valor ˜ω

, e ˜ω

= ω

k+1

Seja T o espa¸co de probabilidades invariantes para o shift, i.e., µ ∈ T ⇔

µ(A) = µ(σ

−1

(A)), A conjunto de Borel. Este ´e o modelo da Mecˆanica Es-

tat´ıstica no reticulado Z via o shift de Bernoulli. Um modelo mais apropriado

seria sobre o reticulado tridimensional Z

, mas aqui vamos evitar situa¸c˜oes

mais complexas.

Seja U : Ω → R uma fun¸c˜ao cont´ınua, que cont´em a informa¸c˜ao rela-

cionada com alguma grandeza f´ısica (energia, temperatura, campo magn´etico,

etc.). Queremos obter agora uma maneira de determinar a distribui¸c˜ao de

Gibbs no reticulado unidimensional inﬁnito de uma forma semelhante a usada

no caso ﬁnito que vimos acima.

A distribui¸c˜ao de Gibbs associado a U ser´a uma probabilidade ν sobre o

espa¸co Ω = {1, . . . , n} .

Por exemplo, considere uma determinada distribui¸c˜ao de spins + ou −

de part´ıculas no reticulado unidimensional Z (poder´ıamos ter escrito 0 e 1

no lugar de + e −, por exemplo). Devemos considerar o espa¸co de Bernoulli

de dois s´ımbolos Ω = {+, −} , e probabilidades µ em Ω. ﬁxado U, qual

probabilidade ν ´e a de Gibbs asociada a U?

E apropriado considerar ape-

nas probabilidades em T porque n˜ao h´a uma raz˜ao natural para destacar

um determinado ponto do reticulado como sendo o valor i = 0. Assim, a

probabilidade de Gibbs deve ser invariante por transla¸c˜ao.

Vamos denotar por ++ = {ω = (. . . , ω

−1

, ω

, ...)| tal que ω

+, ω

= +}. Da mesma forma, + − + = {ω = (. . . , ω

−1

, ω

, ...)|

tal que ω

= +, ω

= −, ω

= +}, e assim por diante...

O estado de Gibbs ν vai dizer, por exemplo, qual a probabilidade de

ocorrer no reticulado o arranjo ω

= +, ω

= −, ω

= +, atrav´es de ν(+ − +).

Na verdade, vamos considerar o espa¸co Ω = {+, −} e n˜ao {+, −} .

Exemplo. Seja Ω = {+, −} . Suponha que U ´e constante em cada um

dos cilindros ++, +−, −+ e −−. Vamos identiﬁcar + com 2 e − com 1.

Sejam p

≥ 0, p

+ p

= 1, p

+ p

= 1 e deﬁna

U da seguinte maneira:

U(ω) =











−log p

, se ω ∈ ++

−log p

, se ω ∈ +−

−log p

, se ω ∈ −+

−log p

, se ω ∈ −−

Neste caso, assumimos que no reticulado Z existe uma probabilidade p

obter um + `a direita de um + e uma probabilidade p

de obter um − `a

direita de um +.

Qual seria o estado de Gibbs ν associado a tal U?

Voltemos agora ao caso geral.

Dada uma fun¸c˜ao U cont´ınua em Ω, vamos analisar o seguinte problema

variacional. Seja

P (U) = sup

µ∈T



S(µ) +



Udµ



onde S(µ) ´e a entropia da probabilidade µ (ver deﬁni¸c˜ao na pr´oxima se¸c˜ao).

Diremos que P (U) ´e a press˜ao topol´ogica associada a U.

Gostar´ıamos de encontrar um probabilidade ν, deﬁnida em todo o espa¸co

Ω, que assuma o supremo mencionado acima. Tal probabilidade ser´a chamada

de estado de equil´ıbrio, ou estado de Gibbs associado ao potencial U.

Em outras palavras,

P (U) = S(ν) +



Udν ≥ S(µ) +



Udµ, ∀µ ∈ T .

O estado de equil´ıbrio ν ser´a deﬁnido, portanto, por meio de um princ´ıpio

de m´aximo, ou seja, ν maximiza algo. O potencial U do exemplo particular

acima mencionado descreve uma certa intera¸c˜ao entre spins no reticulado,

mas o problema faz sentido para U qualquer, n˜ao necessariamente como no

exemplo. Poderia, por exemplo, depender de mais coordenadas, n˜ao ape-

nas duas. Vamos considerar na pr´oxima se¸c˜ao o caso simples em que U(ω)

depende apenas de duas, ou seja de ω

e ω

, onde ω = (···ω

−1

···),

ou seja, cada spin depende apenas do vizinho `a direita. No exemplo dado

abaixo, a solu¸c˜ao pode ser obtida atrav´es de

Algebra Linear, ou seja, pela

teoria de Cadeias de Markov e pelo Teorema de de Perron-Frobenius (de-

scrito no Apˆendice deste cap´ıtulo). Se o U depende de inﬁnitas coordenadas,

a´ı o procedimento via

Algebra Linear n˜ao resolve o problema; ´e necess´ario

utilizar [35].

Ruelle mostrou que o que os f´ısicos denominam de estado de Gibbs, no

caso do reticulado Z, pode ser obtido via o procedimento acima atrav´es de

uma escolha correta de U. Diferentes problemas de Mecˆanica Estat´ıstica

requerem diferentes U.

A an´alise de quest˜oes mais gerais em Mecˆanica Estat´ıstica pode ser en-

contrada em [10] [40].

6.2.3 Caracteriza¸c˜ao variacional

Para simpliﬁcar, no lugar de Ω = {1, ···, n} , vamos considerar

Ω = {1, ···, n} .

O problema para um U geral deﬁnido em Ω = {1, ···, n} pode ser re-

duzido a este {1, ···, n} (ver Proposition 1.2 [35]).

Seja uma fun¸c˜ao potencial do tipo U : {1, ···, n} → R, com U(ω) =

U(ω

, ω

), onde ω = (ω

···), isto ´e, U s´o depende de duas coordenadas.

Observe que se consideramos um potencial U que depende de n coordenadas,

com 2 < n < ∞, podemos modiﬁcar o espa¸co Ω de modo a fazer com que U

dependa de apenas duas coordenadas.

Por exemplo, suponha que Ω = {1, 2} e que temos um potencial U que

depende de 3 coordenadas, isto ´e, U(ω) = U(ω

, ω

). Considere ent˜ao o

espa¸co

Ω = {1

∗

, 2

∗

, 3

∗

, 4

∗

} e o relacionamos com Ω fazendo as identiﬁca¸c˜oes

11 ↔ 1

∗

12 ↔ 2

∗

21 ↔ 3

∗

22 ↔ 4

∗

Note agora que certas rela¸c˜oes est˜ao proibidas. O par 1

∗

n˜ao ´e permi-

tido. O par 1

∗

´e permitido.

Podemos pensar que U est´a deﬁnido em

Ω como uma certa V . De fato, V

deﬁnida de maneira natural em

Ω depende apenas de duas coordenadas, pois,

por exemplo U(1, 1, 2, . . .) = U(1, 1, 2) = V (1

∗

, 2

∗

), ainda U(1, 2, 2, . . .) =

U(1, 2, 2) = V (2

∗

, 4

∗

) e assim por diante.

Desta maneira se pode fazer recair o caso em que U depende de ﬁnitas

coordenadas no espa¸co de Bernoulli ao caso em que dependa de apenas duas,

como ser´a analisado a seguir.

Tal procedimento n˜ao pode ser feito se o potencial considerado depende

de inﬁnitas coordenadas.

Um cilindro de Ω de comprimento k ´e um conjunto A da seguinte forma:

ﬁxe (a

, ···, a

) ∈ {1, ···, n}

A = {ω = (ω

, ···, ω

, ω

k+1

, .., ω

, ...) ∈ Ω : (ω

, ···, ω

) = (a

, ···, a

)}

Iremos denotar tal cilindro por

A = a

···a

Seja F a σ-´algebra gerada pelos cilindros de Ω de todos os comprimentos

poss´ıveis.

Seja σ : Ω → Ω a aplica¸c˜ao shift dada por (σω)

= ω

k+1

, k ∈ N.

Em outras palavras, se ω = (ω

, ω

, ...),

σ(ω) = (ω

, ω

, ...).

Por exemplo, em Ω = {1, 2, 3} , temos que

σ(1, 2, 1, 1, 3, 2, ..) = (2, 1, 1, 3, 2, ..).

Iremos a seguir considerar medidas µ sobre a σ-´algebra F. Diremos que

µ ∈ T ⇔ (Ω, F, µ) ´e espa¸co de probabilidade, com µ invariante pelo shift

(i.e., µ(σ

−1

(A)) = µ(A), A ∈ F), e diremos que T ´e o conjunto das medidas

invariantes por transla¸c˜ao. Sabe-se que T ´e compacto se consideramos a

convergˆencia fraca de medidas [7] [6].

Seja k ﬁxo e A

o conjunto dos cilindros de comprimento k, k ≥ 1, que ´e

uma parti¸c˜ao de Ω. Deﬁna a entropia da parti¸c˜ao por

S(A

) = −



a∈A

µ(a) log µ(a)

onde escrevemos a = a

, . . . a

∈ A

Deﬁnimos a entropia da medida (com rela¸c˜ao ao shift) por

s(µ) = lim

n→+∞

S(A

)

, µ ∈ T , (6.1)

Deﬁnindo a fun¸c˜ao potencial U : Ω → R, diremos que U(i, j), 1 ≤ i, j ≤ n

´e a energia de intera¸c˜ao entre ω

e ω

k+1

se ω

= i, ω

k+1

= j. Deﬁna a energia

m´edia da parti¸c˜ao A

como sendo

E(A

) =



a∈A



µ(a)



U(a

, a

j+1

)



A energia espec´ıﬁca da parti¸c˜ao com respeito a U ´e

(µ) = lim

n→+∞

E(A

)

(6.2)

que ´e uma fun¸c˜ao cont´ınua e aﬁm. Aﬁrmamos que

(µ) =



Udµ

De fato, pelo teorema erg´odico de Birkhoﬀ (proposi¸c˜ao 6.4.3) e aplicando o

teorema da convergˆencia dominada para a sequˆencia de fun¸c˜oes



N−1

k=1

U ◦

, temos:



Udµ =



lim

N→+∞

N−1



j=1

U(σ

(ω))dµ(ω) = lim

N→+∞



N−1



j=1

U(σ

(ω))dµ(ω) =

= lim

N→+∞

N−1



j=1



U(σ

(ω))dµ(ω) = lim

N→+∞



a∈A

µ(a)U(σ

(a)) =

= lim

N→+∞



a∈A

µ(a)



U(a

, a

j+1

) = e

(µ)

Assim, se a energia livre em A

´e

F (A

) = S(A

) − E(A

deﬁnimos a energia livre espec´ıﬁca como sendo

(µ) = s(µ) − e

(µ) = s(µ) −



Udµ (6.3)

Vamos estar interessados nas medidas µ que maximizam tal valor.

O conjunto M ⊂ T das medidas de Markov ser´a deﬁnido da seguinte

maneira. Diremos que µ ∈ M ⇔ ∃ matriz n×n linha estoc´astica M = M

(i.e.,



= 1) estritamente positiva tal que

µ(a

, ···a

) = ϕ

M(a

, a

)M(a

, a

) ···M(a

N−1

, a

) , a

, . . . , a

∈ {1, . . . , n}

(6.4)

onde ϕ ´e o ´unico vetor de probabilidade invariante `a esquerda para M (ou

seja, ϕ

> 0, 1 ≤ k ≤ n,



= 1 e ϕM = ϕ). Deﬁnindo µ sobre os

cilindros, ﬁca determinada de maneira ´unica, pelo teorema de Kolmogorov,

uma medida de probabilidade sobre a σ-´algebra gerada pelos cilindros.

Voltando `a fun¸c˜ao potencial U dada acima, seja a matriz Q = Q

deﬁnida

por

Q(i, j) = e

−U(i,j)

, 1 ≤ i, j ≤ n (6.5)

Seja λ = λ(U) o maior autovalor (positivo) de Q e sejam l, r os autove-

tores `a esquerda e `a direita de Q correspondentes a λ, e normalizados de

modo que l

> 0, r

> 0, 1 ≤ i ≤ n e l, r =



= 1 (proposi¸c˜ao 6.4.1).

Deﬁna a seguinte matriz:

M(i, j) =

Q(i, j)

, 1 ≤ i, j ≤ n (6.6)

A matriz M = M(U) ´e positiva e ´e linha estoc´astica. De fato:

Qr = λr ⇒ Q













= λ(r

, ···, r

) ⇒



Q(i, j)r

= λr

Ent˜ao



M(i, j) =



Q(i, j)

λr



Q(i, j)r

λr

= 1

Observe que M tem um vetor de probabilidade invariante

= l

, 1 ≤ i ≤ n (6.7)

De fato,

ϕM = (l

, ···, l

)M ⇒

⇒ (ϕM)



M(k, i) =



Q(k, i)



Q(k, i) =

λl

= r

= ϕ

⇒ ϕM = ϕ

Note que l

e r

s˜ao deﬁnidos a menos de constante multiplicativa e acima

escolhemos ϕ = (ϕ

, ···, ϕ

) como sendo ϕ

= l

, i = 1, . . . , n e



= 1,

> 0.

Vamos formular a caracteriza¸c˜ao variacional de ν. Para U ﬁxo, seja ν =

(U)

a medida de Markov deﬁnida pela matriz de transi¸c˜ao M = M(U) obtida

acima, isto ´e,

ν(a) = ϕ

M(a

, a

)M(a

, a

) ···M(a

k−1

, a

) , a ∈ A

Dizemos que σ ´e erg´odica para µ (invariante) se σ

−1

(A) = A implica

µ(A) = 0 ou 1. Pode-se mostrar que a probabilidade ν acima ´e invariante e

erg´odica para o shift σ se¸c˜ao 11.6 [36].

Aﬁrmamos que sup

µ∈T

(µ) = f

(ν). Mais precisamente, temos o seguinte:

Teorema 6.2.1 Seja U : Ω → R cont´ınua. Ent˜ao:

(µ) ≤ log λ(U) = log(λ) , ∀µ ∈ T (6.8)

e vale a igualdade se e somente se µ for a medida de Markov ν = ν

(U)

deﬁnida

acima.

Uma maneira de provar o teorema consiste em 3 passos:

1. Mostrar a desigualdade, e que vale a igualdade se µ = ν

(U)

2. Mostrar a desigualdade estrita se µ = ν

(U)

, µ erg´odica.

3. Mostrar a desigualdade estrita se µ = ν

(U)

, µ qualquer.

100

Na demonstra¸c˜ao a seguir, escreveremos ν

(U)

= ν.

Prova Mostremos o primeiro passo. Seja ν a medida de Markov deﬁnida

por M, e µ ∈ T qualquer. Sejam M e ϕ deﬁnidos por (5), (6), (7), ν(a) =

M(a

, a

)M(a

, a

) ···M(a

k−1

, a

Suponha ainda que os cilindros considerados tem comprimento N,isto ´e,

consideramos os cilindros de A

. Ent˜ao

E(A

) =



a∈A



µ(a)

N−1



k=1

U(a

, a

k+1

)



Escrevendo λ(U) = λ, temos:

N−1



k=1

U(a

, a

k+1

) =

N−1



k=1

−log Q(a

, a

k+1

) = −log

N−1



k=1

Q(a

, a

k+1

) =

= −log



N−1



k=1

M(a

, a

k+1

)λ

k+1



= −



log

N−1



k=1

M(a

, a

k+1

) + log

N−1



k=1

λ + log

N−1



k=1

− log

N−1



k=1

k+1



= −(N − 1) log λ − log



N−1



k=1

M(a

, a

k+1

)



− log r

+ log r

= −(N − 1) log λ − log

ν(a)

− log r

+ log r

= −(N − 1) log λ − log ν(a) + log l

− log r

+ log r

= −(N − 1) log λ − log ν(a) + log l

+ log r

Calculando a energia m´edia com respeito a µ obtemos

E(A

) =



a∈A

µ(a)

N−1



k=1

U(a

, a

k+1

) =



a∈A

µ(a)(−(N − 1) log λ − log ν(a) + log l

+ log r

)

101

Como o n´umero de a

∈ {1, 2, .., n} ´e ﬁnito e os r

e l

s˜ao positivos,

ent˜ao existe c

e c

tal que para todo i vale c

< log r

, log l

< c

Sendo assim,



a∈A

µ(a)(−(N − 1) log λ − log ν(a) + 2 c

) ≤

≤ E

(µ) =



a∈A

µ(a)(−(N − 1) log λ − log ν(a) + log l

+ log r

) ≤

≤



a∈A

µ(a)(−(N − 1) log λ − log ν(a) + 2 c

Observando que o somat´orio



a∈A

µ(a) log

ν(a)

µ(a)

(6.9)

´e negativo (veja a proposi¸c˜ao 6.4.2), temos

F (A

) =

(S(A

) − E(A

)) = (6.10)



a∈A

µ(a) log

ν(a)

µ(a)

+ log λ −

log λ

−

(log l

+ log r

)

≤ (6.11)

≤ log λ −

log λ

− 2

(6.12)

Fazendo N → +∞, obtemos a desigualdade procurada, isto ´e, f

(µ) ≤

log λ. Para mostrar a igualdade, observe que o somat´orio (6.9) ´e igual a zero

se µ = ν. Segue da´ı que

log λ −

log λ

− 2

≤

F (A

) ≤ log λ −

log λ

− 2

(6.13)

Fazendo N → +∞, obtemos a igualdade, ou seja, f

(µ) = log λ se µ =

(U)

(isto ´e, se µ for a medida de Markov). Isso prova o primeiro passo.

Agora vamos supor provado o segundo passo (ou seja, suponha que vale a

desigualdade estrita se µ = ν

(U)

, µ erg´odica). Este segundo passo ´e bastante

t´ecnico e referimos o leitor para uma prova geral em [35].

Mostremos o terceiro passo, ou seja, que vale a desigualdade estrita se

µ = ν

(U)

, µ qualquer.

102

Primeiro, observamos que T ´e convexo [39]. De fato, se µ

, µ

∈ T , ent˜ao

µ = (1 − λ)µ

+ λµ

´e tal que

µ(σ

−1

(A)) = (1−λ)µ

(σ

−1

(A))+λµ

(σ

−1

(A)) = (1−λ)µ

(A)+λµ

(A) = µ(A)

e ent˜ao µ ∈ T , logo T ´e convexo.

Vale que s ´e semicont´ınua superiormente (ver [42]), e como e

´e cont´ınua,

= s − e

´e uma fun¸c˜ao semicont´ınua superiormente. Seja

K = K

= {µ ∈ T : f

(µ) assume o valor m´aximo M}

(Sabemos que T ´e compacto e f

´e semicont´ınua superiormente; isto implica

que f

assume um m´aximo em T , conforme [27]). Vimos no primeiro passo

que ν ∈ K. Aﬁrmo que K ´e fechado. De fato, seja µ = lim µ

, µ

∈ K. Ent˜ao

M = lim sup

n→∞

(µ

) ≤ f

(µ)

e logo, f

(µ) assume o m´aximo ⇒ µ ∈ K. Logo, K ´e fechado. Segue da´ı que

K ´e compacto, pela compacidade de T .

Como f

´e uma aplica¸c˜ao aﬁm, vale que K ´e convexo [39]. Com efeito,

sejam µ

, µ

∈ K. Se µ = (1 − λ)µ

+ λµ

, temos

(µ) = f

((1−λ)µ

+λµ

) = (1−λ)f

(µ

)+λf

(µ

) = (1−λ)M +λM = M

e logo, (1 − λ)µ

+ λµ

∈ K ⇒ K ´e convexo.

Para mostrar a desigualdade estrita, ´e suﬁciente mostrar que K = {ν}.

Como K ´e compacto e convexo, pelo teorema de Krein-Milman (ver o Apˆendice

deste cap´ıtulo), isso ocorrer´a se e somente se K tem um ´unico ponto extremo.

Aﬁrmamos que todo ponto extremo de K ´e um ponto extremo de T . Com

efeito, suponha por absurdo que η ´e ponto extremo de K que n˜ao ´e ponto

extremo de T . Ent˜ao η pode ser escrito como

η = λµ

+ (1 − λ)µ

, 0 < λ < 1 , µ

/∈ K ou µ

/∈ K

Suponha que µ

/∈ K. Ent˜ao, f

(µ

) < M e assim,

M = f

(η) = f

(λµ

+ (1 − λ)µ

) = λf

(µ

) + (1 − λ)f

(µ

) <

< λM + (1 − λ)f

(µ

) ≤ λM + (1 − λ)M = M,

absurdo. Logo, todo ponto extremo de K ´e um ponto extremo de T .

103

Um fato conhecido sobre o conjunto T ´e que os seus pontos extremos

s˜ao justamente as medidas erg´odicas [42]. Ent˜ao o problema ´e reduzido a

mostrar que K n˜ao cont´em outras medidas erg´odicas al´em de ν. Ora, mas

pelo segundo passo, se supomos que a medida µ = ν considerada ´e erg´odica,

ent˜ao vale a desigualdade estrita, ou seja, µ n˜ao ´e tal que f

assume um

m´aximo. Isso completa a prova.



6.3 Observa¸c˜oes sobre processos quˆanticos

Sabemos de [15] que a matriz de amplitude [A

] ´e uma matriz unit´aria, suas

entradas s˜ao n˜ao-nulas e ´e coluna-estoc´astica, ou seja



= 1.

Seja A a matriz de amplitude de transi¸c˜ao de uma N-cadeia. Deﬁna a

matriz de amplitude de transi¸c˜ao com um potencial por A

: S ×S → C,



(

q, q



) :=

−iV (q)

(

q, q



) =

−iV (q)



Interpretamos que A



´e, como no caso de cadeias de Markov, a amplitude

de transi¸c˜ao de q at´e q



. Supomos que o potencial depende apenas da posi¸c˜ao

onde a part´ıcula se encontra, ou seja, V = V (q).

Dizemos que A

´e a amplitude correspondente a uma part´ıcula evoluindo

sob a inﬂuˆencia de um potencial. Note que se V = 0, A

se reduz `a fun¸c˜ao

de amplitude livre A.

A seguir, escreveremos S = {s

, . . . , s

n−1

} e V (s

) = V (k).

Lema 6.3.1 Vale que A

´e uma matriz unit´aria com entradas n˜ao nulas.

Al´em disso, A

´e coluna-estoc´astica apenas quando consideramos potenciais

V do tipo

V (s

) = 2πc

, c

∈ Z , k = 0, . . . n − 1.

Prova De fato,

V ∗

)



)



iV (j)

−iV (k)

= e

i(V (j)−V (k))





0 , se j = k

1 , se j = k

104

onde a ´ultima igualdade, no caso j = k, segue do fato que A ´e N-cadeia

quˆantica (e portanto unit´aria) e, no caso em que j = k, do fato que



|A(X

−1

) ∩ X

−1

))|

= 1

Como A tem entradas n˜ao nulas, ´e claro que A

tamb´em.

Vale que A

´e coluna-estoc´astica apenas quando consideramos potenciais

V do tipo

V (s

) = 2πc

, c

∈ Z , k = 0, . . . n − 1,

pois



−iV (k)

= e

−iV (k)



= e

−iV (k)



A seguir, fazemos outras observa¸c˜oes.

1) Considere as matrizes de Dirichlet

M(n, a) =

√

iπa(j−k)

, j, k = 0, 1, . . . , n − 1

vistas na se¸c˜ao 2.3. Ali, mostra-se uma maneira de transformar tal matriz

em uma outra, M



(n, a), que ´e estoc´astica desde que na seja par. O m´etodo

visto ali n˜ao funciona para M(3, 1) por exemplo. Para resolver esse caso,

tentamos usar uma id´eia baseada em [38], onde se usa o maior autovalor de

uma dada matriz positiva A e o seu autovetor `a direita para transform´a-la em

estoc´astica. Mas aqui temos apenas matrizes complexas, ent˜ao necessitamos

de algumas adapta¸c˜oes.

A matriz M(3, 1) ´e

M(3, 1) =

√







1+i

√

−1−i

√

1+i

√

1+i

√

−1−i

√

1+i

√







Os autovalores e autovetores s˜ao, respectivamente,

−i , (1, −1, 1);

i +

√

, (1, 1, 0), (−1, 0, 1).

Gostar´ıamos de escolher de alguma maneira natural um dos autovalores de

M(3, 1). Note que a norma dos dois autovalores ´e 1.

105

Deﬁna T : M(3, C) → M(3, R) a aplica¸c˜ao

→ A ,

onde (A )

= Re(A

Deﬁna a aplica¸c˜ao t

max

: M(3, R) → R dada por

max

→ maior autovalor de A.

A id´eia ´e associar `a matriz M(3, 1), uma outra, T (M(3, 1)), que possui

coeﬁcientes reais e tomar o seu maior autovalor. Esse autovalor est´a associado

de maneira natural com um dos autovalores da matriz original M(3, 1) da

seguinte maneira. Deﬁnindo

:= t

max

(T (M(3, 1))),

tomamos o autovalor λ

de M(3, 1), onde λ

= γ(1), e γ : C → C ´e o ´unico

caminho que leva um autovalor de M(3, 1) at´e λ

= γ(0). Vamos explicar

com mais precis˜ao esta ´ultima id´eia.

Deﬁna a fam´ılia de matrizes M(3, 1; t), t ∈ [0, 1] dada por

M(3, 1; t) =

√







1+ti

√

−1−ti

√

1+ti

√

1+ti

√

−1−ti

√

1+ti

√







E claro que M(3, 1; 1) = M(3, 1) e que M(3, 1; 0) = T (M(3, 1)). O espectro

da fam´ılia M(3, 1; t) ´e formado por trˆes curvas, η, ζ e γ, onde uma delas

(que chamamos de γ acima) tem como um de seus extremos o maior dos

autovalores de T (M(3, 1)), que chamamos λ

= γ(0). Ent˜ao o que fazemos ´e

escolher o autovalor no outro extremo desta curva, ou seja λ

= γ(1).

Continuando, obtemos

T (M(3, 1)) =

√





−





Da´ı, alguns c´alculos simples mostram que λ

√

3/2 e que λ

= (i +

√

3)/2 ´e o autovalor de M(3, 1) encontrado de acordo com a regra postu-

lada acima. Um autovetor r com entradas positivas, e tal que



= 1, ´e

r = (

√

6/6,

√

6/3,

√

6/6). Agora, procedendo de maneira an´aloga ao m´etodo

em [38], deﬁnimos



(3, 1)(i, j) :=

M(3, 1)

106

Escreva α = (1 + i

√

3)/2. Ent˜ao



(3, 1)(1, 1) = M



(3, 1)(2, 2) = M



(3, 1)(3, 3) = 2/(3 + i

√

Mais algumas contas simples nos fornecem



(3, 1) =

3 + i

√





2 4α −2α

α 2 α

−2α 4α 2





que ´e linha estoc´astica, mas n˜ao ´e unit´aria.

2) Considere o seguinte lema [14]:

Lema 6.3.2 (Wielandt) seja A = (a

) matriz irredut´ıvel n˜ao negativa de

ordem n e C = (c

) uma matriz quadrada complexa de ordem n. Suponha

que

≤ A. (6.14)

Ent˜ao para todo autovalor γ de C vale que

|γ| ≤ r, (6.15)

onde r ´e o maior autovalor de A. Al´em disso, vale a igualdade se e somente

C = e

iϕ

DAD

−1

, (6.16)

onde e

iϕ

= γ/r e D ´e uma matriz diagonal cujos elementos n˜ao nulos tem

m´odulo 1 (vale que D

= I).

A prova deste lema encontra-se no Apˆendice deste cap´ıtulo. Um poss´ıvel

trabalho futuro baseado neste lema ´e o seguinte: dada uma matriz complexa,

obter um m´etodo de normaliza¸c˜ao a partir da matriz m´odulo associada, o

que pode fornecer um m´etodo mais geral do que o obtido no ´ıtem 1).

3) Para que uma matriz estoc´astica com entradas n˜ao nulas seja a matriz

de uma cadeia de Markov quˆantica, precisamos ainda que ela seja unit´aria.

Para este ﬁm, devemos determinar se ´e poss´ıvel adaptar o m´etodo acima de

modo a fornecer a propriedade unit´aria.

Podemos obter uma condi¸c˜ao para que uma matriz normalizada na forma

do item anterior seja unit´aria:

Lema 6.3.3 Seja

A(i, j) =

M(i, j)

onde M ´e uma matriz complexa, λ ´e um autovalor n˜ao nulo de M e r um

autovetor associado a λ com entradas n˜ao nulas. Se vale que A ´e unit´aria,

temos:

107

1. Para todo i,



|M(i, k)|

= |λ|

2. Para i = j,



M(i, k)M(j, k)r

= 0

Prova Temos:



k=1

∗



(1/λ)M(i, k)

(1/λ)M(j, k)

|λ|



M(i, k)M(j, k)r

Se A ´e unit´aria ent˜ao para i = j, vale a seguinte condi¸c˜ao:



|M(i, k)|

= |λ|

E se i = j, vale



M(i, k)M(j, k)r

= 0



6.4 Apˆendice

Proposi¸c˜ao 6.4.1 (Perron-Frobenius) Seja A = a

 uma matriz com

entradas estritamente positivas, 1 ≤ i, j ≤ n. Ent˜ao existem λ > 0 e vetores

u = (u

, ···, u

) e v = (v

, ···, v

) tais que

1. u

> 0, v

> 0 , 1 ≤ i ≤ n



j=1

= λu

, 1 ≤ i ≤ n e



i=1

= λv

, 1 ≤ j ≤ n

(i.e., u ´e autovetor `a direita de A e v ´e autovetor `a esquerda de A).

108

Prova Esta prova segue [37]. Seja A matriz com entradas positivas. Mostremos

que existe pelo menos um vetor u com coordenadas positivas, e λ ≥ 0, tais

que



j=1

= λu

, 1 ≤ i ≤ n.

Considere o conjunto convexo H de vetores h = (h

, ···, h

) tais que h

≥ 0,

1 ≤ i ≤ n e



i=1

= 1. A matriz A determina uma transforma¸c˜ao cont´ınua

A : H → H, dada por Ah = h



, onde





j=1



i=1



j=1

O teorema do ponto ﬁxo de Brouwer [27] nos diz que tal aplica¸c˜ao possui

pelo menos um ponto ﬁxo. Se u ´e tal ponto ﬁxo ent˜ao Au = u, ou seja,



j=1



i=1



j=1

Fazendo λ =



i=1



j=1

, obtemos o que quer´ıamos.

Considere a matriz A

= a

, a

= a

. Pela primeira parte do lema,

podemos obter λ

∗

e v tais que A

v = λ

∗

v, ou seja,



j=1

= λ

∗

e v

> 0. Al´em disso,

λu, v = Au, v = u, A

v = λ

∗

u, v

o que implica λ = λ

∗



Proposi¸c˜ao 6.4.2 Se p

, ···, p

e q

, ···, q

s˜ao distribui¸c˜oes de probabili-

dade, com p

> 0, i = 1, ···, k, ent˜ao



i=1

log

≥ 0

com igualdade valendo se e somente se p

= q

, i = 1 ···, k (por conven¸c˜ao,

escrevemos 0 log 0 = 0).

109

Prova a desigualdade ´e evidente no caso em que p

= q

porque log 1 = 0.

No caso geral, observe que a fun¸c˜ao ϕ(x) = −x log x ´e estritamente cˆoncava,

pois ϕ



(x) < 0. Como

ϕ(



i=1

) = ϕ(



i=1

) = ϕ(1) = 0,

ent˜ao

ϕ(



i=1

) >



i=1

ϕ(

) =



i=1

−q

log

⇒



i=1

log

> 0.



Uma fun¸c˜ao f ´e dita T -invariante se f(T (ω)) = f(ω). Diremos que uma

propriedade vale em quase toda parte (q.t.p.), ou com probabilidade 1,

se o conjunto dos elementos onde n˜ao vale a propriedade tem medida nula.

Proposi¸c˜ao 6.4.3 (Teorema Erg´odico de Birkhoﬀ) [42] Seja T uma

transforma¸c˜ao que preserva medida em (Ω, F, µ). Seja f fun¸c˜ao mensur´avel

e integr´avel. Ent˜ao existe K, µ(K) = 1 tal que para todo ω ∈ K,

lim

n→+∞



k=1

f(T

k−1

ω) =

f(ω)

(i.e., o limite existe q.t.p.), onde

f ´e T -invariante e vale que



fdµ =



fdµ

Se T ´e erg´odica para µ ent˜ao

f =



fdµ q.t.p.

Um espa¸co vetorial X com uma topologia T ´e um espa¸co vetorial

topol´ogico se a soma ´e uma fun¸c˜ao cont´ınua de X × X em X e se a mul-

tiplica¸c˜ao por escalar ´e uma fun¸c˜ao cont´ınua de R × X em X. Um espa¸co

vetorial topol´ogico ´e dito localmente convexo se podemos obter uma base

para a topologia formada por conjuntos convexos.

Proposi¸c˜ao 6.4.4 (Krein-Milman)[39][6][10] Seja K um conjunto con-

vexo compacto em um espa¸co vetorial topol´ogico localmente convexo. Ent˜ao

a intersec¸c˜ao de todos os conjuntos convexos fechados contendo os pontos

extremos de K ´e o pr´oprio K.

110

6.4.1 Prova do lema de Wielandt

Aqui provamos o lema de Wielandt. Esta exposi¸c˜ao ´e baseada em [14].

Sejam A e B matrizes reais retangulares de mesma dimens˜ao m × n,

A = (a

), B = (b

). Escrevemos A ≤ B (ou B ≥ A) se

≤ b

, i = 1, . . . m , j = 1 . . . n.

Em particular, quando A ≥ 0, diremos que A ´e n˜ao-negativa. Se o sinal de

igualdade puder ser omitido em todas as desigualdades acima, escreveremos

A < B (analogamente, quando A > 0, diremos que A ´e positiva).

Denotamos por C

a matriz m´odulo C, obtida a partir de C quando

todos os seus elementos s˜ao trocados pelos seus respectivos m´odulos.

Diremos que A ´e redut´ıvel se pudermos escrever o conjunto de ´ındices

{1, . . . , n} como sendo uma uni˜ao de conjuntos complementares {i

, . . . , i

}

e {j

, . . . , j

} (com µ + ν = n) tais que

= 0 , α = 1, . . . µ , β = 1, . . . ν.

Caso contr´ario, diremos que A ´e irredut´ıvel.

Vamos obter outra caracteriza¸c˜ao para matrizes irredut´ıveis. Uma per-

muta¸c˜ao de uma matriz quadrada A signiﬁca uma permuta¸c˜ao das linhas de

A juntamente com a mesma permuta¸c˜ao de colunas. Podemos ent˜ao deﬁnir

matriz redut´ıvel da seguinte forma: a matriz A ser´a redut´ıvel se existir uma

permuta¸c˜ao que transforma A em um operador da forma

A =



B 0

C D



onde B e D s˜ao matrizes quadradas. Caso contr´ario, diremos que A ´e ir-

redut´ıvel. Um subespa¸co coordenado ν-dimensional de R

´e um subespa¸co

de R

que possui uma base {e

. . . , e

} (1 ≤ k

< k

··· < k

≤ n).

Existem





subespa¸cos coordenados ν-dimensionais associados a uma base

. . . , e

} dada. Assim, podemos deﬁnir matriz redut´ıvel de outra forma:

uma matriz A ´e redut´ıvel se e somente se possui um subespa¸co coordenado

invariante ν-dimensional com ν < n.

De agora em diante, a menos que seja especiﬁcado, iremos considerar

matrizes A n˜ao negativas (i.e., A ≥ 0).

111

Lema 6.4.5 Se A ≥ 0 ´e uma matriz irredut´ıvel de ordem n ent˜ao

(I + A)

n−1

> 0

Prova

E suﬁciente mostrar que para todo vetor y ≥ 0, y = 0, vale

(I + A)

n−1

y > 0.

Provaremos a desigualdade acima se mostrarmos que se y ≥ 0, y = 0, o vetor

z = (I + A)y possui menos coordenadas nulas que y. Vamos supor que isso

n˜ao vale. Como z = y + Ay e Ay ≥ 0, vale que a coordenadas positivas de y

correspondem coordenadas positivas de z. E segue da express˜ao acima que

z n˜ao pode ter mais coordenadas nulas que y. Ent˜ao y e z tem as mesmas

coordenadas nulas. Sem perda de generalidade, suponha que

y = (u, 0) , z = (v, 0) u > 0, v > 0.

(com u e v s˜ao colunas de mesma dimens˜ao). Escrevendo

A =





temos

y + Ay = z ⇔















e logo, A

u = 0. Como u > 0, segue que A

= 0, o que contradiz a

irredutibilidade de A. Isso prova o lema.



Um corol´ario conhecido ´e a seguinte deﬁni¸c˜ao equivalente para matrizes

irredut´ıveis.

Corol´ario 6.4.6 Se A ≥ 0 ´e irredut´ıvel ent˜ao para todo i, j existe p ∈ N tal

que (a

) > 0. Al´em disso, p pode ser escolhido de maneira que p ≤ m −1 se

i = j ou ent˜ao de maneira que p ≤ m se i = j, onde m ´e o grau do polinˆomio

minimal de A.

Vamos enunciar o teorema de Frobenius.

Teorema 6.4.7 (Frobenius): Toda matriz irredut´ıvel n˜ao negativa A de

ordem n possui um autovalor positivo r que ´e uma raiz simples da equa¸c˜ao

caracter´ıstica, e a ele corresponde um autovetor com entradas positivas. O

m´odulo dos demais autovalores ´e menor ou igual a r.

112

Al´em disso, se A tem h autovalores λ

= r, λ

, . . . , λ

de m´odulo r ent˜ao

esses valores s˜ao todos distintos, s˜ao ra´ızes da equa¸c˜ao

− r

= 0,

e o espectro de A ´e invariante por rota¸c˜ao de ˆangulo 2π/h.

Este ´e um importante teorema cuja demonstra¸c˜ao pode ser encontrada

em [14]. Estamos interessados em uma caracteriza¸c˜ao de matrizes complexas

(limitadas em um certo sentido por uma matriz irredut´ıvel) em termos dos

seus autovalores e que ser´a dada de forma mais precisa a seguir (lema 6.4.10).

Tal formula¸c˜ao est´a relacionada com o teorema de Frobenius.

Dado um vetor real x = (x

, . . . , x

), x ≥ 0 ﬁxado, deﬁnimos

= min

i∈{1,...,n}

(Ax)

onde

(Ax)



j=1

, i = 1, . . . n.

Nesta deﬁni¸c˜ao de m´ınimo, excluimos os valores de i onde x

= 0. Segue

diretamente da deﬁni¸c˜ao que r

≥ 0 e ´e o maior n´umero η tal que

ηx ≤ Ax.

Lema 6.4.8 Existe z ≥ 0 tal que o valor m´aximo r da fun¸c˜ao r

´e atingido,

ou seja:

r = r

= max

x≥0

= max

x≥0

min

i∈{1,...,n}

(Ax)

. (6.17)

Prova Pela deﬁni¸c˜ao de r

, segue que ao multiplicarmos um vetor x ≥ 0,

x = 0, por um n´umero λ, o valor de r

n˜ao se altera. Ent˜ao, para calcularmos

o m´aximo de r

, podemos nos restringir ao conjunto fechado

M = {x : x ≥ 0,



i=1

= 1}.

Se a fun¸c˜ao r

fosse cont´ınua em M, poder´ıamos obter um m´aximo. Entre-

tanto, esta fun¸c˜ao pode ser descont´ınua nos pontos de fronteira de M onde

uma das coordenadas do vetor se anula. Sendo assim, vamos considerar o

conjunto

N = {y : y = (I + A)

n−1

x, x ∈ M}.

113

Este conjunto ´e fechado e limitado, e pelo lema 6.4.5, consiste apenas de

vetores positivos.

Multiplicando a desigualdade

x ≤ Ax

por (I + A)

n−1

, obtemos

y ≤ Ay,

onde y = (I + A)

n−1

x. Ent˜ao, pela deﬁni¸c˜ao de r

, obtemos

≤ r

Assim, ao calcularmos o m´aximo de r

, podemos nos restringir ao conjunto N

que consiste apenas de vetores positivos. E em N, que ´e fechado e limitado,

a fun¸c˜ao r

´e cont´ınua e portanto assume um valor m´aximo para algum vetor

z ≥ 0.



Diremos que um vetor z ≥ 0 tal que r

= r ´e um vetor extremal.

Lema 6.4.9 O valor r deﬁnido no lema anterior ´e positivo, e ´e um autovalor

de A (´e o valor r mencionado no teorema de Frobenius). Todo vetor extremal

z ´e positivo e ´e um autovetor de A para o autovalor r. Isto ´e,

r > 0 , z > 0 , Az = rz.

Prova Seja u = (1, 1, . . . , 1). Ent˜ao

= min

i∈{1,...n}



k=1

Da´ı, r

> 0, porque nenhuma coluna de uma matriz irredut´ıvel pode ser

formada por zeros apenas. Logo, como r ≥ r

, obtemos r > 0.

Agora, considere

x = (I + A)

n−1

onde z ´e um vetor extremal. Pelo lema 6.4.5, x > 0. Suponha por absurdo

que Az − rz = 0. Ent˜ao obtemos que

Az − rz > 0 ⇒ (I + A)

n−1

(Az − rz) > 0 ⇒ Ax − rx > 0.

A ´ultima desigualdade contradiz a deﬁni¸c˜ao de r porque ela implicaria que

Ax − (r + ε)x > 0 para ε > 0 suﬁcientemente pequeno, ou seja, obter´ıamos

≥ r + ε > r. Logo, Az = rz. Ent˜ao

0 < x = (I + A)

n−1

z = (1 + r)

n−1

e portanto, z > 0.

114



Lema 6.4.10 seja A = (a

) matriz irredut´ıvel n˜ao negativa de ordem n e

C = (c

) uma matriz quadrada complexa de ordem n. Suponha que

≤ A. (6.18)

Ent˜ao para todo autovalor γ de C vale que

|γ| ≤ r, (6.19)

onde r ´e o maior autovalor de A. Al´em disso, vale a igualdade se e somente

C = e

iϕ

DAD

−1

, (6.20)

onde e

iϕ

= γ/r e D ´e uma matriz diagonal cujos elementos n˜ao nulos tem

m´odulo 1 (vale que D

= I).

Prova Considere y um autovetor de C correspondente ao autovalor γ:

Cy = γy , γ = 0. (6.21)

Como C

≤ A, vale que C

≤ Ay

. Al´em disso,

Cy = (



, . . . ,



) , γy = (γy

, . . . , γy

)

⇒ C

= (



|, . . . ,



|) , |γ|y

= (|γy

|, . . . , |γy

De Cy = γy, obtemos:

|γy

| = |



i=1

| ≤



i=1

| , j = 1, . . . n

o que implica

|γ|y

≤ C

. (6.22)

Logo,

|γ|y

≤ C

≤ Ay

(6.23)

pelo que vimos antes. Como por deﬁni¸c˜ao r

´e o maior n´umero tal que

≤ Ay

concluimos de (6.23) que

|γ| ≤ r

≤ r.

115

(a segunda desigualdade acima segue de (6.17)). Isso prova a desigualdade

(6.19) que enunciamos.

Analisemos agora o caso em que |γ| = r. A ´ultima desigualdade nos

fornece r

= r = max

x≥0

. Segue da´ı que y

´e um vetor extremal para A,

> 0 e que y

´e autovetor de A para o autovalor r. Ent˜ao ry

= Ay

e a

desigualdade (6.23) se transforma em

|γ|y

= ry

= Ay

= C

. (6.24)

Ent˜ao como C

≤ A e y

> 0, segue de Ay

= C

⇔ (A −C

= 0

que

= A. (6.25)

Seja y = (y

, . . . , y

), onde y

= |y

iϕ

, j = 1, . . . n. Deﬁna a seguinte

matriz diagonal

D = {e

iϕ

, . . . , e

iϕ

Ent˜ao, vale que

y = Dy

Escrevendo

iϕ

e substituindo a express˜ao acima em (6.21), obtemos

F y

= ry

, (6.26)

onde

F = e

−iϕ

−1

CD. (6.27)

Comparando (6.24) com (6.26), obtemos

F y

= C

= Ay

. (6.28)

Mas por (6.27) e (6.25),

= C

= A.

Logo, obtemos a partir de (6.28) que

F y

= F

Como y

> 0, aﬁrmamos que isso implica que

F = F

Provamos esta ´ultima aﬁrma¸c˜ao no caso de dimens˜ao 2. Seja

F =



a b

c d



⇒ F



|a| |b|

|c| |d|



116

Ent˜ao

F y

= F

⇒ (F − F

= 0 ⇒



a − |a| b − |b|

c − |c| d − |d|









Da´ı escrevendo a = x + iy, b = z + iw,

(a − |a|)y

+ (b − |b|)y

= 0 ⇔ (x + iy − |a|)y

+ (z + iw −|b|)y

= 0

o que implica, em particular, que

(x − |a|)y

+ (z − |b|)y

= 0 ⇔ (x −



+ y

+ (z −

√

+ w

= 0

Os termos entre parenteses na ´ultima express˜ao s˜ao menores ou iguais a zero,

claramente. Mas n˜ao podem ser estritamente menores que zero (pois o fato

de que y

, y

> 0 implicaria que a express˜ao acima ´e negativa). Logo,

x −



+ y

= 0 ⇒ x = |a| e y = 0 ⇒ a = |a|

z −

√

+ w

= 0 ⇒ z = |b| e w = 0 ⇒ b = |b|

Analogamente para c e d. Logo, F = F

Mas

F = F

⇔ e

−iϕ

−1

CD = A.

Logo,

C = e

iϕ

DAD

−1



117

Cap´ıtulo 7

∗

-´algebras e cadeias de

Markov quˆanticas

Faremos aqui uma descri¸c˜ao breve de cadeias de Markov quˆanticas no con-

texto de ´algebra de operadores. Essa formula¸c˜ao ´e baseada na constru¸c˜ao

original feita por L. Accardi em [1] e [2], por exemplo.

A vantagem de se estudar cadeias de Markov quˆanticas no contexto de

´algebras reside no fato de que podemos fazer uso do instrumental constru´ıdo

nesse ambiente para se tentar descobrir estados de equil´ıbrio, um problema

importante em mecˆanica estat´ıstica quˆantica. Discutiremos brevemente a

rela¸c˜ao entre os estados KMS e os estados de Gibbs, mencionados no cap´ıtulo

anterior.

7.1 C

∗

-´algebras

Deﬁni¸c˜ao 7.1.1 Uma ´algebra A sobre C ´e um espa¸co vetorial complexo

equipado com uma opera¸c˜ao bilinear e associativa • : A × A → A, dita

multiplica¸c˜ao. Para a, b ∈ A, denotaremos •(a, b) simplesmente por ab.

Deﬁni¸c˜ao 7.1.2 Uma ´algebra normada ´e uma ´algebra A sobre C equipada

com uma fun¸c˜ao norma a ∈ A → a ∈ R, que torna A um espa¸co normado,

ou seja, para a, b ∈ A e λ ∈ C, temos

1. a ≥ 0, e a = 0 ⇒ a = 0

2. λa = |λ|a, onde |λ| denota o m´odulo do n´umero complexo λ

3. a + b ≤ a + b,

e que al´em disso obedece a seguinte propriedade:

118

4. ab ≤ ab

Naturalmente, podemos nos referir `a distˆancia entre dois elementos de

uma ´algebra normada, bastando para isso considerar a m´etrica induzida pela

norma.

Deﬁni¸c˜ao 7.1.3 Uma ´algebra de Banach ´e uma ´algebra normada com-

pleta.

Deﬁni¸c˜ao 7.1.4 Seja A uma ´algebra de Banach. Uma involu¸c˜ao em A ´e

uma fun¸c˜ao ∗ : A → A tal que para todo a, b ∈ A, λ ∈ C, e denotando

∗

:= ∗(c), ∀ c ∈ A, temos

1. (a + b)

∗

= a

∗

+ b

∗

2. (λa)

∗

= λa

∗

3. (ab)

∗

= b

∗

4. (a

∗

)

∗

= a

5. a

∗

 = a

Deﬁni¸c˜ao 7.1.5 Uma C

∗

-´algebra ´e uma ´algebra de Banach equipada com

uma involu¸c˜ao para o qual vale

a

∗

a = a

, ∀ a ∈ A.

Por exemplo, a ´algebra M

da matrizes de ordem n sobre C ´e uma

∗

-´algebra se considerarmos as matrizes como sendo operadores no espa¸co

euclideano C

e se tomarmos a norma de operadores  ·  sobre matrizes. A

involu¸c˜ao ´e dada pela matriz transposta conjugada.

7.2 Cadeias de Markov quˆanticas

A descri¸c˜ao de cadeias de Markov quˆanticas dada aqui segue [1] e [28], que

´e uma constru¸c˜ao conhecida em ´algebra de operadores. Nesse contexto, um

estado em B ´e simplesmente um funcional φ : B → C tal que φ(1) = 1.

Seja B = B(H) uma C

∗

-´algebra para um certo espa¸co de Hilbert ﬁxado

H e seja

A := B ⊗B ⊗ B ⊗ ···

onde ⊗ ´e o C

∗

-produto tensorial induzido pelo produto tensorial usual de

espa¸cos de Hilbert.

119

Deﬁni¸c˜ao 7.2.1 Uma aplica¸c˜ao bilinear E : B ⊗ B → B ´e dita esperan¸ca

de transi¸c˜ao se for completamente positiva e preservar a identidade.

Deﬁni¸c˜ao 7.2.2 (Cadeia de Markov quˆantica associada a um es-

tado) Um estado φ em A ´e uma cadeia de Markov quˆantica se existir

um estado φ

em B e uma esperan¸ca de transi¸c˜ao E tais que

φ(a

⊗ a

⊗ ··· ⊗ a

⊗ 1 ⊗ ···)

= φ

(E(a

⊗ E(a

⊗ ··· ⊗ E(a

n−1

⊗ E(a

⊗ 1)) ···)), (7.1)

para quaisquer a

∈ B, i = 0, 1, . . . n.

Prova-se em [2] que toda esperan¸ca de transi¸c˜ao tem a forma

E(x) = tr

(



∗

) (7.2)

onde x, K

∈ B ⊗ B, j = 1, 2, . . . e tr

´e o tra¸co parcial com respeito ao

segundo fator. O ´ındice j percorrer´a apenas um subconjunto ﬁnito de N se

H for de dimens˜ao ﬁnita, e esse ser´a o caso considerado aqui.

Seja dim(H) = d < ∞ e seja {e

}

n=1

uma base ortonormal para H. Neste

caso, B(H)

∼

, onde M

´e a ´algebra das matrizes d ×d. Para simpliﬁcar,

iremos supor B(H) = M

Para cada K ∈ B ⊗ B, temos a express˜ao

K =



n,n



e



| ⊗ K

n,n



, (7.3)

onde |e

e



| ´e a matriz cuja posi¸c˜ao (n, n



) ´e igual a 1, e as outras posi¸c˜oes

s˜ao nulas. Denotaremos por D a sub-´algebra diagonal de M

correspondente

`a base {e

}

n=1

Mostraremos agora como uma cadeia de Markov cl´assica {X

}

∞

n=1

, com

valores no conjunto {1, . . . , d}, em um espa¸co de probabilidade (Ω, P) com

distribui¸c˜ao inicial p e matriz de transi¸c˜ao P = (p

) pode ser vista como

sendo uma cadeia de Markov quˆantica. Procedemos da seguinte maneira:

1. Deﬁna

1,n,n







√

n,1

0 ··· 0

√

n,2

··· 0

0 0 ···

√

n,d







(7.4)

120

1,n,n



:= 0 , se n = n



, (7.5)

m,n,n



:= 0 , ∀m ≥ 2. (7.6)

2. Deﬁna φ

em D ⊂ B por

(·) := tr









0 ··· 0

0 p

··· 0

0 0 ··· p









(7.7)

E f´acil veriﬁcar que

(x) := tr

∗

), (7.8)

onde K



e

| ⊗ K

1,n,n



, ´e uma esperan¸ca de transi¸c˜ao, e ´e tal que

(f ⊗ g) = fE

(1 ⊗ g) , ∀f, g ∈ D (7.9)

e vale que φ

´e um estado em M

. Portanto (φ

, E

) ´e uma cadeia de Markov

quˆantica e al´em disso tal cadeia quˆantica restrita `a sub-´algebra diagonal D

´e simplesmente a cadeia de Markov cl´assica dada inicialmente.

Observe que a escolha de (φ

, E) n˜ao ´e ´unica. De fato, podemos trocar a

matriz







0 ··· 0

0 p

··· 0

0 0 ··· p







por qualquer outra matriz densidade ω

que possua na diagonal os elementos

, . . . , p

}. Al´em disso, podemos trocar K

1,n,n

por qualquer K

n,n

que possua

a propriedade

n,n

∗

n,n

(j, j) = p

n,j

, ∀ j = 1, . . . d.

Denote por



e

| ⊗ K

n,n

e deﬁna

(·) := tr

∗

· K

Ent˜ao, (tr(ω

·), E

(·)) tamb´em ´e uma cadeia de Markov quˆantica obtida a

partir da mesma cadeia cl´assica (p, P = (p

)) e al´em disso, restringindo as

121

duas cadeias quˆanticas (tr(ω

·), E

(·)) e (φ

, E

) ao conjunto D, obtemos a

mesma cadeia de Markov cl´assica (p, P = (p

)).

Observa¸c˜ao Note que se

E(D ⊗ D) ⊂ D, (7.10)

ent˜ao podemos considerar a matriz densidade inicial ω

como sendo diagonal,

j´a que os elementos fora da diagonal n˜ao s˜ao usados neste caso.

Proposi¸c˜ao 7.2.3 [28] Uma esperan¸ca de transi¸c˜ao E leva D⊗D em D se e

somente se para cada r, r



, n ∈ {1, . . . , d}, com r = r



, a matriz



j,n,r

∗

j,n,r



´e tal que os elementos de sua diagonal s˜ao iguais a zero.

Deﬁni¸c˜ao 7.2.4 (Cadeia de Markov quˆantica associada a um processo

estoc´astico cl´assico) Dizemos que um processo estoc´astico cl´assico {X

}

∞

n=0

que toma valores em {1, . . . , d} em um espa¸co de probabilidade (Ω, P) ´e uma

cadeia de Markov quˆantica (φ

, E) se E satisfaz (7.10) e se as distribui¸c˜oes

conjuntas s˜ao as mesmas, ou seja, para cada n ∈ N, i

∈ {1, . . . , d}, k =

1, . . . n, temos

P (X

= i

, X

= i

, . . . , X

= i

)

= φ(|e

e

| ⊗ |e

e

| ⊗ ··· ⊗ |e

e

|) (7.11)

= φ

(E(|e

e

|⊗E(|e

e

|⊗···⊗E(|e

n−1

e

n−1

|⊗E(|e

e

|⊗1)) ···))

Deﬁni¸c˜ao 7.2.5 (Cadeia de Markov cl´assica associada a uma cadeia

quˆantica) Uma cadeia de Markov quˆantica (φ

, E) ´e uma cadeia de Markov

cl´assica na sub-´algebra diagonal D se (7.10) vale e se

E(a ⊗ b) = a E(1 ⊗ b), ∀ a, b ∈ D. (7.12)

Teorema 7.2.6 Seja {X

}

∞

n=1

um processo estoc´astico cl´assico {X

}

∞

n=0

que toma valores em {1, . . . , n} em um espa¸co de probabilidade (Ω, P). Ent˜ao

}

∞

n=1

´e uma cadeia de Markov quˆantica se e somente se existe uma me-

dida de probabilidade p

em {1, . . . d} e uma matriz c´ubica (de 3 ´ındices)

T = (T

j,i,k

) com as seguintes propriedades:

j,i,k

≥ 0, ∀ j, i, k ∈ {1, . . . d} (7.13)



i,k

j,i,k

= 1, ∀ j ∈ {1, . . . d} (7.14)

P(X

= j) =



i,k

(i)T

j,i,k

, ∀ j ∈ {1, . . . d}, (7.15)

122

e tal que a distribui¸c˜ao conjunta ´e dada por

P(X

= i

, X

= i

, . . . , X

= i

)



j,j

,...,j

(j)T

j,i

···T

n−2

n−1

. (7.16)

Em [28], temos ainda a prova do seguinte:

Teorema 7.2.7 Seja {X

}

∞

n=1

um processo estoc´astico cl´assico {X

}

∞

n=0

que toma valores em {1, . . . , n} em um espa¸co de probabilidade (Ω, P). Ent˜ao

temos que {X

}

∞

n=1

´e uma cadeia de Markov quˆantica se e somente se existir

uma cadeia de Markov cl´assica {(Z

, Y

)}

∞

n=1

tomando valores em {1, . . . , d}

em um espa¸co de probabilidade (P



, Ω



) com as seguintes propriedades:

1. A probabilidade de transi¸c˜ao

(j,i),(j



)

:= P



((Z

, Y

) = (j



, i



)|(Z

n−1

, Y

n−1

) = (j, i)) (7.17)

´e independente de i.

2. Existe uma distribui¸c˜ao de probabilidade p

em {1, . . . , d} e uma dis-

tribui¸c˜ao inicial para {(Z

, Y

)}

∞

n=0

dada por



((Z

, Y

) = (j, i)) =



(k)T

k,i,j

(7.18)

(onde T

k,i,j

foi determinado no teorema 7.2.6), tais que

P(X

= i

, X

= i

, . . . , X

= i

) = P



= i

, Y

= i

, . . . , Y

= i

(7.19)

Corol´ario 7.2.8 Se a cadeia de Markov quˆantica (φ

, E) em



tem a

propriedade de que E leva D ⊗D em D ent˜ao o processo estoc´astico cl´assico

obtido pela restri¸c˜ao de (φ

, E) `a sub-´algebra diagonal D ´e estocasticamente

equivalente `a segunda componente de uma cadeia de Markov cl´assica

{(Z

, Y

)}

∞

n=0

que toma valores em {1, . . . , d}, e que possui as propriedades 1 e 2 do teorema

7.2.7.

123

Teorema 7.2.9 A cadeia de Markov quˆantica (φ

, E) ´e uma cadeia de Markov

cl´assica sobre a sub-´algebra diagonal se e somente se os operadores K

, dados

por



n,n



e



| ⊗ K

j,n,n



tem a forma



e

| ⊗ K

j,n,n

, ∀ j = 1, . . . , d. (7.20)

Observa¸c˜ao A f´ormula (7.20) signiﬁca que cada um dos K

´e diagonal

em blocos de ordem d

, ou seja,







j,1,1

0 ··· 0

0 K

j,2,2

··· 0

0 0 ··· K

j,d,d







onde cada K

j,l,l

, l = 1, . . . , d, ´e uma matriz de ordem d.

7.3 CAR C

∗

-´algebras e estados KMS

Fazemos aqui uma breve introdu¸c˜ao `as CAR C

∗

-´algebras e aos estados KMS.

Uma referˆencia b´asica para o assunto ´e [8].

Deﬁni¸c˜ao 7.3.1 Uma ∗-´algebra A ´e uma ´algebra associativa sobre os com-

plexos, munida de uma involu¸c˜ao que ´e um antiautomorﬁsmo antilinear, ou

seja,

1. (u

∗

)

∗

= u

2. (u + v)

∗

= u

∗

+ v

∗

3. (cv)

∗

= cv

∗

4. (uv)

∗

= v

∗

para todo u, v ∈ A, c ∈ C.

Um homomorﬁsmo entre ´algebras f : A → B ´e um ∗-homomorﬁsmo se

for compat´ıvel com as involu¸c˜oes de A e B, ou seja, se

f(a

∗

) = f(a)

∗

, ∀a ∈ A.

E f ser´a um ∗-isomorﬁsmo se for uma aplica¸c˜ao bijetora.

124

Deﬁni¸c˜ao 7.3.2 Uma C

∗

-´algebra A tal que seus elementos satisfazem as

rela¸c˜oes de anticomutatividade canˆonicas

, a

} = 0

∗

, a

} = δ

onde a

, etc. s˜ao elementos de A, e {·, ·} ´e o anticomutador, ´e dita CAR

∗

-´algebra.

O pr´oximo teorema, cuja prova pode ser vista em [8], ´e a base de estudo

de tais ´algebras.

Teorema 7.3.3 Seja H um espa¸co de Hilbert e sejam H

, i = 1, 2 duas

∗

-´algebras geradas pela identidade 1 e elementos a

(v), v ∈ H satisfazendo:

1. v → a

(v) ´e linear,

2. {a

(v), a

(w)} = 0,

3. {a

(v), a

(w)

∗

} = (v, w)1,

para todo v, w ∈ H, i = 1, 2. Ent˜ao existe um ´unico ∗-isomorﬁsmo α : H

→

tal que

α(a

(v)) = a

(v),

para todo v ∈ H. Portanto, existe uma ´unica C

∗

-´algebra A = A(H) = A(H),

a menos de ∗-isomorﬁsmo, satisfazendo as rela¸c˜oes de anticomutatividade

canˆonicas sobre H. Al´em disso, se H tem dimens˜ao n, temos que A(H) ´e

isomorfa `a C

∗

-´algebra das matrizes complexas 2

× 2

Seja U a CAR-´algebra com geradores a

e respectivos adjuntos a

∗

, i ∈ I,

onde o conjunto de ´ındices I ´e discreto, enumer´avel e totalmente ordenado,

contendo possivelmente um menor elemento j

−

e/ou um maior elemento j

Se I n˜ao cont´em nem j

e nem j

−

ent˜ao podemos fazer a identiﬁca¸c˜ao I ∼ Z.

Se cont´em apenas j

ent˜ao I ∼ Z

−

; se cont´em apenas j

−

ent˜ao I ∼ Z

Os geradores {a

, a

}

j∈I

satisfazem as rela¸c˜oes

, a

} = δ

, {a

, a

} = {a

, a

} = 0, j, k ∈ I

O automorﬁsmo de paridade de U ´e denotado por Θ. Para qualquer subcon-

junto Λ ⊂ I, a C

∗

-sub-´algebra de U gerada por a

, a

, para j ∈ Λ ´e denotada

por U

. Sabemos que U ´e uma ´algebra Z

-graduada, com Θ sendo o auto-

morﬁsmo da gradua¸c˜ao. Sabemos tamb´em que a CAR-´algebra ´e isomorfa ao

produto C

∗

-tensorial inﬁnito



(C).

125

A ﬁm de obter estados peri´odicos ou invariantes por transla¸c˜ao, consi-

deramos apenas esperan¸cas quase-condicionais (ver deﬁni¸c˜ao a seguir) Θ-

invariantes, a menos que especiﬁcado em contr´ario.

Uma nota¸c˜ao comum em ´algebra de operadores ´e a seguinte. Se A

, B

s˜ao ´algebras, n ∈ N, escrevemos

⊗ B ⊗A

:= A

⊗ A

⊗ ··· ⊗ A

n−1

⊗ B ⊗A

n+1

⊗ A

n+2

⊗ ···

Vale uma nota¸c˜ao an´aloga para operadores.

Deﬁni¸c˜ao 7.3.4 Sejam W ⊂ V ⊂ U C

∗

-´algebras com unidade. Uma es-

peran¸ca quase-condicional com respeito `a essa tripla ´e uma aplica¸c˜ao

E : U → V tal que ´e completamente positiva, preserva a identidade e

E(wu) = wE(u), u ∈ U , w ∈ W

Deﬁni¸c˜ao 7.3.5 Um estado φ em U ´e dito estado de Markov se para cada

−

≤ j ≤ j

existe uma esperan¸ca quase-condicional E

com respeito `a tripla

n−1)

⊂ U

n+1)

satisfazendo

n+1)

◦ E

= φ

[n,n+1]

) = U

{n}

Deﬁni¸c˜ao 7.3.6 Uma esperan¸ca condicional (de Umegaki) E : A →

B ⊂ A ´e uma proje¸c˜ao de norma 1 da C

∗

−´algebra A em uma C

∗

-sub-´algebra

B (com a mesma identidade I).

Quando A ´e uma ´algebra de matrizes, a estrutura de tal esperan¸ca condi-

cional ´e bem conhecida [3]. A prova da seguinte proposi¸c˜ao pode ser vista

em [3]:

Proposi¸c˜ao 7.3.7 Seja φ um estado da CAR-´algebra. S˜ao equivalentes:

1. φ ´e um estado de Markov.

2. as propriedades listadas na deﬁni¸c˜ao 7.3.5 s˜ao satisfeitas se trocarmos

as esperan¸cas quase-condicionais E

por esperan¸cas condicionais de

Umegaki E

3. Para cada j < j

, existe uma esperan¸ca condicional E

: U → R(E

) ⊂

satisfazendo

φ ◦ E

= φ

) ⊂ U

{n}

(7.21)

126

4. As propriedades listadas no item 3 s˜ao satisfeitas se trocarmos as es-

peran¸cas condicionais E

por esperan¸cas quase-condicionais E

Na prova desta proposi¸c˜ao, consideramos a restri¸c˜ao e

:= E

[n,n+1]

, que

´e uma aplica¸c˜ao completamente positiva, que preserva a identidade. Fazendo

uso de um limite

:= lim

k−1



t=0

)

obtemos uma esperan¸ca condicional que deixa invariante o estado φ. Com

isso, chegamos ao seguinte lema [3]:

Lema 7.3.8 Seja φ um estado de Markov na CAR-´algebra e {ε

}

−

≤j≤j

seq¨uˆencia associada de esperan¸cas condicionais. Ent˜ao

φ(x

···x

) = φ((ε

k+1

···ε

l−1

) ···)))

para todo k, l ∈ I com k < l e x

k+1

···x

l−1

qualquer gerador linear de

[k,l]

Deﬁni¸c˜ao 7.3.9 Seja A uma C

∗

-´algebra, β ∈ R e seja α : R → Aut(A)

uma a¸c˜ao fortemente cont´ınua. Um estado φ satisfaz a condi¸c˜ao KMS

para α `a temperatura inversa β se

φ(vα

iβ

(u)) = φ(uv)

para todo u,v ∈ A, com u inteira para α.

Em teoria quˆantica de campos descreve-se um sistema f´ısico a partir de

uma C

∗

-´algebra A com unidade. Os elementos autoadjuntos de A (tais que

∗

= u) s˜ao ditos observ´aveis do sistema. Como vimos antes, um estado do

sistema ´e deﬁnido com sendo um funcional C-linear φ : A → C, com φ(uu

∗

) >

0, tal que φ(1) = 1. Determinar a existˆencia e a unicidade de estados KMS

´e importante para se estudar a mecˆanica estat´ıstica de uma teoria quˆantica

de campos. Por exemplo, considerando o espa¸co dos operadores compactos

em um espa¸co de Hilbert dado, pode-se mostrar que o ´unico estado sobre

esse espa¸co que satisfaz a condi¸c˜ao KMS acima com respeito ao valor β ´e o

estado de equil´ıbrio canˆonico de Gibbs

βµ

(A) =

tr(e

−βK

tr(e

−βK

)

onde K = H − µN, H ´e o hamiltoniano autoadjunto e N ´e o operador

n´umero, respectivamente. Para mais detalhes, veja [8].

127

7.4 Moeda quˆantica revisitada

Consideremos aqui a moeda quˆantica (ver se¸c˜ao 8.2). Tal sistema ´e bastante

simples em dimens˜ao 2, dependendo de um ´unico parˆametro real x ∈ (0, 1).

Como antes, sejam u, v ∈ C tais que u +v = 1, |u|

+|v|

= 1. Vimos que

as probabilidades de transi¸c˜ao independem do tempo, e mais especiﬁcamente

que P

(0) = |u|

, P

(1) = |v|

. Vamos mostrar que a moeda quˆantica, vista

como uma cadeia de Markov quˆantica alg´ebrica (i.e., via ´algebra de opera-

dores) nos permite obter, como ´e desej´avel, estas mesmas probabilidades de

transi¸c˜ao.

Seguimos a constru¸c˜ao feita no in´ıcio da se¸c˜ao 7.2. Se p

´e a probabilidade

de transi¸c˜ao do estado i para o estado j, temos que p

= p

= |u|

, p

= 1 − |u|

= |v|

e portanto,

0,0,0

= K

0,1,1



√





√





|u| 0

0 |v|



Para ilustrar os c´alculos envolvidos mostremos, por exemplo, que

P (X

= 0) = φ(|e

e

|) = |u|

P (X

= 0, X

= 1) = φ(|e

e

| ⊗ |e

e

|) = |u|

|v|

Temos:

φ(|e

e

|) = φ

(E(|e

e

| ⊗ 1))

Mas

E(|e

e

| ⊗ 1) = tr

∗

(|e

e

| ⊗ 1)K

)

= tr

((|e

e

| ⊗ K

0,0,0

)

∗

(|e

e

| ⊗ 1)(|e

e

| ⊗ K

0,0,0

))

= tr

((|e

e

| ⊗ K

0,0,0

)(|e

e

| ⊗ K

0,0,0

))

= tr

(|e

e

| ⊗ K

0,0,0

)

= |e

e

|tr



|u|

0 |v|



= |e

e

Logo,

φ(|e

e

|) = φ

(|e

e

= tr



|u|

0 |v|



1 0

0 0



= tr



|u|

0 0



= |u|

como era de se esperar.

128

Analogamente,

P (X

= 0, X

= 1) = φ(|e

e

| ⊗ |e

e

= φ

(E(|e

e

| ⊗ E(|e

e

| ⊗ 1)))

Mas

E(|e

e

| ⊗ 1)

= tr

((|e

e

| ⊗ K

0,0,0

+ |e

e

| ⊗ K

0,1,1

)

∗

(|e

e

| ⊗ 1)(|e

e

| ⊗ K

0,0,0

+|e

e

| ⊗ K

0,1,1

))

= tr

((|e

e

| ⊗ K

0,0,0

+ |e

e

| ⊗ K

0,1,1

)

∗

(|e

e

| ⊗ K

0,1,1

))

= tr

(|e

e

| ⊗ K

0,1,1

) = |e

e

Ent˜ao

P (X

= 0, X

= 1) = φ

(E(|e

e

| ⊗ |e

e

|))

Mas

E(|e

e

| ⊗ |e

e

= tr

((|e

e

|⊗K

0,0,0

+|e

e

|⊗K

0,1,1

)

∗

(|e

e

|⊗|e

e

|)(|e

e

|⊗K

0,0,0

+|e

e

| ⊗ K

0,1,1

))

= tr

((|e

e

| ⊗ K

0,0,0

+ |e

e

| ⊗ K

0,1,1

)

∗

(|e

e

| ⊗ |e

e

0,0,0

))

= tr

(|e

e

| ⊗ K

0,0,0

e

|) = |e

e

|tr(K

0,0,0

e

= |v|

e

Logo,

P (X

= 0, X

= 1) = φ

(E(|e

e

| ⊗ |e

e

|))

= φ

(|v|

e

|) = tr



|u|

0 |v|



|v|

0 0



= tr



|u|

|v|

0 0



= |u|

|v|

129

Cap´ıtulo 8

Apˆendice: Processos de

Markov quˆanticos

Neste apˆendice fazemos uma descri¸c˜ao de processos de Markov quˆanticos. Tal

constru¸c˜ao ´e mais elaborada do que a usada para cadeias de Markov quˆanticas

e permite o estudo de sistemas mais complicados. Mostramos ainda como a

moeda quˆantica ´e descrita nesse contexto. Esta exposi¸c˜ao segue [16].

8.1 Nota¸c˜oes e deﬁni¸c˜oes

Um espa¸co de medida pontual ´e um espa¸co de medida em que conjuntos

pontuais (isto ´e, com um elemento apenas) s˜ao mensur´aveis. Seja Ω um

conjunto n˜ao vazio, chamado espa¸co amostral.

Deﬁni¸c˜ao Uma aplica¸c˜ao mensur´avel X : Ω → S com imagem R(X) ⊂ S

´e uma medi¸c˜ao se:

1. R(X) ´e o espa¸co base de um espa¸co de medida pontual (R(X), Σ

, µ

onde Σ

´e uma σ-´algebra de R(X) e µ

´e uma medida real sobre Σ

2. para cada x ∈ R(X), X

−1

(x) ´e o espa¸co base de um espa¸co de medida

−1

(x), Σ

, µ

), onde Σ

´e uma σ-´algebra de X

−1

(x) e µ

´e uma

medida real sobre Σ

Observa¸c˜ao Em processos estoc´asticos e em aplica¸c˜oes de mecˆanica

quˆantica baseadas em amplitudes de transi¸c˜ao, estamos interessados nos ele-

mentos de R(X) (os resultados das medi¸c˜oes), e n˜ao no conjunto Ω ou nas

ﬁbras X

−1

(x), x ∈ R(X). Entretanto, seguiremos a descri¸c˜ao dada em [16]

porque ela ´e ´util para se descrever a interferˆencia entre medi¸c˜oes.

130

No caso de N-cadeias quˆanticas, supomos que S = {s

, . . . , s

n−1

} ´e um

conjunto ﬁnito, Ω = S

, e que naquele caso uma medi¸c˜ao X : Ω → S

´e uma aplica¸c˜ao tal que X

−1

) ∈ Λ (onde Λ ´e uma σ-´algebra ﬁxada de

Ω),



P (X

−1

)) = 1. A menos que seja especiﬁcado, iremos supor que

Ω = S

para algum n. Ainda, iremos supor em geral que S = R(X) ´e ﬁnito

ou enumer´avel.

Alguns exemplos:

1. Moeda quˆantica. Neste caso, Ω = {0, 1}

, S = {0, 1}, X

: {0, 1}

→

{0, 1} ´e X

, . . . , x

) = x

, R(X) = {0, 1} e µ

, µ

s˜ao medidas da

contagem.

2. Mecˆanica quˆantica discreta. Neste caso, S = {s

, . . . , s

} onde s

´e

um estado que o sistema pode assumir, Ω = S

n+1

, X

: Ω → S,

, . . . , s

) = s

, R(X

) = {s

, . . . s

} e µ

, µ

s˜ao medidas da con-

tagem em S e em X

−1

(s), respectivamente. Vemos que este exemplo

possui uma estrutura semelhante ao da moeda quˆantica mencionada

acima.

3. Mecˆanica quˆantica discreta com amplitudes de Feynman. Este ´e um

caso particular do anterior. Sejam a, m ∈ Z. Seja α = 2π/m e para

i = 0, . . . , m − 1, deﬁna k

∈ R

, k

 = 1, ∠(k

i+1

, k

) = α. Seja

V = {v ∈ R

: v =



j=1

, e

∈ {k

, . . . , k

m−1

}, n ∈ N}

Pensamos em V como sendo um espa¸co de conﬁgura¸c˜ao discreto, e que

est´a associado a um espa¸co de fase discreto

S = {(v, k

) : v ∈ V, j = 0, . . . , m − 1}

Ent˜ao, Ω = S

n+1

, e X

: Ω → S, X

((v

, k

i(0)

), . . . , (v

, k

i(n)

)) =

, k

i(j)

Deﬁni¸c˜ao Se X ´e mensur´avel, o conjunto de eventos de X ´e deﬁnido por

E(X) := {X

−1

(B) : B ∈ Σ

o qual ´e uma σ-´algebra de subconjuntos de Ω.

Deﬁni¸c˜ao Uma fun¸c˜ao a : Ω → C ´e uma densidade de amplitude

(para a medi¸c˜ao X) se

(x) :=



−1

(x)

adµ

∈ L

(R(X), Σ

, µ

) (8.1)

131

onde, ´e claro, supomos que a|X

−1

(x) ∈ L

−1

(x), Σ

, µ

), para cada x ∈

R(X) e ainda que

A





dµ

= 1 (8.2)

Veremos no exemplo da moeda quˆantica que se u, v ∈ C, com u + v = 1,

|u|

+ |v|

= 1, ent˜ao deﬁnindo a : Ω → C, a(ω) = u

n−k

, onde n ´e o

comprimento de ω e k ´e o n´umero de “caras”(ou zeros) na seq¨uˆencia, vale

que a ´e uma densidade de amplitude para X

, x

, . . . , x

) = x

Deﬁni¸c˜ao O espa¸co de probabilidade quˆantica, denotado por A(Ω, a),

´e o conjunto das medi¸c˜oes para os quais a : Ω → C ´e uma densidade de am-

plitude.

Deﬁni¸c˜ao Seja X ∈ A(Ω, a) uma medi¸c˜ao. Um (X, a)-evento ´e um

conjunto C ⊂ Ω tal que

(C)(x) :=



C∩X

−1

(x)

adµ

∈ L

(R(X), Σ

, µ

) (8.3)

onde supomos que C ∩ X

−1

(x) ∈ Σ

, para todo x ∈ R(X). Dizemos que

que A

(Ω) = A

. Denotaremos o conjunto dos (X, a)-eventos por E(X, a).

Vale que E(X) ⊂ E(X, a). Com efeito, seja C ∈ E(X), ent˜ao C =

−1

(B), B ∈ Σ

. Da´ı,

C ∩ X

−1

(x) = X

−1

(B) ∩ X

−1

(x) =



−1

(x) se x ∈ B

∅ se x /∈ B

Em qualquer caso, C ∩ X

−1

(x) ∈ Σ

. E ´e claro que a aplica¸c˜ao A

(R(X), Σ

, µ

). Logo, E(X) ⊂ E(X, a).

Deﬁni¸c˜ao Seja C ∈ E(X, a). Deﬁnimos a (X, a)-probabilidade de C

como sendo

X,a



(C)|

dµ

= A

(C)

Lema 8.1.1 Seja C ∈ E(X, a), B ∈ Σ

. Ent˜ao X

−1

(B) ∩ C ∈ E(X, a) e

−1

(B) ∩ C) = 1

(C).

Prova

E claro que X

−1

(B) ∩ C ∈ Σ

, para todo x ∈ R(X), e al´em disso,

−1

(B) ∩ C ∩ X

−1

(x) =



C ∩ X

−1

(x) se x ∈ B

∅ se x /∈ B

132

Portanto,

−1

(B) ∩ C) =



−1

(B)∩C∩X

−1

(x)

adµ

= 1

(C)

Como A

(R(X), Σ

, µ

), temos que 1

(R(X), Σ

, µ

)

e portanto (8.3) vale.



Aplicando o lema 8.1.1, obtemos

−1

(B)) = A

−1

(B) ∩ Ω) = 1

(Ω) = 1

X,a

−1

(B)) =



−1

(B)

dµ



−1

(B)





−1

(x)

adµ



dµ

(x) (8.4)

Concluimos de (8.2) e (8.4) que P

X,a

´e uma medida de probabilidade em Σ

que chamamos de distribui¸c˜ao de X.

Deﬁni¸c˜ao Seja X, Y ∈ A(Ω, a). Dizemos que X n˜ao interfere em Y se

E(Y ) ⊂ E(X, a), e para cada B ∈ Σ

X,a

−1

(B)) = P

Y,a

−1

(B))

Nesse caso, a distribui¸c˜ao de Y ´e determinada quando realizamos a medi¸c˜ao

E f´acil mostrar que n˜ao ´e uma rela¸c˜ao sim´etrica em geral. Para ver como

esta deﬁni¸c˜ao extende a de cadeias de Markov quˆanticas, considere X e Y

medi¸c˜oes. Pela primeira deﬁni¸c˜ao, temos que se X n˜ao interfere em Y , ent˜ao

P [Y = s

] =

n−1



k=0

P [Y = s

, X = r

]

O lado esquerdo da igualdade pode ser escrito como

P [Y = s

] =



−1

)

dµ

= P

Y,a

−1

))

E o lado direito como





−1

)∩X

−1

(x)

dµ



−1

)

dµ

= P

X,a

−1

))

133

Deﬁni¸c˜ao Dizemos que X ´e independente de Y se E(Y ) ⊂ E(X, a) e

para cada B ∈ Σ

e C ∈ Σ

X,a

−1

(B), Y

−1

(C)) = P

X,a

−1

(B))P

X,a

−1

(C))

Se X for independente de Y ent˜ao P

X,a

(B|Y

−1

(C)) = P

X,a

−1

(B)) para

todo B ∈ Σ

e C ∈ Σ

com P

X,a

−1

(C)) = 0.

Seja T um subconjunto n˜ao vazio de R e suponha que existe uma medi¸c˜ao

∈ A(Ω, a) para cada t ∈ T .

Deﬁni¸c˜ao Dizemos que (X

)

t∈T

´e um processo estoc´astico quˆantico

(QSP) se para cada t, s

, . . . , s

∈ T , com s

≤ t, j = 1, . . . n e para cada

∈ Σ

s(j)

(onde s(j) = s

), temos



−1

s(j)

) ∈ E(X

, a) (8.5)

A equa¸c˜ao (8.5) aﬁrma que uma medi¸c˜ao no presente pode ser usada

para se obter uma informa¸c˜ao sobre o passado. Isso ´e mais fraco do que a

aﬁrma¸c˜ao



−1

s(j)

) ∈ E(X

ou seja, que a informa¸c˜ao do passado est´a contida no presente.

Seja (X

)

t∈T

um QSP em A(Ω, a). Para t

, . . . , t

∈ T com t

< . . . < t

e x

∈ R

, j = 1, . . . n, deﬁnimos (onde t(n) = t

t(n)

t(n−1)

= x

n−1

, . . . , X

t(1)

= x

]

t(n)

t(n−1)

= x

n−1

, . . . , X

t(1)

= x

](x

)

t(n−1)

t(n−2)

= x

n−2

, . . . , X

t(1)

= x

](x

n−1

)

quando o denominador n˜ao se anula; caso contr´ario, deﬁnimos o lado es-

querdo como sendo igual a zero.

Deﬁni¸c˜ao Dizemos que (X

)

t∈T

´e um processo de Markov quˆantico

(QMP) quase-discreto se

t(n)

t(n−1)

= x

n−1

, . . . , X

t(1)

= x

]

= A

t(n)

t(n−1)

= x

n−1

] (8.6)

= x] ∈ L

, Σ

, µ

), ∀s, t ∈ T , s ≤ t (8.7)

134

x → A

[C ∩ X

−1

(x)](y) ∈ L

1,2

, Σ

, µ

), ∀s ≤ t , y ∈ R

∀ C ∈ E(X

), u ≤ t, e



[C ∩ X

−1

(x)](y)dµ

(x) = A

(C)(y)

(8.8)

A seguir analisamos exemplos de QSP’s quase-discretos.

8.2 Exemplos

Para analisar os exemplos desta se¸c˜ao, resumimos as express˜oes para ampli-

tude e probabilidade obtidas na se¸c˜ao anterior.

A (X, a)-probabilidade de um conjunto C ⊂ Ω ´e

X,a







C∩X

−1

(x)

adµ



dµ

(x) (8.9)

e deﬁnimos tamb´em as amplitudes

(x) =



−1

(x)

adµ

(8.10)

(C)(x) =



C∩X

−1

(x)

adµ

(8.11)

Iremos dar aten¸c˜ao maior para o exemplo da moeda quˆantica descrito

a seguir. Primeiro, faremos a constru¸c˜ao de acordo com [16], adotando a

nota¸c˜ao usada ali (isto ´e, com as f´ormulas de amplitude e de probabilidade

enunciadas acima). Depois, enunciaremos a constru¸c˜ao em uma forma que ´e

mais usual em teoria da medida. Existem outras constru¸c˜oes na literatura,

tamb´em ditas moedas quˆanticas, que s˜ao usadas com mais frequˆencia [23].

Exemplo 1 Moeda quˆantica. Sejam u, v ∈ C tais que u + v = 1 e |u|

|v|

= 1. Uma condi¸c˜ao necess´aria e suﬁciente para que essas propriedades

sejam satisfeitas ´e que u = 1 −v, 0 ≤ Re(u) ≤ 1 e Im(u) = ±(Re(u))

1/2

(1 −

Re(u))

1/2

. Ent˜ao, vemos que o n´umero real 0 ≤ Re(u) ≤ 1 determina u e v

a menos de conjuga¸c˜ao. Por exemplo, se Re(u) = 1/2, temos u = (1 ± i)/2,

v = (1 ∓ i)/2.

Seja n ∈ N e seja Ω = {0, 1}

. Para ω = (x

, x

, . . . , x

) ∈ Ω , deﬁna

(ω) = x

, j = 1, . . . n. Considerando a medida da contagem na imagem

e nas ﬁbras de X

, vemos que X

´e uma medi¸c˜ao, j = 1, . . . , n (para con-

sidera¸c˜oes sobre cilindros em Ω = {0, 1}

, veja observa¸c˜ao abaixo). Ent˜ao

135

Ω representa n jogadas de moeda e X

mede o resultado da j-´esima jogada.

Deﬁna a densidade de amplitude a : Ω → C por a(ω) = u

n−k

, onde k ´e

o n´umero de zeros na seq¨uˆencia ω. Pela deﬁni¸c˜ao (8.10), as fun¸c˜oes A

j = 1, . . . n assumem os valores

(0) =



−1

(0)

adµ

= u

n−1



k=0



n − 1



n−k−1

= u(u + v)

n−1

= u

(1) = v(u + v)

n−1

= v

Como

A





dµ

= |A

(0)|

+ |A

(1)|

= |u|

+ |v|

= 1,

segue que a : {0, 1}

→ C ´e uma densidade de amplitude para X

, e X

∈

A(Ω, a), j = 1, . . . n. Vale que (X

)

j=1

´e um QSP.

A distribui¸c˜ao de X

´e dada por

−1

(0)) =







−1

(0)∩X

−1

(x)

adµ



dµ

(x)





−1

(0)∩X

−1

(0)

adµ



= |A

(0)|

= |u|

−1

(1)) = |A

(1)|

= |v|

Logo, os X

s˜ao identicamente distribu´ıdos.

Vale que os X

n˜ao interferem entre si. Por exemplo,

−1

(0)) =







−1

(0)∩X

−1

(x)

adµ



dµ

= |A

−1

(0))(0)|

+ |A

−1

(0))(1)|

= |u

+ |uv|

= |u|

= P

−1

(0))

−1

(1)) = |A

−1

(1))(0)|

+ |A

−1

(1))(1)|

= |uv|

+ |v

= |v|

= P

−1

(1))

Vale tamb´em que os X

s˜ao independentes no sentido que deﬁnimos acima,

pois por exemplo,

= 0, X

= 1) =



n−1



i=0



n − 2



n−i−2



= |u|

|v|

136

Finalmente, vale que (X

) ´e um processo de Markov. De fato, as equa¸c˜oes

(8.7) e (8.8) claramente valem. Para veriﬁcar (8.6), temos

t(m)

t(m−1)

= x

m−1

, . . . , X

t(1)

= x

)(x

) = u

m−k

onde k ´e o n´umero de zeros na seq¨uˆencia (x

, . . . , x

). Portanto,

t(m)

t(m−1)

= x

m−1

, . . . , X

t(1)

= x

) =



u se x

= 0

v se x

= 1

E ´e claro que A

t(m)

t(m−1)

= x

m−1

) tem o mesmo valor.

Observa¸c˜ao 1 Em teoria da medida, o exemplo acima admite uma cons-

tru¸c˜ao muito mais simples. Seja B a ´algebra gerada pelos cilindros em {0, 1} .

Fixe n ∈ N e deﬁna

k,n

= {ω = (x

, x

, . . .) ∈ {0, 1} : o n´umero de 0’s em (x

, . . . , x

) ´e k}

Vale que B

k,n

´e uma uni˜ao de cilindros, e portanto B

k,n

∈ B. Ent˜ao a

densidade de amplitude de B

k,n

a(B

k,n

) = u

n−k

pode ser vista como sendo uma medida complexa a : B → C, e ent˜ao obtemos

uma ´unica extens˜ao para a σ-´algebra gerada pelos cilindros, pelo teorema da

extens˜ao de Kolmogorov. A probabilidade ´e obtida tomando o m´odulo ao

quadrado desta medida, o que est´a de acordo com os c´alculos de amplitudes

feitos acima. Ainda, n˜ao precisamos nos preocupar em deﬁnir uma medida

e uma σ-´algebra na imagem e nas ﬁbras das medi¸c˜oes.

Exemplo 2 Moeda quˆantica de 3 lados. Sejam u, v, w ∈ C tais que

u + v + w = 1 e |u|

+ |v|

+ |w|

= 1. Seja n ∈ N e deﬁna Ω = {0, 1, 2}

Para ω = (x

, . . . , x

) ∈ Ω, deﬁna X

(ω) = x

, j = 1, . . . n. Considerando

a medida da contagem na imagem e nas ﬁbras de X

, temos que X

´e uma

medi¸c˜ao, j = 1, . . . n. Deﬁna a densidade de amplitude a : Ω → C, a(ω) =

, onde j

´e o n´umero de k’s na seq¨uˆencia ω. As fun¸c˜oes A

, j =

1, . . . n tem os valores

(0) =



−1

(0)

adµ

= u



{



n − 1



: j

+ j

= n − 1}

= u(u + v + w)

n−1

= u

137

(1) = v(u + v + w)

n−1

= v

(2) = w(u + v + w)

n−1

= w

Como

(0)|

+ |A

(1)|

+ |A

(2)|

= |u|

+ |v|

+ |w|

= 1,

temos que X

∈ A(Ω, a), j = 1, . . . n, e ´e claro que (X

)

j=1

´e um QSP. A

distribui¸c˜ao de X

´e dada por

−1

(0)) =







−1

(0)∩X

−1

(x)

adµ



dµ

(x)





−1

(0)∩X

−1

(0)

adµ





−1

(0)∩X

−1

(1)

adµ





−1

(0)∩X

−1

(2)

adµ



= |A

−1

(0))(0)|

+ 0 + 0 = |A

(0)|

= |u|

Analogamente,

−1

(1)) = |A

(1)|

= |v|

−1

(2)) = |A

(2)|

= |w|

Logo, os X

s˜ao identicamente distribuidos, e como no exemplo 1, eles s˜ao

mutuamente independentes e formam um QMP. Entretanto, ao contr´ario do

exemplo 1, os X

interferem entre si. Para mostrar isso, seja j, k ∈ {1, . . . n},

com j = k. Ent˜ao

∈ {0, 1})(0) =



−1

(0)∪X

−1

(1))∩X

−1

(0)

adµ

= u(u + v)

∈ {0, 1})(1) =



−1

(0)∪X

−1

(1))∩X

−1

(1)

adµ

= v(u + v)

∈ {0, 1})(2) =



−1

(0)∪X

−1

(1))∩X

−1

(2)

adµ

= w(u + v)

Logo,

∈ {0, 1}) =







−1

(x)∩(X

−1

(0)∪X

−1

(1))

adµ



dµ

(x)





−1

(0)∩(X

−1

(0)∪X

−1

(1))

adµ





−1

(1)∩(X

−1

(0)∪X

−1

(1))

adµ



138





−1

(2)∩(X

−1

(0)∪X

−1

(1))

adµ



= |u(u + v)|

+ |v(u + v)|

+ |w(u + v)|

= |u + v|

(|u|

+ |v|

+ |w|

)

= |u + v|

E claro que em geral, isso n˜ao ´e igual a

∈ {0, 1}) =







−1

(x)∩(X

−1

(0)∪X

−1

(1))

adµ



dµ

(x)





−1

(0)∩(X

−1

(0)∪X

−1

(1))

adµ





−1

(1)∩(X

−1

(0)∪X

−1

(1))

adµ





−1

(2)∩(X

−1

(0)∪X

−1

(1))

adµ



(0)|

+ |A

(1)|

+ 0 = |u|

+ |v|

Logo, como X

−1

({0, 1}) ∈ Σ

segue pela deﬁni¸c˜ao de n˜ao interferˆencia

que X

interfere em X

Exemplo 3 Mecˆanica quˆantica discreta. Seja S um conjunto n˜ao vazio

de estados que uma part´ıcula pode assumir.

Deﬁni¸c˜ao Uma fun¸c˜ao A

: S ×S → C ´e uma amplitude de transi¸c˜ao

estoc´astica em um passo se para cada s

, s

∈ S, temos



, s)A

, s) =



(s, s

) = δ



, s) = 1

onde a soma converge absolutamente.

Uma matriz de amplitude de transi¸c˜ao de uma cadeia de Markov quˆantica

induz uma fun¸c˜ao de amplitude de transi¸c˜ao estoc´astica (a fun¸c˜ao induzida

´e simplesmente A : S × S → C, A(s

, s

) = A

). Denote o conjunto das

fun¸c˜oes de amplitude de transi¸c˜ao estoc´astica por T (S).

Fixemos Ω = S

n+1

= {(s

, s

, . . . , s

) : s

∈ S}. Seja a

∈ l

(S) um vetor

unit´ario representando a distribui¸c˜ao inicial de uma part´ıcula quˆantica. Fixe

∈ T (S). Para ω = (s

, s

, . . . s

) ∈ Ω, deﬁna a densidade de amplitude

a(w) := a

, s

) ···A

n−1

, s

)

139

Para j = 0, 1, . . . , n, deﬁna X

: Ω → S por

, s

, . . . , s

) = s

Seja µ

e µ

a medida da contagem em S e em X

−1

(s), respectivamente.

Equipado com essa estrutura, X

´e uma medi¸c˜ao, j = 0, 1, . . . n e vale que

∈ A(Ω, a),j = 0, . . . , n. Se j < k, vale que X

n˜ao interfere em X

(ver

[16]). Mas exemplos simples mostram que X

pode interferir em X

. Al´em

disso, X

e X

n˜ao s˜ao independentes em geral. Finalmente, vale que (X

)

j=0

´e um QMP quase-discreto (ver [16]).

Vamos analisar um modelo concreto para a mecˆanica quˆantica discreta

em 2 dimens˜oes. Sejam a e m inteiros positivos relativamente primos, m par.

Seja α = 2π/m e sejam k

, k

, . . . , k

m−1

vetores unit´arios em R

tais que cada

um forma um ˆangulo α com o anterior. Seja

V = {v ∈ R

: v =



j=1

, e

∈ {k

, . . . , k

m−1

}, n ∈ N}

Pensamos em V como sendo um espa¸co de conﬁgura¸c˜ao discreto, e que est´a

associado a um espa¸co de fase discreto

S = {(v, k

) : v ∈ V, j = 0, . . . , m − 1}

Deﬁni¸c˜ao A amplitude de transi¸c˜ao de Feynman discreta em um passo

´e a aplica¸c˜ao A

: S ×S → C dada por

((v, k

), (v + k

, k

)) = n

−1/2

exp



imπ(t − r)



e A

´e zero, caso contr´ario.

Pode-se mostrar que um m´ultiplo constante de A

, de m´odulo 1, est´a

contido em T (S). Como tal m´ultiplo n˜ao afeta as probabilidades, iremos

assumir que A

∈ T (S).

Seja n ∈ N e seja Ω = S

n+1

= {(s

, s

, . . . , s

) : s

∈ S}. Deﬁna a

densidade de amplitude a : Ω → C e as medi¸c˜oes X

: Ω → S como antes.

Neste caso, para

ω = ((v

, k

i(0)

), . . . , (v

, k

i(n)

))

temos que X

(ω) = (v

, k

i(j)

), j = 0, . . . n. Pelo que ﬁzemos acima, con-

cluimos que (X

)

j=0

´e um QMP em A(Ω, a).

140

Vamos mostrar que se n → ∞, A

se aproxima, em um certo sentido, da

amplitude de Feynman usual para uma part´ıcula livre. Seja

p = {(x

, k

), . . . , (x

, k

)},

tal que x

= x

s+1

, s = 0, . . . r−1. Seja β

= 2π(j

−j

s−1

)/n, s = 1, . . . , r

e suponha que os β

s˜ao pequenos (ou pr´oximos de 2π). Ent˜ao a distˆancia

entre x

s+1

e x

s−1

´e

x

s+1

− x

s−1



= x

+ k

s−1

+ k

− x



= k

s−1

+ k



= 2 + 2k

s−1

= 2 + 2 cos β

≈ 2 + 2



1 −



= 4 − β

Portanto, β

≈ 4 − x

s+1

− x

s−1



. Se v

denota a “velocidade”da part´ıcula

no tempo s, temos v

≈ x

s+1

−x

s−1



/4. Logo, β

≈ 4(1−v

) e a amplitude

do caminho p ´e

A(p) = n

−r/2

exp



imπn

−1



s=1

− j

s−1

)



= n

−r/2

exp



imn(4π)

−1



s=1



≈

≈ n

−r/2

exp



imnπ

−1



s=1

(1 − v

)



= n

−r/2

imnr/π

exp



−i2nπ

−1



s=1



Se ﬁzermos com que o n´umero m corresponda `a massa da part´ıcula, ent˜ao o

somat´orio corresponde `a integral da energia cin´etica sobre o caminho. Desta

forma, A

(p) se aproxima da amplitude de Feynman usual (cont´ınua) para

uma part´ıcula livre.

Exemplo 4 Ainda, de maneira an´aloga a feita para cadeias quˆanticas,

podemos tamb´em calcular a entropia de processos de Markov. Usando a

express˜ao para a probabilidade de um evento B ∈ Σ

, que repetimos aqui,

X,a

(B) =



|A|

dµ



dµ



|A(X

−1

(B)|

dµ







−1

(B)∩X

−1

(x)

adµ



dµ

(x),

141

podemos calcular a entropia de Shannon e a de von Neumann dos exemplos

que consideramos nas se¸c˜oes 8.1 e 8.2. No caso da moeda quˆantica, os dois

casos que consideramos (n´umero ﬁnito ou arbitr´ario de medi¸c˜oes) possuiam a

mesma distribui¸c˜ao estacion´aria, a saber, P

(0) = |A

(0)|

= |u|

, e P

(1) =

(1)|

= |v|

. O operador densidade associado ´e ρ = |u|

|00| + |v|

|11|

e portanto, por (5.1) (ap´os deﬁni¸c˜ao de entropia de von Neumann),

S(ρ) = −tr(ρ log ρ) = −|u|

log |u|

− |v|

log |v|

8.3 Processos de Markov quˆanticos

quase-discretos

Nesta se¸c˜ao, X

, t ∈ T ⊂ R ser´a um QMP quase-discreto sobre A(Ω, a). Para

s, t ∈ T , deﬁna F

s,t

: R

× R

→ C por

s,t

(x, y) = A

(y|X

= x)

Se A

(x) = 0 ent˜ao

s,t

(x, y) =

= x)(y)

(x)

= A

(x)

−1



−1

(x)∩X

−1

(y)

adµ

e F

s,t

(x, y) = 0, caso contr´ario. Podemos aplicar o item 3 da deﬁni¸c˜ao de

QMP quase-discreto para calcular A

em termos de A

, para s ≤ t:

(y) =



= x)(y)dµ

(x) =



(x)F

s,t

(x, y)dµ

(x) (8.12)

Deﬁni¸c˜ao O kernel de amplitude de transi¸c˜ao K

s,t

: R

× Σ

→ C para

s, t ∈ T , s ≤ t ´e dado por

s,t

(x, B) =



s,t

(x, y)dµ

(y)

Segue do item 2 da deﬁni¸c˜ao de QMP quase-discreto que K

s,t

existe e ´e ﬁnito,

e pelo item 3 vale que F

s,t

´e mensur´avel em ambas as vari´aveis. Fazendo

uma analogia com um n´ucleo de Markov, vemos que K

s,t

(x, .) ´e uma medida

complexa limitada em Σ

e que K

s,t

(., B) ´e mensur´avel em R

. Al´em disso,

s,t

(x, .)  µ

s,t

(x, .)

dµ

(y) = F

s,t

(x, y)

Agora provamos uma vers˜ao do teorema de Chapman-Kolmogorov neste con-

texto.

142

Teorema 8.3.1 Para s, u, t ∈ T , s ≤ u ≤ t e x ∈ R

, z ∈ R

, B ∈ Σ

temos

s,t

(x, z) =



u,t

(y, z)F

s,u

(x, y)dµ

(y) =



u,t

(y, z)K

s,u

(x, dy)

s,t

(x, B) =



u,t

(y, B)K

s,u

(x, dy)

Prova Se A

(x) = 0, a desigualdade vale claramente, ent˜ao assumimos que

(x) = 0. Aplicando (8.6) e (8.8), temos



u,t

(y, z)K

s,u

(x, dy) =



u,t

(y, z)F

s,u

(x, y)dµ

(y)



(z|X

= y)A

(y|X

= x)dµ

(y)



(z|X

= y, X

= x)A

(y|X

= x)dµ(y)



= y, X

= x)(z)

= x)(y)

(x)

dµ

(y)

(x)



= y, X

= x)(z)dµ

(y)

(x)

= x)(z) = F

s,t

(x, z)

Integrando a primeira igualdade, obtemos a segunda.



Agora assumimos que os contradom´ınios coincidem, ou seja,

, Σ

, µ

) = (R, Σ, µ), t ∈ T

Seja H = L

(R, Σ, µ). Diremos que (X

)

t∈T

´e estacion´ario (homogˆeneo no

tempo) se F

s+u,t+u

= F

s,t

sempre que s, t, s + u, t + u ∈ T , s ≤ t. Assuma

que (X

)

t∈T

´e estacion´ario e que T = [0, a], 0 < a < ∞ ou T = [0, ∞). Ent˜ao

deﬁnimos F

: R × R → C por F

= F

0,t

, t ∈ T . Da´ı, temos F

s,t

= F

t−s

Analogamente, deﬁnimos K

: R × Σ → C por K

= K

0,t

e da´ı K

s,t

= K

t−s

Ent˜ao

(x, B) =



(x, y)dµ(y)

143

Assim, podemos reescrever (8.12) na forma

(y) =



(x)F

(x, y)dµ(x) (8.13)

Al´em disso, fazendo s = 0 e trocando t por s + t e u por s, a equa¸c˜ao de

Chapman-Kolmogorov se torna

s+t

(x, z) =



(x, y)F

(y, z)dµ(y) (8.14)

s+t

(x, B) =



(y, B)K

(x, dy) (8.15)

Para t ∈ T deﬁna a aplica¸c˜ao K

: Σ × R → C por

(B, y) =



(x, y)dµ(x)

Segue dos itens 2 e 3 da deﬁni¸c˜ao de QMP que K

(B, x) ´e mensur´avel na

segunda vari´avel e ´e uma medida complexa limitada na primeira vari´avel.

Al´em disso, K

(., y)  µ e

(., y)

dµ

(x) = F

(x, y)

Diremos que (X

)

t∈T

´e unit´ario se para cada t ∈ T se para cada t ∈ T ,

y ∈ R, B ∈ Σ com µ(B) < ∞, temos



(x, B)F

(x, y)dµ(x) =



(B, x)F

(y, x)dµ(x) = 1

(y), µ − q.t.p.

Deﬁna o operador linear U

: H → H por

g(y) =



g(x)F

(x, y)dµ(x) =



g(x)K

(dx, y)

Aplicando (8.13) temos A

= U

, t ∈ T . Agora mostraremos que neste caso

t → U

´e um semigrupo unit´ario a um parˆametro. Mostraremos tamb´em que

)

t∈T

´e unit´ario se e somente se U

´e unit´ario para todo t ∈ T .

Teorema 8.3.2 1. Se (X

)

t∈T

´e unit´ario ent˜ao U

´e um operador unit´ario,

t ∈ T e U

s+t

= U

para todo s, t ∈ T com s + t ∈ T .

2. Se U

´e unit´ario, t ∈ T ent˜ao (X

)

t∈T

´e unit´ario.

144

Prova 1. Suponha que (X

)

t∈T

´e unit´ario. Primeiro mostraremos que U

´e limitado, t ∈ T . Seja g ∈ H uma fun¸c˜ao simples. Ent˜ao existe B

∈ Σ,

i = 1, . . . , n com B

∩ B

= ∅ se i = j, µ(B

) < ∞ e c

∈ C, i = 1, . . . , n tais

que g =



B(i)

. Da´ı,

U

g



g(y)|

dµ(y) =







g(x)K

(dx, y)





g(z)K

(dz, y)



dµ(y)







g(x)F

(x, t)dµ(x)



[



, y)]dµ(y)





g(x)





, y)F

(x, y)dµ(y)



dµ(x)





g(x)1

B(i)

(x)dµ(x) =



µ(B

) = g

Portanto, U

restrita ao subespa¸co denso S de fun¸c˜oes simples possui norma

1. Logo, esta restri¸c˜ao possui uma ´unica extens˜ao linear e limitada

para

H de norma 1. Agora seja g ∈ H qualquer. Ent˜ao existe uma seq¨uˆencia

∈ S tal que |g

(x)| ≤ |g(x)| para todo x ∈ R e g

→ g na convergˆencia da

norma. Segue que existe uma subseq¨uˆencia, que tamb´em denotaremos por g

tal que g

→ g, µ-q.t.p.. Como g, F

(., y) ∈ H, temos gF

(., y) ∈ L

(R, Σ, µ)

e al´em disso,

(x)F

(x, y)| ≤ |g(x)F

(x, y)|

para todo x ∈ R. Aplicando o teorema da convergˆencia dominada, temos

g(y) = lim

(y) = lim



(x)F

(x, y)dµ(x)



g(x)F

(x, y)dµ(x) = U

g(y)

Logo, U

e portanto U

´e limitada.

Mostremos que U

´e unit´aria. Note que a adjunta de U

´e dada por

∗

g(y) =



g(x)F

(y, x)dµ(x) =



g(x)K

(y, dx)

Novamente, se g =



B(i)

´e uma fun¸c˜ao simples, temos

∗

g(y) =



∗

g(x)F

(x, y)dµ(x)







g(z)K

(x, dz)



(x, y)dµ(x)

145





(x, B

(x, y)dµ(x) =



B(i)

(y) = g(y)

Analogamente,

∗

g(y) =



g(x)F

(y, x)dµ(x)







g(z)K

(dz, x)



(y, x)dµ(x)





, x)F

(y, x)dµ(x) =



B(i)

(y) = g(y)

Logo, U

∗

= U

∗

= 1 em S e portanto U

´e unit´aria. Finalmente, se s, t,

s + t ∈ T , temos por (8.14) que

s+t

g(y) =



g(x)F

s+t

(x, y)dµ(x)



g(x)





(x, z)F

(z, y)dµ(z)



dµ(x)







g(x)F

(x, z)dµ(x)



(z, y)dµ(z) = U

g(y)

2. Suponha que U

, t ∈ T ´e unit´ario. Se B ∈ Σ com µ(B) < ∞ ent˜ao

∈ H. Logo,

(x) = U

∗

(x) =







(z)K

(x, dz)



(x, y)dµ(x)



(x, B)F

(x, y)dµ(x)

(x) = U

∗

(x) =







(z)K

(dz, x)



(y, x)dµ(x)



(B, x)F

(y, x)dµ(x)



Seja (X

)

t∈T

unit´ario com T = [0, ∞). Deﬁnindo U

−t

= U

∗

, temos que t → U

´e um grupo unit´ario a um parˆametro em R. Note que F

(x, .) −F

(x, .) ∈ H

e F

(x, .) −F

(x, .) ´e mensur´avel. Dizemos que (X

)

t∈T

´e cont´ınuo se para

todo  > 0 existe δ > 0 tal que |t| < δ implica que



F

(x, .) − F

(x, .)

dµ(x) < 

146

Teorema 8.3.3 Se (X

)

t∈T

´e cont´ınuo, unit´ario e estacion´ario, ent˜ao t →

´e fortemente cont´ınuo.

Prova Mostraremos que t → U

´e fracamente cont´ınuo em 0, donde o

resultado segue. Para g, h ∈ H temos, aplicando a desigualdade de Schwarz,

que

|(U

− I)g, h| =



 

g(x)[F

(x, y) − F

(x, y)]dµ(x)h(y)dµ(y)



≤



|g(x)|



(x, y) − F

(x, y)||h(y)|dµ(y)dµ(x)

≤ h



|g(x)|F

(x, .) − F

(x, .)dµ(x)

≤ hg





F

(x, .) − F

(x, .)

dµ(x)



1/2

Logo, dado  > 0, existe δ > 0 tal que |t| < δ implica

|(U

− I)g, h| ≤ hg



Sob as condi¸c˜oes do teorema anterior, temos que t → U

´e um grupo unit´ario

a um parˆametro cont´ınuo. Portanto, pelo teorema de Stone, U

= e

itH

para

um ´unico operador auto-adjunto H. Chamamos tal processo de processo

Hamiltoniano.

Teorema 8.3.4 Se (X

)

t∈T

´e estacion´ario e unit´ario ent˜ao X

n˜ao interfere

em X

para s ≤ t.

Prova Para B ∈ Σ, temos por (8.8) e pela unitaridade de U

t−s

que

∈ B) =



∈ B)(y)|

dµ(y)







−1

(B) ∩ X

−1

(x)](y)dµ(x)



dµ(y)







(x)A

= x)(y)dµ(x)



dµ(y)







(x)A

(x)F

t−s

(x, y)dµ(x)



dµ(y)



t−s

(y)|

dµ(y) = U

t−s



= 1





dµ = P

(B)



147

Referˆencias Bibliogr´aﬁcas

[1] Accardi, L. A. Nonrelativistic quantum mechanics as a non-commutative

Markov process. Adv. Math, Vol. 20, 1976.

[2] Accardi, L. Topics in quantum probability, Phys. Reports, 77, No. 3

(1981), 169-192.

[3] Accardi, L., Fidaleo, F., Mukhamedov, F. Markov states on the CAR

algebra. Math-ph/0411035.

[4] Arveson, W. The canonical anticommutation relations. Lecture Notes

for Mathematics 208. November 1998.

[5] Atiyah, M.F., Macdonald, I.G. Introduction to Commutative Algebra.

Addison-Wesley, 1969.

[6] Balakrishnan, A. V. Applied Functional Analysis. Springer-Verlag, 1976.

[7] Billingsley, P. Probability and Measure. John Wiley & Sons, Inc., 1995.

[8] Bratteli, O., Robinson, D. Operator algebras and quantum statistical

mechanics, vols. 1 e 2. Second edition. Springer-Verlag, 1997.

[9] Brin, M. Stuck, G. Introduction to Dynamical Systems. Cambridge Uni-

versity Press, 2002.

[10] Ellis, R. S. Entropy, Large Deviations, and Statistical Mechanics.

Springer-Verlag, 1985.

[11] Fernandez, P. Medida e Integra¸c˜ao. Projeto Euclides, 1996.

[12] Feynman, R., Hibbs, A. Quantum mechanics and path integrals.

McGraw-Hill, New York, N.Y., 1965.

[13] Feynman, R. QED: The Strange Theory of Light and Matter. Princeton

University Press, Princeton, New Jersey, 1985.

148

[14] Gantmacher, F.R. The Theory of Matrices, vol. 2. Chelsea Publishing

Company, New York, N.Y., 1959.

[15] Gudder, S., Marbeau, J. Analysis of a Quantum Markov Chain. Annales

de l’Institut Henri Poincar´e - Physique Th´eorique, Vol 52, no. 1, 1990,

p. 31-50.

[16] Gudder, S., Schindler, C. Quasi-discrete Quantum Markov Processes.

Annales de l’Institut Henri Poincar´e - Physique Th´eorique, Vol 56, no.

2, 1992, p. 123-142.

[17] Gudder, S., Marbeau, J. A quantum random walk. Annales de la Foun-

dation Louis de Broglie, Vol. 14, no. 4, 1989.

[18] Gudder, S. Quantum Probability. Academic Press, Inc., Boston, 1988.

[19] Gudder, S. Discrete Quantum Mechanics. J. Math. Physics, 27 (7), 1986,

p. 1782-1790.

[20] Gustafson, S., Sigal, I. Mathematical Concepts of Quantum Mechanics.

Springer-Verlag, 2003.

[21] Isham, C. J. Lectures on Quantum Theory. Imperial College Press, 1995.

[22] Karlin, S., Taylor, H. A ﬁrst course in stochastic processes. Academic

Press, Inc. 1975.

[23] Kempe, J. Quantum random walks: an introductory overview. Contem-

porary Physics, vol. 44, number 4, july-august 2003.

[24] Kitaev, A. Yu., Shen, A. H., Vyalyi, M. N. Classical and Quantum Com-

putation. Graduate Studies in Mathematics, vol. 47. American Mathe-

matical Society, 2002.

[25] Kumjian, A., Renault, J. KMS states on C

∗

-algebras associated to ex-

pansive maps. Math.OA/0305044.

[26] Lanford, O. E., Ruelle, D. Observables at inﬁnity and states with short

range correlation in statistical mechanics. Comm. Math. Phys. Vol. 13,

194-215, 1969.

[27] Lima, E. L. Espa¸cos M´etricos. Projeto Euclides, 1996.

[28] Lu, Y-G. Quantum Markov Chains and classical random sequences.

Nagoya Math. Journal. Vol. 139 (1995), pp. 173-183.

149

[29] Madsen, I., Tornehave, J. From calculus to cohomology: De Rham co-

homology and characteristic classes. Cambridge University Press, 1997.

[30] Nelson, E. Construction of quantum ﬁelds from Markov ﬁelds. Journal

of Functional Analysis, Vol. 12, 1973.

[31] Neshveyev, S., Stormer, E. The variational principle for a class of as-

ymptotically abelian C

∗

-algebras.

http://www.math.uio.no/eprint/pure math/2000/11-00.ps.

[32] Nielsen, M., Chuang, I. Quantum computation and quantum informa-

tion. Cambridge University Press, 2000.

[33] Norris, J. R. Markov Chains. Cambridge University Press, 1998.

[34] Ohya, M., Petz, D. Quantum entropy and its use, Texts and monographs

in physics. Springer-Verlag, Berlin. 1993.

[35] Parry, W., Pollicott, M. Zeta Functions and the Periodic Orbit Struc-

ture of Hyperbolic Dynamics. Soci´et´e Math´ematique de France. 187-188,

Ast´erisque, 1990.

[36] Pollicott, M. Yuri, M. Dynamical Systems and Ergodic Theory. Cam-

bridge University Press, 1998.

[37] Sinai, Ya. Probability Theory. Springer-Verlag, 1992.

[38] Spitzer, F. A variational characterization of ﬁnite Markov chains. Annals

of Math. Statistics, Vol 43, No. 1, 1972, p. 303-307.

[39] Urruty, J. B. H. Fundamentals of Convex Analysis. Springer-Verlag,

2001.

[40] van Enter, A. C. C., Fernandez R. and Sokal, A. D. Regularity proper-

ties and pathologies of position-space renormalization-group transforma-

tions: Scope and limitations of Gibbsian theory, Journ. of Stat. Phys.,

Vol 72, N 5/6, 1993 pp 879-1187.

[41] Vedral, V. The role of relative entropy in quantum information theory.

Reviews of modern physics, Vol. 74, January 2002.

[42] Walters, P. An Introduction to Ergodic Theory. Springer-Verlag, New

York, 1982.

150

Indice Remissivo

(X, a)-evento, 132

(X, a)-probabilidade, 132, 135

∗-´algebra, 124

∗

-´algebra, 4, 119

Algebra, 118

Algebra de Banach, 119

Algebra normada, 118

Amplitude de transi¸c˜ao, 8

Bit, 54

Cadeia de Markov, 12

Cadeia de Markov quˆantica, 13, 120,

122

Conjunto de eventos, 131

Decomposi¸c˜ao espectral, 67

Decomposi¸c˜ao polar, 67

Decomposi¸c˜ao de Schmidt, 66

Decomposi¸c˜ao em valores singulares,

Densidade de amplitude, 131, 132

Desigualdade de Araki-Lieb, 79

Desigualdade de Klein, 76

Distribui¸c˜ao de Gibbs, 93

Energia espec´ıﬁca, 98

Energia livre, 99

Energia m´edia, 98

Ensemble, 62

Entropia condicional de Shannon, 72

Entropia condicional de von Neumann,

Entropia de Shannon, 71

Entropia de uma medida, 98

Entropia de uma parti¸c˜ao, 98

Entropia de von Neumann, 76

Entropia quˆantica, 76

Entropia relativa de Shannon, 71

Entropia relativa de von Neumann,

Equa¸c˜ao de Schr¨odinger, 5, 64

Espa¸co de probabilidade quˆantica, 132

Esperan¸ca condicional (de Umegaki),

126

Esperan¸ca de transi¸c˜ao, 120

Esperan¸ca quase-condicional, 126

Estado (funcional), 119

Estado (vetor-estado), 54

Estado de Markov, 126

Estado emaranhado, 60, 66

Estado KMS, 127

Estado misturado, 63

Estado puro, 63

Estados correlacionados, 72, 79

Informa¸c˜ao m´utua de Shannon, 72

Informa¸c˜ao m´utua de von Neumann,

Involu¸c˜ao, 119

Lema de Wielandt, 107

Matriz densidade, 62

Matriz irredut´ıvel, 111

Matriz redut´ıvel, 111

Mecˆanica estat´ıstica quˆantica, 118

Mecˆanica quˆantica discreta, 139

151

Medi¸c˜ao, 10, 130

Medi¸c˜oes independentes, 134

Medida erg´odica, 100

Moeda quˆantica, 127, 135

Moeda quˆantica de 3 lados, 137

N-cadeia, 11

N-cadeia quˆantica, 13

N-cadeia unit´aria, 13

N´umero de Schmidt, 69

N˜ao-interferˆencia, 12, 133

Operador densidade, 62

Operador densidade reduzido, 63

Press˜ao topol´ogica, 95

Processo de Markov quˆantico, 134

Processo estacion´ario, 143

Processo estoc´astico quˆantico, 134

Processo unit´ario, 144

Produto de Kronecker, 61

Puriﬁca¸c˜ao de um estado, 69

Q-bit, 54

Rela¸c˜oes de anticomutatividade canˆonicas

(CAR), 125

Teorema de Birkhoﬀ, 110

Teorema de Krein-Milman, 110

Teorema de Lieb, 83

Teorema de Perron-Frobenius, 108

Teoria quˆantica de campos, 127

Tra¸co parcial, 63

152

Livros Grátis
( http://www.livrosgratis.com.br )
 
Milhares de Livros para Download:
 
Baixar livros de Administração
Baixar livros de Agronomia
Baixar livros de Arquitetura
Baixar livros de Artes
Baixar livros de Astronomia
Baixar livros de Biologia Geral
Baixar livros de Ciência da Computação
Baixar livros de Ciência da Informação
Baixar livros de Ciência Política
Baixar livros de Ciências da Saúde
Baixar livros de Comunicação
Baixar livros do Conselho Nacional de Educação - CNE
Baixar livros de Defesa civil
Baixar livros de Direito
Baixar livros de Direitos humanos
Baixar livros de Economia
Baixar livros de Economia Doméstica
Baixar livros de Educação
Baixar livros de Educação - Trânsito
Baixar livros de Educação Física
Baixar livros de Engenharia Aeroespacial
Baixar livros de Farmácia
Baixar livros de Filosofia
Baixar livros de Física
Baixar livros de Geociências
Baixar livros de Geografia
Baixar livros de História
Baixar livros de Línguas

Baixar livros de Literatura
Baixar livros de Literatura de Cordel
Baixar livros de Literatura Infantil
Baixar livros de Matemática
Baixar livros de Medicina
Baixar livros de Medicina Veterinária
Baixar livros de Meio Ambiente
Baixar livros de Meteorologia
Baixar Monografias e TCC
Baixar livros Multidisciplinar
Baixar livros de Música
Baixar livros de Psicologia
Baixar livros de Química
Baixar livros de Saúde Coletiva
Baixar livros de Serviço Social
Baixar livros de Sociologia
Baixar livros de Teologia
Baixar livros de Trabalho
Baixar livros de Turismo