O que significam as matrizes de Pauli?

Todas as introduções que eu “encontrei para matrizes Pauli até agora simplesmente as declaram e em seguida, comece a usá-los. As descrições que acompanham seu significado parecem frustrantemente incompletas; eu, pelo menos, não consigo entender as matrizes de Pauli depois de lê-las.

Meu entendimento e confusão atuais são demonstrados abaixo. Eu ficaria muito grato se alguém pudesse preencher todos os buracos, ou abrir novos quando apropriado.

Spinors se parecem com vetores de coluna, ou seja, $$ s = \ left (\ begin {matrix} 1 \\ 0 \\ 1 \ end {matrix} \ right) $$ e são usados para que a rotação em três dimensões (usando números complexos) possa ser transformada linearmente. O que significa o spinor do exemplo acima? Um valor de spin de 1 nas direções xez? Como o spin – $ \ frac {1} {2} $ pode ser representado com apenas 1s então?

Um vetor tridimensional é usado para construir o Pauli matriz para cada dimensão. Por exemplo, para spin – $ \ frac {1} {2} $, os vetores usados para x, y e z são $ v_x = (1,0,0) $, $ v_y = (0,1 , 0) $ e $ v_z = (0,0,1) $. Você os transforma cada um na matriz de Pauli relevante pela seguinte equação, usando a dimensão x para demonstração, $$ P ^ x = \ left (\ begin {matrix } v_3 ^ x & v_1 ^ x – i v_2 ^ x \\ v_1 ^ x + i v_2 ^ x & -v_3 ^ x \ end {matrix} \ right) $$ onde sobrescrito denota dimensão, não poder.

Depois de ter e essas matrizes, você opera nos spinors com elas. O que isso faz?

Você também pode encontrar os autovalores e autovetores da matriz, que podem ser usados para encontrar a probabilidade de que uma partícula, se medida, tenha um certo spin em uma dimensão, quando medido em seguida, terá spin em outra dimensão que você escolher. Não entendo como isso funciona. O que o autovalor e o autovetor neste sentido representam fisicamente e como o spin para cima e para baixo se encaixa nisso? Por exemplo, se você tivesse uma partícula de spin-1 que você sabia que era spin-up na direção x, o que você faria para encontrar a probabilidade de ele ter spin para cima ou para baixo na dimensão z ou y na próxima medição?

Exemplos concretos provavelmente ajudariam muito na minha compreensão .

Comentários

  • Tudo está explicado aqui
  • Este é o entendimento correto? Pauli [x] = Inverte o spin no eixo x na base z (uma matriz de rotação – valores de troca) Pauli [y] = Inverte o spin no eixo y na base z Pauli [ z] = Inverte o spin no eixo z na base z (Inverter matriz – Spin + é positivo, Spin – é negativo)

Resposta

Deixe-me primeiro lembrar (ou talvez apresentá-lo) alguns aspectos da mecânica quântica em geral como um modelo ou sistemas físicos. Parece-me que muitas de suas perguntas podem ser respondidas com uma melhor compreensão desses aspectos gerais, seguido por um apelo sobre como os sistemas de spin surgem como um caso especial.

Observações gerais sobre estados quânticos e medição.

O estado de um sistema quântico é modelado como um elemento de comprimento de unidade $ | \ psi \ rangle $ de um espaço de Hilbert complexo $ \ mathcal H $, um tipo especial de espaço vetorial com um produto interno. Cada quantidade observável (como momentum ou spin) associada a tal sistema, cujo valor alguém pode querer medir, é representada por um operador auto-adjunto $ O $ naquele espaço. Se alguém construir um dispositivo para medir tal observável, e se usar esse dispositivo para fazer uma medição daquele observável no sistema, a máquina produzirá um valor próprio $ \ lambda $ daquele observável. Além disso, se o sistema está em um estado $ | \ psi \ rangle $, então a probabilidade de que o resultado da medição dessa quantidade seja o autovalor do observável é \ begin {align} p (\ lambda) = | \ langle \ lambda | \ psi \ rangle | ^ 2 \ end {align} onde $ | \ lambda \ rangle $ é o autovetor normalizado correspondente ao autovalor $ \ lambda $.

Especialização em sistemas de spin.

Suponha, agora, que o sistema que estamos considerando consiste no spin de uma partícula. O espaço de Hilbert que modela o estado de spin de um sistema com spin $ s $ é um espaço de Hilbert $ 2s + 1 $ dimensional. Os elementos desse espaço vetorial são frequentemente chamados de “espinores”, mas não deixe que isso o distraia, eles são como qualquer outro vetor em um espaço de Hilbert, cujo trabalho é modelar o estado quântico do sistema.

Os observáveis primários cuja medição geralmente se discute para sistemas de spin são os componentes cartesianos do spin do sistema. Em outras palavras, existem três operadores auto-adjuntos convencionalmente chamados $ S_x, S_y, S_z $ cujos autovalores são os valores possíveis pode-se obter se medirmos um desses componentes do spin do sistema. O espectro (conjunto de autovalores) de cada um desses operadores é o mesmo.Para um sistema de spin $ s $, cada um de seus espectros consiste nos seguintes valores: \ begin {align} \ sigma (S_i) = \ {m_i \ hbar \, | \, m_i = -s, -s + 1, \ dots, s-1, s \} \ end {align} onde em minha notação $ i = x, y, z $. Portanto, por exemplo, se você construir uma máquina para medir o componente $ z $ do spin de um sistema de spin- $ 1 $, a máquina produzirá um dos valores no conjunto $ \ {- \ hbar, 0, \ hbar \} $ todas as vezes. Correspondendo a cada um desses autovalores, cada operador de componente de spin tem um autovetor normalizado $ | S_i, m_i \ rangle $. Conforme indicado pelas observações gerais acima, se o estado do sistema é $ | \ psi \ rangle $, e se deseja saber a probabilidade de que a medição do componente de spin $ S_i $ produza um certo valor $ m_i \ hbar $ , então simplesmente calcula-se \ begin {align} | \ langle S_i, m_i | \ psi \ rangle | ^ 2. \ end {align} Por exemplo, se o sistema tem spin- $ 1 $, e se alguém deseja saber a probabilidade de que uma medida de $ S_y $ irá render o autovalor $ – \ hbar $, então calcula-se \ begin {align} | \ langle S_y, -1 | \ psi \ rangle | ^ 2 \ end {align}

Spinors.

No contexto acima, os espinores são simplesmente as representações matriciais dos estados de um sistema de spin particular em uma certa base ordenada, e as matrizes de spin de Pauli são, até uma normalização, as representações matriciais de os operadores de componente de spin nessa base especificamente para um sistema com spin- $ 1/2 $. As representações matriciais geralmente facilitam o cálculo e a compreensão conceitual, por isso as usamos.

Mais explicitamente, suponha que se considere um sistema de spin $ 1/2 $ e se escolha representar estados e observáveis na base $ B = (| S_z, -1/2 \ rangle, | S_z, 1/2 \ rangle) $ consistindo nos autovetores normalizados do componente $ z $ do spin, então seria possível encontrar as seguintes representações de matriz nessa base \ begin {align} [S_x] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & 1 \\ 1 & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_x \\ [S_y] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & -i \\ i & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_y \\ [S_z] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 1 & 0 \\ 0 & -1 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_z \\ \ end {align} Notar que essas representações são precisamente as matrizes de Pauli até o fator $ \ hbar / 2 $ extra. Além disso, cada estado do sistema seria representado por uma matriz $ 2 \ vezes 1 $, ou “spinor” \ begin {align} [| \ psi \ rangle] _B = \ begin {pmatrix} a \\ b \ end {pmatrix } \ end {align} E pode-se usar essas representações para realizar os cálculos mencionados acima.

Comentários

  • Muito obrigado; isso me ajudou muito a entender. É apenas uma convenção que os estados próprios que retornam valores próprios negativos são spin ‘ para baixo ‘ e spin positivo ‘ up ‘? Para verificar meu entendimento, eu ‘ tentei calcular o exemplo que usei acima: é verdade que uma partícula de spin-1 medida para estar na dimensão x (autovalor hbar) irá estar no estado normalizado < 1/2, sqrt (2) / 2, 1/2 > e a probabilidade de dimensão az a medição retornando para cima será 1/4, retornando o spin zero será 1/2 e para baixo 1/4?
  • +1 Gosto especialmente de suas ” máquinas ” no primeiro parágrafo – com um sabor muito feynmaniano. Lutei por muitos anos para ” entender ” QM: a matemática e a teoria de mentira estavam acostumadas a mim, mas demorou muito para mim entender que ” operadores ” não apenas operadores, mas também vieram com uma receita especial para interpretá-los como modelos de ” máquinas de medição “. Infelizmente, não consigo ‘ não me lembrar se foram as palestras de Feynman ou o Sakurai que transmitiram a mensagem, ou se realmente foi uma mistura dos dois em meus pensamentos no chuveiro ou durante caminhando, mas isso é o que eu recomendo para as pessoas agora.

Resposta

Grupos são estruturas matemáticas abstratas, definidas por sua topologia (no caso de grupos contínuos (Lie)) e a operação de multiplicação.

Mas é quase impossível falar em grupos abstratos. É por isso que geralmente os elementos dos grupos são mapeados em operadores lineares agindo em algum espaço vetorial $ V $:

$$ g \ in G \ rightarrow \ rho (g) \ in \ text {End} (V ), $$

onde G é o grupo, $ \ text {End} (V) $ significa endomorfismos (operadores lineares) em $ V $, e $ \ rho (g) $ é o mapeamento .Para que este mapeamento seja significativo, temos que mapear a multiplicação do grupo corretamente:

$$ \ rho (g_1 \ circ g_2) = \ rho (g1) \ cdot \ rho (g2). $$

O inverso também é mapeado para

$$ \ rho (g ^ {- 1}) = \ rho (g) ^ {- 1} $$

e a identidade do grupo é apenas

$$ \ rho (e) = \ text {Id} _V. $$

Isso é chamado de representação do grupo $ G $. $ V $ transforma-se sob a representação $ \ rho $ do grupo $ G $.

No seu caso, o grupo de interesse é o grupo de rotações em 3 dimensões que normalmente é denotado como SO (3). Nosso objetivo é encontrar diferentes objetos que podem ser girados, ou seja, representações (e espaços de representação) de SO (3).

Uma dessas representações é a representação de definição (que é usada para definir SO (3)) , ou a representação vetorial. Neste caso $ V $ é apenas $ R ^ 3 $ e as matrizes de $ \ rho (\ text {SO (3)}) $ são ortogonais $ 3 \ vezes 3 $ matrizes com determinante unitário:

$ $ A ^ {T} A = 1; \ quad \ det A = 1 $$

Assim, os vetores podem ser girados em 3 dimensões. O resultado dessa rotação por $ g \ in \ text {SO (3)} $ é determinado atuando no vetor inicial com o operador $ \ rho (g) $.

Outra representação é o spinor representação. O espaço vetorial agora é bidimensional e complexo . A imagem desta representação consiste em $ 2 \ times 2 $ unitários com determinante da unidade:

$$ A ^ {\ dagger} A = 1; \ quad \ det A = 1. $$

Esta representação não é tão óbvia como a anterior, uma vez que os espinores são algo que normalmente não vemos na vida quotidiana. Mas pode ser matematicamente provado que estas representações são isomórficas e, portanto, são duas representações diferentes do mesmo grupo (na verdade, elas são homomórficas e a representação do espinor é a dupla capa da representação vetorial).

Agora, para as matrizes de Pauli. Há um princípio geral: para cada grupo de Lie $ G $ existe um linear correspondente espaço (álgebra de Lie) com um colchete de Lie (uma operação anti-comutativa que satisfaz a identidade de Jacobi) que mapeia exclusivamente em alguma vizinhança da unidade de grupo de $ G $. Esse mapeamento é chamado de exponencial.

Então você pode escrever uma matriz arbitrária (próxima o suficiente da unidade para evitar problemas topológicos globais) $ 2 \ vezes 2 $ matriz complexa fr om a representação do spinor na forma

$$ A = \ exp \ left [\ frac {i} {2} \ alpha ^ a \ sigma_a \ right], $$

onde $ \ alpha ^ a $ são três números que parametrizam o elemento do grupo cuja representação é $ A $, e $ \ frac {i} {2} \ sigma_a $ são a base da álgebra de Lie, com $ \ sigma_a $ – 3 $ 2 \ times 2 matrizes de $ Pauli. Esta equação especifica basicamente como um spinor é transformado sob uma rotação arbitrária.

Na representação vetorial, há também uma base de álgebra de Lie, que consiste em 3 $ 3 \ vezes 3 $ matrizes.

Resposta

Existem duas outras interpretações das matrizes Pauli que você pode achar úteis, embora só depois de entender A excelente descrição física de JoshPhysics . O seguinte pode ser entendido mais como ” trivia funky ” (em menos eu os acho interessantes) sobre as matrizes de Pauli ao invés de uma interpretação física.

1. Como uma base para $ \ mathfrak {su} (2) $

A primeira interpretação é vista de várias maneiras como (i) eles são quatérnios unitários , módulo uma mudança de sinal e reordenação da definição do matemático de essas feras , (ii) como base para a álgebra de Lie $ \ mathfrak {su} (2) $ de $ SU (2) $ quando usamos a matriz exponencial para recuperar o grupo $ SU (2) = \ exp (\ mathfrak {su} (2)) $ a (iii) uma generalização tridimensional de Teorema de De Moivre .

Uma matriz hermitiana geral, sem rastros, $ 2 \ times2 $ distorcida $ H $ pode ser decomposto exclusivamente como:

$$ H = \ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z \ tag {1} $$

com $ \ alpha_x, \, \ alpha_y, \, \ alpha_z \ in \ mathbb { R} $ . Esta matriz cumpre a equação característica $ H ^ 2 = – \ frac {\ theta ^ 2} {4} \, \ mathrm {id} $ , onde $ \ mathrm {id} $ é a identidade $ 2 \ times2 $ e $ \ frac {\ theta} {2} = \ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2} $ .Portanto, se implantarmos a série de Taylor exponencial de matriz convergente universalmente e, em seguida, reduzirmos todos os poderes de $ H $ acima do termo linear com a equação característica, obtemos:

$$ \ exp \ left (H \ right) = \ cos \ left (\ frac {\ theta} {2} \ right) \ mathrm {id} + \ hat {H} \ sin \ left (\ frac {\ theta} {2} \ right) \ tag {2} $$

que é visto como uma generalização de De Fórmula de Moivre para a ” unidade imaginária pura ” unidade

$$ \ hat {H} = \ frac {\ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z} {\ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2}} \ tag {3 } $$

e todos os membros de $ SU (2) $ podem ser realizados por um exponencial, como em (2) (mas esteja ciente de que o exponencial de uma álgebra de Lie, embora todo o $ SU (2) $ neste caso, nem sempre é todo o grupo de Lie, a menos que o lat ter é (i) conectado e (ii) compacto). Assim, cada membro de $ SU (2) $ pode ser decomposto como uma ” superposição de comprimento de unidade das matrizes de Pauli e matriz de identidade.

A razão para o fator 2 na definição $ \ theta / 2 $ é até agora misteriosa: testemunhe que para os fins de acima, poderíamos facilmente ter substituído $ \ theta / 2 $ por $ \ theta $ . O motivo está relacionado à relação entre as matrizes de Pauli e a esfera Celestial, que discutirei mais adiante. Quatérnions representam rotações por meio de um mapa espinoral ( MAS , como a Joshphysics aconselha, não se distraia muito com esta palavra); se um vetor no espaço 3 é representado por um quatérnio puramente imaginário da forma $ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ , então sua imagem sob uma rotação do ângulo $ \ theta $ em torno de um eixo com cossenos de direção $ \ gamma_x, \, \ gamma_y, \, \ gamma_z $ é dado por:

$$ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z \ mapsto U \, (x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z) \, U ^ \ dagger; \ quad U = \ exp \ left (\ frac {\ theta} {2} (\ gamma_x \, \ sigma_x + \ gamma_y \, \ sigma_y + \ gamma_z \, \ sigma_z) \ right) \ tag {4} $$

Este mapa spinor é um exemplo do grupo $ SU (2) $ agindo em sua própria álgebra de Lie por meio da representação adjunta. Pode ser intuitivamente entendido em termos de uma regra de triângulo para calcular as composições de duas rotações, conforme esboçado em meu diagrama abaixo. Os arcos na esfera unitária representam uma rotação por meio de um ângulo duas vezes maior que o dado pelo ângulo subtendido pelo arco na origem.

Composição da rotação

Eu explico isso em detalhes no Exemplo 1.4 ” $ 2 \ times2 $ Grupo unitário $ SU (2) $ ” em minha página da web ” Alguns exemplos de grupos de mentiras conectados ” aqui .

Há também minha demonstração interativa do Mathematica ” O $ SU (2) $ Mapa Spinor: Composição de rotação por triângulos gráficos de quatérnio ” no site Wolfram Demonstrations .

2. A esfera celestial

Expandindo o espaço linear tridimensional de sobreposições de matrizes de Pauli (que é o mesmo que o espaço linear de sem traços $ 2 \ times2 $ matrizes skew-Hermitian) para o espaço 4 dimensional estendido pelas matrizes de Pauli e as matrizes de identidade, então qualquer transformação do grupo $ SL (2, \ , \ mathbb {C}) $ atua em vetores da forma $ t \, \ mathrm {id} + x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ pelo mesmo mapa spinor que em (4). Se nos restringirmos aos raios projetivos neste espaço, o grupo $ SL (2, \, \ mathbb {C}) $ , isomórfico ao grupo Moebius de As transformações de Möbius atuam neste espaço de raios exatamente da mesma maneira que as transformações de Möbius (lineares fracionárias) atuam na esfera de Riemann. $ SL (2, \, \ mathbb {C}) $ é uma capa dupla do grupo Lorentz, e você pode calcular como a visão de um viajante do espaço muda conforme ele sofrer transformações de Lorentz. Consulte a seção ” Transformações de Lorentz ” na Wikipedia ” Página da transformação de Möbius ” para obter mais detalhes.

Resposta

Uma explicação geral sobre mecânica. Os campos e as ondas seguem equações hiperbólicas (equações de onda). Eles representam o avanço no espaço e no tempo e, como tal, não podem representar a massa que precisa ser estacionária, mas também podem estar girando. Esse movimento precisa de uma equação elíptica. Por exemplo, a equação de Kline-Gordon é hiperbólica, enquanto a equação de Dirac é elíptico. Em um fluido em fluxo, há um exemplo paralelo. Vórtices e turbulência não podem se formar sem a ajuda de um limite para desviar o fluxo de avançar para o estado de circulação. A primeira região é hiperbólica e a segunda é elíptica.

Agora, para criar uma partícula (energia giratória) de um campo (movendo-se na posição), precisamos desviar / girar a direção do campo. É aqui que as matrizes de Pauli vêm em busca de ajuda e fornecem a elipticidade necessária. É por isso que números / rotação imaginários são usados. Multiplicar uma quantidade por i gira em 90 graus, para um ângulo geral usamos o exponencial de uma quantidade imaginária.

Mais tarde, quando misturamos as Lagrangianas de ondas e partículas em um modelo mais geral, nós revertemos para usar o Higgs para fazer o mesmo trabalho de transformação de um tipo de energia para outro – isto é, de campos para partículas e vice-versa.

Deixe uma resposta

O seu endereço de email não será publicado. Campos obrigatórios marcados com *