Todas las presentaciones que he encontrado de matrices de Pauli hasta ahora simplemente las expresan y luego comience a usarlos. Las descripciones adjuntas de su significado parecen frustrantemente incompletas; yo, al menos, no puedo entender las matrices de Pauli después de leerlas.
Mi comprensión y confusión actuales se demuestran a continuación. Estaría muy agradecido si alguien pudiera rellenar todos los agujeros, o hacer nuevos donde sea apropiado.
Los espinos se ven como vectores de columna, es decir, $$ s = \ left (\ begin {matrix} 1 \\ 0 \\ 1 \ end {matrix} \ right) $$ y se usan para que la rotación en tres dimensiones (usando números complejos) se pueda transformar linealmente. ¿Qué significa el espínor del ejemplo anterior? Un valor de espín de 1 en las direcciones xyz? Entonces, ¿cómo se puede representar spin – $ \ frac {1} {2} $ con solo 1s?
Se usa un vector tridimensional para construir el Pauli matriz para cada dimensión. Por ejemplo, para spin – $ \ frac {1} {2} $, los vectores usados para x, y y z son $ v_x = (1,0,0) $, $ v_y = (0,1 , 0) $ y $ v_z = (0,0,1) $. Transforma cada uno de ellos en la matriz de Pauli relevante mediante la siguiente ecuación, usando la dimensión x para la demostración, $$ P ^ x = \ left (\ begin {matrix } v_3 ^ x & v_1 ^ x – i v_2 ^ x \\ v_1 ^ x + i v_2 ^ x & -v_3 ^ x \ end {matriz} \ right) $$ donde el superíndice denota dimensión, no potencia.
Una vez que haya En estas matrices, operas sobre los espinores con ellas. ¿Qué hace esto?
También puede encontrar los autovalores y autovectores para la matriz, que se pueden usar para encontrar la probabilidad de que una partícula, si se mide, tenga un cierto espín en una dimensión, cuando se mida a continuación, tendrá giro en otra dimensión que elija. No entiendo cómo funciona esto. ¿Qué representan físicamente el valor propio y el vector propio en este sentido, y cómo encaja el giro hacia arriba y hacia abajo en esto? en la dirección x, ¿qué harías para encontrar la probabilidad de que tenga un giro hacia arriba o hacia abajo en la dimensión zo y la próxima vez que se mida?
Los ejemplos concretos probablemente ayudarían mucho a mi comprensión .
Comentarios
- Todo se explica aquí
- ¿Es este el entendimiento correcto? Pauli [x] = Girar el giro en el eje x en la base z (una matriz de rotación – intercambiar valores) Pauli [y] = Girar el giro en el eje y en la base z Pauli [ z] = Voltea el giro en el eje z en la base z (Voltear matriz- Spin + es positivo, Spin – es negativo)
Respuesta
Permíteme primero recordarte (o quizás presentarte) un par de aspectos de la mecánica cuántica en general como modelo f o sistemas físicos. Me parece que muchas de sus preguntas pueden responderse con una mejor comprensión de estos aspectos generales seguidos de una apelación a cómo los sistemas de espín emergen como un caso especial.
Observaciones generales sobre estados cuánticos y medidas.
El estado de un sistema cuántico se modela como un elemento de longitud unitaria $ | \ psi \ rangle $ de un espacio de Hilbert complejo $ \ mathcal H $, un tipo especial de espacio vectorial con un producto interno. Cada cantidad observable (como la cantidad de movimiento o el giro) asociada con un sistema de este tipo cuyo valor uno podría querer medir está representada por un operador autoadjunto $ O $ en ese espacio. Si uno construye un dispositivo para medir un observable de este tipo, y si usa ese dispositivo para realizar una medición de ese observable en el sistema, entonces la máquina generará un valor propio $ \ lambda $ de ese observable. Además, si el sistema está en un estado $ | \ psi \ rangle $, entonces la probabilidad de que el resultado de medir esa cantidad sea el valor propio del observable es \ begin {align} p (\ lambda) = | \ langle \ lambda | \ psi \ rangle | ^ 2 \ end {align} donde $ | \ lambda \ rangle $ es el vector propio normalizado correspondiente al valor propio $ \ lambda $.
Especialización en sistemas de espín.
Supongamos, ahora, que el sistema que estamos considerando consiste en el espín de una partícula. El espacio de Hilbert que modela el estado de giro de un sistema con giro $ s $ es un espacio de Hilbert dimensional de $ 2s + 1 $. Los elementos de este espacio vectorial a menudo se denominan «espinores», pero no dejes que esto te distraiga, son como cualquier otro vector en un espacio de Hilbert cuyo trabajo es modelar el estado cuántico del sistema.
Los observables primarios cuya medida se suele discutir para los sistemas de espín son los componentes cartesianos del espín del sistema. En otras palabras, hay tres operadores autoadjuntos llamados convencionalmente $ S_x, S_y, S_z $ cuyos valores propios son los valores posibles uno podría obtener si se mide uno de estos componentes del giro del sistema. El espectro (conjunto de valores propios) de cada uno de estos operadores es el mismo.Para un sistema de espín $ s $, cada uno de sus espectros consta de los siguientes valores: \ begin {align} \ sigma (S_i) = \ {m_i \ hbar \, | \, m_i = -s, -s + 1, \ dots, s-1, s \} \ end {align} donde en mi notación $ i = x, y, z $. Entonces, por ejemplo, si construye una máquina para medir el componente $ z $ del giro de un sistema spin- $ 1 $, entonces la máquina producirá uno de los valores en el conjunto $ \ {- \ hbar, 0, \ hbar \} $ cada vez. En correspondencia con cada uno de estos valores propios, cada operador de componente de espín tiene un vector propio normalizado $ | S_i, m_i \ rangle $. Como se indica en las observaciones generales anteriores, si el estado del sistema es $ | \ psi \ rangle $, y se quiere saber la probabilidad de que la medición del componente de giro $ S_i $ dé un valor determinado $ m_i \ hbar $ , entonces uno simplemente calcula \ begin {align} | \ langle S_i, m_i | \ psi \ rangle | ^ 2. \ end {align} Por ejemplo, si el sistema tiene spin- $ 1 $, y si uno quiere saber la probabilidad de que una medición de $ S_y $ dé el valor propio $ – \ hbar $, entonces se calcula \ begin {align} | \ langle S_y, -1 | \ psi \ rangle | ^ 2 \ end {align}
Spinors.
En el contexto anterior, los espinores son simplemente las representaciones matriciales de los estados de un sistema de espín particular en una determinada base ordenada, y las matrices de espín de Pauli son, hasta una normalización, las representaciones matriciales de los operadores de componentes de giro en esa base específicamente para un sistema con giro- $ 1/2 $. Las representaciones matriciales a menudo facilitan el cálculo y la comprensión conceptual, razón por la cual las usamos.
Más explícitamente, suponga que se considera un sistema spin- $ 1/2 $ y se elige representar estados y observables en la base $ B = (| S_z, -1/2 \ rangle, | S_z, 1/2 \ rangle) $ consistente en los autovectores normalizados del componente $ z $ del espín, entonces se encontrarían las siguientes representaciones matriciales en esa base \ begin {align} [S_x] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & 1 \\ 1 & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_x \\ [S_y] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & -i \\ i & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_y \\ [S_z] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 1 & 0 \\ 0 & -1 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_z \\ \ end {align} Darse cuenta de estas representaciones son precisamente las matrices de Pauli hasta el factor $ \ hbar / 2 $ extra. Además, cada estado del sistema estaría representado por una matriz de $ 2 \ times 1 $, o «espinor» \ begin {align} [| \ psi \ rangle] _B = \ begin {pmatrix} a \\ b \ end {pmatrix }. \ end {align} Y se podrían usar estas representaciones para realizar los cálculos mencionados anteriormente.
Comentarios
- Muchas gracias; esto me ayudó mucho a comprender. ¿Es solo una convención que los estados propios que devuelven valores propios negativos son spin ‘ abajo ‘ y spin positivo ‘ arriba ‘? Para comprobar mi comprensión, ‘ he intentado calcular el ejemplo que utilicé anteriormente: ¿es cierto que una partícula de espín-1 medida para estar en la dimensión x (valor propio hbar) estar en el estado normalizado < 1/2, sqrt (2) / 2, 1/2 > y la probabilidad de una dimensión z la medición que regresa hacia arriba será 1/4, regresando el giro cero será 1/2 y hacia abajo 1/4?
- +1 Me gustan especialmente sus » máquinas » en el primer párrafo – muy feynmaniano en sabor. Luché durante muchos años para » entender » QM: las matemáticas y la teoría de la mentira me resultaban del agrado pero me tomó mucho tiempo comprender que los » operadores » no solo son operadores, sino que también vienen con una receta especial sobre cómo interpretarlos como modelos de » máquinas de medición «. Lamentablemente, no puedo ‘ recordar si fueron las conferencias de Feynman o Sakurai las que transmitieron el mensaje, o si de hecho fue una mezcla de los dos en mis pensamientos en la ducha o mientras caminar, pero esto es lo que recomiendo a la gente ahora.
Respuesta
Los grupos son estructuras matemáticas abstractas, definidas por su topología (en caso de grupos continuos (Lie)) y la operación de multiplicación.
Pero es casi imposible hablar de grupos abstractos. Es por eso que generalmente los elementos de los grupos se mapean en operadores lineales que actúan en algún espacio vectorial $ V $:
$$ g \ in G \ rightarrow \ rho (g) \ in \ text {End} (V ), $$
donde G es el grupo, $ \ text {End} (V) $ representa endomorfismos (operadores lineales) en $ V $, y $ \ rho (g) $ es el mapeo .Para que este mapeo sea significativo, tenemos que mapear la multiplicación de grupos correctamente:
$$ \ rho (g_1 \ circ g_2) = \ rho (g1) \ cdot \ rho (g2). $$
La inversa también se asigna a
$$ \ rho (g ^ {- 1}) = \ rho (g) ^ {- 1} $$
y la identidad del grupo es simplemente
$$ \ rho (e) = \ text {Id} _V. $$
Esto se llama la representación del grupo $ G $. $ V $ se transforma bajo la representación $ \ rho $ del grupo $ G $.
En su caso, el grupo de interés es el grupo de rotaciones en 3 dimensiones que generalmente se denota como SO (3). Nuestro objetivo es encontrar diferentes objetos que se puedan rotar, es decir, representaciones (y espacios de representación) de SO (3).
Una de esas representaciones es la representación definitoria (que se utiliza para definir SO (3)) , o la representación vectorial. En este caso, $ V $ es solo $ R ^ 3 $ y las matrices de $ \ rho (\ text {SO (3)}) $ son matrices ortogonales $ 3 \ times 3 $ con unidad determinante:
$ $ A ^ {T} A = 1; \ quad \ det A = 1 $$
Entonces, los vectores se pueden rotar en 3 dimensiones. El resultado de dicha rotación por $ g \ in \ text {SO (3)} $ se determina actuando sobre el vector inicial con el operador $ \ rho (g) $.
Otra representación es el espinor representación. El espacio vectorial ahora es bidimensional y complejo . La imagen de esta representación consta de $ 2 \ times 2 $ unitarios con unidad determinante:
$$ A ^ {\ dagger} A = 1; \ quad \ det A = 1. $$
Esta representación no es tan obvia como la anterior, ya que los espinores son algo que no solemos ver en la vida cotidiana. Pero se puede demostrar matemáticamente que estas representaciones son isomorfas y por lo tanto son dos representaciones diferentes del mismo grupo. (en realidad, son homomórficas y la representación de espinor es la doble cobertura de la representación vectorial).
Ahora a las matrices de Pauli. Hay un principio general: para cada grupo de Lie $ G $ existe una línea lineal correspondiente espacio (álgebra de Lie) con un corchete de Lie (una operación anti-conmutativa que satisface la identidad de Jacobi) que se mapea de forma única en algún vecindario de la unidad de grupo de $ G $. Este mapeo se llama exponencial.
Entonces puede escribir un arbitrario (lo suficientemente cercano a la unidad para evitar problemas topológicos globales) $ 2 \ times 2 $ matriz compleja fr om la representación del espinor en forma
$$ A = \ exp \ left [\ frac {i} {2} \ alpha ^ a \ sigma_a \ right], $$
donde $ \ alpha ^ a $ son tres números que parametrizan el elemento de grupo cuya representación es $ A $, y $ \ frac {i} {2} \ sigma_a $ son la base del álgebra de Lie, con $ \ sigma_a $ – 3 $ 2 \ times 2 matrices de $ Pauli. Esta ecuación prácticamente especifica cómo se transforma un espinor bajo una rotación arbitraria.
En la representación vectorial también hay una base de álgebra de Lie, que consta de matrices de 3 $ 3 \ veces 3 $.
Respuesta
Hay otras dos interpretaciones de las matrices de Pauli que pueden resultarle útiles, aunque solo después de comprender Excelente descripción física de JoshPhysics . Lo siguiente se puede tomar más como » trivia divertida » (en al menos los encuentro interesantes) sobre las matrices de Pauli en lugar de una interpretación física.
1. Como base para $ \ mathfrak {su} (2) $
La primera interpretación se ve de diversas maneras como (i) son unidades cuaterniones, módulo un cambio de signo y reordenación de la definición de matemática de estas bestias , (ii) como base para el álgebra de Lie $ \ mathfrak {su} (2) $ de $ SU (2) $ cuando usamos la matriz exponencial para recuperar el grupo $ SU (2) = \ exp (\ mathfrak {su} (2)) $ hasta (iii) una generalización tridimensional de Teorema de De Moivre .
Una matriz hermitiana sesgada $ 2 \ times2 $ general, sin trazas, $ H $ se puede descomponer de forma única como:
$$ H = \ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z \ tag {1} $$
con $ \ alpha_x, \, \ alpha_y, \, \ alpha_z \ in \ mathbb { R} $ . Esta matriz cumple la ecuación característica $ H ^ 2 = – \ frac {\ theta ^ 2} {4} \, \ mathrm {id} $ , donde $ \ mathrm {id} $ es la identidad $ 2 \ times2 $ y $ \ frac {\ theta} {2} = \ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2} $ .Entonces, si implementamos la serie de Taylor exponencial de matriz convergente universal, y luego reducimos todas las potencias de $ H $ más altas que el término lineal con la ecuación característica, obtenemos:
$$ \ exp \ left (H \ right) = \ cos \ left (\ frac {\ theta} {2} \ right) \ mathrm {id} + \ hat {H} \ sin \ left (\ frac {\ theta} {2} \ right) \ tag {2} $$
que se considera una generalización de De Fórmula de Moivre para la » pura » unidad
$$ \ hat {H} = \ frac {\ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z} {\ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2}} \ tag {3 } $$
y todos los miembros de $ SU (2) $ se pueden realizar mediante un exponencial como en (2) (pero tenga en cuenta que el exponencial de un álgebra de Lie, aunque la totalidad de $ SU (2) $ en este caso, no siempre es todo el grupo de Lie a menos que el lat ter está (i) conectado y (ii) compacto). Por tanto, cada miembro de $ SU (2) $ puede descomponerse como una » superposición de longitud unitaria de las matrices de Pauli y matriz de identidad.
La razón del factor 2 en la definición $ \ theta / 2 $ es hasta ahora misteriosa: atestigua que para los propósitos de lo anterior, podríamos haber reemplazado fácilmente $ \ theta / 2 $ por $ \ theta $ . La razón está relacionada con la relación entre las matrices de Pauli y la esfera celeste, de la que hablaré más adelante. Los cuaterniones representan rotaciones a través de un mapa de espinor ( PERO , como aconseja Joshphysics, no se distraiga demasiado con esta palabra); si un vector en 3 espacios está representado por un cuaternión puramente imaginario de la forma $ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ , luego su imagen bajo una rotación de ángulo $ \ theta $ alrededor de un eje con cosenos de dirección $ \ gamma_x, \, \ gamma_y, \, \ gamma_z $ viene dado por:
$$ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z \ mapsto U \, (x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z) \, U ^ \ dagger; \ quad U = \ exp \ left (\ frac {\ theta} {2} (\ gamma_x \, \ sigma_x + \ gamma_y \, \ sigma_y + \ gamma_z \, \ sigma_z) \ right) \ tag {4} $$
Este mapa de espinor es un ejemplo del grupo $ SU (2) $ actuando en su propio álgebra de Lie a través de la representación adjunta. Puede entenderse intuitivamente en términos de una regla de triángulo para calcular las composiciones de dos rotaciones, como se muestra en mi diagrama a continuación. Los arcos de la esfera unitaria representan una rotación a través de un ángulo dos veces mayor que el dado por el ángulo subtendido por el arco en el origen.
Explico esto en detalle en Ejemplo 1.4 » $ 2 \ times2 $ Grupo unitario $ SU (2) $ » en mi página web » Algunos ejemplos de grupos de mentiras conectados » aquí .
También está mi demostración interactiva de Mathematica » El mapa de spinor $ SU (2) $ : composición de rotación por triángulos cuaternión gráficos » en el sitio de demostraciones de Wolfram .
2. La esfera celeste
Al expandir el espacio lineal tridimensional de superposiciones de matrices de Pauli (que es el mismo que el espacio lineal de traceless $ 2 \ times2 $ matrices sesgadas-hermitianas) al espacio de 4 dimensiones abarcado por las matrices de Pauli y las matrices de identidad, luego cualquier transformación del grupo $ SL (2, \ , \ mathbb {C}) $ actúa sobre vectores de la forma $ t \, \ mathrm {id} + x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ por el mismo mapa de espinor que en (4). Si nos limitamos a los rayos proyectivos en este espacio, el grupo $ SL (2, \, \ mathbb {C}) $ , isomorfo al grupo de Moebius de Las transformaciones de Möbius actúan sobre este espacio de rayos exactamente de la misma manera que las transformaciones de Möbius (lineales fraccionales) actúan sobre la esfera de Riemann. $ SL (2, \, \ mathbb {C}) $ es una portada doble del grupo de Lorentz, y puedes calcular cómo cambia la vista de un viajero espacial a medida que sufrir transformaciones de Lorentz. Consulte la sección » Transformaciones de Lorentz » en la Wikipedia » Transformación de Möbius » página para obtener más detalles.
Respuesta
Una explicación mecánica general. Los campos y las ondas siguen ecuaciones hiperbólicas (ecuaciones de onda). Estos representan un avance en el espacio y el tiempo, y como tal no pueden representar la masa que necesita estar estacionaria, pero también podría estar girando. Tal movimiento necesita una ecuación elíptica. Como ejemplo, la ecuación de Kline-Gordon es hiperbólica, mientras que la ecuación de Dirac elíptica. En los fluidos que fluyen hay un ejemplo paralelo. Los vórtices y las turbulencias no pueden formarse sin la ayuda de un límite para desviar el flujo de avanzar al estado circulante. La primera región es hiperbólica y la segunda es elíptica.
Ahora, para crear una partícula (energía giratoria) a partir de un campo (moviéndose en posición) necesitamos desviar / rotar la dirección del campo. Aquí es donde las matrices de Pauli vienen en busca de ayuda y dan la elipticidad requerida. Por eso se utilizan números / rotación imaginarios. Al multiplicar una cantidad por i la rota 90 grados, para un ángulo general usamos el exponencial de una cantidad imaginaria.
Más tarde, cuando mezclamos los lagrangianos de ondas y partículas en un modelo más general, revertimos al uso del Higgs para hacer el mismo trabajo de transformación de un tipo de energía a otro, es decir, de campos a partículas y viceversa.