Wat betekenen de Pauli-matrices?

Alle inleidingen die ik “heb gevonden in Pauli-matrices tot nu toe, noem ze gewoon en Begeleidende beschrijvingen van hun betekenis lijken frustrerend onvolledig; ik kan Pauli-matrices in ieder geval helemaal niet begrijpen nadat ik ze heb gelezen.

Mijn huidige begrip en verwarring wordt hieronder aangetoond. Ik zou heel dankbaar zijn als iemand alle gaten zou kunnen invullen, of waar nodig nieuwe zou kunnen porren.

Spinors zien eruit als kolomvectoren, dwz $$ s = \ left (\ begin {matrix} 1 \\ 0 \\ 1 \ end {matrix} \ right) $$ en worden gebruikt zodat rotatie in drie dimensies (met behulp van complexe getallen) lineair kan worden getransformeerd. Wat betekent de bovenstaande voorbeeldspinor? Een spinwaarde van 1 in de x- en z-richting? Hoe kan spin – $ \ frac {1} {2} $ dan worden weergegeven met slechts 1s?

Een driedimensionale vector wordt gebruikt om de Pauli te construeren matrix voor elke dimensie. Bijv. voor spin – $ \ frac {1} {2} $ zijn de vectoren die voor x, y en z worden gebruikt $ v_x = (1,0,0) $, $ v_y = (0,1 , 0) $ en $ v_z = (0,0,1) $. Je transformeert ze elk naar de relevante Pauli-matrix met de volgende vergelijking, waarbij je dimensie x gebruikt voor demonstratie, $$ P ^ x = \ left (\ begin {matrix } v_3 ^ x & v_1 ^ x – i v_2 ^ x \\ v_1 ^ x + i v_2 ^ x & -v_3 ^ x \ end {matrix} \ right) $$ waar superscript dimensie aangeeft, niet macht.

Als je eenmaal hebt Met deze matrices opereer je met hen op de spinoren. Wat doet dit?

Je kunt ook de eigenwaarden en eigenvectoren voor de matrix vinden, die kunnen worden gebruikt om de kans te vinden dat een deeltje, indien gemeten, een bepaalde spin heeft in de ene dimensie, als de volgende wordt gemeten, zal de spin draaien in een andere dimensie die u kiest. Ik begrijp niet hoe dit werkt. Wat vertegenwoordigen de eigenwaarde en eigenvector in deze zin fysiek, en hoe passen spin-up en down hierin? Bijv. als je een spin-1-deeltje had waarvan je wist dat het spin-up was in de x-richting, wat zou u doen om de waarschijnlijkheid te vinden dat het omhoog of omlaag draait in de z- of y-dimensie bij de volgende meting?

Concrete voorbeelden zouden me waarschijnlijk veel helpen begrijpen .

Reacties

  • Het wordt hier allemaal uitgelegd
  • Is dit het juiste begrip? Pauli [x] = Draai de draai om de x-as in de z-basis (een rotatiematrix – wissel waarden om) Pauli [y] = Draai de draai om de y-as in de z-basis Pauli [ z] = Draai de spin om de z-as in de z-basis (Flip matrix – Spin + is positief, Spin – is negatief)

Antwoord

Laat me je eerst herinneren aan (of je misschien voorstellen aan) een aantal aspecten van de kwantummechanica in het algemeen als een model f of fysieke systemen. Het lijkt mij dat veel van uw vragen kunnen worden beantwoord met een beter begrip van deze algemene aspecten, gevolgd door een beroep op hoe spinsystemen naar voren komen als een speciaal geval.

Algemene opmerkingen over kwantumtoestanden en metingen.

De toestand van een kwantumsysteem wordt gemodelleerd als een eenheidslengte-element $ | \ psi \ rangle $ van een complexe Hilbertruimte $ \ mathcal H $, een speciaal soort vectorruimte met een inproduct. Elke waarneembare grootheid (zoals momentum of spin) geassocieerd met een dergelijk systeem waarvan men de waarde zou willen meten, wordt vertegenwoordigd door een zelf-adjunct-operator $ O $ op die ruimte. Als je een apparaat bouwt om zon waarneembaar te meten, en als je dat apparaat gebruikt om een meting van dat waarneembaar te maken op het systeem, dan zal de machine een eigenwaarde $ \ lambda $ van dat waarneembare uitvoeren. Bovendien, als het systeem zich in de toestand $ | \ psi \ rangle $ bevindt, dan is de kans dat het resultaat van het meten van die hoeveelheid de eigenwaarde van het waarneembare is \ begin {align} p (\ lambda) = | \ langle \ lambda | \ psi \ rangle | ^ 2 \ end {align} waarbij $ | \ lambda \ rangle $ de genormaliseerde eigenvector is die overeenkomt met de eigenwaarde $ \ lambda $.

Specialisatie om systemen te spinnen.

Stel nu dat het systeem dat we overwegen bestaat uit de spin van een deeltje. De Hilbertruimte die de spintoestand modelleert van een systeem met spin $ s $ is een $ 2s + 1 $ dimensionale Hilbertruimte. Elementen van deze vectorruimte worden vaak “spinoren” genoemd, maar laat je hierdoor niet afleiden, ze zijn net als elke andere vector in een Hilbertruimte wiens taak het is om de kwantumtoestand van het systeem te modelleren.

De belangrijkste waarneembare waarnemingen waarvan men gewoonlijk bespreekt voor spinsystemen, zijn de cartesische componenten van de spin van het systeem. Met andere woorden, er zijn drie zelfaanpassende operatoren die conventioneel $ S_x, S_y, S_z $ worden genoemd, waarvan de eigenwaarden de mogelijke waarden zijn men zou kunnen krijgen als men een van deze componenten van de spin van het systeem meet. Het spectrum (set eigenwaarden) van elk van deze operators is hetzelfde.Voor een systeem van spin $ s $, bestaat elk van hun spectra uit de volgende waarden: \ begin {align} \ sigma (S_i) = \ {m_i \ hbar \, | \, m_i = -s, -s + 1, \ dots, s-1, s \} \ end {align} waarbij in mijn notatie $ i = x, y, z $. Dus als u bijvoorbeeld een machine bouwt om de $ z $ component van de spin van een spin- $ 1 $ systeem te meten, dan zal de machine een van de waarden opleveren in de set $ \ {- \ hbar, 0, \ hbar \} $ elke keer. Overeenkomend met elk van deze eigenwaarden, heeft elke spincomponentoperator een genormaliseerde eigenvector $ | S_i, m_i \ rangle $. Zoals aangegeven door de algemene opmerkingen hierboven, als de toestand van het systeem $ | \ psi \ rangle $ is, en men wil de waarschijnlijkheid weten dat de meting van de spincomponent $ S_i $ een bepaalde waarde $ m_i \ hbar $ zal opleveren , dan berekent men eenvoudig \ begin {align} | \ langle S_i, m_i | \ psi \ rangle | ^ 2. \ end {align} Als het systeem bijvoorbeeld spin- $ 1 $ heeft, en als men de kans wil weten dat een meting van $ S_y $ de eigenwaarde $ – \ hbar $ oplevert, dan berekent men \ begin {align} | \ langle S_y, -1 | \ psi \ rangle | ^ 2 \ end {align}

Spinors.

In de bovenstaande context zijn spinoren eenvoudig de matrixrepresentaties van toestanden van een bepaald spinsysteem op een bepaalde geordende basis, en de Pauli-spinmatrices zijn, tot een normalisatie, de matrixrepresentaties van de spin component operators in die basis specifiek voor een systeem met spin- $ 1/2 $. Matrixrepresentaties vergemakkelijken vaak berekeningen en conceptueel begrip en daarom gebruiken we ze.

Meer expliciet, stel dat men een spin- $ 1/2 $ -systeem beschouwt, en men kiest ervoor om toestanden en observabelen weer te geven in de basis $ B = (| S_z, -1/2 \ rangle, | S_z, 1/2 \ rangle) $ bestaande uit de genormaliseerde eigenvectoren van de $ z $ component van spin, dan zou men de volgende matrixrepresentaties in die basis \ begin vinden {align} [S_x] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & 1 \\ 1 & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_x \\ [S_y] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 0 & -i \\ i & 0 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_y \\ [S_z] _B & = \ frac {\ hbar} {2} \ begin {pmatrix} 1 & 0 \\ 0 & -1 \ end {pmatrix} = \ frac {\ hbar} {2} \ sigma_z \\ \ end {align} Let erop dat deze representaties zijn precies de Pauli-matrices tot aan de extra $ \ hbar / 2 $ -factor. Bovendien zou elke toestand van het systeem worden vertegenwoordigd door een $ 2 \ times 1 $ matrix, of “spinor” \ begin {align} [| \ psi \ rangle] _B = \ begin {pmatrix} a \\ b \ end {pmatrix }. \ end {align} En men zou deze representaties kunnen gebruiken om de hierboven genoemde berekeningen uit te voeren.

Opmerkingen

  • Heel erg bedankt; dit hielp me enorm te begrijpen. Is het gewoon conventie dat de eigentoestanden die negatieve eigenwaarden retourneren spin ‘ omlaag ‘ en positieve spin ‘ omhoog ‘? Om mijn begrip te controleren, heb ik ‘ geprobeerd het voorbeeld te berekenen dat ik hierboven gebruikte: is het waar dat een spin-1-deeltje waarvan wordt gemeten dat het hoger is in de x-dimensie (eigenwaarde hbar) zal zich in de genormaliseerde toestand bevinden < 1/2, sqrt (2) / 2, 1/2 >, en de kans op een az-dimensie meting die naar boven terugkeert zal dan 1/4 zijn, en spin nul teruggeven is 1/2 en omlaag 1/4?
  • +1 Ik vind vooral je ” machines ” in de eerste alinea – erg Feynmaniaans van smaak. Ik heb jarenlang geworsteld om ” te begrijpen ” QM: de wiskunde- en leugentheorie waren gewoon bij mij, maar het duurde lang voor mij om te begrijpen dat ” operators ” niet alleen operators maar ook een speciaal recept bevatte voor hoe ze te interpreteren als modellen van ” meetmachines “. Helaas kan ik ‘ me niet herinneren of het de Feynman-lezingen of Sakurai waren die de boodschap doorbrachten, of dat het inderdaad een mengeling van de twee was in mijn gedachten onder de douche of terwijl lopen, maar dit is wat ik mensen nu aanbeveel.

Antwoord

Groepen zijn abstracte wiskundige structuren, gedefinieerd door hun topologie (in het geval van continue (Lie) groepen) en de vermenigvuldigingsoperatie.

Maar het is bijna onmogelijk om over abstracte groepen te praten. Dat is de reden waarom elementen van groepen meestal worden toegewezen aan lineaire operatoren die werken op een vectorruimte $ V $:

$$ g \ in G \ rightarrow \ rho (g) \ in \ text {End} (V ), $$

waar G de groep is, $ \ text {End} (V) $ staat voor endomorfismen (lineaire operatoren) op $ V $, en $ \ rho (g) $ de afbeelding is .Om deze mapping zinvol te laten zijn, moeten we de groepsvermenigvuldiging correct in kaart brengen:

$$ \ rho (g_1 \ circ g_2) = \ rho (g1) \ cdot \ rho (g2). $$

De inverse wordt ook toegewezen aan

$$ \ rho (g ^ {- 1}) = \ rho (g) ^ {- 1} $$

en de groepsidentiteit is gewoon

$$ \ rho (e) = \ text {Id} _V. $$

Dit wordt de representatie van de groep $ G $ genoemd. $ V $ transformeert onder de representatie $ \ rho $ van groep $ G $.

In jouw geval is de groep van interesse de groep rotaties in 3 dimensies die gewoonlijk wordt aangeduid als SO (3). Ons doel is om verschillende objecten te vinden die kunnen worden geroteerd, dwz representaties (en representatieruimten) van SO (3).

Een van die representaties is de bepalende representatie (die wordt gebruikt om SO (3) te definiëren) , of de vectorweergave. In dit geval is $ V $ slechts $ R ^ 3 $ en zijn matrices van $ \ rho (\ text {SO (3)}) $ orthogonaal $ 3 \ maal 3 $ matrices met eenheidsdeterminant:

$ $ A ^ {T} A = 1; \ quad \ det A = 1 $$

Vectoren kunnen dus in 3 dimensies worden geroteerd. Het resultaat van zon rotatie met $ g \ in \ text {SO (3)} $ wordt bepaald door op de initiële vector te reageren met de operator $ \ rho (g) $.

Een andere representatie is de spinor vertegenwoordiging. De vectorruimte is nu tweedimensionaal en complex . De afbeelding van deze voorstelling bestaat uit unitair $ 2 \ maal 2 $ met eenheidsdeterminant:

$$ A ^ {\ dagger} A = 1; \ quad \ det A = 1. $$

Deze weergave is niet zo voor de hand liggend als de vorige, aangezien spinoren iets zijn dat we meestal niet zien in het dagelijks leven. Maar het kan wiskundig worden bewezen dat deze voorstellingen isomorf zijn en daarom twee verschillende voorstellingen zijn van dezelfde groep. (eigenlijk zijn ze homomorf en is de spinor-representatie de dubbele dekking van de vectorrepresentatie).

Nu naar de Pauli-matrices. Er is een algemeen principe: voor elke Lie-groep $ G $ bestaat er een overeenkomstige lineaire space (Lie-algebra) met een Lie-haakje (een anti-commutatieve operatie die voldoet aan de Jacobi-identiteit) die uniek is toegewezen aan een omgeving van de groepseenheid van $ G $. Deze mapping wordt de exponentiële genoemd.

Dus je kunt een willekeurige (dicht genoeg bij de eenheid schrijven om globale topologische problemen te vermijden) $ 2 \ maal 2 $ complexe matrix fr om de spinor-weergave in vorm

$$ A = \ exp \ left [\ frac {i} {2} \ alpha ^ a \ sigma_a \ right], $$

waar $ \ alpha ^ a $ zijn drie getallen die het groepselement parametriseren waarvan de representatie $ A $ is, en $ \ frac {i} {2} \ sigma_a $ zijn de Lie-algebra-basis, met $ \ sigma_a $ – 3 $ 2 \ keer 2 $ Pauli-matrices. Deze vergelijking specificeert vrijwel hoe een spinor wordt getransformeerd onder een willekeurige rotatie.

In de vectorweergave is er ook een Lie-algebra-basis, die bestaat uit 3 $ 3 \ maal 3 $ matrices.

Answer

Er zijn twee andere interpretaties van de Pauli-matrices die u wellicht nuttig vindt, hoewel alleen nadat u De uitstekende fysieke beschrijving van JoshPhysics . Het volgende kan meer worden opgevat als ” funky trivia ” (op ik vind ze tenminste interessant) over de Pauli-matrices in plaats van een fysieke interpretatie.

1. Als basis voor $ \ mathfrak {su} (2) $

De eerste interpretatie wordt op verschillende manieren gezien als (i) ze zijn eenheid quaternions, modulo een tekenwijziging en herschikking van de definitie van de wiskundige van deze beesten , (ii) als basis voor de Lie-algebra $ \ mathfrak {su} (2) $ van $ SU (2) $ wanneer we de exponentiële matrix gebruiken om de groep $ SU (2) = \ exp (\ mathfrak {su} (2)) $ t / m (iii) een driedimensionale generalisatie van De stelling van De Moivre .

Een algemene, spoorloze $ 2 \ times2 $ scheef hermitische matrix $ H $ kan op unieke wijze worden ontleed als:

$$ H = \ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z \ tag {1} $$

met $ \ alpha_x, \, \ alpha_y, \, \ alpha_z \ in \ mathbb { R} $ . Deze matrix voldoet aan de karakteristieke vergelijking $ H ^ 2 = – \ frac {\ theta ^ 2} {4} \, \ mathrm {id} $ , waarbij $ \ mathrm {id} $ is de $ 2 \ times2 $ identiteit en $ \ frac {\ theta} {2} = \ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2} $ .Dus als we de universeel convergente matrix exponentiële Taylor-reeks inzetten en vervolgens alle machten van $ H $ hoger dan de lineaire term met de karakteristieke vergelijking reduceren, krijgen we:

$$ \ exp \ left (H \ right) = \ cos \ left (\ frac {\ theta} {2} \ right) \ mathrm {id} + \ hat {H} \ sin \ left (\ frac {\ theta} {2} \ right) \ tag {2} $$

wat wordt gezien als een generalisatie van De Moivre “s formule voor de ” puur denkbeeldige ” eenheid

$$ \ hat {H} = \ frac {\ alpha_x \ sigma_x + \ alpha_y \ sigma_y + \ alpha_z \ sigma_z} {\ sqrt {\ alpha_x ^ 2 + \ alpha_y ^ 2 + \ alpha_z ^ 2}} \ tag {3 } $$

en alle leden van $ SU (2) $ kunnen worden gerealiseerd door een exponentieel zoals in (2) (maar houd er rekening mee dat de exponentiële waarde van een Lie-algebra, hoewel de hele $ SU (2) $ in dit geval niet altijd de hele Lie-groep is, tenzij de lat ter is (i) verbonden en (ii) compact). Dus elk lid van $ SU (2) $ kan worden ontleed als een ” superpositie van eenheidslengte van de Pauli-matrices en de identiteitsmatrix.

De reden voor de factor 2 in de definitie $ \ theta / 2 $ is tot dusver mysterieus: getuig dat voor de doeleinden van het bovenstaande hadden we net zo goed $ \ theta / 2 $ kunnen vervangen door $ \ theta $ . De reden is gerelateerd aan de relatie tussen de Pauli-matrices en de hemelbol, die ik later bespreek. Quaternionen vertegenwoordigen rotaties door een spinor-kaart ( MAAR , zoals Joshphysics adviseert, laat je niet te veel afleiden door dit woord); als een vector in 3-spatie wordt weergegeven door een puur denkbeeldig quaternion in de vorm $ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ , vervolgens de afbeelding onder een hoekverdraaiing $ \ theta $ om een as met cosinusrichting $ \ gamma_x, \, \ gamma_y, \, \ gamma_z $ wordt gegeven door:

$$ x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z \ kaarten naar U \, (x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z) \, U ^ \ dagger; \ quad U = \ exp \ left (\ frac {\ theta} {2} (\ gamma_x \, \ sigma_x + \ gamma_y \, \ sigma_y + \ gamma_z \, \ sigma_z) \ right) \ tag {4} $$

Deze spinor-kaart is een voorbeeld van de groep $ SU (2) $ werkt op zijn eigen Lie-algebra via de adjunct-weergave. Het kan intuïtief worden begrepen in termen van een driehoeksregel om de composities van twee rotaties uit te werken, zoals geschetst in mijn onderstaande diagram. De bogen op de eenheidssfeer vertegenwoordigen een rotatie over een hoek die twee keer zo groot is als de hoek die wordt ingesloten door de boog bij de oorsprong.

Rotatiesamenstelling

Ik leg dit in detail uit in Voorbeeld 1.4 ” $ 2 \ times2 $ Eenheidsgroep $ SU (2) $ ” op mijn webpagina ” Enkele voorbeelden van verbonden leugroepen ” hier .

Er is ook mijn interactieve Mathematica-demonstratie ” De $ SU (2) $ Spinor-kaart: rotatiesamenstelling door grafische quaternion-driehoeken ” op de Wolfram Demonstrations-site .

2. De hemelbol

Door de driedimensionale lineaire ruimte van superposities van Pauli-matrices uit te breiden (wat hetzelfde is als de lineaire ruimte van spoorloos $ 2 \ times2 $ skew-Hermitische matrices) naar de 4 dimensionale ruimte die wordt omspannen door de Pauli-matrices en de identiteitsmatrices, en vervolgens elke transformatie van de groep $ SL (2, \ , \ mathbb {C}) $ werkt op vectoren van de vorm $ t \, \ mathrm {id} + x \, \ sigma_x + y \, \ sigma_y + z \, \ sigma_z $ door dezelfde spinor-map als in (4). Als we ons beperken tot projectieve stralen in deze ruimte, is de groep $ SL (2, \, \ mathbb {C}) $ , isomorf met de Moebius-groep van Möbius-transformaties werken op deze stralenruimte op precies dezelfde manier in als Möbius-transformaties (fractioneel lineair) op de Riemann-sfeer. $ SL (2, \, \ mathbb {C}) $ is een dubbele dekking van de Lorentz-groep, en je kunt berekenen hoe de weergave van een ruimtevaarder verandert als ze ondergaan Lorentz-transformaties. Zie de sectie ” Lorentz Transformations ” op de Wikipedia ” Möbius-transformatie ” pagina voor meer details.

Antwoord

Een algemene mechanische uitleg. Velden en golven volgen hyperbolische vergelijkingen (golfvergelijkingen). Deze vertegenwoordigen vooruitgang in ruimte en tijd, en als zodanig kunnen “t geen massa vertegenwoordigen die stationair moet zijn, maar die ook kan draaien. Een dergelijke beweging heeft een elliptische vergelijking nodig. Als voorbeeld is de Kline-Gordon-vergelijking hyperbolisch, terwijl de Dirac-vergelijking is elliptisch. In een stromende vloeistof is er een parallel voorbeeld. Wervelingen en turbulentie kunnen “niet ontstaan zonder de hulp van een grens – om de stroom af te buigen van het voortbewegen naar de circulerende toestand. Het eerste gebied is hyperbolisch en het tweede is elliptisch.

Om een deeltje (draaiende energie) te creëren uit een veld (bewegend in positie), moeten we de richting van het veld afbuigen / roteren. Hier komen de Pauli-matrices voor hulp, en geven de vereiste ellipticiteit. Daarom worden denkbeeldige getallen / rotatie gebruikt. Door een grootheid met i te vermenigvuldigen, wordt het met 90 graden gedraaid, voor een algemene hoek gebruiken we de exponentiële van een denkbeeldige grootheid.

Wanneer we later de Lagrange van golven en deeltjes mengen in een meer algemeen model, keren we terug om de Higgs te gebruiken om hetzelfde werk te doen: transformeren van het ene type energie naar het andere – dat wil zeggen van velden naar deeltjes en omgekeerd.

Geef een reactie

Het e-mailadres wordt niet gepubliceerd. Vereiste velden zijn gemarkeerd met *