Yksinkertainen selitys Baum Welchille / Viterbille

Etsin hyvin yksinkertaista selitystä Baum Welchille ja Viterbille HMM: ille suoraviivaisella, hyvin huomautetulla esimerkillä. Lähes kaikki selitykset, jotka löydän netistä, siirtyvät poikkeuksetta alusta alkaen lähes täysin ammattikieleen / symboleihin perustuvaksi selitykseksi.Muutama kerta, kun heillä on esimerkki, ne yleensä työnnetään sivulle tai heikosti merkitään (ts. Epäselvä miten symbolit ja Olen kuullut sellaista, kuten jotkut lähteet väittävät, että Baum Welch perustuu EM-algoritmiin ja toiset sanovat sen perustuvan poispäin eteenpäin taaksepäin olevasta algoritmista ja jotkut sanovat molemmat, joten haluaisin saada lisätietoja, kuten se selvisi.

Lähin löytämäni tähän mennessä on 1 h video, joka on tänne lähetetty ja jonka ihmisten mielestä oli hieno, mutta jota ei voida toistaa, koska flash on kielletty ja selitys wikipediassa, jonka vieressä on muistiinpano sanomalla väärin .

Vastaa

Etsin hyvin yksinkertaista selitystä Baum Welchille ja Viterbille HMM-laitteille …

  • Havaittujen tietojen perusteella Baum-Welch-algoritmi löytää todennäköisyyttä maksimoivat parametrit.

  • Kun otetaan huomioon havaitut tiedot ja parametrit, Viterbi-algoritmi löytää todennäköisimmän piilotettujen tilojen sekvenssin.

Olen kuullut sellaista, kuten jotkut lähteet väittävät Baum Welchin olevan perustuu EM-algoritmiin …

Baum-Welch-algoritmi on EM-algoritmin erityistapaus.

… ja muut sanovat sen perustuvan taaksepäin suuntautuvaan algoritmiin

Eteenpäin-taaksepäin hajoaminen on se, miten teet ”E-” -vaiheen (käyttämällä EM-terminologiaa). Se on ominaista piilotetuille Markov-malleille.

Muutama kerta, kun heillä on esimerkki, se yleensä työnnetään sivulle tai merkitään huonosti (ts. Epäselvä miten symbolit ja esimerkki liittyvät toisiinsa)

En tiedä mitä esimerkkejä tarkastelet, mutta voin kertoa sinulle siellä ovat monia hyviä. Muista, että nämä menetelmät keksittiin hyvin kauan sitten, ja niitä käytetään edelleen laajalti . Edellä mainittu linkitetty Rabiner on luultavasti tunnetuin, mutta sinun on löydettävä haluamasi, jonka läpi jatkat työskentelyä. Suosittelen, että löydät sellaisen, jossa on esimerkki, joka sisältää sinua kiinnostavia tietoja ja merkinnän siitä, että olet tunne on oppimiskykyinen. Mitä löydät, sillä on paljon merkintöjä. Sitä ei voida kiertää, joten olet juuri löytänyt jotain, johon voit tyytyä.

Vastaa

Minulla on täydellinen paperi sinulle: http://www.stat.columbia.edu/~liam/teaching/neurostat-fall17/papers/hmm/rabiner.pdf

Huomaa, että on olemassa uudempia mustavalkomenetelmiä.

Yritetty yksinkertainen selitys Viterbille: Viterbin tavoitteena on löytää optimaalinen tilajakso tietyn ajanjakson aikana.
Aloita aluksi todennäköisyydellä olla tilassa $ s $ kerrallaan $ t = 0 $. Lisää sitten $ t $ ja etsi jokaiselle osavaltiolle tuolloin ($ t = 1 $) paras osavaltio $ s $ arvossa $ t-1 $ (paras kuin järjestyksessä, joka antaa suurimman todennäköisyyden Tallenna nämä tiedot. Tämä tarkoittaa, että jokaiselle osavaltiolle $ s $ paikassa $ t = 1 $ tallenna paras tila $ s $ arvolla $ t = 0 $. Tallenna myös todennäköisyys tälle (optimaaliselle) jaksolle.
Nosta sitten $ t $ arvoon $ t = 2 $ ja toista toimenpide (kunkin valtion $ s $ todennäköisyydellä $ t-1 $ on juuri laskettu paras todennäköisyys tälle tilalle). e piste, jonka saavutat $ t = T $ (viimeinen ajankohta). Sitten valitset vain tilan suurimmalla todennäköisyydellä ja muistat jokaisesta osavaltiosta aina, kun olet tallentanut parhaan tilan hintaan $ t-1 $, joten ota paras tila arvolla $ t = T $ ja jatka sitten aina taaksepäin valitsemalla tallennettu optimaalinen tila.

Yksityiskohtaisemmaksi siitä, mitä se tekee yleisemmällä tasolla: Jos sinulla on joukko tiloja $ S $, jotka kaikki voidaan valita jonkin ajanjakson ajan $ T $, Naiivi ratkaisu parhaan sekvenssin löytämiseksi olisi luetella kaikki mahdolliset sekvenssit ja laskea sitten todennäköisyys kullekin niistä (se tarkoittaa tilan ja siirtymätodennäköisyyksien tulon laskemista). Tässä tekemä virhe on, että monet laskelmat ovat päällekkäisiä, esimerkkinä sinulla voi olla kaksi jaksoa $ p_1, p_2 $ ($ p $ on tilojen sekvenssi), joissa ainoa ero on lopullinen tila, mutta Tämän lähestymistavan avulla lasket jaettujen tilojen todennäköisyydet sekä $ P (p_1) $: lle että $ P (p_2) $: lle.
Käyttämällä iteratiivista lähestymistapaa, jota käytetään viterbissä, ei ole päällekkäisiä laskelmia, joten ilmeisesti se tapahtuu paljon tehokkaampi.

Kommentit

Vastaa

Sähköpostiosoitettasi ei julkaista. Pakolliset kentät on merkitty *