バウムウェルチ/ビタビの簡単な説明

バウムウェルチとビタビのHMMについて、わかりやすい注釈付きの例を使用して、できるだけ簡単な説明を探しています。ネット上で見つけたほとんどすべての説明は、常に最初からほぼ完全にジャーゴン/シンボルベースの説明にジャンプします。例がある場合は、通常、横に押し込まれたり、注釈が不十分だったりします(つまり、シンボルと例は相互に関連しています)。バウムウェルチがEMアルゴリズムに基づいていると主張する情報源や、フォワードバックワードアルゴリズムに基づいていると主張する情報源などを聞いたことがあります。そのため、次のような詳細を取得したいと思います。

これまでに見つけた最も近いものは、ここに投稿された1時間のビデオで、人々は素晴らしいと言っていましたが、フラッシュが禁止されているため再生できません。ウィキペディアの説明の横に間違っていると書かれています。 。

回答

HMMのバウムウェルチとビタビについて可能な限り簡単な説明を探しています…

  • 観測データが与えられると、バウムウェルチアルゴリズムは尤度最大化パラメーターを見つけます。

  • 観測データとパラメーターが与えられると、ビタビアルゴリズムは、最も可能性の高い一連の隠れた状態を検出します。

バウムウェルチがEMアルゴリズムに基づく…

バウムウェルチアルゴリズムは、EMアルゴリズムの特殊なケースです。

…その他の人はフォワードバックワードアルゴリズムに基づいていると言っています

前後分解は、「E-」ステップを実行する方法です(EM用語を使用)。これは隠れマルコフモデルに固有のものです。

例がある場合は、通常、横に押し込まれたり、注釈が不十分です(つまり、方法が不明です)。記号と例は相互に関連しています)

どの例を見ているのかわかりませんが、そこにあると言えます多くの良い方法があります。これらの方法は非常に昔に発明されたものであり、今でも広く使用されていることを忘れないでください。 。上にリンクされているラビナーはおそらく最も有名ですが、あなたはあなたがやり続けるあなたが好きなものを見つける必要があります。あなたが興味を持っているデータとあなたの記法を持っている例を持っているものを見つけることをお勧めします感じは学ぶことができます。あなたが見つけたものは何でも多くの表記法があります。それを回避する方法はないので、「落ち着くことができるものを見つける必要があります。

回答

あなたにぴったりの論文: http://www.stat.columbia.edu/~liam/teaching/neurostat-fall17/papers/hmm/rabiner.pdf

新しいBWメソッドがあることに注意してください。

Viterbiの簡単な説明の試み:viterbiの目標は、ある離散的な期間中に状態の最適なシーケンスを見つけることです。
時間に$ s $の状態にある初期確率から始めます。 $ t = 0 $。次に$ t $を増やし、その時点($ t = 1 $)の各状態について、$ t-1 $で最良の状態$ s $を見つけます(最も高い確率を与えるシーケンスのように最良) )この情報を保存します。つまり、$ t = 1 $の各状態$ s $について、$ t = 0 $の最良の状態$ s $を保存します。また、その(最適な)シーケンスの確率も保存します。
次に、$ t $を$ t = 2 $に増やし、手順を繰り返します($ t-1 $での各状態$ s $の確率は、その状態で計算されたばかりの最良の確率です)。 eポイントあなたは$ t = T $(最後の時点)に到達します。次に、最も可能性の高い状態を選択し、$ t-1 $で最良の状態を保存するたびに各状態を覚えているので、$ t = T $で最良の状態を取得し、常に逆方向に作業します。保存された最適な状態を選択します。

より一般的なレベルでの動作を詳しく説明するには:状態のセット$ S $があり、それらすべてを一定期間$ T $で選択できる場合、最良のシーケンスを見つけるための素朴な解決策は、考えられるすべてのシーケンスを列挙してから、それぞれの確率を計算することです(つまり、状態と遷移の確率の積を計算します)。ここで行っている間違いは、多くの計算が重複していることです。たとえば、2つのシーケンス$ p_1、p_2 $($ p $は状態のシーケンス)があり、唯一の違いは最終状態ですが、このアプローチでは、$ P(p_1)$と$ P(p_2)$の両方の共有状態の確率を計算しています。
viterbiで使用される反復アプローチを採用することにより、重複する計算がないため、明らかに次のようになります。はるかに効率的です。

コメント

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です