VC次元の正確な定義は何ですか?

Andrew Ng Stanfordの講義から機械学習を勉強していて、VC次元の理論に出くわしました。講義と私が理解したことによると、定義VC次元のは、次のように指定できます。

$ n $ポイントのセットが見つかった場合、分類子によって粉砕されます(つまり、可能なすべての$ 2 ^ n $ラベリングを正しく分類します)、粉砕できる$ n + 1 $ポイントのセットを見つけることができません(つまり、$ n + 1 $ポイントのセットには、少なくとも1つのラベリング順序があるため、分類子はすべてのポイントを正しく分離できない場合)、VC次元は$ n $です。

また、教授は例を挙げてこれをうまく説明しました。これは次のとおりです。

みましょう、

$ H = \ {{set \ of \ linear \ classifiers \ in \ 2 \ Dimensions \}} $

次に、任意の3つのポイントで次の図に示すように、ハイパープレーンを分離して$ H $で正しく分類されます。

これが、$ H $のVC次元が3である理由です。2D平面内の任意の4点に対して、線形分類器は次のことができます。ポイントのすべての組み合わせを粉砕するわけではありません。例:

ここに画像の説明を入力

Forこの点のセット、このセットを分類するために分離超平面を描画することはできません。したがって、VC次元は3です。

ここまでアイデアが浮かびます。しかし、「次のタイプのパターンがある場合はどうなりますか?

ここに画像の説明を入力してください

または3点が一致するパターン、ここでも3点間で分離超平面を描くことはできませんが、それでもこのパターンはVC次元の定義では考慮されていません。なぜですか?同じ点について、私がここで16:24 に見ている講義についても説明していますが、教授はこの背後にある正確な理由については言及していません。

説明の直感的な例があれば幸いです。ありがとう

コメント

回答

VC次元の定義は次のとおりです。if分類子によって粉砕される可能性のあるn個のポイントのセットが存在します 存在しません分類器によって粉砕できるn + 1ポイントのセットの場合、分類器のVC次元はnです。

定義には次のようには書かれていません。の場合のn点のセットは分類器によって粉砕される可能性があります。 ..

分類器のVC次元が3の場合、可能な限りすべてを粉砕する必要はありません 3ポイントの配置。

3ポイントの配置すべての場合、少なくとも1つを見つけることができます。分類器によって粉砕される可能性があり、粉砕される可能性のある4つのポイントを見つけることができないような配置の場合、VC次元は3です。

コメント

回答

ポイントは、VC次元を検討する前に、一般的な条件でポイントを満たす必要があります。 ここに画像の説明を入力

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です