Studuji strojové učení z přednášek Andrewa Ng Stanforda a právě jsem narazil na teorii dimenzí VC. Podle přednášek a toho, co jsem pochopil, definice dimenze VC lze zadat jako,
Pokud najdete sadu $ n $ bodů, aby ji mohl klasifikátor rozbít (tj. správně klasifikujte všechny možné označování $ 2 ^ n $) a nemůžete najít žádnou sadu $ n + 1 $ bodů, která by se mohla rozbít (tj. pro jakoukoli sadu $ n + 1 $ bodů existuje alespoň jedna objednávka označení, takže klasifikátor nelze správně oddělit všechny body), pak je dimenze VC $ n $.
Také profesor vzal příklad a pěkně to vysvětlil. Což je:
Nechte,
$ H = \ {{sada \ lineárních \ klasifikátorů \ v \ 2 \ Dimenze \}} $
Pak mohou být libovolné 3 body být správně klasifikován $ H $ s oddělující hyper rovinou, jak je znázorněno na následujícím obrázku.
Proto je dimenze VC $ H $ 3. Protože pro libovolné 4 body ve 2D rovině může lineární klasifikátor nerozbít všechny kombinace bodů. Například
Pro tato sada bodů, neexistuje žádná oddělující hyperrovina, kterou lze za účelem klasifikace této sady nakreslit. Dimenze VC je tedy 3.
Nápad chápu až sem. Ale co když sledujeme typ vzoru?
Nebo vzor, kde se tři body shodují na sobě, zde také nemůžeme nakreslit oddělující hyperrovinu mezi 3 body. Tento vzor však stále není zohledněn v definici dimenze VC. Proč? stejný bod je také diskutován na přednáškách, které sleduji Zde v 16:24 , ale profesor nezmiňuje přesný důvod.
Oceníte jakýkoli intuitivní příklad vysvětlení. Děkujeme
Komentáře
- převzaty z datascience.stackexchange.com/a/16146/23305
Odpověď
Definice dimenze VC je: if existuje sada n bodů, které lze klasifikátorem rozbít, a neexistuje sada n + 1 bodů, které lze klasifikátorem rozbít, dimenze VC klasifikátoru je n.
Definice neříká: pokud libovolnou sadu n bodů lze klasifikátorem rozbít. ..
Pokud je dimenze VC klasifikátoru 3, nemusí se rozbít vše možné uspořádání 3 bodů.
Pokud ze všech uspořádání 3 bodů najdete alespoň jedno takové uspořádání, které může klasifikátor rozbít a nemůže najít 4 body, které lze rozbít, pak je dimenze VC 3.
Komentáře
- Pak v tomto případě můžeme získat alespoň jeden vzor libovolného počtu bodů, který lze klasifikovat přímkou. Například uvažujte o 4 bodech. Dva červené body na levé straně a dva modré body na pravé straně by umožnily klasifikaci, a dimenze VC by byla 4. Tak proč to neuvažovat?
- Klasifikováno – ano. Rozbité – ne
- Takže jaký je význam rozbití uspořádání bodů? Jsem tady ' opravdu zmatený. Díky
- Uspořádání bodů lze rozbít, pokud lze libovolnou podmnožinu tohoto uspořádání izolovat a dát do jedné třídy. Řekněme, že chcete otestovat, zda určité uspořádání (ne všechna možná uspořádání, ale pouze jedno konkrétní uspořádání) n bodů může být rozbité určitým typem klasifikátorů. Poté nejprve vyzkoušejte, zda lze izolovat jakýkoli jednotlivý bod. Pak, pokud lze izolovat nějaké 2 body, pak pokud nějaké 3 body atd., Až do n-1 bodů konkrétního uspořádání. Viz zde en.wikipedia.org/wiki/Shattered_set
- Obrázek s 8 subploty je velmi dobrým příkladem toho, co se otřásá. Tady máte 3 body, 2 třídy, takže 2 ^ 3 = 8 možných označení těchto 3 bodů. Všech 8 štítků lze provést a izolovat pomocí čáry, proto lze tuto sadu pomocí čáry rozbít. Obrázek se 4 body: má některá označení, která lze izolovat čárou (řekněme, dvě vlevo jsou červené, dvě vpravo jsou modré), ale má také označení, které nelze izolovat čárou (jako na obrázku: horní a spodní modrá; vlevo a vpravo vlevo). Protože má označení, které nelze izolovat čárou, není tato sada rozbitá.