Zrozumienie składowych Cb i Cr przestrzeni kolorów YCbCr

Jestem zaznajomiony z przestrzenią kolorów addytywną (RGB), subtraktywną (CMYK) i HSV, ale artykuł Obecnie próbuję zrozumieć, że działa na YCbCr przestrzeni kolorów dla segmentacji obrazu / definicji obiektu.

Większość poranka spędziłem na szukaniu czegoś, co naturalnie wyjaśniłoby YCbCr, ale po prostu tego nie rozumiem. Otrzymałem ładne, intuicyjne wyjaśnienie ogólnej idei tej przestrzeni kolorów tutaj i wyjaśnienie, w jaki sposób jest używany do kodowania / kompresji obrazu z tych faceci (wszystko na foto.SE).

Formuły obliczania YCbCr z RGB są łatwo dostępne na wikipedia .

Mam motywację do tego przedstawienia, otrzymałem, że składnik Y zawiera najważniejsze (dla ludzkiego oka ) informacje o obrazie w skali szarości.

Dostałem, że Cb i Cr niosą informacje o kolorach i że (ze względu na (nie) wrażliwość ludzkiego oka) mogą być skompresowane bez widocznej utraty jakości. Ale co właściwie reprezentuje każdy ze składników chrominancji?

Jak wspominają autorzy artykułu „ informacja o chrominancji jest najważniejsza w definicji obiektów „w ich podejściu i nie mogę w pełni zrozumieć, co czytam z moim aktualnym„ Y to intensywność, Cb i Cr w jakiś sposób przenoszą informacje o kolorze ”.

Szukam odpowiedzi w ten sposób, że „Cb to …, podczas gdy Cr to …” lub „jeśli wyobrażasz sobie przeglądanie / z XY, to„ faktycznie patrzysz na składnik Cb … ” lub w inny sposób, który pomógłby mi zrozumieć informacje przenoszone przez każdy z komponentów oddzielnie, a nie tylko to, że razem niosą informacje o kolorze.

EDYCJA

Pozwólcie, że podam przykłady intuicyjnych wyjaśnień dla innych przestrzeni kolorów typu, którego szukam:

RGB : jak świecenie kolorowej lampy błyskowej światło na czarnej ścianie: jeśli zaświeci się niebieską latarką, zobaczysz niebieskie odbicie. Jeśli dodasz czerwoną latarkę, będzie ona miała purpurowe odbicie, które jest mieszaniną niebieskiego i czerwonego.

CMYK : Podobnie jak przy mieszaniu akwareli, „dodajesz do kolorów, które odbija powierzchnia” (tj. odejmuje kolor od tła), więc jeśli zmieszasz żółty z cyjanem, jeśli odbije się on na zielono, a tym samym otrzymasz zielony kolor.

HSV : Małe dzieci przyciągają obiekty mocno nasycone, a nie jasne (wartość ). Składnik Hue jest tym, co „nadaje kolor”, podczas gdy niskie nasycenie oznacza, że kolor jest „rozcieńczany” przez biel. Zmiana wartości sprawia, że całość jest jaśniejsza lub ciemniejsza.

Dzięki tym definicjom udało mi się uzyskać intuicyjne przeczucie, co oznacza reprezentacja kolorów w każdej przestrzeni kolorów, bez zapamiętywania wykresów dla każdej z nich .

Odpowiedź

YUV (lub YCbCr) jest jak HSV, ale ma różne współrzędne. (Różnica między YUV i YCbCr to marginalny – dotyczy głównie dokładnych formuł).

Składnik $ V $ jest taki sam. $ (S, H) $ można traktować jako współrzędne biegunowe, a $ (U, V) $ jako kartezjańskie. $ H $ to kąt, a $ S $ to promień. Zgrubna konwersja to:

$ U = S \ cdot \ cos (H) $

$ V = S \ cdot \ sin ( H) $

Możesz zobaczyć ten link, aby uzyskać więcej informacji rmacja.

Kolejna rzecz do dodania do listy intuicji:

Nasycenie to czystość koloru z widmowego punktu widzenia . Na przykład laser ma bardzo wąskie widmo, co oznacza duże nasycenie.

Komentarze

czy możesz dodać wyjaśnienie różnicy między YUV a YCbCr, ze względu na kompletność?
@Andrey Rubshtein, Jeśli laser ma wysokie nasycenie, czy odwrotność jest prawdą? Innymi słowy, jeśli zmierzę RGB i przekonwertuję na HSV, czy wysokie nasycenie oznacza, że musi pochodzić ze spójnego źródła laserowego? Dziękuję.
@Frank, niekoniecznie laser. Ale ' trudno jest uzyskać nasycony kolor o szerokim spektrum, ponieważ im jest szerszy, tym trudniej jest uzyskać wysoką odpowiedź tylko w jednym składniku.
@Andrey Rubshtein, Dziękuję za odpowiedź. Jednostki mks intensywności nasycenia to energia na jednostkę czasu na jednostkę powierzchni. . Jednostki mks energii nasycenia to energia na jednostkę powierzchni.gdzie impulsy lasera na ciele stałym są długie, od 10 do 50 ns (nanosekund). Czy wysokie nasycenie przy bardzo wąskim widmie oznacza, że musi pochodzić ze spójnego źródła lasera?
@Andrey Rubshein. Masz całkowitą rację… Właśnie się dowiedziałem, że diody LED emitują światło prawie monochromatyczne, podobnie jak niskoprężne lampy sodowe. Czy istnieją charakterystyczne cechy spójnych wskaźników laserowych, których można by użyć do odróżnienia wiązek wskaźnika laserowego od ogólnego obrazu obserwowanego przez okno kokpitu samolotu Boeing 737?

Odpowiedź

Nie jestem pewien, co masz na myśli, mówiąc „faktycznie”, ponieważ ani RGB, ani YUV nie reprezentują ani częstotliwości fotonów, ani typowych reakcji pręcików / stożków ludzkich oczu. Ale możesz zobaczyć, jak one wyglądają, syntetyzując niektóre łaty kolorów YCrCb, takie jak (1,1,0), (1, -1,0), (1,0,1), (1,0, – 1) itp.

Oto „strona Wikipedii zawierająca wykres:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

DODANE: RGB i tym podobne, zostały prawie zaprojektowane (lub ewoluowały), aby dopasować się do możliwego ludzkiego intuicyjnego rozumienia percepcji (a nazwy kolorów okazują się być kulturowo wyuczone). YUV jest odwrotnie, zaprojektowany w taki sposób, że szum w obszarze UV (dodany do zaszumionego podpasma NTSC) byłby trudny do zauważenia, a przez to trudniejszy do opisania. YCrCb jest odmianą tego samego odwzorowania kolorów. Więc nie szukaj istniejącego „intuicyjny” wgląd, który może nie istnieć. Być może stwórz swój własny, „ucząc się” wykresu i budując całkiem nowe połączenia neuronowe, które obecnie mogą nie istnieć w Twoim mózgu (lub coś w tym rodzaju).

Komentarze

Dodałem przykłady innych przestrzeni kolorów, które chciałbym uzyskać dla YCbCr. Mam nadzieję, że dzięki temu wyjaśnienie, które ja ' m szukałem, było jaśniejsze.

Odpowiedź

Kiedy zrozumiesz HSV / HSB, nie powinno być trudno zrozumieć YCbCr. Kanał B w HSB odpowiada barwie (chroma = nasycenie http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ ). Możesz wziąć obraz rgb i przekonwertować go na skalę szarości lub możesz przekonwertować każdy kanał RGB na skalę szarości i połączyć je w jeden kanał. Dla uproszczenia załóżmy, że piksel jest w 100% czerwony, 100% zielony i 70% niebieski. Obliczysz średnią … (100 + 100 + 70) / 3 i otrzymasz wartość 90%, co oznacza 90% jasności Tak więc w skali szarości jest to kolor bardzo jasnoszary. Teraz, gdybyśmy chcieli wyrazić oryginalne kolory w kierunku kanału skali szarości, potrzebowalibyśmy 3 formuł dla każdego koloru (czerwony, zielony, niebieski). Obliczycie różnicę wartości R vs skala szarości, G vs skala szarości i B vs skala szarości. Wymagałoby to 4 kanałów (RGB + chroma). Ale możemy zrobić to samo z 3 kanałami. Możemy zrobić małą korektę w kanale zielonym. Obliczmy różnicę w stosunku do kanału zielonego. Oryginalna zieleń to 100%, nowa wartość zieleni zamieniona na szarość to 90%. Różnica wynosi -10%. Więc zmieńmy kanały R i B tego piksela o tę różnicę. Właśnie zrobiliśmy korekcję gamma lub wszystkie kanały. Wartości kanału zielonego będą takie same jak dla obrazu w skali szarości. Więc nie będziemy już obliczać z kanałem zielonym. Zielony jest zakodowany „w kanale barwy Y …. Pozostałe kolory (R, B) również są korygowane. R` = 90% oryginału lub 100% Y, ponieważ R i B są równe w tym przykładzie. Związek B ma różnica + 20% w stosunku do oryginału, ale po zmianie z korekcją gamma ma różnicę + 30% w stosunku do Y. Aby jeszcze bardziej uprościć, jest to jak formuła, w której musisz dodać wszystkie trzy związki. Różnice, które otrzymujesz dla czerwonego i niebieskiego to Cb i Cr. Znaki po prostu mówią, że porównałeś kanał niebieski do kanału chroma i kanał czerwony do kanału Chromma. Stąd Cb i Cr.

Odpowiedź

Komentarze

Odpowiedź

Komentarze

Odpowiedź

Dodaj komentarz Anuluj pisanie odpowiedzi