Porozumění komponentám Cb a Cr barevného prostoru YCbCr

Znám aditivní (RGB), subtraktivní (CMYK) a barevné prostory podobné HSV, ale článek Momentálně se snažím pochopit, pracuje na YCbCr barevném prostoru pro segmentaci obrázků / definici objektů.

„Strávil jsem většinu svého rána hledáním něčeho, co by přirozeně vysvětlovalo YCbCr, ale prostě to nechápu. Dostal jsem pěkné, intuitivní vysvětlení obecné myšlenky za tímto barevným prostorem zde a vysvětlení, jak se používá pro kódování a kompresi obrázků z těchto kluci (vše na photo.SE).

Vzorce pro výpočet YCbCr z RGB jsou snadno dostupné na wikipedia .

Dostal jsem motivaci pro tuto reprezentaci, dostal jsem, že složka Y obsahuje to nejdůležitější (pro lidské oko ) informace o obrázku v šedém měřítku.

Dostal jsem, že Cb a Cr nesou informace o barvách a že (kvůli (ne) citlivosti lidského oka) mohou být komprimován bez viditelné ztráty kvality. Ale co vlastně každá z chrominančních složek představuje?

Jak to autoři článku zmiňují “ informace o chrominanci jsou při definici objektů „v jejich přístupu prvořadé a nemohu plně pochopit, co čtu s mým současným„ Y je intenzita, Cb a Cr nějakým způsobem nesou informace o barvě “úroveň porozumění YCbCr.

Hledám odpověď v duchu „Cb je …, zatímco Cr je …“ nebo „pokud si představujete, že se díváte skrz / s XY, skutečně se díváte na komponentu Cb …“ nebo jiným způsobem, který by mi pomohl porozumět informacím přenášeným každou ze složek samostatně, nejen tomu, že společně nesou informace o barvách.

EDIT

Dovolte mi uvést příklady intuitivních vysvětlení pro jiné barevné prostory typu, který hledám:

RGB : Jako zářící barevný záblesk světlo na černé zdi: Pokud svítíte modrou baterkou, uvidíte modrý odraz. Pokud přidáte červenou baterku, zobrazí se purpurový odraz, což je směs modré a červené.

CMYK : Stejně jako míchání vodových barev „přidáváte k barvám, které povrch odráží“ (tj. odečte barvu od pozadí), takže pokud namícháte žlutou s azurovou, bude-li odrážet zelenou barvu a tím získáte zelená barva.

HSV : Malé děti přitahují vysoce nasycené objekty, nikoli jasné (hodnota ). Složka Odstín je to, co „dává barvu“, zatímco nízká sytost znamená, že je barva „zředěna“ bílou. Díky změně hodnoty je celá věc světlejší nebo tmavší.

Díky těmto definicím jsem mohl získat intuitivní pocit z toho, co znamená barevné znázornění v každém barevném prostoru, aniž bych si zapamatoval grafy pro každý z nich .

Odpověď

YUV (nebo YCbCr) je jako HSV, ale v různých souřadnicích. (Rozdíl mezi YUV a YCbCr je marginální – většinou souvisí s přesnými vzorci).

Komponenta $ V $ je stejná. $ (S, H) $ lze považovat za polární souřadnice a $ (U, V) $ za kartézský. $ H $ je úhel a $ S $ je poloměr. Hrubá konverze by byla:

$ U = S \ cdot \ cos (H) $

$ V = S \ cdot \ sin ( H) $

Další informace najdete tento odkaz rmation.

Další věc, kterou je třeba přidat do seznamu intuice:

Sytost je čistá barva ze spektrálního hlediska . Například laser má velmi úzké spektrum, což znamená vysokou sytost.

Komentáře

  • můžete přidat vysvětlení rozdílu mezi YUV a YCbCr, pro úplnost?
  • @Andrey Rubshtein, pokud má laser vysokou sytost, je obrácení pravdivé? Jinými slovy, pokud měřím RGB a převádím na HSV, znamená vysoká saturace, že musí pocházet z koherentního laserového zdroje? Děkuji.
  • @Frank, nemusí to být nutně laser. ‚ Je však těžké mít sytou barvu se širokým spektrem, protože čím širší je, tím těžší je mít vysokou odezvu pouze u jedné složky.
  • @Andrey Rubshtein, děkuji za odpověď. Jednotky mks Saturation Intensity jsou energie za jednotku času na jednotku plochy. . Mks jednotky vlivu saturace energie jsou energie na jednotku plochy.kde jsou laserové pulsy v pevné fázi dlouhé 10 až 50 ns (nanosekund). Znamená vysoká saturace s velmi úzkým spektrem, že musí pocházet z koherentního laserového zdroje?
  • @Andrey Rubshein. Máte úplnou pravdu .. Právě jsem zjistil, že LED diody vyzařují světlo, které je do značné míry monochromatické, stejně jako nízkotlaká sodíková světla. Existují charakteristické vlastnosti koherentního laserového ukazovátka, které lze použít k rozpoznání paprsků laserového ukazatele na rozdíl od celkového obrazu pozorovaného oknem kokpitu letecké společnosti Boeing 737?

Odpověď

Nejste si jisti, co máte na mysli pod pojmem „ve skutečnosti“, protože RGB ani YUV nepředstavují ani frekvenci fotonů, ani typické reakce lidského oka na kužel. Ale můžete vidět, jak vám vypadají, syntetizováním některých barevných záplat YCrCb, například (1,1,0), (1, -1,0), (1,0,1), (1,0, – 1) atd.

Tady je stránka Wikipedie, která obsahuje graf:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

PŘIDÁNO: RGB a podobně byly téměř navrženy (nebo vyvinuty) tak, aby odpovídaly možnému lidskému intuitivnímu vnímání vnímání (a názvy barev se ukážou jako kulturně naučené). YUV je pravý opak, navržený tak, aby hluk v UV oblasti (přidaný k hlučnému subpásmu NTSC) byl těžko viditelný, a proto by bylo těžší jej popsat. YCrCb je variace na stejné barevné mapování. Takže nehledejte existující „intuitivní“ vhled, který nemusí existovat. Možná si vytvoříte vlastní tím, že se „naučíte“ graf a vytvoříte zbrusu nová neurální spojení, která ve vašem mozku aktuálně možná neexistují (nebo něco podobného.)

Komentáře

  • Přidal jsem příklady pro další barevné prostory typu, který bych chtěl získat pro YCbCr. Doufám, že to způsobí, že typ vysvětlení, který ‚ hledám, bude jasnější.

Odpovědět

Když rozumíte HSV / HSB, nemělo by být těžké porozumět YCbCr. B kanál v HSB odpovídá chroma (chroma = saturation http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ ). Můžete pořídit obrázek RGB a převést jej na stupně šedi nebo můžete převést každý kanál RGB na stupně šedi a spojit je do jednoho kanálu. Pro zjednodušení nechme mít pixel se 100% červenou, 100% zelenou a 70% modrou. Vypočítáte průměr … (100 + 100 + 70) / 3 a získáte hodnotu 90%, což znamená 90% jasu . Takže ve stupních šedi je to velmi světle šedá barva. Nyní, pokud bychom chtěli vyjádřit původní barvy směrem ke kanálu ve stupních šedi, potřebovali bychom 3 vzorce pro každou barvu (červená, zelená, modrá). Vypočítali byste rozdíl hodnoty R vs stupně šedi, G vs stupně šedi a B vs stupně šedi. To by vyžadovalo 4 kanály (RGB + chroma). Ale můžeme udělat totéž se 3 kanály. Můžeme udělat malou korekci zeleného kanálu. Pojďme vypočítat rozdíl vůči zelenému kanálu. Původní zelená je 100%, nová hodnota zelené převedená na šedou je 90%. Rozdíl je -10%. Pojďme tedy s tímto rozdílem změnit kanály R a B tohoto pixelu. Právě jsme provedli gama korekci nebo všechny kanály. Hodnoty zeleného kanálu budou stejné jako u obrazu ve stupních šedi. Takže se zeleným kanálem již nepočítáme. Zelená je zakódována „v kanálu Y … chroma. Ostatní barvy (R, B) jsou také upraveny. R` = 90% originálu nebo 100% Y, protože R a B jsou v tomto příkladu stejné. Sloučenina B má rozdíl + 20% oproti původnímu, ale poté, co byl změněn pomocí gama korekce, má rozdíl + 30% vůči Y. Chcete-li to ještě více zjednodušit, je to jako vzorec, ve kterém musíte přidat sčítání pro všechny tři sloučeniny. Rozdíly, které získáte pro červenou a modrou jsou Cb a Cr. Znaky pouze říkají, že jste srovnávali modrý kanál s chroma kanálem a červený kanál s kanálem Chromma. Proto Cb a Cr.

Napsat komentář

Vaše e-mailová adresa nebude zveřejněna. Vyžadované informace jsou označeny *