Az YCbCr színtér Cb és Cr összetevőinek megértése

Ismerem az additív (RGB), a szubsztraktív (CMYK) és a HSV-szerű színtereket, de egy cikk Jelenleg megpróbálom megérteni az YCbCr színteret a kép szegmentálásához / az objektum meghatározásához.

Reggelem nagy részét olyasvalaminek töltöttem, amely természetes módon megmagyarázná az YCbCr-t, de egyszerűen nem értem. Szép, intuitív magyarázatot kaptam a e színtér mögött meghúzódó általános gondolatra itt , és annak magyarázata, hogyan használják a képek kódolására / tömörítésére ezekből srácok (mindez a photo.SE-n található).

Az YCbCr RGB-ből való kiszámításának képletei könnyen elérhetők a wikipédia .

Megkaptam a motivációt ehhez az ábrázoláshoz, megkaptam, hogy az Y komponens tartalmazza a legfontosabbakat (az emberi szem számára ) szürkeárnyalatos információk a képről.

Megkaptam, hogy a Cb és Cr információkat hordoz a színek ről, és hogy (az emberi szem (érzékenysége miatt) képesek tömöríteni kell látható minőségromlás nélkül. De mit jelent valójában az egyes színkomponensek?

Amint a cikk szerzői megemlítik, hogy ” a krominancia információ az objektumok meghatározásában kiemelt fontosságú “megközelítésükben, és nem tudom teljesen megérteni, mit olvasok a jelenlegi” Y-val az intenzitás, a Cb és a Cr valamilyen módon színes információt hordoznak “az YCbCr megértésének szintjén.

A “Cb is …, míg Cr is …” vagy “ha azt képzeljük, hogy XY-n keresztül / keresztül nézegetjük, akkor a Cb komponenst keresem …” , vagy valamilyen más módon, amely segít megérteni az egyes komponensek külön-külön hordozott információkat, nemcsak hogy színes információkat tartalmaznak.

SZERKESZTÉS

Engedje meg, hogy példákat adjak intuitív magyarázatokra más típusú, keresett I típusú színterekhez:

RGB : Mint egy színes vaku ragyogása fény a fekete falon: Ha kék zseblámpával ragyog, kék tükröződést lát. Ha hozzáad egy piros zseblámpát, az bíborvörös tükröt mutat, amely a kék és a vörös keveréke.

CMYK : Akvarellek keveréséhez hasonlóan “hozzáadod a színeket, amelyeket a felület tükröz” (azaz kivonja a színt a háttérből), tehát ha egy sárgát kever össze egy ciánnal, akkor az zöldet fog tükrözni, és így kapsz zöld szín.

HSV : A kisgyerekeket erősen telített, nem világos tárgyak vonzzák (érték ). A Hue komponens az, ami “megadja a színt”, míg az alacsony telítettség azt jelenti, hogy a színt fehér “hígítja”. Az értékváltozás világosabbá vagy sötétebbé teszi az egészet.

Ezekkel a definíciókkal intuitív érzéseket kaptam arról, hogy mit jelent az egyes színterek színábrázolása, anélkül, hogy megjegyezném mindegyikük diagramjait .

Válasz

A YUV (vagy YCbCr) olyan, mint a HSV, de különböző koordinátákban. (A YUV és az YCbCr közötti különbség marginális – többnyire pontos képletekkel kapcsolatos).

A $ V $ komponens ugyanaz. $ (S, H) $ felfogható polárkoordinátának, és $ (U, V) $ derékszögűnek. $ H $ a szög és a $ S $ a sugár. Durva konverzió lenne:

$ U = S \ cdot \ cos (H) $

$ V = S \ cdot \ sin ( H) $

ezt a linket további információkért láthatja rmáció.

Egy másik dolog, amelyet hozzá kell adni intuícióinak listájához:

A telítettség az, hogy a szín milyen tiszta színképi szempontból . Például egy lézernek nagyon keskeny a spektruma, ami nagy telítettséget jelent.

Megjegyzések

  • hozzáadhatja a YUV és a YCbCr, a teljesség kedvéért?
  • @Andrey Rubshtein, Ha egy lézernek magas a telítettsége, akkor fordítva igaz? Más szavakkal: Ha megmérem az RGB-t és átalakítom HSV-re, akkor a magas telítettség azt jelenti-e, hogy koherens lézerforrásból kell származnia? Köszönöm.
  • @Frank, nem feltétlenül lézer. De ‘ nehéz, ha telített színe van széles spektrummal, mivel minél szélesebb, annál nehezebb csak egy komponensben nagy választ adni.
  • @Andrey Rubshtein, köszönöm a választ. A telítettségi intenzitás mks egységei egységnyi idő / terület egységnyi energia. . A telítettség-energiaáramlás mks egységei egységnyi területre eső energia.ahol a szilárdtest lézerimpulzusok hosszúak, 10-50 ns (nanoszekundum). A nagyon szűk spektrumú telítettség azt jelenti, hogy koherens lézerforrásból kell származnia?
  • @Andrey Rubshein. Teljesen igazad van .. Most jöttem rá, hogy a LED-ek nagyjából monokromatikus fényt bocsátanak ki, csakúgy, mint az alacsony nyomású nátriumlámpák. Léteznek-e olyan koherens lézermutatók megkülönböztető jellemzői, amelyek segítségével meg lehetne különböztetni a lézermutató sugarakat a Boeing 737 légitársaság pilótafülke ablakán keresztül megfigyelt összképtől?

Válasz

Nem biztos abban, hogy mit ért a “valójában” alatt, mivel sem az RGB, sem az YUV nem képviseli sem a foton frekvenciáját, sem a tipikus emberi szem rúd / kúp válaszokat. De láthatja, hogy néznek ki Önnek, ha szintetizál néhány YCrCb színfoltot, például: (1,1,0), (1, -1,0), (1,0,1), (1,0, – 1) stb.

Itt a Wikipédia oldala, amely táblázatot tartalmaz:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

HOZZÁADOTT: Az RGB-ket és az ilyeneket szinte úgy tervezték (vagy alakították ki), hogy megfeleljenek az észlelés lehetséges emberi intuitív megértésének (és a színnevek kulturálisan megtanulhatónak bizonyulnak). az ellenkezője, úgy lett megtervezve, hogy az UV-területen fellépő zajt (hozzáadva egy zajos NTSC részsávhoz) nehéz lenne észrevenni, és ezért nehezebb leírni. Az YCrCb ugyanazon színtérkép változata. Tehát ne keressen létezőt “intuitív” betekintés, amely nem biztos, hogy létezik. Esetleg hozza létre sajátját úgy, hogy “megtanulja” a diagramot, és felépít néhány vadonatúj neurális kapcsolatot, amelyek jelenleg nem létezhetnek az agyában (vagy ilyesmi.)

Hozzászólások

  • Hozzáadtam példákat más típusú színterekre, amelyeket szeretnék beszerezni az YCbCr-hez. Remélem, hogy ez világosabbá teszi az I ‘ m magyarázat típusát.

Válasz

Ha megérted a HSV / HSB-t, akkor nem lehet nehéz megérteni az YCbCr-t. A HSB B csatornája megfelel a kromának (chroma = saturation http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ ). Készíthet rgb képet, és átalakíthatja szürkeárnyalatosra, vagy átalakíthatja az RGB minden csatornáját szürkeárnyalattá, és egyesítheti őket egy csatornává. Az egyszerűség kedvéért legyen képpontja 100% piros, 100% zöld és 70% kék színű. Kiszámítja az átlagot … (100 + 100 + 70) / 3, és 90% -os értéket kap, ami a fényerő 90% -át jelenti . Tehát szürkeskálában nagyon világos szürke színű. Most, ha az eredeti színeket a szürkeárnyalatos csatorna felé szeretnénk kifejezni, minden színre 3 képletre lenne szükségünk (piros, zöld, kék). Kiszámítaná az R szürkeárnyalatos, G vs szürkeárnyalatos és B vs szürkeárnyalatos. Ehhez 4 csatornára lenne szükség (RGB + kroma). De ugyanezt megtehetjük 3 csatornával is. Kicsit korrigálhatunk a zöld csatornán. Számítsuk ki a különbséget a zöld csatornához képest. Az eredeti zöld 100%, a zöld szürkévé alakított új értéke 90%. A különbség -10%. Tehát változtassuk meg ennek a képpontnak az R és B csatornáit ezzel a különbséggel. Csak gamma korrekciót hajtottunk végre, vagy az összes csatornát. A zöld csatorna értékei megegyeznek a szürkeárnyalatos képekkel. Tehát már nem a zöld csatornával számolunk. A zöldet “kódolják” “az Y … kroma csatornában. A többi szín (R, B) is módosul. R” = az eredeti 90% -a vagy Y 100% -a, mert R és B ebben a példában egyenlő. A B vegyület + 20% az eltérés az eredetihez képest, de miután gamma-korrekcióval megváltoztatták, + 30% -kal különbözik az Y-tól. A még egyszerűbbé tétele érdekében ez olyan, mint a képlet, ahol mindhárom vegyületet hozzá kell adni. mert a piros és a kék a Cb és a Cr. A karakterek csak azt mondják, hogy a Kék csatornát a chroma Csatornához, a Vörös csatornát a Chromma csatornához hasonlítottad. Ezért Cb és Cr.

Vélemény, hozzászólás?

Az email címet nem tesszük közzé. A kötelező mezőket * karakterrel jelöltük