Forståelse af Cb- og Cr-komponenter i YCbCr-farverum

Jeg er fortrolig med additiv (RGB), sub-abstractive (CMYK) og HSV-lignende farverum, men en artikel Jeg forsøger i øjeblikket at forstå fungerer på YCbCr farveområde til billedsegmentering / objektdefinition.

Jeg har brugt det meste af min morgen på at lede efter noget, der forklarer YCbCr naturligt, men jeg får det bare ikke. Jeg fik en flot, intuitiv forklaring på den generelle idé bag dette farverum her og forklaring på, hvordan det bruges til billedkodning / komprimering fra disse fyre (alle på foto.SE).

Formlerne til beregning af YCbCr fra RGB er let tilgængelige på wikipedia .

Jeg fik motivationen til denne repræsentation, jeg fik at Y-komponenten indeholder det vigtigste (for det menneskelige øje ) gråskalainformation om billedet.

Jeg fik, at Cb og Cr bærer information om farverne og at de (på grund af menneskets øje (i) følsomhed) kan komprimeres uden et synligt tabt kvalitet. Men, hvad repræsenterer hver af krominanskomponenterne faktisk?

Da artikelforfatterne nævner, at ” chrominansinformation er altafgørende i definitionen af objekter “i deres tilgang, og jeg kan ikke fuldt ud forstå, hvad jeg læser med min nuværende” Y er intensitet, Cb og Cr bærer farveinformation på en eller anden måde “niveau af forståelse YCbCr.

Jeg leder efter et svar i retning af “Cb er …, mens Cr er …” eller “hvis du forestiller dig at se igennem / med XY, ser du faktisk på Cb-komponent …” eller en anden måde, der kan hjælpe mig med at forstå oplysninger, der bæres af hver af komponenterne separat, ikke bare at de sammen bærer farveoplysninger.

EDIT

Lad mig give eksempler på intuitive forklaringer på andre farverum af den type, jeg leder efter:

RGB : Som at skinne en farvet flash lys på en sort væg: Hvis du skinner med en blå lommelygte, ser du en blå refleksion. Hvis du tilføjer en rød lommelygte, viser den en magenta refleksion, som er en blanding af blå og rød.

CMYK : Som at blande akvareller tilføjer du “de farver, overfladen reflekterer”, (dvs. fratrækker farve fra baggrunden), så hvis du blander en gul med en cyan, vil den reflektere grøn og dermed får du en grøn farve.

HSV : Små børn er tiltrukket af meget mættede objekter, ikke lyse (værdi ). Hue-komponenten er det, der “giver farven”, mens lav mætning betyder, at farven er “fortyndet” med hvid. Ændring i værdi gør det hele lysere eller mørkere.

Med disse definitioner har jeg været i stand til at få en intuitiv fornemmelse af, hvad en farverepræsentation i hvert farveområde betyder uden at huske diagrammer for hver af dem .

Svar

YUV (eller YCbCr) er som HSV, men i forskellige koordinater. (Forskellen mellem YUV og YCbCr er marginal – hovedsagelig relateret til nøjagtige formler).

$ V $ -komponenten er den samme. $ (S, H) $ kan betragtes som polære koordinater og $ (U, V) $ som kartesisk. $ H $ er vinklen, og $ S $ er radius. En grov konvertering ville være:

$ U = S \ cdot \ cos (H) $

$ V = S \ cdot \ sin ( H) $

Du kan se dette link for mere info rmation.

En anden ting at tilføje til din intuitionsliste:

Mætning er, hvor ren farven er fra spektral synspunkt . For eksempel har en laser et meget smalt spektrum, hvilket indebærer høj mætning.

Kommentarer

  • kan du tilføje forklaringen på forskellen mellem YUV og YCbCr, for fuldstændighedens skyld?
  • @Andrey Rubshtein, hvis en laser har høj mætning, er det omvendte sandt? Med andre ord, hvis jeg måler RGB og konverterer til HSV, betyder høj mætning, at det skal stamme fra en sammenhængende laserkilde? Tak.
  • @Frank, ikke nødvendigvis en laser. Men det ‘ er svært at have en mættet farve med et bredt spektrum, da jo bredere den er, jo sværere er det at have en høj respons i kun en komponent.
  • @Andrey Rubshtein, tak for dit svar. Mks-enhederne af mætningsintensitet er energi pr. Tidsenhed pr. Arealenhed. . Mks-enhederne af mætningsenergifluens er energi pr. Arealenhed.hvor solid state laserpulser er lange, 10 til 50 ns (nanosekunder). Betyder høj mætning med et meget smalt spektrum, at den skal stamme fra en sammenhængende laserkilde?
  • @Andrey Rubshein. Du er helt korrekt..Jeg har lige fundet ud af, at lysdioder udsender lys, der er stort set monokromatisk, ligesom lavtryksnatriumlys gør. Er der forskellige kendetegn ved sammenhængende laserpegere, som man kan bruge til at fortælle laserpegerstråler bortset fra det samlede billede, der observeres gennem et Boeing 737 cockpitvindue?

Svar

Ikke sikker på, hvad du mener med “faktisk” repræsenterer, da hverken RGB eller YUV repræsenterer hverken fotonfrekvens eller de typiske menneskelige øjne stang / kegle svar. Men du kan se, hvordan de ser ud for dig, ved at syntetisere nogle YCrCb-farvepletter, såsom (1,1,0), (1, -1,0), (1,0,1), (1,0, – 1) osv.

Her er en Wikipedia-side, der indeholder et diagram:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

TILFØJET: RGB og sådan blev næsten designet (eller udviklet) til at matche en mulig menneskelig intuitiv forståelse af opfattelse (og farvenavne viser sig at være kulturelt lært). er det modsatte, designet således, at støj i UV-området (tilføjet til et støjende NTSC-underbånd) ville være svært at se og dermed være sværere at beskrive. YCrCb er en variation på den samme farvekortlægning. Så se ikke efter en eksisterende “intuitiv” indsigt, som muligvis ikke findes. Måske oprette din egen ved at “lære” diagrammet og opbygge nogle helt nye neurale forbindelser, der muligvis ikke findes i din hjerne (eller noget lignende).

Kommentarer

  • Jeg tilføjede eksempler på andre farverum af den type, jeg gerne vil have til YCbCr. Håber dette gør den type forklaring, jeg ‘ søger frem, klarere.

Svar

Når du forstår HSV / HSB, bør det ikke være svært at forstå YCbCr. B-kanalen i HSB svarer til chroma (chroma = mætning http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ ). Du kan tage rgb-billede og konvertere det til gråtoner, eller du kan konvertere hver kanal i RGB til gråtoner, og de fletter dem sammen til en kanal. For at forenkle, lad os have pixel med 100% rød, 100% grøn og 70% blå. Du beregner gennemsnit … (100 + 100 + 70) / 3, og du får en værdi på 90%, hvilket betyder 90% af lysstyrken Så i gråtoner er det meget lysegrå farve. Hvis vi nu vil udtrykke de originale farver mod gråtonekanalen, har vi brug for 3 formler for hver farve (rød, grøn, blå). Du vil beregne forskellen i værdi R vs gråtoner, G vs gråtoner og B vs gråtoner. Dette ville have brug for 4 kanaler (RGB + chroma). Men vi kan gøre det samme med 3 kanaler. Vi kan foretage en lille korrektion til den grønne kanal. Lad os beregne forskellen til den grønne kanal. Originalgrøn er 100%, ny værdi af grønt konverteret til grå er 90%. Forskellen er -10%. Så lad os ændre R- og B-kanaler for denne pixel med denne forskel. Vi har lige foretaget gammakorrektion eller alle kanaler. Grøn kanalværdier vil være de samme som for gråtonebillede. Så vi beregner ikke længere med grøn kanal. Grøn er “kodet “i Y … kromakanalen. Resten af farver (R, B) justeres også. R` = 90% af originalen eller 100% af Y, fordi R og B er ens i dette eksempel. B-forbindelsen har forskel + 20% i retning af original, men efter at den blev ændret med gammakorrektion, har den forskel + 30% mod Y. For at forenkle det endnu mere er det som en formel, hvor du skal tilføje for alle tre forbindelser. for rød og blå er Cb og Cr. Tegnene siger bare, at du sammenlignede blå kanal med chromakanal og rød kanal til Chromma-kanal. Derfor Cb og Cr.

Skriv et svar

Din e-mailadresse vil ikke blive publiceret. Krævede felter er markeret med *