Ich bin mit additiven (RGB), subtraktiven (CMYK) und HSV-ähnlichen Farbräumen vertraut, aber mit einem Artikel Ich versuche gerade zu verstehen, funktioniert YCbCr Farbraum für Bildsegmentierung / Objektdefinition.
Ich habe den größten Teil meines Morgens damit verbracht, nach etwas zu suchen, das das YCbCr auf natürliche Weise erklären würde, aber ich verstehe es einfach nicht. Ich habe eine nette, intuitive Erklärung der allgemeinen Idee hinter diesem Farbraum hier und Erläuterung, wie es für die Bildcodierung / -komprimierung von diesen guys (alle auf photo.SE).
Die Formeln zur Berechnung von YCbCr aus RGB sind unter wikipedia .
Ich habe die Motivation für diese Darstellung erhalten, ich habe festgestellt, dass die Y-Komponente das Wichtigste enthält (für das menschliche Auge ) Graustufeninformationen über das Bild.
Ich habe erfahren, dass Cb und Cr Informationen über die Farben enthalten und dass sie (aufgrund der (Un-) Empfindlichkeit des menschlichen Auges) dies können ohne sichtbaren Qualitätsverlust komprimiert werden. Aber was repräsentiert jede der Chrominanzkomponenten tatsächlich?
Wie die Artikelautoren erwähnen, dass “ Chrominanzinformationen sind bei der Definition von Objekten „in ihrem Ansatz von größter Bedeutung, und ich kann nicht vollständig verstehen, was ich mit meinem aktuellen Verständnisniveau“ Y ist Intensität, Cb und Cr tragen irgendwie Farbinformationen „YCbCr.
lese
Ich suche nach einer Antwort in der Art „Cb ist …, während Cr … ist“ oder „Wenn Sie sich vorstellen, durch / mit XY zu schauen,“ betrachten Sie tatsächlich die Cb-Komponente … “ oder auf eine andere Weise, die mir helfen würde, Informationen zu verstehen, die von jeder der Komponenten einzeln übertragen werden, und nicht nur, dass sie zusammen Farbinformationen enthalten.
BEARBEITEN
Lassen Sie mich Beispiele für intuitive Erklärungen für andere Farbräume des Typs geben, nach dem ich suche:
RGB : Wie ein farbiger Blitz Licht an einer schwarzen Wand: Wenn Sie mit einer blauen Taschenlampe leuchten, sehen Sie eine blaue Reflexion. Wenn Sie eine rote Taschenlampe hinzufügen, wird eine magentafarbene Reflexion angezeigt, die eine Mischung aus Blau und Rot darstellt.
CMYK : Wie beim Mischen von Aquarellen fügen Sie „zu den Farben hinzu, die die Oberfläche reflektiert“ (dh subtrahieren die Farbe vom Hintergrund). Wenn Sie also eine gelbe mit einer cyanfarbenen Farbe mischen, wird die Farbe grün reflektiert und Sie erhalten eine grüne Farbe.
HSV : Kleine Kinder fühlen sich von stark gesättigten Objekten angezogen, die nicht hell sind (Wert) ). Die Farbtonkomponente gibt „die Farbe“, während eine niedrige Sättigung bedeutet, dass die Farbe durch Weiß „verdünnt“ wird. Eine Wertänderung macht das Ganze heller oder dunkler.
Mit diesen Definitionen konnte ich ein intuitives Gefühl dafür bekommen, was eine Farbdarstellung in jedem Farbraum bedeutet, ohne mir Diagramme für jeden einzelnen zu merken
Antwort
YUV (oder YCbCr) ist wie HSV, jedoch in unterschiedlichen Koordinaten. (Der Unterschied zwischen YUV und YCbCr beträgt marginal – meistens bezogen auf exakte Formeln).
Die Komponente $ V $ ist dieselbe. $ (S, H) $ kann als Polarkoordinaten und $ (U, V) $ als kartesisch angesehen werden. $ H $ ist der Winkel und $ S $ ist der Radius. Eine grobe Konvertierung wäre:
$ U = S \ cdot \ cos (H) $
$ V = S \ cdot \ sin ( H) $
Weitere Informationen finden Sie unter unter diesem Link rmation.
Eine weitere Sache, die Sie Ihrer Intuitionsliste hinzufügen sollten:
Die Sättigung ist, wie rein die Farbe aus spektraler Sicht ist . Zum Beispiel hat ein Laser ein sehr enges Spektrum, was eine hohe Sättigung impliziert.
Kommentare
- können Sie die Erklärung des Unterschieds zwischen YUV und hinzufügen YCbCr, der Vollständigkeit halber?
- @Andrey Rubshtein: Wenn ein Laser eine hohe Sättigung aufweist, ist das Gegenteil der Fall? Mit anderen Worten, wenn ich RGB messe und in HSV konvertiere, bedeutet eine hohe Sättigung, dass es von einer kohärenten Laserquelle stammen muss? Vielen Dank.
- @Frank, nicht unbedingt ein Laser. ‚ ist es jedoch schwierig, eine gesättigte Farbe mit einem breiten Spektrum zu erhalten, da es umso schwieriger ist, eine hohe Reaktion in nur einer Komponente zu erzielen, je breiter sie ist.
- @Andrey Rubshtein, vielen Dank für Ihre Antwort. Die mks-Einheiten der Sättigungsintensität sind Energie pro Zeiteinheit pro Flächeneinheit. . Die mks-Einheiten der Sättigungsenergiefluenz sind Energie pro Flächeneinheit.Wenn Festkörperlaserpulse lang sind, 10 bis 50 ns (Nanosekunden). Bedeutet eine hohe Sättigung mit einem sehr engen Spektrum, dass sie von einer kohärenten Laserquelle stammen muss?
- @Andrey Rubshein. Sie haben völlig Recht. Ich habe gerade herausgefunden, dass LEDs Licht emittieren, das ziemlich monochromatisch ist, ebenso wie Natriumdampf-Niederdrucklichter. Gibt es Unterscheidungsmerkmale von kohärenten Laserpointern, mit denen man Laserpointerstrahlen von dem durch ein Cockpitfenster der Boeing 737-Fluggesellschaft beobachteten Gesamtbild unterscheiden kann?
Antwort
Nicht sicher, was Sie unter „tatsächlich“ verstehen, da weder RGB noch YUV entweder die Photonenfrequenz oder die typischen Stab- / Kegelreaktionen der menschlichen Augen darstellen. Sie können jedoch sehen, wie sie für Sie aussehen, indem Sie einige YCrCb-Farbfelder wie (1,1,0), (1, -1,0), (1,0,1), (1,0, -) synthetisieren 1) usw.
Hier „eine Wikipedia-Seite, die ein Diagramm enthält:
http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png
HINZUGEFÜGT: RGB und dergleichen wurden fast so entworfen (oder weiterentwickelt), dass sie einem möglichen intuitiven Verständnis der Wahrnehmung durch den Menschen entsprechen (und Farbnamen erweisen sich als kulturell erlernt). YUV ist das Gegenteil, so konzipiert, dass Rauschen im UV-Bereich (hinzugefügt zu einem verrauschten NTSC-Teilband) schwer zu erkennen und daher schwerer zu beschreiben ist. YCrCb ist eine Variation derselben Farbabbildung. Suchen Sie also nicht nach einem vorhandenen „intuitive“ Einsicht, die möglicherweise nicht existiert. Erstellen Sie möglicherweise Ihre eigenen, indem Sie das Diagramm „lernen“ und einige brandneue neuronale Verbindungen aufbauen, die derzeit möglicherweise nicht in Ihrem Gehirn vorhanden sind (oder so ähnlich).
Kommentare
- Ich habe Beispiele für andere Farbräume des Typs hinzugefügt, den ich für YCbCr erhalten möchte. Ich hoffe, dies macht die Art der Erklärung, die ich ‚ suche, klarer.
Antwort
Wenn Sie HSV / HSB verstehen, sollte es nicht schwer sein, YCbCr zu verstehen. Der B-Kanal in HSB entspricht der Chroma (chroma = Sättigung http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ ). Sie können ein RGB-Bild aufnehmen und es in Graustufen konvertieren, oder Sie können jeden Kanal des RGB in Graustufen konvertieren und sie zu einem Kanal zusammenführen. Zur Vereinfachung haben wir Pixel mit 100% Rot, 100% Grün und 70% Blau. Sie berechnen den Durchschnitt … (100 + 100 + 70) / 3 und erhalten einen Wert von 90%, was 90% der Helligkeit bedeutet In Graustufen ist es also eine sehr hellgraue Farbe. Wenn wir nun die Originalfarben in Richtung des Graustufenkanals ausdrücken möchten, benötigen wir 3 Formeln für jede Farbe (rot, grün, blau). Sie würden die Differenz des Wertes R vs. Graustufen, G gegen Graustufen und B gegen Graustufen. Dies würde 4 Kanäle (RGB + Chroma) erfordern. Aber wir können dasselbe mit 3 Kanälen tun. Wir können kleine Korrekturen am grünen Kanal vornehmen. Berechnen wir die Differenz zum grünen Kanal. Das ursprüngliche Grün beträgt 100%, der neue Wert von in Grau umgewandeltem Grün beträgt 90%. Die Differenz beträgt -10%. Ändern wir also die R- und B-Kanäle dieses Pixels um diesen Unterschied. Wir haben gerade die Gammakorrektur oder alle Kanäle durchgeführt. Die Werte der grünen Kanäle sind dieselben wie für Graustufenbilder. Wir berechnen also nicht mehr mit dem grünen Kanal. Grün ist „codiert“ „im Y … Chroma-Kanal. Der Rest der Farben (R, B) wird ebenfalls angepasst. R` = 90% des Originals oder 100% des Y, da R und B in diesem Beispiel gleich sind. Die B-Verbindung hat Differenz + 20% gegenüber dem Original, aber nachdem es mit Gammakorrektur geändert wurde, hat es Differenz + 30% gegenüber Y. Um es noch weiter zu vereinfachen, ist es wie eine Formel, bei der Sie für alle drei Verbindungen eine Addition vornehmen müssen. Die Unterschiede, die Sie erhalten für rot und blau sind Cb und Cr. Die Zeichen sagen nur, dass Sie den blauen Kanal mit dem Chroma-Kanal und den roten Kanal mit dem Chromma-Kanal verglichen haben. Daher Cb und Cr.