나는 가산 (RGB), substractive (CMYK) 및 HSV 유사 색 공간에 익숙하지만 기사 저는 현재 이미지 분할 / 객체 정의를 위해 YCbCr 색상 공간에서 작동을 이해하려고합니다.
저는 아침의 대부분을 YCbCr을 자연스럽게 설명 할 무언가를 찾는 데 보냈지 만 이해하지 못했습니다. 이 색 공간 뒤에 숨은 일반적인 아이디어 에 대한 멋지고 직관적 인 설명을 받았습니다. 여기 및 이러한
guys (모두 photo.SE에 있음)
RGB에서 YCbCr을 계산하는 공식은 wikipedia .
이 표현에 대한 동기를 얻었습니다. Y 구성 요소가 가장 중요한 요소 (인간 눈에 ) 이미지에 대한 회색조 정보.
Cb와 Cr은 색상 에 대한 정보를 전달하며 (인간의 눈 (in) 감수성 때문에) 품질 저하없이 압축됩니다. 하지만 각 색차 구성 요소가 실제로 무엇을 나타내는 것일까 요?
기사 작성자가 다음과 같이 언급했듯이 ” 색차 정보는 객체의 정의에서 가장 중요합니다. “라는 접근 방식에서”Y는 강도, Cb 및 Cr은 색상 정보를 어떻게 든 전달합니다 “YCbCr에 대한 이해 수준으로 내가 읽고있는 내용을 완전히 이해할 수 없습니다.
저는 “Cb는 …, Cr은 …”또는 “XY를 통해보고 있다고 상상하면 실제로 Cb 구성 요소를보고있는 것입니다.”라는 줄을 따라 답을 찾고 있습니다. , 또는 각 구성 요소가 색상 정보를 함께 전달한다는 점뿐만 아니라 각 구성 요소에서 개별적으로 전달하는 정보를 이해하는 데 도움이되는 다른 방법입니다.
편집
찾고있는 유형의 다른 색상 공간에 대한 직관적 인 설명의 예를 들어 보겠습니다.
RGB : 컬러 플래시를 비추는 것처럼 검은 벽에 빛 : 파란색 손전등으로 빛나면 파란색 반사가 보입니다. 빨간색 손전등을 추가하면 파란색과 빨간색이 혼합 된 자홍색 반사가 표시됩니다.
CMYK : 수채화를 혼합하는 것처럼 “표면이 반사하는 색상에 추가”(예 : 배경에서 색상을 뺍니다)하므로 노란색과 청록색을 혼합하면 녹색이 반사되어 녹색입니다.
HSV : 어린 아이들은 밝지 않고 채도가 높은 물체에 끌립니다 (값 ). 색조 구성 요소는 “색상을 제공”하는 반면 채도가 낮다는 것은 색상이 흰색으로 “희석”된다는 것을 의미합니다. 가치의 변화는 모든 것을 더 밝게 또는 더 어둡게 만듭니다.
이 정의를 통해 각 색상 공간에 대한 차트를 암기하지 않고도 각 색상 공간의 색상 표현이 의미하는 바에 대한 직관적 인 느낌을 얻을 수있었습니다. .
Answer
YUV (또는 YCbCr)는 HSV와 비슷하지만 좌표가 다릅니다. (YUV와 YCbCr의 차이점은 한계-대부분 정확한 공식과 관련됨).
$ V $ 구성 요소는 동일합니다. $ (S, H) $ 는 극좌표로, $ (U, V) $ 는 카티 시안으로 생각할 수 있습니다. $ H $ 는 각도이고 $ S $ 는 반경입니다. 대략적인 변환은 다음과 같습니다.
$ U = S \ cdot \ cos (H) $
$ V = S \ cdot \ sin ( H) $
자세한 정보는 이 링크를 참조하세요. rmation.
직관 목록에 추가 할 또 다른 사항 :
채도는 스펙트럼 관점에서 색상이 얼마나 순수한지입니다 . 예를 들어, 레이저는 매우 좁은 스펙트럼을 가지고있어 채도가 높다는 것을 의미합니다.
설명
- YUV와 YUV의 차이점에 대한 설명을 추가 할 수 있습니까? YCbCr, 완전성을 위해?
- @Andrey Rubshtein, 레이저의 채도가 높으면 그 반대가 사실입니까? 즉, RGB를 측정하고 HSV로 변환하면 높은 채도가 일관된 레이저 소스에서 비롯된 것이어야 함을 의미합니까? 감사합니다.
- @Frank, 반드시 레이저는 아닙니다. 그러나 ' 넓은 스펙트럼으로 포화 된 색상을 갖는 것은 어렵습니다. 그 이유는 넓을수록 하나의 구성 요소에서만 높은 응답을 얻기가 더 어렵 기 때문입니다.
- @Andrey Rubshtein, 답변 해 주셔서 감사합니다. Saturation Intensity의 mks 단위는 단위 면적당 단위 시간당 에너지입니다. . 포화 에너지 플루 언스의 mks 단위는 단위 면적당 에너지입니다.고체 레이저 펄스가 긴 경우 10 ~ 50ns (나노초) 매우 좁은 스펙트럼의 높은 채도는 일관된 레이저 소스에서 생성되어야 함을 의미합니까?
- @Andrey Rubshein. 당신은 완전히 옳습니다. 저는 저압 나트륨 조명처럼 LED가 거의 단색 인 빛을 방출한다는 것을 방금 알아 냈습니다. 보잉 737 항공기 조종실 창을 통해 관찰 된 전체 이미지와는 별도로 레이저 포인터 빔을 구분하는 데 사용할 수있는 일관된 레이저 포인터의 특징이 있습니까?
답변
RGB도 YUV도 광자 주파수 나 일반적인 사람의 눈 막대 / 원추형 반응을 나타내지 않기 때문에 “실제”가 의미하는 바가 확실하지 않습니다. 그러나 (1,1,0), (1, -1,0), (1,0,1), (1,0,-과 같은 일부 YCrCb 색상 패치를 합성하여 그들이 어떻게 보이는지 볼 수 있습니다. 1) 등
다음은 차트가 포함 된 Wikipedia 페이지입니다.
http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png
추가됨 : RGB 등은 인간의 직관적 인 인식 이해와 일치하도록 거의 설계 (또는 진화)되었습니다 (색상 이름은 문화적으로 학습 된 것으로 판명 됨). YUV 반대로 UV 영역의 노이즈 (시끄러운 NTSC 서브 밴드에 추가됨)가보기 어렵고 설명하기 어렵도록 설계되었습니다. YCrCb는 동일한 색상 매핑의 변형입니다. 따라서 기존 항목을 찾지 마십시오. 존재하지 않을 수있는 “직관적 인”통찰력. 아마도 차트를 “학습”하고 현재 뇌에 존재하지 않을 수도있는 새로운 신경 연결 (또는 이와 유사한 것)을 구축하여 나만의 것을 만들 수도 있습니다.
댓글
- YCbCr에 대해 얻고 자하는 유형의 다른 색상 공간에 대한 예제를 추가했습니다. 이것이 제가 앞으로 나아가고 자하는 설명 유형이 ' 더 명확 해지기를 바랍니다.
답변
HSV / HSB를 이해하면 YCbCr을 이해하는 것이 어렵지 않습니다. HSB의 B 채널은 채도 (chroma = 채도 http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ )에 해당합니다. rgb 이미지를 가져와 그레이 스케일로 변환하거나 RGB의 모든 채널을 그레이 스케일로 변환하여 하나의 채널로 병합 할 수 있습니다. 단순화를 위해 100 % 빨간색, 100 % 녹색 및 70 % 파란색 픽셀을 사용합니다. 평균 … (100 + 100 + 70) / 3을 계산하고 90 % 값을 얻습니다. 이는 밝기의 90 %를 의미합니다. . 따라서 그레이 스케일에서는 매우 밝은 회색입니다. 이제 원래 색상을 그레이 스케일 채널로 표현하려면 모든 색상 (빨강, 녹색, 파랑)에 대해 3 가지 공식이 필요합니다. 값 R 대 그레이 스케일, G vs 그레이 스케일, B vs 그레이 스케일. 4 개 채널 (RGB + 크로마)이 필요합니다.하지만 3 개 채널로 똑같이 할 수 있습니다. 녹색 채널에 약간의 보정을 할 수 있습니다. 녹색 채널과의 차이를 계산해 보겠습니다. 원래 녹색은 100 %, 회색으로 변환 된 녹색의 새 값은 90 %입니다. 차이는 -10 %입니다. 이 차이에 의해이 픽셀의 R 및 B 채널을 변경해 보겠습니다. 감마 보정 또는 모든 채널을 방금 수행했습니다. 녹색 채널 값은 회색조 이미지와 동일합니다. 따라서 더 이상 녹색 채널로 계산하지 않습니다. 녹색은 “인코딩됩니다.” “Y … 크로마 채널에서. 나머지 색상 (R, B)도 조정됩니다. R` = 원본의 90 % 또는이 예에서 R과 B가 동일하기 때문에 Y의 100 %. B 화합물은 원본에 비해 20 % 차이가 있지만 감마 보정으로 변경 한 후에는 Y에 대해 + 30 % 차이가 있습니다. 더 단순화하기 위해 세 가지 화합물을 모두 추가해야하는 공식과 같습니다. 빨간색과 파란색은 Cb와 Cr입니다. 캐릭터는 파란색 채널을 크로마 채널과 빨간색 채널을 Chromma 채널과 비교했다고 말합니다. 따라서 Cb와 Cr입니다.