YCbCr色空間のCbおよびCrコンポーネントを理解する

私は加法(RGB)、サブストラクティブ(CMYK)、およびHSVのような色空間に精通していますが、記事私は現在、画像セグメンテーション/オブジェクト定義のために YCbCr 色空間で動作することを理解しようとしています。

私は朝のほとんどをYCbCrを自然に説明する何かを探していましたが、それがわかりません。この色空間の背後にある一般的な考え方 ここ、およびこれら

みんな(すべてphoto.SEにあります)。

RGBからYCbCrを計算するための式は、 wikipedia

この表現の動機を得て、Yコンポーネントに最も重要なものが含まれていることがわかりました(人間の目には)画像に関するグレースケール情報。

CbとCrにはに関する情報が含まれていることがわかりました。また、(人間の目(の)感性のため)、次のことができます。目に見える品質の低下なしに圧縮されます。しかし、各クロミナンスコンポーネントは実際に何を表していますか?

記事の著者が述べているように「クロミナンス情報は、オブジェクトの定義において最も重要であり、現在の「Yは強度であり、CbとCrは何らかの形で色情報を伝達する」レベルのYCbCrで読んでいるものを完全に理解することはできません。

私は「Cbは…、Crは…」または「XYを通して/ XYを見ると想像すると、実際にはCbコンポーネントを見ている…」という線に沿って答えを探しています。 、またはコンポーネントが一緒になって色情報を運ぶだけでなく、各コンポーネントによって別々に運ばれる情報を理解するのに役立つ他の方法。

編集

私が探しているタイプの他の色空間の直感的な説明の例を挙げましょう:

RGB :色付きのフラッシュを照らすように黒い壁の光:青い懐中電灯で照らすと、青い反射が見られます。赤い懐中電灯を追加すると、青と赤が混ざったマゼンタの反射が表示されます。

CMYK :水彩画を混ぜるのと同じように、「表面が反射する色に追加」(つまり、背景から色を差し引く)なので、黄色とシアンを混ぜると、緑が反射し、次のようになります。緑色。

HSV :小さな子供たちは、明るくなく、飽和度の高いオブジェクトに惹かれます(値)。色相成分は「色を与える」ものですが、彩度が低いと、色が白で「希釈」されることを意味します。値を変えると全体が明るくなったり暗くなったりします。

この定義により、各色空間のチャートを覚えなくても、各色空間の色表現が何を意味するのかを直感的に理解することができました。 。

回答

YUV(またはYCbCr)はHSVに似ていますが、座標が異なります(YUVとYCbCrの違いは限界-主に正確な式に関連しています。

$ V $ コンポーネントは同じです。 $ (S、H)$ は極座標、 $(U、V)$ はカルテシアンと考えることができます。 $ H $ は角度、 $ S $ は半径です。大まかな変換は次のようになります。

$ U = S \ cdot \ cos(H)$

$ V = S \ cdot \ sin( H)$

詳細については、このリンクをご覧ください。 rmation。

直感リストに追加するもう1つのこと:

彩度は、スペクトルの観点から見た色の純度です。たとえば、レーザーのスペクトルは非常に狭く、飽和度が高いことを意味します。

コメント

  • YUVとの違いの説明を追加できますかYCbCr、完全を期すために?
  • @Andrey Rubshtein、レーザーの彩度が高い場合、その逆は本当ですか?言い換えると、RGBを測定してHSVに変換する場合、彩度が高いということは、コヒーレントレーザー光源から発生している必要があることを意味しますか?ありがとう。
  • @Frank、必ずしもレーザーではありません。ただし、'広いスペクトルで彩度の高い色を得るのは困難です。幅が広いほど、1つのコンポーネントだけで高い応答を得ることが難しくなります。
  • @Andrey Rubshtein、ご回答ありがとうございます。飽和強度のmks単位は、単位面積あたりの単位時間あたりのエネルギーです。 。飽和エネルギーフルエンスのmks単位は、単位面積あたりのエネルギーです。固体レーザーパルスが長い場合、10〜50 ns(ナノ秒)。非常に狭いスペクトルでの高飽和は、コヒーレントレーザー光源から発生している必要があることを意味しますか?
  • @Andrey Rubsheinあなたは完全に正しいです..私は、低圧ナトリウムランプがそうであるように、LEDがほとんど単色の光を発することをちょうど知りました。ボーイング737の航空会社のコックピットの窓から観察された画像全体とは別に、レーザーポインターのビームを区別するために使用できるコヒーレントレーザーポインターの特徴はありますか?

回答

RGBもYUVも光子周波数または典型的な人間の目のロッド/コーン応答を表していないため、「実際に」何を意味するのかわからない。ただし、(1,1,0)、(1、-1,0)、(1,0,1)、(1,0、-などのYCrCbカラーパッチを合成することで、それらがどのように見えるかを確認できます。 1)など。

チャートを含むウィキペディアのページ:

http://en.wikipedia.org/wiki/File:YCbCr-CbCr_Scaled_Y50.png

追加:RGBなどは、人間が直感的に知覚を理解できるように設計(または進化)されています(そして色の名前は文化的に学習されていることがわかります)。YUVは反対で、UV領域のノイズ(ノイズの多いNTSCサブバンドに追加される)が見にくく、説明が難しいように設計されています。YCrCbは、同じカラーマッピングのバリエーションです。したがって、既存のものを探しないでください。存在しないかもしれない「直感的な」洞察。おそらく、チャートを「学習」し、現在脳に存在しない可能性のあるまったく新しい神経接続(またはそのようなもの)を構築することによって、独自のものを作成します。

コメント

  • YCbCrで取得したいタイプの他の色空間の例を追加しました。これにより、私が'前に求めている説明の種類がより明確になることを願っています。

回答

HSV / HSBを理解するとき、YCbCrを理解するのは難しいことではありません。 HSBのBチャネルは彩度に対応します(彩度=彩度 http://vident.com/products/shade-management/color-theory/understanding-color-overview/hue-value-and-chroma/ )。 rgb画像を取得してグレースケールに変換するか、RGBのすべてのチャネルをグレースケールに変換して1つのチャネルにマージすることができます。簡単にするために、100%赤、100%緑、70%青のピクセルを作成します。平均を計算します…(100 + 100 + 70)/ 3、値90%を取得します。これは、明るさの90%を意味します。 。したがって、グレースケールでは非常に明るいグレー色です。ここで、元の色をグレースケールチャネルに向けて表現する場合は、すべての色(赤、緑、青)に対して3つの式が必要になります。値Rとの差を計算します。グレースケール、G対グレースケール、B対グレースケール。これには4チャンネル(RGB +クロマ)が必要です。ただし、3チャンネルでも同じことができます。緑チャンネルに小さな補正を加えることができます。緑チャンネルとの差を計算してみましょう。元の緑は100%、灰色に変換された緑の新しい値は90%です。差は-10%です。それでは、この違いによってこのピクセルのRチャネルとBチャネルを変更しましょう。ガンマ補正またはすべてのチャネルを実行しました。緑チャネルの値はグレースケール画像の場合と同じになります。したがって、緑チャネルでは計算しなくなります。緑は「エンコードされます」 “Y …クロマチャネルで。残りの色(R、B)も調整されます。この例ではRとBが等しいため、R` =元の90%またはYの100%です。B化合物は元の値に対して+ 20%の差がありますが、ガンマ補正で変更した後は、Yに対して+ 30%の差があります。さらに単純化するために、3つの化合物すべてを加算する必要がある式のようなものです。赤と青はCbとCrです。文字は、青チャネルをクロマチャネルに、赤チャネルをクロマチャネルに比較したことを示しています。したがって、CbとCrです。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です