회귀 계수의 역변환

변환 된 종속 변수로 선형 회귀를 수행하고 있습니다. 잔차의 정규성을 가정하기 위해 다음 변환이 수행되었습니다. 변환되지 않은 종속 변수는 음으로 치우 쳤으며 다음 변환은 정상에 가깝게 만들었습니다.

$$ Y = \ sqrt {50-Y_ {orig}} $$

여기서 $ Y_ {orig} $는 원래 척도의 종속 변수입니다.

$ \ beta $ 계수에 대한 일부 변환을 사용하여 원래 척도로 돌아가는 것이 합리적이라고 생각합니다. 다음 회귀 방정식을 사용하여

$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$

$ X =를 수정하여 0 $, 우리는

$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$

그리고 마지막으로 ,

$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$

동일한 논리를 사용하여

$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$

이제 매우 잘 작동합니다. 1 개 또는 2 개의 예측 변수가있는 모델; 역변환 된 계수는 원래 계수와 비슷하지만 이제는 표준 오차를 신뢰할 수 있습니다. 문제는

$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$

그러면 $ \ beta $ s에 대한 역변환이 원래 스케일의 역변환과 그다지 가깝지 않습니다. 그 이유가 무엇인지 잘 모르겠습니다. 공식이 역변환을 했는지도 확실하지 않습니다. 베타 계수를 변환하는 것은 세 번째 $ \ beta $ (상호 작용 항의 경우)와 같이 사용할 수 있습니다. 미친 대수학을 시작하기 전에 조언을 구해야겠다고 생각했습니다 …

댓글

  • $ \ alpha_ {orig}를 어떻게 정의하나요? $ 및 $ \ beta_ {orig} $?
  • 원래 스케일의 알파 및 베타 값
  • 하지만 그게 무슨 의미일까요?
  • 나에게 의미없는 개념 인 것 같습니다. gung '의 답변에 동의합니다.

Answer

한 가지 문제는 귀하가 작성했다는 것입니다.

$$ Y = α + β⋅X $$

단순한 결정 론적입니다 (즉, 무작위 ) 모델. 이 경우 간단한 대수의 문제 일 뿐이므로 계수를 원래 척도로 역변환 할 수 있습니다. . 그러나 일반적인 회귀에서는 $ E (Y | X) = α + β⋅X $ 만 있습니다. 모델에서 오류 항을 제외했습니다. $ Y $에서 $ Y_ {orig} $ 로의 변환이 비선형이면 $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ 이후 문제가있을 수 있습니다. , 일반적으로. 나는 그것이 당신이보고있는 불일치와 관련이 있다고 생각합니다.

편집 : 변환이 선형이면 역변환을 통해 원래 척도의 계수 추정치를 얻을 수 있습니다. 기대 값은 선형이기 때문입니다.

댓글

  • + 이유 를 ' 베타를 역변환 할 수없는 이유를 설명하는 1입니다.

답변

여기에서 귀하의 노력에 경의를 표하지만 귀하는 잘못된 나무를 짖고 있습니다. 변환 베타를 백업하지 않습니다. 모델은 변환 된 데이터 세계를 유지합니다. 예를 들어 예측을하려면 $ \ hat {y} _i $를 다시 변환하지만 그게 전부입니다. 물론 상한 및 하한 값을 계산하여 예측 간격을 얻은 다음 다시 변환 할 수도 있지만 어떤 경우에도 베타를 다시 변환하지 않습니다.

코멘트

  • 역변환 된 계수가 변환되지 않은 변수를 모델링 할 때 얻은 계수에 매우 가까워진다는 사실을 어떻게해야합니까? ' 원래 규모에 대한 추론을 허용하지 않습니까?
  • 정확히 알지 못합니다 '. 여러 가지에 따라 달라질 수 있습니다. 내 첫 번째 추측은 ' 첫 두 개의 베타 버전으로 운이 좋았지 만 운이 바닥났다는 것입니다. " '가 얻은 추정치가 선형 회귀에 적합한 원래 데이터임을 @ mark999와 동의해야합니다 "는 ' 실제로 말이되지 않습니다. & 처음에는 붉어지는 것처럼 보이지만 불행히도 '하지 않았습니다. 그리고 ' 원래 척도에 대한 추론에 대한 라이선스를 부여하지 않습니다.
  • 비선형 변환 (예 : box cox)의 경우 @gung : 적합 값을 다음과 같이 변환 할 수 있습니다. 예측 간격뿐 아니라 ' 베타를 변환하거나 베타에 대한 계수 간격을 변환 할 수 없습니다. 알아야 할 추가 제한 사항이 있습니까? btw, 이것은 매우 흥미로운 주제입니다. 어디에서 더 나은 이해를 얻을 수 있습니까?
  • @mugen, ' 당신이 알아야 할 다른 것에 대해 말하기가 어렵습니다. 의.한 가지 염두에 두어야 할 점은 y-hat의 역변환은 조건부 중앙값 을 제공하는 반면 역변환되지 않은 (bleck) y-hat은 조건부 평균이라는 것입니다. 그 외에는 좋은 회귀 교과서에서이 자료를 다루어야합니다.
  • @mugen, ' 환영합니다. 일반적인 메커니즘을 통해 더 많은 질문을 할 수 있습니다 (ASK QUESTION 클릭). 답변을위한 더 많은 리소스가있을 것이며 더 많은 CVer의 관심을 받게 될 것입니다. & 후손이 정보에 더 쉽게 액세스 할 수 있습니다.

답글 남기기

이메일 주소를 발행하지 않을 것입니다. 필수 항목은 *(으)로 표시합니다