Estoy haciendo una regresión lineal con una variable dependiente transformada. La siguiente transformación se realizó para que el supuesto de normalidad de los residuos La variable dependiente no transformada estaba sesgada negativamente y la siguiente transformación la hizo casi normal:
$$ Y = \ sqrt {50-Y_ {orig}} $$
donde $ Y_ {orig} $ es la variable dependiente en la escala original.
Creo que tiene sentido usar alguna transformación en los coeficientes $ \ beta $ para volver a la escala original. Usando la siguiente ecuación de regresión,
$$ Y = \ sqrt {50-Y_ {orig}} = \ alpha + \ beta \ cdot X $$
y fijando $ X = 0 $, tenemos
$$ \ alpha = \ sqrt {50-Y_ {orig}} = \ sqrt {50- \ alpha_ {orig}} $$
Y finalmente ,
$$ \ alpha_ {orig} = 50- \ alpha ^ 2 $$
Usando la misma lógica, encontré
$$ \ beta_ { orig} = \ alpha \ space (\ alpha-2 \ beta) + \ beta ^ 2 + \ alpha_ {orig} -50 $$
Ahora las cosas funcionan muy bien para un modelo con 1 o 2 predictores; los coeficientes retrotransformados se parecen a los originales, solo que ahora puedo confiar en los errores estándar. El problema surge cuando se incluye un término de interacción, como
$$ Y = \ alpha + X_1 \ beta_ {X_1} + X_2 \ beta_ {X_2} + X_1X_2 \ beta_ {X_1X_2} $$
Entonces, las transformaciones hacia atrás para $ \ beta $ s no son tan cercanas a las de la escala original, y «no estoy seguro de por qué sucede eso. También» no estoy seguro de si la fórmula encontrada para back- transformar un coeficiente beta se puede utilizar como para el 3er $ \ beta $ (para el término de interacción). Antes de entrar en álgebra loca, pensé en pedir consejo …
Comentarios
- ¿Cómo se define $ \ alpha_ {orig} $ y $ \ beta_ {orig} $?
- Como el valor de alfa y beta en las escalas originales
- Pero, ¿qué significa eso?
- Para mí Parece un concepto sin sentido. Estoy de acuerdo con la respuesta de gung '.
Respuesta
Un problema es que ha escrito
$$ Y = α + β⋅X $$
Eso es un simple determinista (es decir, no aleatorio ) modelo. En ese caso, podría volver a transformar los coeficientes en la escala original, ya que es sólo una cuestión de álgebra simple. Pero, en la regresión habitual, solo tiene $ E (Y | X) = α + β⋅X $; ha dejado el término de error fuera de su modelo. Si la transformación de $ Y $ a $ Y_ {orig} $ no es lineal, es posible que tenga un problema ya que $ E \ big (f (X) \ big) ≠ f \ big (E (X) \ big) $ , en general. Creo que puede tener que ver con la discrepancia que estás viendo.
Editar: Tenga en cuenta que si la transformación es lineal, puede volver a transformar para obtener estimaciones de los coeficientes en la escala original, ya que la expectativa es lineal.
Comentarios
- + 1 por explicar por qué no podemos ' volver a transformar las betas.
Respuesta
Saludo tus esfuerzos aquí, pero estás ladrando al árbol equivocado. No transforma las betas hacia atrás. Su modelo se mantiene en el mundo de los datos transformados. Si desea hacer una predicción, por ejemplo, vuelve a transformar $ \ hat {y} _i $, pero eso es todo. Por supuesto, también puede obtener un intervalo de predicción calculando los valores límite alto y bajo, y luego transformarlos de nuevo también, pero en ningún caso se transforman las betas.
Comentarios
- ¿Qué hacer con el hecho de que los coeficientes retrotransformados se acercan mucho a los obtenidos al modelar la variable no transformada? ¿No ' t eso permite alguna inferencia en la escala original?
- No ' no lo sé exactamente. Depende de muchas cosas. Mi primera suposición es que ' estás teniendo suerte con tu primer par de betas, pero luego tu suerte se acaba. Tengo que estar de acuerdo con @ mark999 en que " las estimaciones que ' íbamos a obtener eran los datos originales adecuados para la regresión lineal " no ' realmente tiene sentido; Ojalá lo hiciera &, parece que a primera vista se sonroja, pero desafortunadamente no ' t. Y no ' no autoriza ninguna inferencia en la escala original.
- @gung para transformaciones no lineales (por ejemplo, box cox): puedo transformar valores ajustados como así como los intervalos de predicción, pero puedo ' t transformar betas ni intervalos de coeficientes para los betas. ¿Existe alguna limitación adicional que deba tener en cuenta? Por cierto, este es un tema muy interesante, ¿dónde puedo obtener una mejor comprensión?
- @mugen, es ' es difícil decir qué más debe tener en cuenta de.Una cosa que quizás se deba tener en cuenta es que la transformación hacia atrás de y-hat le da la mediana condicional, mientras que la y-hat no transformada hacia atrás (bleck) es la media condicional. Aparte de eso, este material debería incluirse en un buen libro de texto de regresión.
- @mugen, ' de nada. No dude en hacer más preguntas a través de los mecanismos normales (haciendo clic en
ASK QUESTION
); habrá más recursos para responder, atraerá la atención de más CVers, & la información será más accesible para la posteridad.