Interpretación de los pesos beta positivos y negativos en la ecuación de regresión

Recibí esta pregunta elemental por correo electrónico:

En una ecuación de regresión, estoy en lo cierto al pensar que si el valor beta es positivo, la variable dependiente ha aumentado en respuesta a un mayor uso de la variable independiente, y si es negativa, la variable dependiente ha disminuido en respuesta a un aumento en la variable independiente, ¿similar a la forma en que lee las correlaciones?

Comentarios

  • @Jeromy, por ponderaciones beta, ¿te refieres a los coeficientes de regresión lineal?
  • @mp Convencionalmente, las betas son los coeficientes cuando todas las variables han sido estandarizadas. (Eso debería hacerlos instantáneamente reconocibles como correlaciones parciales, respondiendo la pregunta … 🙂
  • @ayush Me doy cuenta de que es una pregunta elemental, así que no dude en no responderla usted mismo. Sin embargo, creo que el sitio puede beneficiarse de tener preguntas en varios niveles de dificultad; y yo ' me gustaría agregar mi propia respuesta después de darles a otros la oportunidad de responder que retoma algunos problemas generales.
  • Buen punto, @Jeromy. Estoy ' seguro de que @ayush no habría proporcionado un comentario de este tipo (que podría malinterpretarse fácilmente como grosero o algo peor) si un nuevo usuario planteara la misma pregunta. Deje que ' s tomen esto como testimonio de su gran reputación aquí y vean si alguna de las respuestas ayuda a esclarecer a su corresponsal.
  • @whuber. buen punto. Como consultor de estadísticas en psicología, a veces recibo preguntas por correo electrónico que son bastante elementales. Mi situación ideal es animar a estos estudiantes a que publiquen directamente aquí. En general, prefiero responder estas preguntas en este sitio en lugar de enviar una respuesta por correo electrónico al estudiante. De esa manera, mi respuesta puede ser un recurso continuo para Internet y otros pueden dar una respuesta aún mejor.

Answer

Al explicar el significado del coeficiente de regresión, encontré que la siguiente explicación es muy útil. Supongamos que tenemos la regresión

$$ Y = a + bX $$

Digamos que $ X $ cambia por $ \ Delta X $ y $ Y $ cambia por $ \ Delta Y $ . Como tenemos la relación lineal, tenemos

$$ Y + \ Delta Y = a + b (X + \ Delta X) $$

Dado que $ Y = a + bX $ obtenemos que

$$ \ Delta Y = b \ Delta X. $$

Teniendo esto en cuenta, es fácil ver que si $ b $ es positivo, el cambio positivo en $ X $ dará como resultado cambio positivo en $ Y $. Si $ b $ es negativo, el cambio positivo en $ X $ resultará en un cambio negativo en $ Y $.

Nota: Traté esta pregunta como una cuestión pedagógica, es decir, proporcioné una explicación simple.

Nota 2: Como señaló @whuber, esta explicación tiene una suposición importante de que la relación se cumple para todos los valores posibles de $ X $ y $ Y $. En realidad, esta es una suposición muy restrictiva, por otro lado, la explicación es válida para valores pequeños de $ \ Delta X $, ya que el teorema de Taylor dice que las relaciones que pueden expresarse como funciones diferenciables (y esta es una suposición razonable para hacer ) son lineales localmente.

Comentarios

  • … asumiendo que el comportamiento es verdaderamente lineal en todo el rango de valores $ X $! (Una respuesta más cautelosa podría expresar la misma idea en términos de cambios promedio y también evitar cualquier indicio de sugerir que la relación es causal).
  • @whuber, sabía que poner el palabra mejor no fue una buena elección 🙂 Gracias por tu comentario, ' intentaré reformular la respuesta.
  • @mp " Lo mejor " no es ' t necesariamente un problema. Yo ' estoy tratando de hacerte pasar un mal momento 🙂 (Pero " inducir " me llamó la atención …) Si ' realmente buscas el " mejor " explicación, recuerde que un punto común de confusión entre los no iniciados es cómo interpretar los coeficientes de interacción: después de todo, usted puede ' t variar independientemente (digamos) $ XY $; lo hace variando $ X $ o $ Y $ o ambos. Entonces, una explicación que maneje esa situación sería muy bienvenida.
  • @whuber, yes induce fue una mala elección. ' dejaré la explicación de los términos de interacción para otra persona 🙂
  • @mp re Nota 2: Ah, Taylor ' s ¡Teorema! Pero los datos reales no son ' ni siquiera continuos, mucho menos diferenciables. El modelo podría disfrutar de estas propiedades matemáticas. Especialmente en las explicaciones para los no iniciados, puede valer la pena distinguir el comportamiento del modelo ' del comportamiento que esperamos de los datos.Además, el Teorema de Taylor ' s dice poco sobre el rango de valores $ X $ sobre los que se mantiene la casi linealidad. ¡El modelo de regresión dice que este rango es infinito!

Respuesta

Como señala @gung, existen diferentes convenciones con respecto a el significado de ($ \ beta $, es decir, «beta»). En la literatura estadística más amplia, a menudo se usa beta para representar coeficientes no estandarizados. Sin embargo, en psicología (y quizás en otras áreas), a menudo hay una distinción entre b para coeficientes no estandarizados y beta para coeficientes estandarizados. Esta respuesta asume que el contexto indica que beta representa coeficientes estandarizados:

  • Pesos beta: Como mencionó @whuber, los «pesos beta» son por convención coeficientes de regresión estandarizados (consulte wikipedia sobre coeficientes estandarizados ). En este contexto, $ b $ se usa a menudo para coeficientes no estandarizados y $ \ beta $ se usa a menudo para coeficientes estandarizados.

  • Interpretación básica : una ponderación beta para una variable predictora dada es la diferencia predicha en la variable de resultado en unidades estándar para un aumento de una desviación estándar en la variable predictora dada manteniendo todos los demás predictores constante.

  • Recurso general sobre regresión múltiple: La pregunta es elemental e implica que debe leer algún material general sobre regresión múltiple ( aquí hay una descripción elemental de Andy Field ).

  • Causalidad: Tenga cuidado con lenguaje como «la variable dependiente ha aumentado en respuesta a un mayor uso de la variable independiente» . Tal lenguaje tiene connotaciones causales. Los pesos beta por sí mismos no son suficientes para justificar una interpretación causal. Necesitaría evidencia adicional para justificar una interpretación causal.

Comentarios

  • +1 Tenga en cuenta, sin embargo, que son convenciones diferentes con respecto al uso de términos en estadística. Por ejemplo, ' beta ' / $ \ beta $ se utiliza a menudo para indicar el verdadero parámetro que gobierna el proceso de generación de datos, & ' beta hat ' / $ \ hat \ beta $ se refiere a la estimación de pendiente calculada en su muestra. En este caso, no implican que las variables hayan sido estandarizadas 1º. Este uso variado es desafortunado, pero no obstante real. Es importante tener claro cómo se usan los términos cuando uno los encuentra, en lugar de asumir que todos quieren decir lo mismo.
  • @gung buen punto; ' he actualizado mi respuesta para incorporar esto.

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *