Actividades

Regresión lineal múltiple

Los estudiantes comparan múltiples variables independientes como predictoras de una variable dependiente. Ellos exploran en el tema de correlación y líneas de mejor ajuste.

¿En qué consiste la actividad Regresión lineal múltiple ?

Correlación y regresión son elementos utilizados en análisis estadístico para determinar qué tan fuerte es la relación entre dos variables. Ejemplos de variables que pueden estar correlacionadas son los siguientes:

  • La edad de una persona y su estatura
  • Las horas de estudio para un examen y la calificación obtenida
  • La velocidad y el tiempo transcurrido para viajar 10 millas

La correlación se usa para determinar la fuerza y también la dirección de la relación entre las variables. Dos variables están correlacionadas positivamente cuando si una de ellas crece la otra también crece. La correlación es negativa cuando si una variable crece la otra decrece. Se utiliza Regresión Lineal para encontrar la linea de mejor ajuste, entendiendo por esto la línea alrededor de la cual están dispersos los puntos de los datos.  Las correlaciones positivas y negativas  se corresponden con la pendiente de la recta de mejor ajuste. El coeficiente de correlación es una medida de qué tan fuerte es la relación.

Las regresiones múltiples se usan al tratar de establecer un buen indicador para una variable aleatoria. Por ejemplo, si usted piensa comprar un auto nuevo, puede usar el precio del auto como su variable dependiente y entonces examinar su correlación con variables "predictoras" como caballos de fuerza, eficiencia del combustible, precio de reventa, calificación en seguridad en caso de choque, etc. Al hacer el análisis  podria encontrar que la calificación en seguridad es mejor indicador del precio total del auto que el número de asientos que tenga. Podría tambien descubrir que ciertos autos deberían tener un precio más alto o más bajo según sus características, pudiendo así identificar el mejor auto por determinado precio. 

 

Recursos para la clase

Actividad

¿Cómo puedo utilizar esta actividad?

Descripción

Esta actividad ayuda a los estudiantes en la comparación de múltiples variables independientes como predictoras de una variable dependiente. Los estudiantes pueden explorar correlaciones y líneas de mejor ajuste

Controles y Resultados

Ingreso de datos
Primero, el usuario necesita ingresar los datos. Para hacerlo, cada línea debe tener cinco elementos de información. El primero es la variable dependiente. En el ejemplo del auto, aquí es donde se ingresa el precio de cada uno. En seguida está la variable independiente de dimensión 1, después de dimensión 2, etc. Es posible que haya visto anteriormente coordenadas similares para puntos del plano, en las que los valores de X y de Y representan ciertas cualidades de los puntos (es decir, su posición). En esta aplicación cada dimensión representa también alguna cualidad del auto. Las cinco dimensiones son "precio", "portavasos", "motor(litros)", "precio de reventa" y "calificacion de seguridad". Entonces, la línea de datos para un auto que vale $10.000 dólares, tiene 4 portavasos, un motor de seis litros, un precio de reventa igual a la mitad del precio original y una calificación perfecta en seguridad en una escala  sobre 10, sería (10,4,6,5,10) 

Después de presionar Actualizar Datos cada una de las cuatro dimensiones será graficada contra la variable dependiente y aparecerán dos líneas en cada gráfica

(Actualizar datos)

Línea verde de mejor ajuste
Para modificar la recta verde de mejor ajuste utilice las barras deslizadoras púrpura y verde para ajustar la pendiente y el intercepto en el eje Y, respectivamente. El rango de los deslizadores es [-10, 9.5], lo cual hace imposible graficar una recta vertical. Si la recta de mejor ajuste es vertical, la ecuación roja mostrará la ecuación de una recta vertical (por ejemplo, x=3)


Para juzgar qué tan preciso es el ajuste de la recta verde de mejor ajuste hecho por el usuario, en la esquina inferior derecha se muestra la suma de los cuadrados de las diferencias.  

Suma de los cuadrados

Estos cuadrados se pueden integrar sobre las cuatro dimensiones, o verse individualmente seleccionando o no la casilla de verificación Integrar suma de cuadrados

Línea roja de mejor ajuste

La ecuación y correlación, r, se calculan para la línea roja de mejor ajuste con el fin de establecer qué tan bien la linea representa los datos. Para mayor información sobre correlación, ver la  discusión en Coeficientes de Correlación 


 

Recursos y contexto curricular

La aplicacion sobre regresión múltiple se diseñó para que los estudiantes puedan graficar una variable dependiente contra cuatro variables independientes cuando se busca un buen indicador para la variable dependiente. La aplicación calcula automáticamente la recta de mejor ajuste para los datos de cada dimension y su correspondiente r-valor. Sin embargo, para la línea de  mejor ajuste obtenida por el usuario, solamente se muestra la suma de  los cuadrados de las desviaciones. Esto es particularmente importante  cuando una de las dimensiones tiene correlación igual a cero. Aunque se pueden cambiar la pendiente y el intercepto en Y de la recta verde de mejor ajuste para reducir la suma de los cuadrados, no se está cambiando la habilidad de esa dimensión para predecir la variable dependiente. Entonces, cambiar la recta de mejor ajuste para reducir la suma de los cuadrados posiblemente no puede afectar la falta de influencia de esa dimensión sobre las otras dimensiones.

Esta actividad es mejor para  trabajo individual o en grupos pequeños durante unos veinte a veinticinco minutos si se utilizan las preguntas de exploración 


 

Ubicación en el currículo de matemáticas

  • Enseñar a los estudiantes cómo los datos influyen en la recta de mejor ajuste
  • Proporcionar a los estudiantes prácticas en determinación de la recta de mejor ajuste.
  • Permitir que los estudiantes exploreren con coeficiente de correlación lineal
  • Enseñar a los estudiantes sobre usos de la regresión múltiple
  • Continuar con la distinción entre variables independientes y variables dependientes.

Estándares alcanzados

Grados 9-12

  • Análisis de datos y probabilidad
    • Formular preguntas que pueden ser abordada con datos y recopilar, organizar y mostrar datos relevantes para responderlas.
    • Seleccionar y usar métodos estadísticos apropiados para analizar datos.

Esté preparado para:

  • Explicar correlaciones positivas/negativas y el coeficiente de correlación, r.
  • Relacionar correlación con la línea de mejor ajuste.
  • Explicar variables dependientes y variables independientes
  • Presentar las variables independientes como indicadores/ predictores.

Recursos para clases

Lecciones asociadas

Sigue a Eduteka en Redes:

YouTube Facebook Twitter LinkedIn Instagram Gloogle+