Inicio Lecciones Matemáticas discretas Regresión lineal y correlación

Regresión lineal y correlación

Una introducción a la correlación entre dos variables y a la línea de mejor ajuste

Esta lección ha sido diseñada para presentar a los estudiantes los  concepto de correlación entre dos variables y línea de mejor ajuste.
Estas actividades pueden realizarse individualmente o en grupos de hasta cuatro estudiantes. Disponga de 1.5 a 2 horas de tiempo de clase para la clase completa si todas sus componentes se van a hacer en el aula.

Una introducción a la correlación entre dos variables y a la línea de mejor ajuste

Grados 9-12

  • Álgebra
    • Comprender patrones, relaciones y funciones
  • Análisis de datos y probabilidad
    • Hacer preguntas que se pueden abordar con datos, y recolectar organizar y  representar datos relevantes para responderlas. 
    • Seleccionar y usar métodos estadísticos apropiados para analizar datos. 
  • Aritmética: Los estudiantes deben ser capaces de:
    • graficar puntos en un sistema de coordenadas cartesianas.
  • Estadística: Los estudiantes deben:
    • tener una comprensión básica de correlación
  • Tecnología: Los estudiantes deben ser capaces de:
    • hacer movimientos básicos con el ratón como apuntar, hacer click y arrastrar.
    • utilizar un navegador para experimentar con las actividades.

Los estudiantes requieren:

  • Acceso a un navegador
  • Preguntas de exploración sobre diagramas de dispersión
  • Papel cuadriculado y lápiz
correlación Una medida estadística que hace referencia a la relación entre dos variables aleatorias. Es una correlación positiva cuando cada variable tiende a aumentar o disminuir a medida que la otra lo hace, y negativa o correlación inversa si una tiende a aumentar mientras la otra disminuye.
 
coeficiente de correlación Un valor numérico entre -1 y +1 que identifica la fuerza de la relación lineal entre las variables. Un valor de +1 indica una relación positiva exacta, -1 indica una relación inversa exacta y 0 indica que no hay relación predecible entre las variables.
 
recta de mejor ajuste Una recta usada como una mejor aproximación del conjunto de todos los puntos en de un diagrama de dispersión.La posición y la pendiente de la rectas están determinadas por el nivel de correlación entre las dos variables involucradas en la generación del diagrama de dispersión. Esta recta se puede utilizar para hacer predicciones sobre el valor de una de las variables del par si y solo si se conocen los valores de la otra.  
 
regresión lineal Un intento de modelar la relación entre dos variables ajustando una ecuación lineal a los datos observados. Una variable se considera como la variable independiente y la otra como la variable dependiente.
 

error residual

 

El valor observado menos el valor estimado por la fórmula. Es la diferencia entre los resultados obtenidos por observación y por el cálculo hecho con una fórmula.
diagrama de dispersión Una representación gráfica de la distribución de dos variables aleatorias como un conjunto de puntos cuyas coordenadas representan sus pares de valores observados,
 
pendiente de una recta La pendiente de la recta y=mx+b  es la razón de cambio en y por unidad de cambio en x. Las unidades de medida de la pendiente son unidades de y por unidad de x.  (Ver: Discusión sobre funciones lineales).
  • Enfoque y repaso

    Repase con los estudiantes el concepto de correlación. Llévelos a pensar en las palabras e ideas de esta lección.

    • ¿Cual es un ejemplo de dos variables que no tienen correlacion la una con la otra? ¿Puede alguien darnos un ejemplo de dos variables que tienen algún tipo de correlación una con otra? ¿es una correlación positiva? ¿Es negativa? 
  • Objetivos

    Informe a los estudiante sobre lo que harán y aprenderán hoy. Dígales algo como esto:

    • Hoy aprenderemos sobre correlación entre dos variables y haremos una introducción al tema de la recta de mejor ajuste.
    • Usaremos los computadores para aprender algo más sobre correlación, pero no los prendan todavía; primero quiero mostrarles algo sobre esta actividad. 
       

Aportes del maestro

  • Lidere una discusión sobre correlación de variables y propósito de la recta de mejor ajuste.
  • Lidere una discusión sobre el coeficiente de correlacion y cómo varía dependiendo de la relación entre los datos del diagrama de dispersión. 
     
  • Guided Practice

    Complete en clase el applet  Preguntas de Exploración sobre Diagramas de Dispersión Pida a los estudiantes que hagan un diagrama de dispersión con los datos de la clase,  en una hoja de papel cuadriculado. Pregunte a la clase dónde creen que quedará la recta de mejor ajuste y cuál creen que es el coeficiente de correlación. Juntos, grafiquen estos datos usando la actividad Regresión, vean los resultados reales y compare lo encontrado con sus predicciones. 

  • Práctica independiente

    PIda a los estudiantes que usen la actividad Regresión, para estimar la recta de mejor ajuste para sus propios conjuntos de datos y entonces observar dónde queda realmente la recta de mejor ajuste. Anímelos a experimentar con conjuntos de datos que incluyen valores atípicos. También, póngalos a experimentar con la creación de diagramas de dispersión que tendrían un coeficiente de correlación específico.  

  • Cierre

    Quizás quiera tener nuevamente a los estudiantes en grupo para discutir los resultados. Después de que lo hagan, haga un resumen de los resultados de la lección.

Ésta lección puede reorganizarse de varias formas:

  • omita la discusión sobre coeficiente de correlación
  • omita el taller sobre diagrama de dispersión
  • Como clase, antes de dividirla en grupos, haga que los estudiantes representen puntos específicos en la actividad Regresión y que cada uno dibuje la que imagine como recta de mejor ajuste. Finalmente, pídales seleccionar la verdadera recta de mejor ajuste y  ver quién tuvo la aproximación más cercana.