Florence Nightingale

"Lo importante no es lo que nos hace el destino, sino lo que nosotros hacemos de él"

TEMA 12. CORRELACIÓN Y CONCORDANCIA Y CORRELACIÓN PARAMÉTRICA: PEARSON. CORRELACIÓN NO PARAMÉTRICA SPEARMAN.

¡Buenas tardes!

Hoy vengo a presentaros el último tema del temario. En él os presento el último test de comprobación de hipótesis con el que vamos a trabajar.

RELACIONES ENTRE VARIABLES Y REGRESIÓN

El término regresión fue introducido por Galton en su libro "Natural inheritance"_

  • Cada peculiaridad en un hombre es compartida por sus descendentes, pero en media en un menor grado. 
  • Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (variable 1) partir de sus padres (variable 2) 
  • Pearson: realizó un estudio con más de 1000 registros, observanco una relación tipo: 
    • Altura del hijo = 0,85cm + 0,5 x altura del padre (aprox) 
    • Conclusión: los padres altos tienen tendencia a tener hijos que heredan esa parte de altura, aunque tienen tendencia a regresar a la media. Lo mismo ocurría con los bajos. 
ESTUDIO CONJUNTO DE DOS VARIABLES

A la derecha tenemos una posible manera de recoger los datos obtenidos tras la observación en varios individuos de una muestra. 
  • En cada fila tenemos los datos del individuo 
  • En cada columna los valores que toman las variables sobre los mismos. 
  • Los individuos no se muestran en ningún orden en particular 
Dichas observaciones pueden ser representadas en un diagrama de dispersión. En él, cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será conocer si hay relación entre las variables, de qué tipo y si es posible predecir e valor de una de ellas en función de la otra. 

RELACIÓN DIRECTA E INVERSA 


REGRESIÓN LINEAL: CORRELACIÓN Y DETERMINACIÓN 
Se trata de estudiar la observación entre 2 variables cuantitativas; puede ser simple (1sola V.I) o múltiple (2 o más V.I)
  • Ecuación de la recta; y= ax + b 
  • Pendiente es a = β1
  • Punto intersección es b = β0
Modelos deterministas: la VI determina el valor de la VD. Para cada valor de VI solo habrá un valor de VD. 
Modelos probabilísticos: para cada valor de VI existe una distribución de probabilidad de VD, entre 0 y 1. 

Coeficientes de correlación
Miden la fuerza de asociación entre las dos variables. 
  • = 1; determinista al 100%
  • = -1; determinista a la inversa 
  • Si se aproxima a 0; no existe asociación entre las variables: 
    • Pearson: paramétrica, las 2 variabes siguen una distribución normal 
    • Spearman: no paramétrica; las 2 variables no siguen una distribución normal. 
 Análisis de correlación 
Se utiliza con el propósito de disponer d eun indicador cuantitativo que permite sintetizar el grado de asociación entre las variables. 
Coeficiente de correlación de Pearson (r): mide el grado de relación de dependencia existente entre las variables. Valores de -1 a 1. 
Procedimiento: 

  1. Se ordenan los valores 
  2. Se calculan las diferencias de cada observación 
  3. Se eleva al cuadrado cada diferencia y se suman todos los valores encontrados. 
  4. Se calcula para determinar la discrepancia entre los rangos: 

Regresión lineal cálculo: 
y = β1x + β0
y = VD 
x= VI 




y.. hasta aquí el último tema del blog!
Espero que os haya servido de ayuda y guía para estudiar y poder entender mejor la asignatura y lo que la estadística engloba. Muchas gracias. 
Un saludo! Lorena S. 

Comentarios