TEMA 12. CORRELACIÓN Y CONCORDANCIA Y CORRELACIÓN PARAMÉTRICA: PEARSON. CORRELACIÓN NO PARAMÉTRICA SPEARMAN.
¡Buenas tardes!
Hoy vengo a presentaros el último tema del temario. En él os presento el último test de comprobación de hipótesis con el que vamos a trabajar.
RELACIONES ENTRE VARIABLES Y REGRESIÓN
El término regresión fue introducido por Galton en su libro "Natural inheritance"_
Hoy vengo a presentaros el último tema del temario. En él os presento el último test de comprobación de hipótesis con el que vamos a trabajar.
RELACIONES ENTRE VARIABLES Y REGRESIÓN
El término regresión fue introducido por Galton en su libro "Natural inheritance"_
- Cada peculiaridad en un hombre es compartida por sus descendentes, pero en media en un menor grado.
- Su trabajo se centraba en la descripción de los rasgos físicos de los descendientes (variable 1) partir de sus padres (variable 2)
- Pearson: realizó un estudio con más de 1000 registros, observanco una relación tipo:
- Altura del hijo = 0,85cm + 0,5 x altura del padre (aprox)
- Conclusión: los padres altos tienen tendencia a tener hijos que heredan esa parte de altura, aunque tienen tendencia a regresar a la media. Lo mismo ocurría con los bajos.
A la derecha tenemos una posible manera de recoger los datos obtenidos tras la observación en varios individuos de una muestra.
- En cada fila tenemos los datos del individuo
- En cada columna los valores que toman las variables sobre los mismos.
- Los individuos no se muestran en ningún orden en particular
Dichas observaciones pueden ser representadas en un diagrama de dispersión. En él, cada individuo es un punto cuyas coordenadas son los valores de las variables. Nuestro objetivo será conocer si hay relación entre las variables, de qué tipo y si es posible predecir e valor de una de ellas en función de la otra.
RELACIÓN DIRECTA E INVERSA
REGRESIÓN LINEAL: CORRELACIÓN Y DETERMINACIÓN
Se trata de estudiar la observación entre 2 variables cuantitativas; puede ser simple (1sola V.I) o múltiple (2 o más V.I)
- Ecuación de la recta; y= ax + b
- Pendiente es a = β1
- Punto intersección es b = β0
Modelos deterministas: la VI determina el valor de la VD. Para cada valor de VI solo habrá un valor de VD.
Modelos probabilísticos: para cada valor de VI existe una distribución de probabilidad de VD, entre 0 y 1.
Coeficientes de correlación
Miden la fuerza de asociación entre las dos variables.
- = 1; determinista al 100%
- = -1; determinista a la inversa
- Si se aproxima a 0; no existe asociación entre las variables:
- Pearson: paramétrica, las 2 variabes siguen una distribución normal
- Spearman: no paramétrica; las 2 variables no siguen una distribución normal.
Se utiliza con el propósito de disponer d eun indicador cuantitativo que permite sintetizar el grado de asociación entre las variables.
Coeficiente de correlación de Pearson (r): mide el grado de relación de dependencia existente entre las variables. Valores de -1 a 1.
Procedimiento:
Comentarios
Publicar un comentario