análisis de asociación y correlación entre dos variables

Upload: michelle-gonzales

Post on 08-Jul-2018

216 views

Category:

Documents


0 download

TRANSCRIPT

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    1/34

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    2/34

    Transformar variables

    • Si la mayoría de nuestras variablesson cualitativas, y queremosrelacionar algunas variables,tenemos que transformar la escalaen la que la variable ha sidoregistrada o medida.

    • Esta transformación sólo se puederealizar desde una variable continua,para llevarla a una categórica.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    3/34

    ¿Cómo?• Vamos a la tabla de datos “atos de

    empleados!.

    •  "ransformaremos la variable Salarioactual.

    • #o primero, e$plorar la distribución de lavariable, para ver el mínimo y el m%$imo&si la variable no es de razón'.

    •  "eniendo los límites, identi(car los puntosde corte de la distribución.

    • )or e*emplo, cuatro punto de corte+ -.a /0.1 /2. a 23.1 24. a

    .1 . a /5..

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    4/34

    Paso 1: ir a recodicar

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    5/34

    Paso 2: Crear la variable de salida e ingresarlos pntos de corte!

    "arcar

    "arcar

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    6/34

    #$e crea la variable% pero &ay 'egenerar las categor(as)

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    7/34

    *ntonces% la distribción ser(a

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    8/34

    Tabla contingenciase+o,salario

    ¿Cómo podemos crear n tabla 'emestre la relación entre se+o% salarioseg-n pertenencia .tnica?

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    9/34

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    10/34

    Análisis noparam.tricos para dosvariables categóricasnominales ordinales

    C&i/cadrado

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    11/34

    0C&i cadrado

    • Es una prueba para evaluar la hipótesis de larelación entre dos variables categóricas a nivelnominal u ordinal.

    • Se calcula por medio de una tabla decontingencia.

    • )arte del supuesto de no relación de variables.

    • 6naliza la diferencia de entre frecuencia

    esperadas y observadas.• Si e$iste relación, la tabla obtenida tiene que ser

    diferente respecto a las frecuencias esperadas.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    12/34

    ormla

    3dentica

    Pol(tica

    Provincia

    Cat(n "alleco Total

    7zquierda

    3 53

    erecha 4 53 /2

    8entro 2 5 54 "otal -/ - /

    7zquierda &53'98autín &-/'

     "otal &/'

    /-./

    :i*;

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    13/34

    *4emplo de interpretación: se+o ycategor(a laboral

    8hi >cuadrado es24,522#a probabilidad es de

    ,.Siendo la probabilidadmuy peque?a &seacepta hastainferiores a ,-', serechaza la hipótesisde independencia y seconcluye que hayrelación.

    )ara interpretar la prueba, se debe cautelar que las frecuenciasesperada no sean demasiado peque?as. Si hay frecuencias menoresa -, no deben e$ceder el 5@ del total de frecuencias esperadas.=%s de un 5@ debe ser interpretado con mucho cuidado.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    14/34

    ¿5. pasa con los ba4os efectivoso celdas con frecenciasesperadas menores a 6?

    • 6l ser estos valores el denominador de lafórmula, valores peque?os abultan elaporte de la celda al 8hiAcuadrado.

    • )ara ello podemos usar la prueba de Bates,que resta ,- a la diferencia entre fobservada y esperada para cada celda.

    • )ara muestras peque?a &menos de Ccasos' en tablas de 5 $ 5, se usa la pruebade

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    15/34

    7tro problema es el n o tama8o dela mestra

    • 8hiAcuadrado es sensible al tama?o de la muestra&no es aconse*able para muestras mayores a 4casos', ya que tiende a aumentar el nivel designi(cancia.

    • )or e*emplo+ una distribución de - casos,manteniendo la proporcionalidad entre los valores,chiAcuadrado sería de .20 con una sig. de ./-.Si la muestra fuese de .-, manteniendo las

    misma proporción de valores, chiAcuadrado sube a20 y la sig..-44

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    16/34

    Análisis param.tricos para na variablenominal ordinal dicotómica y na contina!

    T/stdent

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    17/34

    T/stdent

    • E$amina si dos grupos di(eren demanera signi(cativa respecto de susmedias.

    • )arte de la hipótesis de diferenciaentre grupos, es decir, los gruposdi(eren signi(cativamente entre sí

    respecto de sus medias &la Dpostula la no diferencia'.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    18/34

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    19/34

    • )rueba #evene+ homogenidad o igualdad e varianza. =ayor a ,-,varianza iguales1 menor a ,-, varianza distintas. Se decide que líneade estadísticos interpretar. )ara el e*emplo, , es menor que ,-,

    por lo tanto asume varianzas no iguales.• )ruba "Astudent+ indica ,03 con un nivel crítico de ,, lo que

    implica la compatibilidad entre las diferencias observadas entre lasmedias muestrales de los grupos y la hipótesis nula de que las mediaspoblacionales son iguales. 6l ser la sig. menor a ,-, se rechaza lahipótesis nula, determinando que los salarios entre hombre y mu*eres

    son diferentes.•

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    20/34

    Correlación entre dos variablescontinas!

    Coeciente r de Pearson

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    21/34

    r de Pearson!

    • )rueba que busca establecer la correlaciónentre variables a nivel de intervalo o de razón.

    • Se obtienen correlaciones del tipo+ 6 mayor $,

    mayor y1 6 mayor $, menor y1 valores altos en$ se asocian a valores altos en y1 valores altosen $ se asocian a valores ba*os en y.

    • #a prueba no parte de la lógica causa efecto,

    aun cuando esta se puede derivar desde lateoría.

    • Varía entre A. y .

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    22/34

    3nterpretación del signo

    • A.; correlación negativa perfecta &a mayor$, menor y'1 esto de manera proporcional,aumentando o disminuyendo por cada unidadconstante &a menor $, mayor y'.

    • A.4 &fuerte'1 A.2- &considerable'1 A.-&media'1 A.5- &dbil'1 A. &muy dbil'.

    •   .4 &fuerte'1 .2- &considerable'1 .-

    &media'1 .5- &dbil'1 . &muy dbil'.• .; correlación positiva perfecta &a mayor

    $, mayor y1 a menor $, menor y'.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    23/34

    • Es adimensional

    • Sólo toma valores en FA,G• #as variables son incorreladas  r;

    • Helación lineal perfecta entre dos variables  r;Io r;A.

    • 8uanto m%s cerca est r de I o A me*or ser% elgrado de relación lineal.

     – Siempre que no e$istan observaciones anómalas.

    )ropiedades de r

    A I

    Helación

    inversaperfect

    a

    Helación

    directacasi

    perfecta

    Variablesincorrelad

    as

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    24/34

    *stdio con4nto de dosvariables

    • 6 la derecha tenemos una posible manera

    de recoger los datos obtenido observandodos variables en varios individuos de unamuestra.

     – En cada (la tenemos los datos de un individuo

     – 8ada columna  representa los valores quetoma una variable sobre los mismos.

     – #as individuos no se muestran en ningJnorden particular.

    • ichas observaciones pueden serrepresentadas en un diagrama dedispersión  &KscatterplotL'. En ellos, cadaindividuos es un punto cuyas coordenadasson los valores de las variables.

    • :uestro ob*etivo ser% intentar reconocer  a

    Alturaen cm.

    Pesoen Kg.

    162 61

    154 60

    180 78

    158 62

    171 66

    169 60

    166 54

    176 84

    163 68

    ... ...

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    25/34

    9iagramas de dispersión o nbede pntos

       "   i   d  e   1   :   ;  c  m !

    "ide 1 =g!

     "enemos las alturas y los pesos de C individuos representados en

    un diagrama de dispersión.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    26/34

    elación entre variables! "enemos las alturas y los pesos de C individuos representados en

    un diagrama de dispersión.

     ) a r e c e

      q  u e  e

     l  p e s o  a

     u m e n

     t a  c o n

      l a 

     a l t u r

     a

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    27/34

    Predicción de na variable enfnción de la otra

    6parentemente el peso aumenta Mg por cada cm dealtura... o sea,el peso aumenta en una unidad por cada unidad de altura.

    1> cm!

    1> =g!

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    28/34

    3ncorrelación

    C

    3

    C

    3

    5C

    53

    CC

    / - 0 2 3 4 5

    Helación directa e inversa

    )ara valores de N por encima de lamedia tenemos valores de B porencima y por deba*o enproporciones similares.7ncorrelación.

    )ara los valores de N mayoresque la media le correspondenvalores de B menores. Esto esrelación inversa o decreciente.

    •)ara los valores de N mayores que lamedia le corresponden valores de Bmayores tambin.

    •)ara los valores de N menores que lamedia le corresponden valores de B

    menores tambin.

    •Esto se llama relación directa.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    29/34

    Entrenando el o*o+ correlaciones positivas

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    30/34

    Entrenando el o*o+ correlaciones negativas

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    31/34

    6nimación+ Evolución de r y diagrama de dispersión

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    32/34

    E*emplo para la variable salario inicialy actual

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    33/34

    Esto nos indica quer corresponde a,33, con una sig.,.

    8orrelación linealpositiva fuerte, deltipo a mayor $,mayor y1 a menor

    $, menor y.

  • 8/19/2019 Análisis de Asociación y Correlación Entre Dos Variables

    34/34

    ¿5. pasa con tipo de salario ymeses de contrato?

    ¿5. pasa con a8os de estdio ytipo de salario?

    ¿5. pasa con e+periencia previa

    y tipo de salario?