lectura 4- análisis de datos y relaciones entre variables

29
Módulo 4 Unidad 7 Lectura 11 Análisis descriptivo de los datos y relación entre variables Materia: Métodos y Técnicas de Investigación Social Profesor: Mgter. Verónica Herrero

Upload: leo-herrera

Post on 25-Nov-2015

203 views

Category:

Documents


1 download

TRANSCRIPT

  • Mdulo 4

    Unidad 7

    Lectura 11

    Anlisis descriptivo de los datos y relacin entre variables

    Materia: Mtodos y Tcnicas de Investigacin Social

    Profesor: Mgter. Vernica Herrero

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|2

    Unidad 7: Anlisis descriptivo de los datos y relacin entre variables

    A- Descripcin Univariada

    Etapas iniciales: la seleccin del software y armado de la base de datos

    Para comenzar el anlisis de datos, se suele tomar la decisin bsica relacionada con qu software estadstico usar. Esto es crucial en la actualidad donde no se realiza ningn tipo de procesamiento estadstico sin este tipo de herramientas. Como decisin complementaria inicial, debe estructurarse la base de datos a generar. En primer lugar hablaremos de las caractersticas de una base de datos, y luego mencionaremos algunas opciones para escoger software estadstico para su procesamiento.

    Una base de datos es un arreglo de filas y columnas en la cual se ingresa la informacin reunida a travs de algn mecanismo de recogida de datos. Como convencin, las columnas corresponden a variables (unidades de informacin que se ha recolectado) en tanto, las filas indican los datos recogidos para cada caso, denominados registros.

    Figura 1: Estructura bsica de una base de datos

    Bibliografa Bsica

    Para cumplir con los objetivos de la Unidad 7 del programa, es necesario profundizar en los temas desarrollados en el Captulo 10 del texto de Hernndez Sampieri (2oo3) y en el texto Relacin entre variables preparado por el Profesor Bologna (2003b), relacionndolos con los comentarios, reflexiones y ejemplos de las lecturas del mdulo.

    (lectura 11, 12 y 13)

    Presentacin de Resultados

    A modo de cierre del desarrollo de la asignatura, se ha incluido al final del presente mdulo un apartado sobre los informes y reportes que permiten la presentacin de resultados.

    Ver pgina 27 y ss.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|3

    La tarea siguiente consiste en especificar las denominaciones y caractersticas de cada variable que se incluir en la base de datos, y posteriormente, proceder a la carga (data entry) de la informacin capturada en las encuestas y/o planillas que se desee sistematizar digitalmente.

    Veamos algunas opciones para seleccionar el software que se utilizar para procesar la base de datos. Existen diversas opciones en el mercado. Entre las herramientas ms difundidas se encuentra el SPSS (Statistical Package for the Social Sciences). Adems, otras herramientas disponibles corresponden a los paquetes bsicos de planillas de clculo o bases de datos, pero no son opciones especialziadas ni que faciliten el uso de las herramientas estadsticas que describiremos en este captulo.

    Algo de historia del programa SPSS:

    El programa fue creado en 1968 por Norman H. Nie, C. Hadlai (Tex) Hull y Dale H. Bent. Entre 1969 y 1975 la Universidad de Chicago por medio de su National Opinin Research Center estuvo a cargo del desarrollo, distribucin y venta del programa. A partir de 1975 corresponde a SPSS Inc.

    Originalmente el programa fue creado para grandes computadores. En 1970 se publica el primer manual de usuario del SPSS por Nie y Hall. Este manual populariza el programa entre las instituciones de educacin superior en EE. UU. En 1984 sale la primera versin para computadores personales.

    Como programa estadstico es muy popular su uso debido a la capacidad de trabajar con bases de datos de gran tamao (millones de registros y cientos de miles de variables). El programa consiste en un mdulo base y mdulos anexos que se han ido actualizando constantemente con nuevos procedimientos estadsticos.

    Versiones del SPSS

    SPSS Inc. desarrolla un mdulo bsico del paquete estadstico SPSS, del que han aparecido las siguientes versiones:

    SPSS-X (para grandes servidores tipo UNIX)

    SPSS/PC (1984, en DOS. Primera versin para computador porttil)

    SPSS/PC+ (1986 (en DOS)

    SPSS for Windows 6 (1992) / 6.1 para Macintosh

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|4

    SPSS for Windows 7, 8, 9, 10 / for Macintosh 10 (2000), 11 (2001) / for Mac OS X 11(2002); 11.5 (2002); SPSS for Windows 12 (2003);

    SPSS for Windows 13 (2004): Permite por primera vez trabajar con mltiples bases de datos al mismo tiempo.

    SPSS for Windows 14 (2005)

    SPSS for Macintosh 13 (2006)

    SPSS for Windows 15 (2006)

    SPSS for Windows 16 (Octubre de 2007): SPSS for Macintosh 16

    SPSS for Linux 16

    SPSS for Windows 17 (2008)

    Fichero de datos de SPSS

    Los ficheros de datos en formato SPSS tienen en Windows la extensin. SAV. Al abrir un fichero de datos con el SPSS, vemos la vista de datos, una tabla en la que las filas indican los casos y las columnas las variables. Cada celda corresponde al valor que una determinada variable adopta en un cierto caso.

    Adems de esta vista de datos, en las ltimas versiones del programa existe una vista de variables en la que se describen las caractersticas de cada una. En esta vista las filas corresponden a cada variable y las columnas nos permiten acceder a sus caractersticas (la Figura 1 es una vista de este Fichero de datos).

    7.1 Anlisis univariado: Distribuciones de frecuencias Recordemos en primer lugar que las variables pueden ser diferente tipo segn el nivel de medicin. En tal sentido distinguimos cuatro tipos de variables:

    Nominales Ordinales De intervalo De razn

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|5

    Los dos primeros tipos corresponden a variables cualitativas o no mtricas, en tanto los restantes tipos de variables son cuantitativas o mtricas.

    Las variables nominales cumplen dos requisitos deseables: exhaustividad y exclusividad. El primero indica que las diferentes categoras o valores que asumen cubren la totalidad de posibilidades que pueden surgir. La exclusividad seala que la variable slo puede asumir uno de los valores posibles. Todas las variables que hacen referencia a un atributo de un objeto. Por ejemplo: la variable es estado de actividad (los valores posibles de la variable son: ocupado, desocupado e inactivo).

    Las variables ordinales tienen implcita la jerarqua, lo cual significa que son ordenables. Ejemplos de este tipo de variable lo constituyen: nivel educativo alcanzado; estrato socioeconmico.

    Las variables de intervalo diferencian adecuadamente la distancia entre valores de la variable, ya que estn expresadas en alguna medida fsica. Por ejemplo, cantidad de hijos tenidos o temperatura.

    Las variables de razn son un tipo especial dentro de las de intervalo, para las cuales el valor 0 tiene un significado claro: indica que no hay presencia de la variable medida. Por ejemplo, edad o ingreso son variables de esta caracterstica.

    A los fines de explorar los datos que hemos recabado y cargado en la base de datos, un primer anlisis exhaustivo consiste en revisar todos los valores que surgieron de las respuestas, y cuntas veces se reiter cada uno de ellos. Para eso se utilizan las frecuencias. Este anlisis puede desarrollarse para las variables de todos los tipos mencionados previamente. Vamos a distinguir entre frecuencias absolutas, frecuencias relativas y frecuencias acumuladas. Las frecuencias absolutas indican la cantidad de veces que se repite cada respuesta posible.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|6

    Tabla 1. Frecuencias absolutas (variable nominal)

    Estado conyugal Frecuencia absoluta

    Casado 50

    Soltero 85

    En pareja / unin 28

    Separado / divorciado 35

    Viudo 12

    Total 210

    Fuente: Elaboracin propia

    La informacin proporcionada en la tabla anterior permite indicar por ejemplo que: 12 de los 210 encuestados, tiene estado conyugal viudo.

    Las frecuencias relativas se desprenden de las respectivas frecuencias absolutas, pero sealan la participacin de cada tipo de respuesta en el total. Se suele expresar tambin esta informacin en porcentajes.

    Tabla 2. Frecuencias relativas (variable nominal)

    Estado conyugal Frecuencia relativa

    Casado 0,238

    Soltero 0,405

    En pareja / unin 0,133

    Separado / divorciado 0,167

    Viudo 0,057

    Total 1

    Fuente: Elaboracin propia

    La suma de las frecuencias relativas alcanza el valor de 1, en indica el 100% de casos. La informacin que proporciona la tabla de frecuencias relativas permite resumir que el 40,5% de los encuestados es soltero.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|7

    Las frecuencias acumuladas dan informacin sobre la cantidad de respuestas que tienen un valor inferior o a lo sumo el indicado en la tabla. Slo tiene sentido para variables medidas en niveles ordinal, de intervalo y de razn.

    Tabla 3. Frecuencias acumuladas (variable de razn)

    Nivel de ingreso familiar mensual

    Frecuencia relativa acumulada

    Hasta $1.000 0,10

    Ms de $1.000 a $3.000 0,40

    Ms de $3.000 a $5.000 0,70

    Ms de $5000 a $8.000 0,95

    Ms de $8.000 a $20.000 1

    Fuente: Elaboracin propia

    Cuando trabajamos con informacin recin obtenida, o con errores o problemas durante el trabajo de campo, la revisin de las frecuencias permite analizar la magnitud de ciertos problemas, como por ejemplo el de falta de respuesta.

    Tabla 4. Frecuencias absolutas y relativas (sobre casos vlidos)

    Nivel de ingreso familiar mensual

    Frecuencia absoluta Frecuencia relativa

    (sobre casos vlidos)

    Hasta $1.000 200 0,10

    Ms de $1.000 a $3.000 600 0,30

    Ms de $3.000 a $5.000 600 0,30

    Ms de $5000 a $8.000 500 0,25

    Ms de $8.000 a $20.000 100 0,05

    No responden 100 -

    Fuente: Elaboracin propia

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|8

    Anlisis univariado: grficos

    Otra manera de representar la informacin provista por tablas de frecuencias es a travs de grficos estadsticos. La visualizacin de los grficos permite una mirada general donde se aprecien de manera rpida y sencilla la posicin central de los valores de la variable analizada como tambin la dispersin que registren tales valores.

    a) Diagrama de barras

    Los diagramas de barras sirven para representar frecuencias absolutas y relativas. La altura de cada barra indica la cantidad de casos (o la proporcin de casos) correspondientes a cada valor de la variable estudiada.

    Tabla 5. Frecuencias absolutas

    Nota en la evaluacin Frecuencia absoluta

    1 3

    2 1

    3 1

    4 1

    5 3

    6 2

    7 5

    8 7

    9 5

    10 2

    Total 30

    Fuente: Elaboracin propia

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|9

    El observar la barra ms elevada se identifica el valor que ms se repite del conjunto de valores posibles de la variable.

    Figura 2: Diagrama de barras

    012345678

    1 2 3 4 5 6 7 8 9 10

    Notas

    Frecue

    ncia

    Fuente: Elaboracin propia

    b) Histograma

    Al igual que los diagramas de barras, los histogramas sirven para representar frecuencias absolutas y relativas. La altura de cada barra indica la cantidad de casos (o la proporcin de casos) correspondientes a cada valor de la variable estudiada. La diferencia principal es que estos ltimos se asocian principalmente con variables de intervalo o razn.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|10

    Tabla 6. Frecuencias absolutas

    Peso al nacer (kg.) Frecuencia absoluta

    [2,5 3) 6

    [3 3,5) 23

    [3,5 4) 12

    [4 4,5) 9

    Total 50

    Fuente: Elaboracin propia

    Figura 3: Histograma

    0

    5

    10

    15

    20

    25

    [2,53) [33,5) [3,54) [44,5)

    Pesoalnacer(kg.)

    Frecue

    ncia

    Tambin en este caso la barra ms elevada da cuenta de la categora de la variable que tiene ms cantidad de repeticiones.

    c) Polgono de frecuencias

    Se trata de un grfico de lneas que se traza desde los puntos medios de cada intervalo a la altura proporcional a su frecuencia. Tambin sirve para representar tanto frecuencias absolutas como relativas

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|11

    Tabla 7. Frecuencias relativas

    Peso al nacer (kg.) Frecuencia relativas

    [2,5 3) 0,12

    [3 3,5) 0,46

    [3,5 4) 0,24

    [4 4,5) 0,18

    Total 1

    Fuente: Elaboracin propia

    Figura 4: Polgono de frecuencias

    0

    0,1

    0,2

    0,3

    0,4

    0,5

    [2,53) [33,5) [3,54) [44,5)

    Pesoalnacer(kg.)

    Frecue

    ncia

    relativa

    d) Ojiva

    Bsicamente, la ojiva es un polgono de frecuencias acumuladas. Permite identificar qu porcentaje o nmero de casos tiene un valor de a lo sumo el indicado para la variable de estudio en el eje de las absisas.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|12

    Tabla 8. Frecuencias acumuladas

    Peso al nacer (kg.) Frecuencia acumulada

    [2,5 3) 6

    [3 3,5) 29

    [3,5 4) 41

    [4 4,5) 50

    Fuente: Elaboracin propia

    Figura 5: Ojiva

    0

    10

    20

    30

    40

    50

    [2,53) [33,5) [3,54) [44,5)

    Pesoalnacer(kg.)

    Frecue

    ncia

    relativa

    Fuente: Elaboracin propia

    e) Grfico de sectores

    Es la representacin en un crculo de la participacin de los distintos valores de la variable en el total. Consiste en asignar proporcionalmente la superficie, tomando como referencia los 360 que componen la correspondiente circunferencia.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|13

    Tabla 9. Frecuencias

    Carrera Frecuencia absoluta Frecuencia relativa

    Asignacin de sectores

    Abogaca 20 0,50 0,50 x 360=180

    Contador Pblico 10 0,25 0,25 x 360 = 90

    Administracin 8 0,20 0,20 x 360 = 72

    Recursos Humanos 2 0,05 0,05 x 360 = 18

    Total 40 1

    Fuente: Elaboracin propia

    Permite graficar variables de todos los niveles, con la precaucin de considerarlo para casos con un nmero razonable de valores, ya que caso contrario la visualizacin de la informacin es poco clara. Es muy til diferenciar las reas con colores y/o con tramas a fin de facilitar la lectura.

    Figura 6: Diagrama de sectores

    CPub;0,25

    Adm;0,2

    RHum;0,05

    Abg;0,5

    Fuente: Elaboracin propia

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|14

    7.2 Medidas descriptivas de un conjunto de datos

    Estadsticas: medidas de posicin y dispersin

    7.2.1 Medidas de posicin o de tendencia central

    El objetivo es disponer de un valor resumen del conjunto de valores observados que permita disponer de una idea general del fenmeno observado.

    i) Media Es la medida ms popular para sintetizar un fenmeno cuantitativo. Para calcularlo, se suman todos los valores observados de la variable y se divide en el nmero de casos.

    Datos

    Variable de estudio: Edad de la mujer al tener su primer hijo (aos)

    15 18 19 22 23 25 25 26 27 27

    28 28 29 30 30 30 31 32 33 37

    Clculo de la media muestral:

    1 535 26,7520

    n

    ii

    xx

    n== = =

    La frmula estadstica anterior hace referencia a las operaciones indicadas, sumar todos los valores de la variable x (la operacin sumar se indica en smbolos matemticos con la letra griega sigma) y luego dividir por el nmero de casos (n es utilizado como referencia de la cantidad de casos de una muestra). La cifra obtenida est expresada en la misma unidad de medida que la variable estudiada, en este caso en aos. Por lo tanto, en promedio, en nuestra muestra de estudio, las mujeres tuvieron su primer hijo aproximadamente a los 27 aos.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|15

    Las frmulas de clculo no difieren para la media poblacional ( ) y la media muestral ( x ). La media no es un buen indicador para sintetizar el problema si los valores presentan mucha discrepancia (o variabilidad) entre s.

    ii) Moda La moda indica cul es el valor de la variable que ms veces se repite en los datos obtenidos. Sirve como indicador para varaibles medidas en cualquier nivel de medicin.

    Hay distribuciones unimodales (tienen una moda), bimodales (dos modas) o multimodales (ms de dos modas). Como principal limitacin se destaca que no intervienen en su clculo todos los datos disponibles.

    Para el conjunto de datos anterior, correspondiente a la Edad de la mujer al tener su primer hijo, la moda es 30, ya que indica el valor de la variable estudiada que se repite ms veces.

    iii) Mediana La mediana hace referencia al valor tal que si los datos estn ordenados de menor a mayor, divide en dos partes con la misma cantidad de casos, a los valores que estn por debajo de este valor, o que estn por encima de este valor.

    El clculo de la mediana puede realizarse para variables medidas al menos en el nivel ordinal (por supuesto tambin las de intervalo o de razn).

    Se presentan dos situaciones para su clculo:

    - Cuando la cantidad de casos analizados es impar. En este caso, el valor central es la mediana:

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|16

    30 31 32 33 37

    Mediana=32

    - Cuando la cantidad de casos analizados es par. En este caso, se toma un promedio de los dos valores centrales de la distribucin:

    15 18 19 22 23 25 25 26 27 27

    Mediana = (23 + 25) /2 = 24

    7.2.2 Medidas de dispersin Este tipo de indicadores hacer referencia a la variabilidad o heterogeneidad de los valores recogidos entre s.

    i) Rango o recorrido Indica la diferencia entre el mayor valor obtenido y el menor. Tiene como principal debilidad el hecho de no incluir todos los valores recogidos, y concentrarse justamente en valores muy extremos de la distribucin. Para el ejemplo anterior sobre la muestra de Edad de la mujer al tener su primer hijo, el rango corresponde a:

    R = Mx Mn = 37 15 = 22 aos

    ii) Desviacin estndar o tpica Esta medida es la ms utilizada entre las de dispersin. La desviacin estndar corresponde al promedio de la desviacin de los casos con relacin a la media.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|17

    Tabla 10. Clculo de la desviacin estndar muestral

    i xi

    xi - x (xi - x )2

    1 15 -11,75 138,0625

    2 18 -8,75 76,5625

    3 19 -7,75 60,0625

    4 22 -4,75 22,5625

    5 23 -3,75 14,0625

    6 25 -1,75 3,0625

    7 25 -1,75 3,0625

    8 26 -0,75 0,5625

    9 27 0,25 0,0625

    10 27 0,25 0,0625

    11 28 1,25 1,5625

    12 28 1,25 1,5625

    13 29 2,25 5,0625

    14 30 3,25 10,5625

    15 30 3,25 10,5625

    16 30 3,25 10,5625

    17 31 4,25 18,0625

    18 32 5,25 27,5625

    19 33 6,25 39,0625

    20 37 10,25 105,0625

    Suma 0 547,75

    DS = 5,37

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|18

    Adems de incluir todos los valores en su clculo, tiene la ventaja de estar expresada en la misma unidad de medida que la variable original. Su frmula de clculo es la siguiente:

    Desviacin estndar poblacional:

    2

    1

    ( )N

    ii

    xDS

    N

    =

    = =

    (1)

    Desviacin estndar muestral:

    2

    1

    ( )

    1

    n

    ii

    x xs

    n=

    =

    (2)

    Para mostrar detalladamente el clculo con los datos sobre Edad de la mujer al tener su primer hijo, se presenta la Tabla 10 (pgina 17). El resultado que all se muestra proviene de la utilizacin de la frmula (2), dado que se trata de una muestra de 20 observaciones. El clculo realizado es, entonces, el siguiente:

    Si realizramos el mismo clculo bajo el supuesto de que estas 20 observaciones constituyen la poblacin total bajo anlisis, podra utilizarse la frmula (1), en cuyo caso obtendramos el siguiente resultado:

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|19

    iii) Varianza La varianza corresponde al cuadrado de la desviacin estndar. Se trata de otra medida de dispersin muy utilizada, aunque su interpretacin, ya que la unidad de medida queda elevada al cuadrado es bastante ms compleja.

    Para el caso anterior, tendremos, dado que se trata de una muestra:

    Var = (5,37)2 = 28,83 aos2

    iv) Coeficiente de variacin El coeficiente de variacin combina la desviacin estndar y la media, de modo de tener un indicador de la variabilidad relativa de la distribucin. Es de gran utilidad en la comparacin de distribuciones, ya sea de dos o ms variables, o de dos o ms subgrupos o poblaciones para una misma variable.

    .100CV =

    Medidas de forma: asimetra y curtosis

    a. Asimetra Indica cmo estn agrupados los datos. Cuando el valor es 0, la curva es simtrica (los valores estn distribuidos por igual por encima o por debajo de la media, y adems, coinciden la media, la mediana y la moda. Veamos un ejemplo:

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|20

    Figura 7: Distribucin simtrica

    Coeficiente de asimetra = 0

    Si el valor del coeficiente de asimetra es un valor positivo, la distribucin es asimtrica derecha o de sesgo positivo (los casos se agrupan a la izquierda de la curva y pocos valores, no representativos, en el lado derecho de la distribucin).

    Figura 8: Distribucin asimtrica derecha (sesgada a la izquierda)

    Coeficiente de asimetra = 0,9767

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|21

    Si el valor del coeficiente de asimetra es un valor negativo, la distribucin es asimtrica izquierda o de sesgo negativo (los casos se agrupan a la derecha de la curva y pocos valores, no representativos, en el lado izquierdo de la distribucin).

    Figura 9: Distribucin asimtrica izquierda (sesgada a la derecha)

    Coeficiente de asimetra = -0,825

    b. Curtosis Grado de concentracin de la distribucin respecto de la media. La siguiente figura 10 ilustra los tres casos en funcin de la concentracin. Como puede observarse el caso de una distribucin leptocrtica corresponde al de una mayor concentracin, en tanto el extremo opuesto corresponde a la situacin de una distribucin platicrtica.

    Figura 10: Distribucin asimtrica izquierda (sesgada a la derecha)

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|22

    Las distribuciones mesocrticas tienen un coeficiente de curtosis igual a 0. En el caso de una distribucin Leptocrtica, el coeficiente de curtosis es positivo, en tanto que el coeficiente es negativo para las distribuciones Platicrticas.

    Algunas consideraciones acerca de la aplicacin del anlisis univariado en la etapa de anlisis de datos

    - Tras la revisin descriptiva inicial, el investigador debe tomar ciertas decisiones acerca de los datos disponibles, para facilitar los anlisis posteriores, teniendo en cuenta los objetivos de la investigacin.

    - En algunos casos, convendr agrupar valores, por ejemplo, estableciendo intervalos de valores (para variables cuantitativas) o categoras integradoras (para variables cualitativas). Para ello considerar si algunos valores presentan muy bajo nivel de aparicin y son asimilables con otras categoras similares.

    - En el caso de las medidas descriptivas (de tendencia central y dispersin), permiten decidir cul de ellas refleja mejor el fenmeno, y en qu casos no debe presentarse nicamente la media (dispersin muy elevada y datos sesgados).

    - La aplicacin de tcnicas estadsticas ms sofisticadas en general exige verificar el cumplimiento de ciertas condiciones (supuestos) acerca de las medidas de tendencia central, de dispersin y de la propia distribucin de datos, entre otras, que deben ser verificadas en esta etapa.

    - Deben tomarse decisiones acerca de las variables con niveles demasiado elevados de no respuesta.

    7.3 Relacin entre variables: clasificacin en referencia al tiempo, a la direccin y a la intensidad.

    El los siguientes apartados, se han incluido una serie de herramientas de anlisis que permiten el anlisis conjunto de dos o ms variables.

    Preste atencin especial a aquellas mencionadas en el texto del Profesor Bologna (2003b). Considere el resto de las herramientas de manera informativa en caso de requerirlas para sus investigaciones o trabajos profesionales que impliquen anlisis de datos de este tipo.

    Bibliografa Bsica

    El punto 7.3 del programa debe estudiarse siguiendo el texto clasificacin de la Relacin entre variables preparado por el Profesor Bologna (2003) y que forma parte de la bibliografa bsica de la materia.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|23

    B. Anlisis bivariado

    1. Tablas de contingencia

    Cuando se consideran dos variables al explicar un fenmeno se suele proceder a cruzar ambas en tablas de contingencia. Si se presupone cierta relacin causal entre ellas, lo convencional es situar la variable dependiente en las filas y la variable independiente en las columnas.

    Cada casillero de la tabla corresponde al cruce de un atributo de una variable con un atributo de la otra variable.

    La informacin extrada de la tabla se limita al anlisis de los porcentajes extrados de la misma (porcentajes del total de casos, porcentajes del total de la fila o porcentajes del total de la columna).

    Los totales de las filas y de las columnas reciben un nombre particular: valores marginales, justamente por ubicarse en los mrgenes de la tabla.

    Existen diversos procedimientos inferenciales (a travs de pruebas de hiptesis estadsticas) para establecer si determinadas relaciones evidenciadas en las tablas de contingencia son significativos o no. Algunos de estos anlisis son:

    o Si se analizan variables nominales, el grado de asociacin entre variables puede ser medido por los siguientes estadsticos: Phi Cuadrado C de Pearson V de Cramer Q de Yule Lambda Tau-Y de Goodman y Kruskal Coeficiente d (diferencia de proporciones)

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|24

    o Si se analizan variables ordinales, el grado de asociacin entre variables puede ser medido por los siguientes estadsticos: Rho de Spearman Tau-A, Tau-B y Tau-C de Kendall Gamma de Goodman y Kruskal D de Sommer

    o Si se analizan variables de intervalo o de razn, el grado de asociacin entre variables puede ser medido, adems, el coeficiente de correlacin de Pearson.

    En todos los casos, los paquetes estadsticos proporcionan estos clculos de manera sencilla. Para estudiar en detalle las frmulas subyacentes y las consideraciones para su aplicacin e interpretacin, deber consultarse algn manual sobre Estadstica para ciencias sociales.

    En general, para las tablas de contingencia se utiliza el test X2 (Chi Cuadrado), que permite comparar las frecuencias observadas (los datos obtenidos correspondientes a cada casilla) con las esperadas bajo condiciones de total independencia entre las variables estudiadas. Con este test puede desecharse (si corresponde) la hiptesis de independencia entre las variables y as concluir que existe una asociacin entre ellas.

    2. Regresin simple

    Cuando se estudia la relacin de tipo lineal entre dos variables, se emplea el anlisis de regresin lineal simple.

    La variable dependiente o explicada debe ser cuantitativa o mtrica. La variable independiente puede ser cuantitativa o cualitativa. El objetivo en este caso es predecir el valor de la variable dependiente a partir del valor de la variable independiente. La idea es estimar una recta que describa de manera aceptable la relacin entre ambas variables, ms all de pequeas variaciones o desviaciones aleatorias que pueden darse.

    El modelo se expresa de la siguiente manera:

    Y = a + b X +e

    Donde

    Y = variable dependiente

    X = variable independiente

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|25

    a = intercepto u ordenada al origen (valor donde la recta corta el eje Y)

    b = pendiente de la recta (variacin de Y cuando X cambia en una unidad)

    e = error de estimacin

    El mtodo utilizado para su estimacin es el de Mnimos Cuadrados. El siguiente esquema da una idea de la relacin entre la relacin observada (puntos en el diagrama) y la recta de regresin estimada.

    Figura 11: Regresin lineal simple

    Fuente: Elaboracin propia

    As, con los datos del ejemplo, podramos predecir el valor del rendimiento escolar de un nio, conociendo slo la cantidad de aos de escolaridad que tuvo su madre (simplemente reemplazamos en la frmula indicada el valor de x correspondiente a los aos de escolaridad de la madre, y realizamos el clculo indicado). Observe las desviaciones que se registran entre la recta de regresin, ya que la relacin no es exacta o determinstica. Tanto la calidad del ajuste de datos logrado con el modelo como la significatividad estadstica de los coeficientes estimados puede ser comprobada con procedimientos simples.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|26

    3. Anlisis multivariado

    Para el caso de fenmenos complejos, es muy poco frecuente que el anlisis bivariado sea suficiente para dar cuenta de las relaciones entre variables. En tales casos, se apela a procedimientos estadsticos ms complejos.

    El siguiente cuadro, sintetiza los principales anlisis multivariados que podran desarrollarse. Nuevamente, para su profundizacin, dado que escapan a los objetivos de la materia, se recomienda la consulta de un manual de Estadstica para ciencias sociales.

    Figura 12: Tcnicas multivariables

    Fuente: Elaboracin propia a partir de Cea DAncona (1999).

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|27

    Presentacin de resultados

    La tarea de investigacin se plasma en informes o reportes de investigacin, a ser presentados ante las personas o instituciones que encargaron, avalaron y/o financiaron el desarrollo del proyecto de investigacin.

    La finalidad de este reporte es informar sobre la manera en que se desarroll la tarea de investigacin, y dar cuenta de los principales hallazgos y conclusiones a las cuales se pudo arribar.

    En general, el informe cuanta con los siguientes elementos constitutivos elementales:

    1. Datos de identificacin del informe 2. Introduccin 3. Aspectos metodolgicos 4. Resultados 5. Discusin o desarrollo 6. Conclusin 7. Referencias bibliogrficas 8. Anexos (si son necesarios)

    Veamos qu se espera que contenga cada una de estas secciones.

    Entre los datos de Identificacin del informe deben figurar:

    1. Ttulo 2. Autor 3. Institucin de pertenencia del o los investigadores 4. Fecha de presentacin 5. Motivo de la presentacin 6. Institucin o entidad que aval, financi y/o encarg el estudio

    La Introduccin resume el problema y su relevancia, los objetivos perseguidos por la investigacin, las principales hiptesis de trabajo y la organizacin general del informe. En esta seccin se indican las principales referencias a los autores consultados.

    En la descripcin de los Aspectos metodolgicos, se realiza un raconto de los elementos del diseo de la investigacin desarrollada. El mtodo empleado y su vinculacin con el problema, la forma de recoleccin de

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|28

    datos, la estrategia muestral empleada, los formularios de captura de datos (si los hubiera), el desarrollo de prueba pilto (si la hubo) la cantidad de casos que se analizaron, as como las tcnicas de anlisis de datos que se aplicaron. En el caso de resultar muy extensa, puede incluirse un Anexo metodolgico al final del informe.

    Los Resultados exponen los hallazgos principales en relacin con los objetivos planteados del estudio. Deben ser claros y precisos.

    La Discusin presenta la justificacin a partir de los datos as como la comparacin con resultados de otros estudios, as como las limitaciones que se detectan.

    La Conclusin incluye los aspectos ms significativos del estudio, que resultan las claves de haber resuelto la investigacin.

    La resea de las Referencias Bibliogrficas debe incluir todos (y solamente) los textos citados de manera breve durante el informe, con todos los datos bsicos que permiten ubicar la obra o trabajo de investigacin. Existen diversas normas de redaccin de las referencias bibliogrficas, entre las cuales se deber seleccionar una y utilizar de manera uniforme para todos los textos incluidos. Debe tenerse en cuenta que en muchas ocasiones (congresos, publicaciones, etc.) se precisan cules normas de uso difundido o propias deben emplearse.

    Los Anexos sirven para incluir material que resulta de lectura ms pesada o de consulta, pero que pueden obviarse en una recorrida del material. Pueden incluirse tablas o grficos, formularios de captura de datos, etc.

  • Materia:MtodosyTcnicasdeInvestigacinSocialProfesora:Mgter.VernicaHerrero|29

    Bibliografa Lectura 11

    Bibliografa Bsica Bologna, E. (2003b) Relacin entre variables. Apunte de Ctedra A. Universidad Empresarial Siglo 21. Hernndez Sampieri, R.,Fernndez Collado, C. y Baptista Lucio, P. (2003) Metodologa de la Investigacin. Tercera Edicin. Mxico: McGrawHill.

    Otras fuentes consultadas Cea DAcona, M.A. (1999) Metodologa cuantitativa: estrategias y tcnicas de investigacin social. 2da. Reimpresin. Madrid: Sntesis.

    www.uesiglo21.edu.ar