esquema de la asignatura

ESQUEMA DE LA ASIGNATURA

Módulo 1 El proceso de investigación en psicologíaMódulo 2 Metodología de la investigación I: Metodologías cuantitativasMódulo 3 Metodología de la investigación II: Metodologías cualitativasMódulo 4 Medición en psicologíaMódulo 5 Teoría y técnicas de construcción de tests, escalas y cuestionariosMódulo 6 Análisis de datos

OBJETIVOS DEL MÓDULO

1. Entender las principales diferencias entre la estadística descriptiva y laestadística inferencial.

2. Descubrir los principales indicadores de la estadística descriptiva.

3. Aprender a calcular los principales indicadores de la estadística des-criptiva.

4. Conocer los principios sobre los que se fundamenta la estadística infe-rencial.

5. Analizar los métodos de muestreo.

181MÉTODOS, DISEÑOS Y TÉCNICAS DE INVESTIGACIÓN PSICOLÓGICOS

EXPOSICIÓN DE LOS CONTENIDOS

1. ESTADÍSTICA DESCRIPTIVA

La estadística descriptiva hace referencia a la recogida, ordenación y aná-lisis de los datos recogidos en una muestra. La descripción de una variabletiene que venir expresada por medio de índices numéricos así como poralguna representación gráfica. A efectos prácticos se debe diferenciar dostipos de variables: las cualitativas y las cuantitativas.

JOSÉ JUAN CASTRO SÁCHEZ

182 MÉTODOS, DISEÑOS Y TÉCNICAS DE INVESTIGACIÓN PSICOLÓGICOS

ESQUEMA DE LOS CONTENIDOS

Análisis de Datos

Estadística escriptitiva Estadística Inferencial

Variable cualitativa

Variable cuantitativa

Conceptos previos

M. deMuestreo

Principalesindicadores

Índices de localización

Índices devariabilidad

Índices deforma

Índices deposición

Otros índices

El azar de la vida

cotidiana

Clases desucesos

Leyes del azar

Introduccióna la Ley de

Laplace

Población ymuestra

M. deMuestreo

M. muestreoProbabilísticos

M. muestreono Probabilísticos

Muestreopolietápico

1.1. Descripción de una variable cualitativa

El mejor descriptor de una variable cualitativa es la frecuencia de cada unade sus categorías, mientras que las representaciones gráficas más habitualesson el diagrama de barras y el diagrama de sectores.

1.2. Descripción de una variable cuantitativa

La descripción numérica de una variable cuantitativa viene dada por unconjunto de índices que hacen referencia a cuatro tipos de información dife-rentes:

1. Índices de localización o tendencia central.

2. Índices de variabilidad o dispersión.

3. Índices de forma.

4. Índices de posición.

1.2.1. Índices de localización

Un índice de localización pretende proporcionar un valor que representeal conjunto de observaciones. Los índices de localización clásicos serían: lamedia aritmética (“mean”) es la que ocupa el primer lugar en relevancia, lamediana (“median”) y la moda (“mode”).

Media aritmética

La media aritmética es aquel valor de la variable que representa el centrode gravedad de la distribución. Es decir, la media aritmética proporcionaaquel valor de la variable en la que la distribución de observaciones quedaequilibrada. Así pues, la media aritmética representa el punto de equilibrio dela distribución, a modo de balanza. Su valor se obtiene sumando los valoresde la variable y dividiendo por su número, mediante la expresión:


ANÁLISIS DE DATOS

∑ xi

nx=

Ejemplo:

En la empresa LMACH, S.L. hay un enorme debate sobre si los sueldosson justos o no. Éstos son los salarios mensuales:

• Directora general: 4.800 €

• Directora comercial: 2.100 €

• Gerente: 1.500 €

• Administrador: 1.200 €

• Dos encargados: 900 € cada uno.

• Cuatro operarios: 300 € cada uno.

Tabla de frecuencia



VALOR FRECUENCIA PORCENTAJE PORCENTAJE ACUMULADO

300 4 40% 40%

900 2 20% 60%

1.200 1 10% 70%

1.500 1 10% 80%

2.100 1 10% 90%

4.800 1 10% 100%

Esto es lo que opina Cristina, directora general: Aquí se gana bastante, lamedia aritmética es de 1.260 € mensuales.

4.800 + 2.100 + 1.500 + 1200 + ( 900 x 2 ) + ( 300 x 4 ) 10

12600 10

X=

X= = 1.260 €

Además de la media aritmética existen otros tipos de medias a las queAmón (1985) denomina medias aritméticas generalizadas”.

Media geométrica

La media geométrica se define como la raíz enésima del producto de lasn observaciones. La media geométrica se utiliza en aquellas situacionesdonde los factores que afectan a la variable son multiplicativos. Así, la con-centración de humo de tabaco en una situación se reduce a la mitad cuandola tasa de aire circulante aumenta el doble.

Media armónica

La media armónica se utiliza en aquellas situaciones donde los factoresque afectan a la variable son inversamente aditivos. Así, si realizamos un viajede 900 km, donde los primeros 300 km los hacemos a 60 km/h, otros 300a 50 km/h y los últimos 300 km a 40 km/h, la velocidad promedio no es de(60 + 50 + 40)/3= 50 km/h, ya que el primer tramo lo hemos hecho en 5horas, el segundo en 6 horas y el tercero en 7,5 horas; la velocidad promedioes 900/ (5+6+7,5)= 48,6486 km/h. Pues bien, este valor es la media armó-nica de las velocidades.

Mediana

La mediana es el valor de la variable que divide a la distribución en dospartes iguales conteniendo cada una de ellas el 50% de las observaciones. Porlo tanto, la mediana es el valor que ocupa el lugar central cuando hemosordenado todos los datos de menor a mayor. Así cuando el número deobservaciones es impar el valor de la mediana es el valor de la variable queocupa el centro de la serie ordenada. Cuando el número de observaciones espar, el valor de la mediana se obtiene mediante la media aritmética de los dosvalores centrales de la serie ordenada o puede que existan dos medianas.

Ejemplo:

Con respecto al ejemplo anterior de la empresa LMACH, S.L. La direc-tora comercial, Pilar podría contestarle a Cristina: “No exageres, Cristina, sicolocamos ordenadamente los 10 sueldos, el que está en medio es de sólo900 €.


ANÁLISIS DE DATOS

Como observamos en la tabla el valor central se corresponde con el sueldode los encargados que es de 900 €. Otra forma de calcular la mediana esutilizando la tabla de frecuencia del ejemplo, aquel valor que se correspondecon el 50% del porcentaje acumulado será el valor de la mediana.

Moda

La moda es aquel valor de la variable que se presenta con mayor fre-cuencia. La moda es el parámetro central más fácil de conocer y obtener. Porello, en el lenguaje coloquial, llamamos moda a lo que más se usa o se lleva. Eslógico suponer que hay estudios estadísticos que tengan más de una moda.

Ejemplo:

Atendiendo al ejemplo desarrollado en la media aritmética y en la mediana,con respecto a la moda, Julio, un operario podría añadir a los comentariosanteriores: “Esta empresa paga mal, ya que la mayoría sólo cobramos 300 €.



PERSONAL SUELDOSDirectora general 4.800 €Directora comercial 2.100 €Gerente 1.500 €Administrador 1.200 €Encargado 900 €Encargado 900 €Operario 300 €Operario 300 €Operario 300 €Operario 300 €

PERSONAL SUELDOS1 Directora general 4.800 €1 Directores comerciales 2.100 €1 Gerentes 1.500 €1 Administrativos 1.200 €2 Encargados 900 €4 Operarios 300 €

También podemos calcular la moda en la tabla de frecuencia observandoque valor presenta mayor porcentaje.

1.2.2. Índices de variabilidad

Un índice de variabilidad permite medir lo lejos o cerca que el conjuntode observaciones está respecto a un valor central como puede ser la mediaaritmética.

Varianza y desviación estándar

Respecto a los índices de variabilidad, el más clásico es la varianza o suraíz cuadrada, S, la desviación estándar. Para medir la variabilidad lo mejorserá medir las distancias de cada observación a la media. Cuando mayoressean estas distancias mayor será la variabilidad. Sin embargo, estas distanciasno pueden sumarse entre sí, ya que sabemos que esta suma siempre es iguala cero y por tanto, no nos sirve como media.


ANÁLISIS DE DATOS

La varianza sería igual a la suma de las distancias cuadráticas, siendo lasdistancias cuadráticas, las distancias de las observaciones con respecto a lamedia al cuadrado.

Ejemplo:

Xi Ni4.800 € 12.100 € 11.500 € 11.200 € 1

900 € 2300 € 4

Sabiendo que la media aritmética es 1.260 calculamos la varianza.

1 x (4.800 - 1.260)2 + 1 x (2.100 - 1260)2 + 1 x (1.500 - 1.260)210

+ 1 x (1.200 - 1.260)2 + 2 x (900 - 1.260)2 + 4 x (300 - 1.260)210

12.531.600 + 705.600 + 57.600 + 3.600 + 259.200 + 368.400 10

σ = =

=

= 1.724.400

Desviación media

Las distancias pueden tomarse en valor absoluto y sumarse. Esta soluciónconduce al índice denominado desviación media. Estos índices miden lahomogeneidad o grado de dispersión de las observaciones, es decir, si estasestán muy próximas entre sí o bien están alejadas.

Amplitud

Otra medida de variabilidad es la denominada amplitud de la distribución(“range”), diferencia entre los valores (“maximum”) y mínimo (“minimum”)de la distribución.

1.2.3. Índices de forma

Los coeficientes de forma son índices que nos permiten estudiar lascaracterísticas de la distribución de datos respecto a la clásica distribuciónnormal de Laplace-Gaus. El coeficiente de asimetría G1 (“skewness”) per-mite estudiar la simetría de la distribución, mientras que el coeficiente deapuntamiento G2 (“kurtosis”) nos permite estudiar su altura.

Tipos de asimetría

Se dice que una distribución es asimétrica positiva cuando el cuerpo centralde observaciones se encuentra desplazado hacia la izquierda y la distribuciónpresenta una cola hacia la derecha por lo que también se denomina simetríahacia la derecha, mientras que será asimetría negativa cuando éste desplazadohacia la derecha, por lo que también se denomina asimetría hacia la izquierda,ya que la distribución presenta una cola hacia la izquierda de la distribución.



La desviación estándar es la raíz cuadrada de la varianza, por tanto es igual a:

S = √1.724400 = 1313,1641

Tipos de apuntamiento

Por otra parte, en relación al apuntamiento, se dice que una distribuciónes leptocúrtica cuando es más apuntada que la normal, mesocúrtica cuandosu altura corresponde con la normal y platicúrtica cuando está por debajo dela normal.


ANÁLISIS DE DATOS

1.2.4. Índices de posición

Los cuantiles permiten posicionar a un sujeto respecto al conjunto de ladistribución. Se define el cuantil Q(p) como aquel valor de la variable quedeja una proporción p de observaciones por debajo de él.

En función del número de divisiones que se realiza de la distribución deobservaciones se definen distintos cuantiles. Así, se definen los cuartilescomo los tres valores que dividen la distribución en cuatro partes de igualtamaño, denominados Q1, Q2, Q3. El primer cuartil Q1 es el valor de lavariable que deja un 25 por 100 de las observaciones por debajo de él, elsegundo cuartil Q2 es el valor de la variable que deja un 50 por 100 de lasobservaciones por debajo de él, mientras que el tercer cuartil Q3, es el valorde la variable que deja un 75 por 100 de las observaciones por debajo de él.De lo anterior se desprende que el segundo cuartil coincide con el valor dela mediana, igual que con el D5 y el P50.

Se puede definir los deciles, Di con rango desde i=1 a i=9, como los valoresque dividen la distribución en diez partes iguales en tamaño, y siguiendo conesta nomenclatura se pueden definir los percentiles, Pi con rango desdei= a i=99, como aquellos valores que dividen la distribución en cien partesde igual tamaño. Su interpretación se realiza en términos de porcentaje desujetos con puntuación inferir o igual al rango del percentil. Así pues, si elpercentil 40 de una distribución vale 33 esto significa que un 40 por 100 desujetos tiene una puntuación en la variable inferior o igual a 33.

Ejemplo:

Continuando con el ejemplo anterior, colocamos todos los sueldos y mar-caremos los tres valores de la variables que se corresponden con los cuartiles.



PERSONAL SUELDOSDirectora general 4.800 €Directora comercial 2.100 €Gerente 1.500 €Administrador 1.200 €Encargado 900 €Encargado 900 €Operario 300 €Operario 300 €Operario 300 €Operario 300 €

1.2.5. Otros índices

Coeficiente de variación

El coeficiente de variación es un índice cuya relevancia no tiene que verdirectamente con la descripción de la distribución, sino más bien nos permitecomparar distribuciones entre sí. Su cálculo se realiza por medio de la expresión.

Coeficiente de correlación

Como medida de relación entre dos variables tiene el problema de quedepende de las unidades de medida de las variables relacionadas. Pearsondefinió el coeficiente de correlación de la siguiente manera.

SCV =

X

∑ xi yi

n X Y

r =Sx Sy

El valor del coeficiente de correlación de Pearson se mueve dentro delintervalo (-1,+1), tomando el valor cero cuando hay independencia entre lasdos variables, es decir, cuando no hay relación entre ellas.

Ejemplo:

Para calcular el coeficiente de correlación utilizaremos el mismo ejemplointroduciendo una nueva variable, los años de antigüedad de los empleados.De esta forma calcularemos si existe una relación entre la antigüedad de losempleados y el sueldo que estos perciben.


ANÁLISIS DE DATOS

Años de antigüedad Sueldos Nº de personas15 4.800 110 2.100 112 1500 19 1200 16 900 22 300 4

Sabiendo que la desviación estándar de los sueldos es de 1313,1641 y lade los años de antigüedad es 4,4988 calculamos el coeficiente de correlación.

Una vez que se ha hallado el coeficiente de correlación de los sueldos delos empleados y los años de antigüedad de los mismos (0,877), al estar esteresultado más cercano a 1 que a 0, esto nos indica que las dos variables estánrelacionadas y pueden ser dependientes.

2. ESTADÍSTICA INFERENCIAL

2.1. Conceptos previos

2.1.1. El azar en la vida cotidiana

Si lanzamos una moneda al aire cinco veces y siempre sale cara. Si la lan-zamos por sexta vez ¿cuál de las siguientes respuestas es la correcta?

• Lo más probable es que aparezca cara

5184 1313,1641 x 4,4988Rxy = = 0,877

• Es igual de probable que salga cara que cruz

Cuando se lanza un dado cúbico, ¿qué número o números son más difí-ciles de obtener? ¿Y cuáles son más fáciles?

Estos experimentos tienen algo en común: no se puede saber el resultadoantes de realizarlo. Como estas acciones (tirar una moneda, un dado, etc.) haymuchas otras en las que no sabemos qué obtendremos hasta no haberlasllevado a cabo.

A todos estos experimentos a los que no se puede predecir su resultadose les denomina experimentos aleatorios. No obstante, no hace falta crear apropósito un experimento para que sea aleatorio. La vida está repleta de juegosque lo son: lotería primitiva, sorteo de la ONCE, lotería nacional, bonoloto,parchís, dominó, cartas, quinielas, etc.

Pero no hace falta recurrir a los juegos y sorteos para encontrarnos confenómenos aleatorios. Así, por ejemplo, cuando una pareja decide tener unhijo no saben de antemano su sexo: el azar es el encargado de cruzar los cro-mosomas XX (para que nazca una niña) o los cromosomas XY (para quenazca un niño). Lo mismo ocurre con la temperatura que hará mañana, el díade la semana en que nacimos, etc.

En cambio, aprobar un examen no depende de la suerte; sino de otrosfactores. Esencialmente de lo que hayas estudiado y trabajado durante elcurso. Tampoco está relacionado con el azar un juego tan interesante comoel ajedrez, ya que todo se basa en cómo muevas las piezas, de modo quecuánto más juegues, más fácil te será ganar.

Por otro lado, en la vida cotidiano hay gran cantidad de experimentos delos cuales sí podemos saber su resultado final y no son aleatorios. Se lesdenomina experimentos deterministas. Por ejemplo, si dejamos caer un bolí-grafo al suelo, éste se caerá.

2.1.2. Clases de sucesos

El azar tiene un lenguaje muy peculiar que es necesario conocer paraentendernos cuando hablamos sobre él. A cada uno de los resultados posiblesque pueden salir en un experimento aleatorio se le llama suceso elemental o sim-plemente suceso.

A la colección formada por todos los sucesos elementales que puedensalir en un experimento aleatorio se le denomina espacio muestral.

Si tenemos la certeza de que un suceso se va a producir se le denominasuceso seguro.



Si tenemos la certeza de que un suceso nunca puede ocurrir se le deno-mina suceso imposible.

Se le denomina suceso contrario a uno dado al formado por los resultadosdel experimento no incluidos en dicho suceso.

Los sucesos incompatibles son aquellos en los que si ocurre uno no puedeocurrir el otro.

Ejemplo:

Tenemos una ruleta dividida en tres partes iguales y con valores 1, 2 y 3.Entonces obtenemos que:

• Es imposible que salga un 5.

• Es seguro que saldrá un valor menor que 4.

• Lo contrario a salir 3 es salir 1 ó 2.

• No es posible que salga 1 y 3 a la vez.

• Es posible que salga 2 y par a la vez.

• Lo contrario a salir par es sacar un número impar.

2.1.3. Leyes del azar. Introducción a la probabilidad

En la mayoría de los experimentos aleatorios se obtiene una gran cantidadde información, de datos, que hay que recoger de algún modo para analizary sacar conclusiones. Una de las formas de clasificar la información es elestudio de frecuencias, tanto absolutas como relativas, agrupadas en tablasde frecuencias.

La frecuencia absoluta es el número de veces que se obtiene un determinadovalor en un experimento aleatorio.

La frecuencia relativa es el número que se obtiene de dividir la frecuenciaabsoluta de un valor entre el número total de veces que se ha realizado elexperimento o suceso aleatorio.


ANÁLISIS DE DATOS

Ejemplo:

Si lanzamos un dado ocho veces y tres de ellas salió el número 2, cuatroveces el número 5 y una vez el 3. La frecuencia absoluta y relativa se expresaen la siguiente tabla:



VALOR FRECUENCIA FRECUENCIA ABSOLUTA RELATIVA

2 3 3/8=0.3753 1 1/8=0.1255 4 4/8=0.5

Lo fundamental de un experimento o suceso aleatorio es lo imprevisiblede sus resultados, ya que nunca podemos conocerlos antes de realizar elexperimento. Sin embargo, al analizar las frecuencias absolutas y relativas sepuede ver si hay alguna tendencia o información que nos sirva de guía parahacer una hipótesis. Para ello, lo mejor es repetir un mismo experimento ungran número de veces y examinar qué ocurre.

De esta manera se comprueba que, a medida que aumenta el número depruebas, la diferencia entre las frecuencias absoluta de dos valores aumentay las frecuencias relativas van aproximándose a un número.

Este resultado podemos generalizarlo para cualquier experimento aleatorio.Así tenemos las siguientes leyes del azar:

Al repetir un gran número de veces un experimento aleatorio:

• La diferencia entre las frecuencias absolutas va aumentando.

• Las frecuencias relativas tienden hacia un determinado número.

Esta última propiedad es la más importante y se le conoce como ley de laestabilidad de frecuencias o ley del azar.

2.1.4. Introducción a la ley de Laplace

Según la ley del azar a cada suceso le podemos asociar un número, com-prendido entre 0 y 1 que indique la probabilidad de que el suceso ocurra alrealizar el experimento. Este número coincide con la tendencia de la fre-cuencia relativa al realizar un número suficientemente elevado de pruebas yse le conoce como la probabilidad del suceso. Si representamos este número

sobre un segmento de longitud 1, la probabilidad podría ser entendida comoalgo similar a lo siguiente:


ANÁLISIS DE DATOS

0 1/2 1Imposible Probable a medias Seguro

Cuanto más cercano esté el valor de 0, menos probable será el suceso y,cuánto más se aproxime a 1, más probable será.

No siempre es fácil asociar una probabilidad a un suceso por ello se pro-pone lo siguiente:

Si tiramos 60 veces un dado de 6 caras, las frecuencias relativas, para cadauno de los valores, se aproximan cada vez más a 0, 1666=1/6. Este númerose puede obtener sin necesidad de calcular sus frecuencias relativas. Un dadocúbico tiene 6 caras, pero sólo una está marcada con el 2, por eso de cada 6posibles resultados sólo uno es favorable a obtener el valor 2. Por tanto, suprobabilidad es 1/6.

Si se generaliza se puede obtener la ley o regla de Laplace que señala quela probabilidad de obtener un suceso es igual al cociente entre los casos favo-rables a dicho suceso y todos los casos posibles del experimento.

Para aplicar esta ley se debe tener en cuenta que cada uno de los sucesoselementales debe ser igual de probable de salir. Así, la probabilidad de obte-ner un 2 en un dado es la misma que la de obtener un 5. Cuando ocurre estose dice que los sucesos son equiprobables.

2.2. Métodos de muestreo

2.2.1. Población y muestra

El investigador delimita el ámbito de su estudio definiendo una población.La población es el conjunto de todos los individuos en los que se desea estudiar elfenómeno. Sin embargo, en la práctica no se analizan todos los individuos dela población; sino que se selecciona una muestra. La muestra es un subcon-junto de la población, seleccionado por algún método de muestreo, sobre elcual se realizan las observaciones y se recogen los datos. El método de muestreodeber ser tal que asegure la representatividad de la muestra. Además el tamañode la muestra debe ser suficiente. Se denomina individuo a cada uno de loselementos que componen la población y también la muestra. Los individuosno son necesariamente personas; pueden ser objetos, acontecimientos. EnCiencias Sociales, en muchas ocasiones son personas y en ese caso se lesdenomina sujetos.

2.2.2. Métodos de muestreo

El procedimiento para seleccionar la muestra de individuos sobre los quese van a recoger datos debe ser tal que asegure su representatividad. Esto esde primordial importancia para llegar a conclusiones que sean generalizables.Cochran (1968) y Kish (1965) desarrollan con todo detalle los principalesmétodos de muestreo. Además son buenos ejemplos Arnau (1978, 199), Fox(1980, 367) y otros. A partir de todas estas obras se puede señalar los prin-cipales métodos de muestreos:

2.2.2.1. Métodos de muestreo probabilísticos

Los métodos de muestreo probabilísticos se basan en el principio de equi-probabilidad. Es decir, todos los individuos de la población tienen las mismasprobabilidades de entrar a formar parte de la muestra. Se recomienda utilizarmétodos probabilísticos siempre que sea posible, puesto que son los que ase-guran mejor la representatividad de la muestra. Dentro de los métodosprobabilísticos se encuentran los siguientes:

a) Aleatorio simple

El procedimiento utilizado consiste en:

1. Asignar un número a cada individuo de la población.

2. La selección se realiza mediante algún sistema mecánico, generalmentemediante las tablas de números aleatorios y otro procedimiento similar.Actualmente los ordenadores y muchas calculadoras de bolsillo puedengenerar números aleatorios que sirven a tal efecto.

b) Aleatorio sistemático

Se siguen los pasos siguientes:

1. Se ordenan los individuos de la población.

2. Se calcula c= N/n donde c (constante) es un número entero, N es elnúmero de individuos de la población y n el tamaño de la muestra.

3. Se elige al azar un número “a”, comprendido entre 1 y c.



4. El número “a” será el primer individuo seleccionado.

5. Los sucesivos individuos serán a + c, a + 2c, a + 3c,... hasta llegar a n.

c) Aleatorio estratificado

El procedimiento consiste en:

1. Dividir la población en varios estratos

2. Dentro de cada estrato se realiza un muestreo por alguno de los otrosprocedimientos que aquí se exponen

3. El número de individuos de cada estrato se decide por: afijación simple: lamuestra total se divide en partes iguales; afijación proporcional: se tiene en con-sideración la proporción de individuos de cada estrato; afijación óptima: ademásde la proporción de cada estrato se tiene en cuenta la dispersión de los datos.

d) Por conglomerados

El muestreo por conglomerados (cluster sampling) se utiliza cuando losindividuos de la población constituyen agrupaciones naturales como, porejemplo, los alumnos de una clase. En este caso la unidad de muestreo no esel individuo sino el conglomerado. Una vez definidos los conglomerados,éstos se seleccionan por algún método de muestreo de los que aquí se pre-sentan, de tal forma que el número total de individuos resultante configureel tamaño de la muestra que se desea.

2.2.2.2. Métodos de muestreo no probabilísticos

Estos métodos seleccionan a los individuos siguiendo determinados cri-terios, procurando que la muestra resultante sea lo más representativa posible.Los principales son:

a) Por cuotas

En este método a veces denominado “accidental”, se fijan unas “cuotas”.Cada cuota consiste en un número de individuos que reúnen unas determinadascondiciones. La selección de las cuotas suele hacerse mediante “rutas” o “iti-nerarios”. Un ejemplo puede ser “20 individuos de 25 a 40 años, casados y


ANÁLISIS DE DATOS

de género masculino de la población de Ingenio (Las Palmas de GranCanaria). Se eligen los primeros que se encuentran que reúnan estas condi-ciones. Este método se utiliza mucho en las encuestas de opinión.

b) Opinático

La selección se hace a expertos según unos criterios establecidos, de talforma que se asegure la representatividad de la muestra.

c) Casual

El caso más frecuente de este procedimiento es el de utilizar como muestraa individuos con los que se tiene facilidad de acceso. Un caso particular es elde utilizar voluntarios. En el caso de utilizar voluntarios hay que tomar unaserie de medidas con objeto de asegurar la representatividad.

d) Bola de nieve

Se localizan algunos individuos, los cuales conducen a otros, y éstos aotros y así hasta conseguir una muestra suficiente. Como una bola de nieve,que al rodar va creciendo. Este tipo de muestreo se aplica en casos especialescomo drogadictos, delincuentes, sectas, etc. Uno se pone en contacto conotros y así sucesivamente se va ampliando la muestra. Es un método propiode la investigación cualitativa.

2.2.2.3. Muestreo polietápico

En la práctica, muchas veces no se utilizan métodos de muestreo puros,sino una combinación de diversos métodos secuenciados en una serie de etapas.Por eso se le denomina “muestreo polietápico”. Por ejemplo, una investigaciónsobre la prevención del tabaquismo puede seleccionar una muestra con lassiguientes condiciones: estratificada por edades, comunidades autónomas,hábitats y sexo: la unidad muestral es un conglomerado grupo-clase, selec-cionado por el método aleatorio sistemático. Como puede verse, para llegara la última unidad de muestreo deben seguirse una serie de etapas.

2.3. Principales indicadores

La probabilidad y el muestreo son el puente que nos permiten pasar valida-mente de la muestra a la población, que legitima el salto desde las características



conocidas de la muestra hasta las características desconocidas de la pobla-ción. En definitiva, la estadística inferencial se ocupa de la verificación deinferencias acerca de la población a partir de la muestra.

En la estadística inferencial suele ser habitual la aplicación de pruebas designificación estadística, también denominadas pruebas de contraste o dedecisión. Estas pruebas sirven para determinar la existencia de diferenciasentre grupos, la dependencia de variables, el ajuste de distribuciones obser-vadas a distribuciones teóricas, etc.

Las pruebas de significación tienen como punto de partida el estableci-miento de una hipótesis estadística. Estas son las que se someten a compro-bación en las pruebas de significación. Las hipótesis estadísticas son dos:

1. Hipótesis nula (Ho): la diferencia es estadísticamente nula. Las dife-rencias observadas son debidas a las oscilaciones del azar.

2. Hipótesis alternativa (H1): las diferencias observadas no pueden serexplicadas por las oscilaciones del azar; es decir, las diferencias son estadís-ticamente significativas.

En una prueba de significación lo que se somete a comprobación siemprees la hipótesis nula, ya que según un principio general de estas pruebas, todaslas diferencias son debidas al azar mientras no se demuestre lo contrario. Elrechazar la hipótesis nula supone automáticamente aceptar la hipótesis alter-nativa.

El término nivel de significación es frecuente en este tipo de estadística,hace referencia al riesgo de error que se está dispuesto a asumir en caso derechazar la hipótesis nula. Más frecuente aún, y debido al desarrollo de lospaquetes informáticos, es el término grado de significación que hace refe-rencia a la probabilidad de error calculada al rechazar la hipótesis nula.

Al aplicar una prueba de significación estadística (también denominadasde contraste o decisión) se siguen, de forma implícita o explícita, los pasossiguientes:

1. Formular la hipótesis nula.

2. Elegir un nivel de significación.

3. Aplicar la prueba estadística adecuada.

4. Tomar una decisión con una probabilidad de error.


ANÁLISIS DE DATOS

La decisión que finalmente se toma se puede expresar mediante una delas formas siguientes:

• Nada se opone a aceptar la hipótesis nula.

• Se rechaza la hipótesis nula (p = valor obtenido).

La estadística inferencial se apoya generalmente sobre pruebas de con-traste paramétricas. Estas pruebas se pueden aplicar con variables que cumplenunos requisitos denominados “supuestos paramétricos”. Estos son:

a) La variable dependiente es cuantitativa continua medida por lo menosen una escaala de intervalos.

b) La muestra procede de una población que se distribuye según la curvanormal.

c) Existe homoscedaticidad entre los grupos (las dispersiones de cadagrupo son equivalentes).

d) La muestra es grande (n>30).

Las pruebas paramétricas de contraste y correlaciones más usuales son:

1. La prueba t de Student de contraste entre dos medias que se utiliza paracomparar dos medias.

2. El análisis de varianza que se utiliza para comparar las medias de másde dos grupos simultáneamente.

3. La correlación (relación entre dos variables) y la regresión (predicciónde una variable en función de otra).

El incumplimiento de los supuestos paramétricos sugiere la convenienciade aplicar pruebas no paramétricas. Se conoce como estadística no paramé-trica al conjunto de pruebas que se aplican sin necesidad de hacer ningúntipo de suposiciones sobre las distribuciones de origen de las variables quese están estudiando. Las pruebas no paramétricas son especialmente útilescon variables medidas en escalas ordinales o nominales. Generalmente se



usan con variables cualitativas, pero también se aplican con variables cuanti-tativas que no cumplen los supuestos paramétricos.

Al igual que en la estadística paramétrica, podemos distinguir entre pruebasde contraste y correlaciones. Entre las primeras, son más conocidas la U deMann-Whitney, Ji-cuadrado y la T de Wilconxon. Entre las segundas, sonmás conocidas la correlación de Spearman, la W de Kendall y la correlaciónbiserial.

ACTIVIDADES

1. Localizar las fórmulas de los siguientes índices: media geométrica,media armónica, desviación media, amplitud.

2. En las siguientes variables calcular: la distribución de frecuencias, lamedia aritmética, la moda y la mediana, la varianza, la desviación típica, laamplitud, el coeficiente de variación y la correlación entre ambas variables.


ANÁLISIS DE DATOS

Altura Peso Nº de personas150 48 1120 35 1100 40 190 22 160 9 250 4 4

BIBLIOGRAFÍA

BIBLIOGRAFÍA COMPLEMENTARIA

BISQUERRA, R. (1987). Introducción a la estadística aplicada a la investigación edu-cativa. Un enfoque informático con los paquetes bmdp y spss-x. PPU: Barcelona

BOTELLA, J., O. LEÓN y R. SAN MARTÍN (1993): Análisis de datos en psi-cología. Tomos I y II. Pirámide: Madrid.

BOTELLA, J y M. BARRIOPEDRO (1993): Problemas y ejercicios dePsicoestadística. Pirámide: Madrid..

REFERENCIAS BIBLIOGRÁFICAS

AMON, J. (1985). Estadística para psicólogos. Vol. 1. Estadística descriptiva.Pirámide: Madrid.

ARNAU, J. (1978). Psicología experimental. Un enfoque metodológico. Trillas:México.

COCHRAN, W. G. (1968). “Errors of measurement in statistics”.Technometrics, 11, 637-666.

FOX, D. (1980). El proceso de investigación en educación. Eunsa: Pamplona

KISH, L. (1965). Survey sampling. John Wiley: New York.



EJERCICIOS DE AUTOCONTROL

1. La descripción numérica de una variable cuantitativa viene dada por unconjunto de índices:

a) Índices de localización, de dispersión, de variabilidad y de forma.b) Índices de tendencia central, de variabilidad, de forma y de locali-

zación.c) Índices de posición, de variabilidad, de forma y de tendencia central.d) Índices de dispersión, de localización, de varianza y de forma.

2. Los índices de variabilidad permiten:

a) Proporcionar un valor que represente al conjunto de observaciones.b) Medir la distancia que existe entre un conjunto de observaciones

respecto a un valor central como puede ser la media aritmética.c) Estudiar las características de la distribución de datos respecto a la

distribución normal de Laplace Gaus.d) Posicionar a un sujeto respecto al conjunto de la distribución.

3. En relación a los tipos de apuntamiento se dice que una distribución esmesocúrtica cuando:

a) Es más apuntada que la normal.b) Su altura corresponde con la normal.c) Su altura está por debajo de la normal.d) Su altura es el doble que la normal.

4. La media aritmética es un índice de localización y se utiliza en situa-ciones:

a) Cuando los factores que afectan a la variable son de naturaleza adi-tiva y la distribución de la variable es asimétrica.

b) Cuando los factores que afectan a la variable son inversamente adi-tivos.

c) Cuando los factores que afectan a la variable son multiplicativos.d) Todas las respuestas son falsas.


ANÁLISIS DE DATOS

5. La descripción gráfica más habitual y característica de una variablecuantitativa es:

a) El diagrama de barras.b) El histograma.c) El diagrama de sectores.d) El diagrama de columnas.

6. La mediana puede definirse como aquel índice de localización coyovalor de la variable:

a) Representa el centro de gravedad de la distribución.b) Se presenta con mayor frecuencia.c) Divide a la distribución en dos partes iguales.d) Se obtiene a través de la raíz enésima del producto de las n obser-

vaciones.

7. La ley de la estabilidad de frecuencias o ley del azar se basa en que alrepetir un gran número de veces un experimento aleatorio:

a) La diferencia entre las frecuencias absolutas va aumentando y lafrecuencias relativas tienden hacia un determinado número.

b) La diferencia entre las frecuencias relativas va aumentando y lasfrecuencias absolutas tienden hacia un determinado número.

c) La diferencia entre las frecuencias absolutas disminuyen y las fre-cuencias relativas tienden hacia un determinado número.

d) Las frecuencias relativas van aumentando y la diferencia entre lasfrecuencias absolutas tienden hacia un determinado número.

8. A la colección formada por todos los sucesos elementales que puedensalir en un experimento aleatorio se le denomina:

a) Suceso seguro.b) Sucesos incompatibles.c) Espacio muestral.d) Sucesos aleatorios.



9. El principio en el cual se basan los métodos de muestreo probabilísticosconsiste en la:

a) Representatividad.b) Equiprobabilidad.c) Probabilidadd) Aleatorización.

10. El primer paso de uno de los métodos de muestreo consiste en ordenarlos individuos de la población y a continuación calcular c=N/n. Este métodode muestreo se denomina:

a) Aleatorio simple.b) Aleatorio estratificado.c) Aleatorio sistemático.d) Opinático.

SOLUCIONES A LOS EJERCICIOS DE AUTOCONTROL

1. c2. b3. b4. d5. b6. c7. a8. c9. b10. c


ANÁLISIS DE DATOS

GLOSARIO DE TÉRMINOS

Afijación: Acto de establecer el número de elementos pertenecientes a unestrato que deben ser incluidos en la muestra.

Aleatorio/a: Sometido al azar, a las leyes de la probabilidad.

Análisis de datos: Fase del proceso de investigación que consiste en organizarla información recogida para que pueda ser tratada, descrita e interpretada.

Análisis estadístico: Análisis de datos que utiliza la estadística para organizar,describir y analizar los datos de un estudio.

Coeficiente de correlación: Coeficiente que indica el grado de relación o con-comitancia entre dos variables. Habitualmente hace referencia al coeficientede correlación de Pearson.

Correlación: Relación recíproca. Grado de relación y sentido de la variaciónde dos o más series de datos. Mutua relación entre dos o más variables.

Cuota: Número de unidades muestrales de unas características fijadas, quehay que completar en el proceso de obtención de las entrevistas.

Dato: Cualquier información extraída de los fenómenos, fijada o codificadapor el investigador. Elemento conocido directamente.

Equiprobabilidad: La misma probabilidad. Igual probabilidad de ser elegidopara formar parte de una muestra.

Estrato: Subconjunto de la población con características propias que dese-amos representar en la muestra.

Ficha técnica: Resumen sobre las características de población, tamaño de lamuestra, afijación, técnica de muestreo, error muestral y fecha de realización.

Hipótesis alternativa: Hipótesis estadística complementaria de la hipótesisnula, que se acepta cuando se rechaza la hipótesis nula. La aceptación de la



hipótesis alternativa implica el rechazo previo de la hipótesis nula.

Hipótesis estadística: Hipótesis que se expresa relacionando las variables entérminos cuantitativos o estadísticos.

Hipótesis nula: Hipótesis estadística que se plantea a priori para comprobar(rechazar o no) la hipótesis mediante pruebas estadísticas pertinentes. El norechazo de la hipótesis nula implica el rechazo de la hipótesis alternativa.

Inferencia: Proceso por el que se acepta una proposición sobre la base deotras proposiciones consideradas ciertas. Sacar consecuencias de algo o deun principio.

Inferencia estadística: Proceso de generalización a una población de los resul-tados obtenidos de una o más muestras.

Nivel de significación: Probabilidad de error que el investigador está dis-puesto a asumir al rechazar la hipótesis nula. En ciencias sociales menor queel 5% (p<.05).

p: Probabilidad de error cuando se rechaza la hipótesis nula. Grado designificación de una prueba estadística.

Representatividad: Propiedad atribuible a una muestra cuando está configu-rada por las mismas variables de la población a la que pertenece. Cuando unamuestra es representativa, las características observadas en la muestra se puedengeneralizar a la población.

Resultados: Conjunto resumido de las mediciones hechas en la variabledependiente.

Ruta aleatoria: Camino en el que interviene el azar, que debe seguir elinvestigador para localizar cada unidad muestral.

Sesgo: Error que se produce al hacer inferencias desde una muestra que noes representativa.

Significación estadística: Probabilidad de que los resultados obtenidos en unestudio se deban a los efectos de la variable independiente y no al azar.

Significativo/a: Término del par opositivo significativo/no significativo,


ANÁLISIS DE DATOS

relativo a la significación estadística.

Unidad muestral: Es el elemento base de la encuesta. Puede ser un individuo,una familia o un grupo determinado.



esquema de la asignatura

Documents