módulo estadística iii.pdf

132
Jorge Amores - ESTADISTICA

Upload: edwpatrik

Post on 01-Dec-2015

47 views

Category:

Documents


0 download

TRANSCRIPT

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

TECNICAS E INSTRUMENTOS DE LA INVESTIGACIÓN

TÉCNICAS DE INVESTIGACIÓN

El método es el camino teórico, las técnicas constituyen los procedimientos concretos que el investigador utiliza para lograr información.

Los métodos son globales y generales, las técnicas son específicas y tienen un carácter práctico y operativo.

Las técnicas se subordinan a un método y éste a su vez es el que determina qué técnicas se van a usar.

Aunque el método y la técnica se encuentran íntimamente ligados no se identifican, pues ambos se complementan y son necesarias en la investigación.

Jorge Amores - ESTADISTICA

TECNICAS E INSTRUMENTOS DE LA

INVESTIGACIÓN

Jorge Amores - ESTADISTICA

Las técnicas constituyen el conjunto de mecanismos, medios o recursos dirigidos a recolectar, conservar, analizar y transmitir los datos de los fenómenos sobre los cuales se investiga.

Por consiguiente, las técnicas son procedimientos o recursos fundamentales de recolección de información, de los que se vale el investigador para acercarse a los hechos y acceder a su conocimiento.

Jorge Amores - ESTADISTICA

Elaborar sistemas de organización y clasificación de la informaciión

Las técnicas proporcionan diversos instrumentos y medios para la recolección, concentración y conservación de los datos (fichas, escalas, cuestionarios, inventarios, registros, videos, cd, etc)

IMPORTANCIA DE LAS TÉCNICAS DE INVESTIGACIÓN

Jorge Amores - ESTADISTICA

IMPORTANCIA DE LAS TÉCNICAS DE INVESTIGACIÓN

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

RECOLECCIÓN DE DATOS

Una vez que seleccionamos el diseño de investigación apropiado y la muestra adecuada, de acuerdo al problema de estudio e hipótesis, es importante recolectar los datos pertinentes sobre los atributos, conceptos o variables de las unidades de análisis o casos.

Jorge Amores - ESTADISTICA

RECOLECCIÓN DE DATOS

Recolectar datos implica elaborar un plan detallado de procedimientos que nos conduzcan a reunir datos con un propósito específico .

Jorge Amores - ESTADISTICA

RECOLECCIÓN DE DATOS (Determinando:)

a) Cuáles son las fuentes de donde se obtendrán los datos , esto es si los datos van a ser proporcionados por personas, observaciones, documentos, archivos, base de datos, etc.

• b) En donde se localizan tales fuentes, generalmente en la muestra seleccionada, pero es indispensable definir con precisión

Jorge Amores - ESTADISTICA

RECOLECCIÓN DE DATOS (Determinando:)

c)A través de que medio o método vamos a recolectar los datos, esto implica elegir uno o varios medios y definir los procedimientos que utilizaremos en la recolección de los datos. El método o métodos deben ser confiables, válidos y objetivos

•d) Una vez recolectados, de qué forma vamos a prepararlos para que puedan analizarse y respondamos al planteamiento del problema

Jorge Amores - ESTADISTICA

ELEMENTOS DEL PLAN DE RECOLECCIÓN DE DATOS

Los recursos disponibles

La muestra

Las definiciones operacionales

Las variables

Jorge Amores - ESTADISTICA

REQUISITOS QUE DEBE CUBRIR UN INSTRUMENTO DE MEDICIÓN

1.Confiabilidad

2.Validez

3.Objetividad

Jorge Amores - ESTADISTICA

POBLACIÓN Y MUESTRA

La muestra para ser confiable debe ser representativa y

además ofrecer las ventajas de ser la más práctica, la más

económica y la más eficiente en su aplicación.

Por más perfecta que sea la muestra, siempre habrá una diferencia entre el resultado que se obtiene de ésta y el resultado del universo, esta

diferencia es lo que se conoce como error de muestreo. Jorge Amores - ESTADISTICA

POBLACIÓN Y MUESTRA

Aplicar en la muestra los procedimientos e instrumentos de recolección de la información.

Lograr que la muestra sea representativa, que refleje las características de la población en la misma proporción.

Determinar el tamaño de la muestra, para obtener el resultado al menor costo, menor tiempo y con el personal indispensable.

Disponer de un registro de la población, es decir, una lista de sus elementos.

Definir la población que sirve de base para la muestra.

AL EXTRAER LA MUESTRA SE DEBE:

Jorge Amores - ESTADISTICA

POBLACION Y MUESTRA

En donde:

O n = tamaño de la muestra

O N = tamaño de la población

O E = error de muestreo, identificado, para la

investigación, como 0,05 (5%).

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

OPERACIONALIZACIÓN DE VARIABLES

Jorge Amores - ESTADISTICA

OPERACIONALIZACION DE LA VARIABLE INDEPENDIENTE

FORMACION TECNICA

CONCEPTUALIZACION CATEGORIAS INDICADORES ITEMS BASICOS

TECNICAS E

INSTRUMENTOS

Los objetivos empresariales Por qué? Entrevista, cuestionario a

EMPLEADOS son desconocidos empleados

* DEFICIENTE MANEJO

DE RECURSOS Los empleados de cada La razón? Encuesta, cuestionario a

HUMANOS sector trabajan por su propia empleados

* FALTA DE GESTION cuenta

* IMPROVISACION

* INEXISTENCIA DE

PLANES DE Apoyo técnico a las labores Por qué? Entrevista, cuestionario a

CAPACITACION de los empleados directivos y empleados

DIRECTIVOS

Desconcimiento de cada uno La razón? Encuesta, cuestioanario

de los sectores, concentración a empleados

de acividades en la oficina matriz

OPERACIONALIZACIÓN DE VARIABLES

Jorge Amores - ESTADISTICA

OPERACIONALIZACION DE LA VARIABLE DEPENDIENTE

RENTABILIDAD

CONCEPTUALIZACION CATEGORIAS INDICADORES ITEMS BASICOS

TECNICAS E

INSTRUMENTOS

* DEFICIENTE MANEJO DE Reducción de clientes Por qué? Entrevista, cuestionario a

LAS OPERACIONES CLIENTES clientes que han salido

* DEFICIENTE MANEJO

DE RECURSOS HUMANOS Insatisfacción de clientes La razón? Entrevista, cuestionario a

* INPRODUCTIVIDAD clientes que aún se encuentran

* GASTOS EXCESIVOS E

INNECESARIOS

* PERDIDAS ECONOMICAS

Capacitación insuficiente Por qué? Encuesta, cuestioanario

a empleados

EMPLEADOS

Planificación, dirección y La razón? Encuesta, cuestioanario

control del Recurso Humano a empleados

deficiente

Conjunto completo de individuos, objetos o datos que poseen alguna característica común observable, y que el investigador esta interesado en estudiar.

Población:

Subconjunto de la población, que lleva implícita todas las características del universo.

Muestra

TÉRMINOS COMUNES UTILIZADOS EN LA ESTADÍSTICA.

Jorge Amores - ESTADISTICA

Comprenden un número finitamente grande de unidades elementales.

Ejemplo: Todas las enfermeras del Ecuador

Cont. Población

LA POBLACIÓN

Población Infinita Población Finita

PUEDE SER

Es aquella que tiene un número limitado o finito de unidades elementales.

Ejemplo: Los salarios de las enfermeras del hospital Ambato. Jorge Amores - ESTADISTICA

Parámetro

Valor representativo de una población

relacionado con una característica determinada

Los parámetros se pueden inferir a

partir de una muestra

Variable

Es toda característica sujeta a medida o cuenta y que es susceptible

de variación

Cuantitativa: se expresa

numéricamente

Cualitativa: se refiere a cualidades

o atributos de los elementos

Jorge Amores - ESTADISTICA

Cont. Variable

PUEDE SER

VARIABLE

Variable

Independiente Variable

Dependiente

Jorge Amores - ESTADISTICA

Variable Independiente:

Es la que explica, condiciona o

determina cambios en otra llamada

dependiente.

•Es la supuesta causa de los cambios que se

operan en la variable dependiente

•Es la que el investigador manipula para

comprobar su efecto en la variabilidad de la

dependiente.

Cont. Variable

Jorge Amores - ESTADISTICA

En la mayor parte de los experimentos, el científico está interesado en determinar el efecto que tiene una variable, sobre alguna o mas variables. Para esto, el experimentador controla los niveles de la variable A y mide el efecto que posee sobre las demás variables. A la variable A se le denomina independiente debido a que en sus niveles son controlados por el investigador sin importar los cambios en las demás variables.

Cont. Variable

Jorge Amores - ESTADISTICA

Variable Dependiente:

•Es la que explica y condiciona determinada por la variable independiente, la variable dependiente en un experimento es la medida por un investigador para determinar el efecto de la variable independiente.

Cont. Variable

Jorge Amores - ESTADISTICA

En el experimento que estudia los efectos del alcohol sobre el comportamiento social, la cantidad de alcohol es la variable independiente, el comportamiento social de los sujetos se mide para ver si es afectado por la cantidad de alcohol consumida, así el comportamiento social es la variable dependiente.

Por ejemplo

Cont. Variable

En la investigación sobre la privación del sueño y el comportamiento agresivo, se controla la

cantidad de la privación del sueño, y se mide el comportamiento agresivo de los sujetos. La

cantidad de privación del sueño es la variable independiente y el comportamiento agresivo es

la variable dependiente.

Jorge Amores - ESTADISTICA

• Medidas que se realizan sobre los sujetos de un experimento. Por lo general, los datos constan de las medidas de la variable dependiente o de otras características del sujeto, como la edad, el género, el número de individuos. Los datos medidos de forma original se conocen como los datos crudos u originales

DATOS

• Número calculado a partir de los datos de la muestra, que cuantifica una característica de ella. Así, el promedio de un conjunto de datos de la muestra sería un estadístico.

• Ejemplo: El salario promedio de las enfermeras de un hospital.

ESTADÍSTICO

Jorge Amores - ESTADISTICA

Estadística

Tecnología del método científico que trata con variables aleatorias con el

objeto de recolectar, organizar, analizar, interpretar y presentar datos obtenidos de la realidad

Obtiene conclusiones , formula predicciones y

permite la toma de decisiones razonables

Examina una muestra en

términos de datos organizados y

resumidos Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

Por lo tanto el método estadístico es una herramienta utilizada por el

hombre para comprender los hechos de la vida real

Jorge Amores - ESTADISTICA

CONCEPTOS GENERALES

Es el lenguaje universal

de las ciencias

Implica información,

números y gráficas

visuales para resumir

esta información y su

interpretación

Jorge Amores - ESTADISTICA

CONCEPTOS GENERALES

La estadísitica es un

sistema o método

usado en:

• Recolección

• Organización, análisis

y descripción

numérica de la

información

Que:

• Estudia el

comportamiento de

los fenómenos de

grupo

Jorge Amores - ESTADISTICA

MÉTODOS ESTADÍSTICOS

Estudios experimentales y observacionales

Un objetivo común para un proyecto de investigación estadística es investigar la causalidad, y en particular extraer una conclusión en el efecto que algunos cambios en los valores de predictores o variables independientes tienen sobre una respuesta o variables dependientes. Hay dos grandes tipos de estudios estadísticos para estudiar causalidad: estudios experimentales y observacionales.

Jorge Amores - ESTADISTICA

MÉTODOS ESTADÍSTICOS

Estudios experimentales y observacionales

En ambos tipos de estudios, el efecto de las diferencias de una variable independiente (o variables) en el comportamiento de una variable dependiente es observado. La diferencia entre los dos tipos es la forma en que el estudio es conducido. Cada uno de ellos puede ser muy efectivo

DISTRIBUCIÓN DE FRECUENCIAS

La distribución de frecuencias es un método utilizado para organizar y resumir datos.

Bajo este método los datos que componen una serie se clasifican y ordenan, indicándose el

número de veces que se repite.

La distribución nos permite manejar grandes cantidades de información en espacios

pequeños, ya sea a través de cuadros o tablas y por medio de gráficas que los complementan

Jorge Amores - ESTADISTICA

Los caracteres de los elementos de una población pueden ser cualitativos o cuantitativos.

Los datos cualitativos, denominados también atributos, son todos aquellos elementos que pueden ser descritos cualitativamente, es decir mediante palabras .

Ejemplo: clasificación de los alumnos de una universidad por lugar de origen, clasificación de un grupo de personas por ocupación, por cargo, por sexo, etc.

Jorge Amores - ESTADISTICA

DISTRIBUCIÓN DE FRECUENCIAS

Los caracteres cuantitativos denominados variables, son todas aquellas características susceptibles de ser expresadas cuantitativamente, es decir mediante números.

Ejemplo: peso, estatura, edad,

número de hijos, salarios, etc.

Jorge Amores - ESTADISTICA

DISTRIBUCIÓN DE FRECUENCIAS

VARIABLE DISCRETA Y CONTINUA

Las Variables Discretas son aquellas que admiten solamente valores enteros, es decir no tienen valores intermedios.

•Ejemplo: el número de hijos por familia, el número de empleados por departamento en una empresa

Las variables continuas son aquellas que admiten valores fraccionarios, pudiéndose establecer intervalos.

•Ejemplo: estatura, peso

Jorge Amores - ESTADISTICA

SÍMBOLOS (variable discreta y continua)

n = n = Tamaño de la muestra

N = N = Tamaño de la población o universo de donde

se extraen las muestras

xi = Xi = Identificación para cada valor observado (mayúsculas en la población y minúsculas en la muestra)

ƒi = ni = Frecuencias absolutas. Es el número de veces que

se repite cada valor de la variable

Xi = yi = Simboliza los valores que toma la variable

discreta

ƒi /n = hi = Frecuencia relativa, valor porcentual, obtenido al

dividir la frecuencia absoluta por n

Jorge Amores - ESTADISTICA

SÍMBOLOS (variable discreta y continua)

Fi = Ni = Frecuencia absoluta acumulada

Fi /n = Hi = Frecuencia relativa acumulada

Xi = yi = Marca de clase, en la variable continua

m = Número de valores que toma la variable Yi.

También se considera como el número de

intervalos o marcas de clase en la variable continua

i = c = Amplitud del intervalo

X’ i-1 -

X’ i

= Y’i-1 -

Y’i

= Forma de simbolizar la columna correspondiente a

los valores que toma la variable continua,

organizada en intervalos. Jorge Amores - ESTADISTICA

DISTRIBUCION DE FRECUENCIAS

(variable discreta)

Jorge Amores - ESTADISTICA

𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛 𝐹𝑖 𝐹𝑖/𝑛

VARIABLE DISCRETA

Jorge Amores - ESTADISTICA

𝒉𝟏 =𝒏𝟏

𝒏 Las frecuencias relativas se

obtienen de la siguiente manera:

𝒉𝟐 =𝒏𝟐

𝒏

𝒉𝟑 =𝒏𝟑

𝒏 𝒉𝟒 =

𝒏𝟒

𝒏

Las frecuencias absolutas

acumuladas se obtienen de la

siguiente manera:

𝑁1 𝒏𝟏

𝑁2 𝒏𝟏 + 𝒏𝟐

𝑁3 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑

𝑁4 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 + 𝒏𝟒

𝑁5 𝒏𝟏 + 𝒏𝟐 + 𝒏𝟑 + 𝒏𝟒 + 𝒏𝟓

VARIABLE CONTÍNUA

El primer paso consiste en determinar el valor máximo y el mínimo que toma la variable: Xmax y Xmin la diferencia entre el valor máximo y el mínimo, se denomina recorrido o rango. Esto es si Xmax = 94 y Xmin = a 47 el recorrido es 47

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

Introducimos dos nuevos símbolos que son:

m= número de intervalos

C= amplitud del intervalo

Jorge Amores - ESTADISTICA

O El valor de m se puede determinar de varias

maneras:

O Un número arbitrario que sea mayor o igual

que cinco, y menor o igual a 16.

O Método muy utilizado, consiste en la

aplicación de la fórmula: (m= 1+ 3.3 log n),

fórmula de sturges

O Otro procedimiento no muy recomendado,

calculando a m mediante la fórmula m= √n

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

(Número de intervalos)

O En cuanto a la aplitud C o I, que debe tomar

cada intervalo de la distribución, dependerá

del criterio establecido para presentar la

información:

O I = C = Rango / m, siempre aproximamos al

número inmediato superior, por pequeña

que sea la fracción.

O C= (X max - X min)/m

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

(Amplitud del intervalo)

O Al multiplicar los resultados de c x m, esto

es 8 x 6, el recorrido aumenta en una

unidad esto es a 48.

O La unidad de incremento se le puede restar

al límite inferior o aumentarse al límite

superior, en este caso se lo restamos a 47,

quedando el límite inferior en 46, a partir de

este valor comenzamos a agregar el valor de

c, para formar los distintos intervalos.

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

(Amplitud del intervalo)

En la variable continua se designa con (Y’i-1 - Y’i) o (X’i-1 - X’i), la columna correspondiente a los distintos valores que toma la variable.

Al primer valor Y’i-1 se denomina límite inferior del intervalo.

A Y’i se denomina límite superior.

La diferencia entre estos límites corresponde al valor de la amplitud del intervalo C o i

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

(Amplitud del intervalo)

Es de anotar que a cada límite inferior del intervalo se le ha agregado 0.1, lo que permite una fácil tabulación y así se sabe a cual intervalo corresponde el valor de Xi, obtenido.

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

Jorge Amores - ESTADISTICA

VARIABLE CONTÍNUA

Solución Ejercicio

Jorge Amores - ESTADISTICA

Marca de

clase

46.1 - 54 2 0.10 2 0.10 50

54.1 - 62 4 0.20 6 0.30 58

62.1 - 70 5 0.25 11 0.55 66

70.1 - 78 4 0.20 15 0.75 74

78.1 - 86 3 0.15 18 0.90 82

86.1 - 94 2 0.10 20 1.00 90

∑ = 20 1.00

𝑛

𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛 𝐹𝑖 𝐹𝑖/𝑛

𝟏

𝑋𝑖

MARCA DE CLASE

Para yi, marca de clase en la variable continua, se pueden obtener de 3 maneras:

a) Se promedia cada intervalo de la siguiente forma:

y1 = (y0 + y1)/2; y2 = (y1 + y2)/2

b) Se obtiene la primera marca de clase por el método anterior y si la amplitud C es constante, se le suma a la primera marca de clase obtenida y así sucesivamente.

c) Se divide la amplitud de cada intervalo por dos y se le suma al límite inferior del intervalo o se le resta al límite superior del intervalo.

Jorge Amores - ESTADISTICA

DISTRIBUCIÓN SIMÉTRICA

Una distribución es simétrica cuando las frecuencias absolutas o relativas, equidistantes a un punto central son iguales. Ej:

Jorge Amores - ESTADISTICA

46.1 - 54 2 0.10

54.1 - 62 6 0.30

62.1 - 70 12 0.60

70.1 - 78 12 0.60

78.1 - 86 6 0.30

86.1 - 94 2 0.10

∑ = 40 2.00

𝑛

𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛

𝟏

2 2 0.10

4 5 0.25

6 6 0.30

8 5 0.25

10 2 0.10

∑ = 20 1.00

𝑛

𝑋𝑖 ƒ𝑖 ƒ𝑖/𝑛

O Media

O Mediana

O Media geométrica

O Moda

O Varianza

O Desviación Media

O Desviación Mediana

Jorge Amores - ESTADISTICA

MEDIDAS DE TENDENCIA CENTRAL

Medidas de Tendencia

Central

Media Aritmética

Media Ponderada

Media Geométrica

Media Armónica

Mediana

Moda

Jorge Amores - ESTADISTICA

X =

Media Aritmética

Es la suma de todos los valores de la variable dividida entre el número total de elementos.

Es confiable porque refleja todos los valores del conjunto de datos, pero puede ser afectada por los valores extremos y de esa forma no constituye un valor típico.

Para el cálculo de la media aritmética se aplica la siguiente expresión:

n

)x...xx( n21 x

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

El promedio es el

punto de equilibrio

del balancín

4 6 8 10

Jorge Amores - ESTADISTICA

ESTADISTICA DESCRIPTIVA

INGRESOS SEMANALES EN DÓLARES

1000 1110 1010 1070 1030 1000

1150 990 1090 1080 1150 1200

1050 1030 1120 1050 1030 1150

1230 1170 1180 1110 1160 1100

1100 1060 1130 1105 935 1210

Media muestral No Agrupada

Media Ponderada Es el resultado de multiplicar cada uno de los elementos

por un valor particular para cada uno de ellos, llamado

peso y obteniendo a continuación la media aritmética del

conjunto formado por los productos anteriores.

Se calcula aplicando la siguiente expresión:

Los valores Xi corresponden a la variable y los valores pi

son los pesos que hacen referencia a su importancia.

Jorge Amores - ESTADISTICA

Media Ponderada

Ejemplo: Una empresa produce cuatro marcas de cigarrillos que se distribuyen a nivel nacional, cuyos precios de venta son: 1,25; 1,50; 1,80; y 2,00 dólares por cajetilla. Las ventas registradas en el último mes fueron respectivamente, en miles de cajetillas: 1.400; 1.250; 1.180; y, 950

Calcule el precio ponderado promedio de la cajetilla:

Xp = 1,25 (1.400) + 1,5 (1.250) + 1,8 (1.180) + 2 (950)

1.400 + 1.250 + 1.180 + 950

Xp = $ 1,60

Jorge Amores - ESTADISTICA

Media Geométrica La media geométrica (G) es igual a la raíz n-ésima del producto de todos los números

Se recomienda para datos de progresión geométrica, para promediar razones, porcentajes, interés compuesto , tasas de crecimiento y números índices

La media geométrica de un conjunto de números positivos, es siempre menor o igual que la media aritmética de dicho conjunto

Es menos sensible que la media aritmética a los valores extremos

Si un valor X= 0 entonces la G se anula

No se puede calcular si hay valores negativos

n

Jorge Amores - ESTADISTICA

Media Geométrica Ejemplo de Aplicación:

Las tasas de interés vigentes de tres bonos son 5%, 7%

y 4%. Calcular la media geométrica del interés:

G = 5.19%

La media aritmética sería:

X = 5.33%

Jorge Amores - ESTADISTICA

Media Armónica La media armónica (H) se define como la media aritmética de los recíprocos de un conjunto de datos.

Esta media se emplea para promediar variaciones con respecto al tiempo tales como: productividades, velocidades, tiempos, rendimientos, cambios, etc.

No se debe utilizar cuando hay valores cero o muy pequeños

Es poco influenciada por valores extremos muy grandes

Siempre es menor o igual que la media geométrica y que la media aritmética

Jorge Amores - ESTADISTICA

Media Armónica

Ejemplo: calcular la velocidad promedio a la que viaja un tren, que entre el punto A y el punto B recorre 200 km a 120 km/h; y entre B y C recorre 200 km a 180 km/h.

La velocidad promedio calculada con la media armónica será:

H = 2/(1/120) + (1/180) = 144 km/h

Es decir, los 400 km recorrerá en: 400/144 = 2.78 h

La media aritmética de la velocidad = 150 km/h

El recorrido de 400 km sería en: 400/150 = 2.67 h

Comprobación:

Entre A y B: 200 km/120 km/h = 1.67 h

Entre B y C: 200 km/180 km/h = 1.11 h 2.78

h

Jorge Amores - ESTADISTICA

Mediana

Es aquel valor de la variable que ocupa exactamente la posición

central cuando se tiene la serie de datos arreglada en orden de

magnitud. La Me no está influenciada por los valores extremos.

El número de observaciones es impar, en cuyo caso la Mediana

toma el valor de la observación que ocupa la posición central.

Ejemplo:

7, 9, 12, 12, 18, 27, 35, 36, 39

Me = 18

El número de observaciones es par, en tal caso la Mediana es

el promedio de los valores que ocupan la posición central.

Ejemplo:

7, 9, 12, 12, 18, 27, 35, 36, 39, 45

Me = 18 + 27 = 22.5

2

Jorge Amores - ESTADISTICA

Jorge Amores - ESTADISTICA

100

110

120

150

140

130

La mediana de la talla es

la talla de un niño ficticio

representado aquí en rojo

Moda

Se define como aquel valor de la variable que se presenta con mayor frecuencia (Md). Se usa especialmente con variables nominales que no pueden arreglarse en orden de magnitud.

Ejemplo: 5, 8, 10, 16, 4, 12, 8, 11, 8, 21 => Md=8

Cuando hay 2 valores o más que se repiten igual número de veces y ese número es el mayor, se dice que la serie es Bimodal o Multimodal, respectivamente.

Ejemplo: 3, 3, 1, 2, 2, 2, 3, 4, 4, 5, 2, 3 => Md1=2; Md2= 3

En el caso de que ningún valor se repita en la serie de datos, simplemente no existe valor modal.

Jorge Amores - ESTADISTICA

Rango Medio

Se obtiene al calcular la cantidad que está a la

mitad, entre los ingresos más altos y más bajos, de

acuerdo a lo siguiente:

Rm = (Xmax + Xmin)/2.

Ejemplo: Las edades de 10 estudiantes es: 23, 25,

26, 28, 24, 22, 20, 25, 26, 25

Rm= (28 + 20)/2

Rm= 24

Jorge Amores - ESTADISTICA

Taller # 1 Una empresa de producción registró los siguientes montos de ventas semanales,

expresadas en miles de dólares:

a. Calcule la media aritmética, media geométrica, media armónica moda y mediana, de

estos valores

b. Interprete los resultados

c. ¿Qué ocurre con estos valores cuando se incrementa a esta serie el monto de ventas

a 400 mil dólares en una semana “anormal”? Interprete los cambios que se

presentan en cada una de las medidas de Tendencia Central calculadas.

Semana Ventas Semana Ventas

1 54 11 67

2 48 12 68

3 58 13 39

4 50 14 35

5 25 15 56

6 47 16 66

7 75 17 33

8 46 18 62

9 60 19 65

10 70 20 67

Jorge Amores - ESTADISTICA

Medidas de

Dispersión

Varianza Desviación estándar

Rango Coeficiente de Variación

Jorge Amores - ESTADISTICA

La Varianza Es la medida de dispersión que mide el grado de variabilidad de un grupo de datos, que se sintetiza en el grado de homogeneidad o heterogeneidad de la variable. S2 =

Ejemplo: calcular la varianza de los valores de pH registrados en varias muestras de jugos de naranja:

S2 =

S2 =

S2 = 0.1057

Muestra pH (Xi) X2

1 3.2 10.24

2 3.5 12.25

3 3.1 9.61

4 2.8 7.84

5 2.6 6.76

6 3.1 9.61

7 3.5 12.25

8 3.4 11.56

Suma 25.2 80.12

Jorge Amores - ESTADISTICA

La Desviación Estándar

Constituye la raíz cuadrada de la varianza y representa el grado

de dispersión que tienen los datos con relación a su media. Se

expresa en las mismas unidades que tiene la variable.

El administrador de una empresa registra los minutos de

atrasos que han tenido sus empleados en el mes anterior, a fin

de establecer correctivos:

S2 = 703.77

S = 26.53 minutos

El gerente decide sancionar

a los empleados que

superan:

X + 1S = 42.17 + 26.53

= 68.7 minutos

Empleado Atraso (Xi) (Xi)2

A 85 7.225

B 33 1.089

C 48 2.304

D 20 400

E 12 144

F 55 3.025

Suma 253 14.187

Promedio 42.17 Jorge Amores - ESTADISTICA

El Rango

Es la diferencia entre el valor más alto y el más bajo, dentro de un grupo de datos. Mientras más grande sea el valor del rango, mayor será la dispersión y consecuentemente será más alta la varianza y la desviación estándar.

Para su cálculo primeramente se ordenan los datos de acuerdo a su magnitud y se resta el valor menor del valor más alto.

Para el ejemplo anterior el valor del rango (R) es:

R = valor mayor – valor menor

R = 85 – 12 = 73 minutos

Jorge Amores - ESTADISTICA

Coeficiente de Variación

Es una medida relativa de variabilidad, independiente de las unidades de medida, que elimina la dimensionalidad de las variables y tiene en cuenta la proporción existente entre medias y desviación estándar.

S

C.V. = x 100

X

El C.V. para los datos de los dos ejemplos anteriores serán:

1. pH jugo de naranja: 0.325 C.V. = x 100 = 10.32% 3.15

2. Atraso de empleados:

26.53 C.V. = x 100 = 62.91% 42.17

Jorge Amores - ESTADISTICA

Taller # 2 El precio de un producto agroindustrial en el comercio local, tomado en 20 locales comerciales, fue el siguiente:

1. Calcule la media, mediana y moda del precio

2. Calcule la varianza, desviación estándar, rango y coeficiente de variación

3. Interprete los resultados

Local Precio, $ Local Precio, $

1 2.5 11 2.6

2 2.8 12 2.8

3 2.6 13 2.9

4 2.6 14 2.3

5 2.9 15 2.6

6 2.3 16 2.6

7 2.4 17 2.7

8 2.6 18 2.5

9 2.4 19 2.4

10 2.5 20 2.6

Jorge Amores - ESTADISTICA

PROBABILIDADES

La definición clásica de probabilidad tiene la desventaja de que la expresión “igualmente posible” es vaga. Por esta razón se considera que la probabilidad estimada o probabilidad empírica de un evento es la frecuencia relativa de ocurrencia del evento cuando la cantidad de observaciones es muy grande.

La probabilidad misma es el límite de esta frecuencia relativa a medida que la cantidad de observaciones aumenta de manera indefinida.

Jorge Amores - ESTADISTICA

PROBABILIDADES

Definimos probabilidad como la frecuencia relativa con que ocurre un evento.

Probabilidad de eventos puede asignarse por observación o mediante la utilización de espacio muestra igualmente probable.

Las reglas de adición y multiplicación ayudan a encontrar la probabilidad de eventos compuestos.

Jorge Amores - ESTADISTICA

PROBABILIDADES

Ejemplo 1: Cuando se lanza un dado, éste puede caer de seis maneras distintas, dando los números: 1, 2, 3, 4, 5, 6.

Un evento E de que caiga un 3 o un 4, la probabilidad es:

Pr (E)=2/6, o bien 1/3. La probabilidad de no obtener un 3 o 4 (es decir, la probabilidad de obtener 1,2,5,6, es

Pr (E)= 1 – Pr (E)= 2/3.

Jorge Amores - ESTADISTICA

Taller de probabilidades

Ejercicio 1: ¿De cuántas maneras pueden sentarse 10

personas en un banco si hay 4 sitios disponibles?

Solución:

Nótese que importa el orden en que se sienten las

personas, ya que los cuatro sitios son diferentes, y

que una persona no puede ocupar más de un sitio a

la vez. Por lo tanto, hay V10,4 = 10!/6! = 10 * 9 * 8 * 7

= 5040 maneras.

Jorge Amores - ESTADISTICA

Taller de probabilidades

Ejercicio 2: En una clase de 10 alumnos van a

distribuirse 3 premios. Averiguar de cuántos modos

puede hacerse si:

1. los premios son diferentes;

2. los premios son iguales.

Jorge Amores - ESTADISTICA

Taller de probabilidades

Solución:

Hay dos supuestos posibles:

1. Si una misma persona no puede recibir más de un premio:

O Hay V10,3 = 10 * 9 * 8 = 720 maneras de distribuir los premios si éstos son diferentes;

O En el caso de que los premios sean iguales, pueden distribuirse de C10,3= 10 * 9 * 8=6 = 120 maneras.

2. Si una misma persona puede recibir más de un premio:

O Se pueden distribuir los premios, si éstos son diferentes, de VR10,3= 10^3 = 1000 maneras;

O Hay CR10,3 = 220 maneras de distribuir los premios si éstos son iguales.

Jorge Amores - ESTADISTICA

La Distribución Normal

1. La media, mediana y moda son coincidentes

2. Tiene una sola moda

3. Es asintótica al eje de las abscisas: el área bajo la curva es igual a 1

4. Es simétrica respecto a su media

5. Mientras mayor es el valor de más aplanada es la curva

6. El área bajo la curva entre ± 1 es igual al 68%; ± 2 es igual al 95%; ± 3 es igual al 99%

Jorge Amores - ESTADISTICA

Curva Normal

Jorge Amores - ESTADISTICA

Tipificación de Variables Se llama tipificación a la operación consistente en cambiar de una variable aleatoria X a otra variable Z de distribución tipificada, por medio de la expresión siguiente:

Z =

Ejemplo: conociendo que X = 18 y S = 3.2 calcular la probabilidad de que un valor Xi se ubique entre 15 y 25:

Z1 = = -0.94

Z2 = = 2.19

El área bajo la curva para estos valores es: 0.3264 y 0.4857

La probabilidad de que un valor Xi se ubique entre 15 y 25 será:

0.3264 + 0.4857 = 0.8121 81.21%

- 0.94 2.19

Jorge Amores - ESTADISTICA

Taller # 3 En la siguiente tabla se presentan los pesos de 30 pollos como parte representativa de un lote de 2.000

1. Calcule el valor del coeficiente de variación y determine si la muestra es representativa

2. Cuál es la probabilidad de que animales que pesan menos de 2.25 kg sean parte de este lote?

3. Cuál es la probabilidad de que hayan pollos que pesen más de 2.75 kg?

Número Peso, kg Número Peso, kg Número Peso, kg

1 2.05 11 2.82 21 2.70

2 2.28 12 2.48 22 2.42

3 2.60 13 2.50 23 2.89

4 2.75 14 2.70 24 2.50

5 2.60 15 2.30 25 2.45

6 2.48 16 2.38 26 2.60

7 2.44 17 2.69 27 2.38

8 2.80 18 2.47 28 2.39

9 2.90 19 2.45 29 2.60

10 2.65 20 2.68 30 2.65

Jorge Amores - ESTADISTICA

TALLER # 4

Se conoce que el peso promedio de un lote de

envases de mermelada es de 502 g., con una

desviación estándar de 4.25 g.

Calcular:

1. ¿Cuál es la probabilidad de encontrar envases con

más de 510 g. de peso?

2. ¿Cuál es la probabilidad de encontrar envases con

menos de 490 g. de peso?

3. ¿Cuál es la probabilidad de encontrar envases con

pesos entre 495 y 505 g. de peso? Jorge Amores - ESTADISTICA

Intervalos de Confianza

Es el conjunto de valores formado a partir de una muestra de datos,

de forma que exista la posibilidad de que el parámetro poblacional

(media) se encuentre dentro de dicho conjunto, con una probabilidad

específica. Esta probabilidad específica recibe el nombre de nivel de

confianza.

Los límites de confianza constituyen el rango o intervalo dentro del

cual se espera encontrar el verdadero valor del parámetro:

P(1 2) = 1 –α

En el que 1 y 2 son los límites inferior y superior del parámetro

poblacional , en tanto que α es el nivel de significación. Por tanto,

nivel de confianza = 1 - α

Jorge Amores - ESTADISTICA

Intervalo de confianza

Jorge Amores - ESTADISTICA

Intervalo de confianza para la Media

Ejemplo: Calcular el intervalo de confianza para la media poblacional,

a partir de la siguiente información obtenida de una muestra de 30

unidades:

X = 41.25 S2 = 3.18

1. Se calcula la desviación estándar de la media (Sx):

Sx = Sx = = 0.33

2. Se calcula los límites inferior y superior del parámetro:

Li = X – Sx (tα) Ls = X + Sx (tα) para α = 5%:

Li = 41.25 – 0.33 (2,045) = 40.57

Ls = 41.25 + 0.33 (2,045) = 41.92

40.57 < < 41.92

Jorge Amores - ESTADISTICA

Uso de Intervalos de Confianza para verificar Hipótesis.

O Los intervalos de confianza permiten verificar hipótesis

planteadas respecto a parámetros poblacionales.

O Por ejemplo, supongamos que se plantea la hipótesis de

que el promedio de peso de nacimiento de cierta población

de primates es igual a la media nacional de 3250 gramos.

Jorge Amores - ESTADISTICA

Formular Hipótesis nula Ho e Hipótesis alternativa Ha

Seleccionar nivel de significación α

Identificar y aplicar estadístico de prueba

Tomar decisión: se acepta o se rechaza Ho

Prueba de Hipótesis

Jorge Amores - ESTADISTICA

Error Estadístico

Tipo I Se rechaza Ho cuando ésta es

verdadera

Tipo II Se acepta Ho

cuando ésta es falsa

Estos errores se pueden reducir:

Aumentando el número de repeticiones

Disminuyendo la desviación estándar Jorge Amores - ESTADISTICA

Prueba de “z”

Compara una media muestral con una media

poblacional

Permite comprobar una hipótesis que compara dos

muestras

Se utiliza cuando se cuentan con

muestras de tamaño grande

(>30 obs.)

Se asume independencia

entre las muestras

Jorge Amores - ESTADISTICA

Prueba de “z” para una muestra Muestra Peso Muestra Peso Muestra Peso

1 0.51 16 0.50 31 0.52

2 0.49 17 0.53 32 0.50

3 0.48 18 0.51 33 0.48

4 0.49 19 0.54 34 0.54

5 0.50 20 0.51 35 0.53

6 0.52 21 0.53 36 0.55

7 0.54 22 0.48 37 0.56

8 0.53 23 0.49 38 0.53

9 0.49 24 0.52 39 0.51

10 0.51 25 0.54 40 0.50

11 0.55 26 0.55 41 0.51

12 0.49 27 0.56 42 0.54

13 0.46 28 0.48 43 0.52

14 0.55 28 0.52 44 0.48

15 0.51 30 0.51 45 0.49

Una empresa farmacéutica

ha establecido que el peso

medio de un comprimido

debe ser igual a µ = 0.50 g.

Se tomó una muestra al

azar de 45 comprimidos de

un lote.

Determinar, al 5% de

significación si el peso de

los comprimidos de la

muestra, se ajusta al

requerimiento de la

empresa.

Ho: µ = x

Ha: µ ≠ x

Jorge Amores - ESTADISTICA

z =

Z = 3.90

Este valor de Z calculado debe compararse con el valor de Z tabular de la zona de rechazo al 5%:

0.5 – 0.025 = 0.475 Z = 1.96

Por lo tanto, se rechazará la Ho cuando

el valor de Z calculado > Z tabular

En este caso se rechaza la Ho a nivel del 5%

Conclusión: el peso de los comprimidos no se ajusta al requerimiento de la empresa farmacéutica

Prueba de “z” para una muestra

0.025 0.025

Jorge Amores - ESTADISTICA

Prueba de “z” para dos muestras Se utilizan dos métodos (A y B) para determinar el contenido de calorías por Kg de

30 muestras de raciones alimenticias. Se quiere conocer si los dos métodos

entregan resultados similares (Ho) o diferentes (Ha)

Muestra A B Muestra A B Muestra A B

1 335 347 11 330 329 21 345 349

2 362 359 12 325 338 22 334 351

3 338 359 13 338 346 23 323 348

4 329 334 14 336 345 24 344 346

5 333 341 15 334 340 25 344 348

6 371 391 16 331 348 26 348 350

7 356 334 17 327 356 27 350 352

8 341 341 18 328 352 28 349 347

9 334 347 19 329 338 29 339 340

10 335 314 20 340 329 30 340 338

Jorge Amores - ESTADISTICA

………Prueba de “z” 1. Cálculo de XA = 10.168

2. Cálculo de XB = 10.357

3. Promedio XA = 338,93

4. Promedio XB = 345,23

5. XA2 = 3 449.726

6. XB2 = 3 580.369

5. Suma de Cuadrados de XA = 3.451,87

6. Suma de Cuadrados de XB = 4.787,37

7. Varianza de XA = 119,03

8. Varianza de XB =165,08

9. Valor de “z” = = = -2.05

Jorge Amores - ESTADISTICA

………Prueba de “z”

Comprobación de la hipótesis: Ho: Método A = Método B

Ha: Método A ≠ Método B

Valor calculado de z = -2.05

Valor tabular para z (2.05) = 0.4798

Probabilidad = (0.500 – 0.4798) x 2 = 0.0404 4.04%

De manera que se rechaza la hipótesis Ho a nivel del 5%, es decir los dos métodos son diferentes con un nivel de confianza del 95%

Para niveles de significación del 5% siempre que z calculada sea mayor a |1.96| se rechaza la Ho

Para niveles de significación del 1% siempre que z calculada sea mayor a |2.57| se rechaza la Ho

Jorge Amores - ESTADISTICA

Análisis de Regresión y

Correlación Lineal Son técnicas estadísticas que se utilizan para

explicar el comportamiento de variables que intervienen en la investigación.

Su principal uso es para explicar asociaciones entre variables cuantitativas

Se puede introducir variables cualitativas previamente codificadas

La correlación mide la dirección y fuerza de asociación entre dos variables

La regresión establece una relación de causalidad o dependencia entre las variables

Jorge Amores - ESTADISTICA

Regresión Lineal Simple

Establece la relación que existe entre dos variables cuantitativas

Una de las variables debe ser considerada como dependiente,

criterio o respuesta y la otra como variable independiente,

predictiva o explicativa

Se pueden realizar predicciones de la variable dependiente

Se construye un modelo estadístico, cuya forma general es:

Jorge Amores - ESTADISTICA

Regresión Lineal Simple

El modelo de regresión lineal se ajusta a la ecuación de la línea

recta:

El proceso de cálculo de los coeficientes a y b es el siguiente:

Coeficiente b =

SPXY = XY –

SCX = X2 –

Coeficiente a = Y - bX Jorge Amores - ESTADISTICA

Ejemplo de Regresión Lineal Se realizó un estudio para conocer la influencia de la

precipitación en la disminución de la cantidad de

contaminación atmosférica, en diez localidades:

Localidad Precipitación mm

Disminución de Contaminación, ppm

1 18 55

2 7 17

3 14 36

4 31 85

5 21 62

6 5 18

7 11 33

8 16 41

9 26 63

10 29 87

Jorge Amores - ESTADISTICA

Ejemplo de Regresión Lineal

Con los datos anteriores:

1. Realizar un gráfico en el que se visualice la

relación entre las variables

2. Calcular los parámetros a y b de la ecuación

de regresión lineal

3. Realizar el análisis de varianza de la regresión

4. Realizar la interpolación para valores de

precipitación: X= 15 X = 20 X= 25

5. Construir intervalos de confianza al 5% para b

Jorge Amores - ESTADISTICA

Gráfico de la Regresión

y = 1.0213 + 2.7348 x

r² = 0.962

0

10

20

30

40

50

60

70

80

90

100

0 5 10 15 20 25 30 35

Dis

min

ució

n C

on

tam

ina

ció

n, p

pm

Precipitación, mm

Disminución de Contaminación, ppm

Jorge Amores - ESTADISTICA

Cálculo de los Parámetros a y b Loc. Precipitación

(X) Contaminación

(Y) X2 Y2 XY

1 18 55

324 3.025 990

2 7 17 49 289 119

3 14 36

196 1.296 504

4 31 85

961 7.225 2.635

5 21 62

441 3.844 1.302

6 5 18 25 324 90

7 11 33

121 1.089 363

8 16 41

256 1.681 656

9 26 63

676 3.969 1.638

10 29 87

841 7.569 2.523

178 497 3.890 30.311 10.820

X 17.8 49.7

Jorge Amores - ESTADISTICA

Cálculo de los Parámetros a y b

1. SPXY = XY – = 10.820 - =

1.973,40

1. SCX = X2 – = 3.890 - = 721,60

2. Coeficiente b = = = 2,735

4. Coeficiente a = Y – b X = 49,70 – 2,735 (17,80) = 1,02

Jorge Amores - ESTADISTICA

Análisis de Varianza de la Regresión

1. Suma de Cuadrados Total: SCT =Y2 - = 30.311 -

SCT = 5.610,10

2. Suma de Cuadrados de la Regresión: SCR = a Y + b XY –

SCR = 1,11 (497) + 2,73 (10.820) - = 5.389,37

3. Suma de Cuadrados del Error: SCE = SCT – SCR

SCE = 5.610,10 – 5.389,37 = 220,73

Jorge Amores - ESTADISTICA

Análisis de Varianza de la Regresión

Fuente de

Variación

Grados de

Libertad

Suma de

Cuadrados

Cuadrados

Medios

F

Total 9 5.610,10

Regresión 1 5.389,37 5.389,37 195,33

Error 8 220,73 27,59

Prueba de Hipótesis: Ho: b = 0 Ha: b≠ 0

Valor de F tabular con 1 y 8 gl: α 0,05 = 5,32 α 0,01 = 11,26

Dado que F calculado > F tabular tanto al 5% como al 1%: se

rechaza Ho y se acepta H1, es decir la pendiente b es diferente de

cero, ya que si existe una relación lineal altamente significativa

entre precipitación y disminución de la contaminación

Jorge Amores - ESTADISTICA

Pronóstico de valores de Y

Mediante la resolución de la ecuación de la

regresión, se pueden estimar valores de Y a

partir de valores conocidos de X:

1. X = 15: Y = 1,02 + 2,73 (15) = 41,97

2. X = 20: Y = 1,02 + 2,73 (20) = 55,62

3. X = 25: Y = 1,02 + 2,73 (25) = 69,27

Jorge Amores - ESTADISTICA

Intervalos de confianza para el coeficiente de regresión

1. Intervalo de confianza al 95%: b ± Sb (t tab, 0.05, n-2 gl)

2. Cálculo del error estándar de b (Sb):

Sb = = = 0,195

3. Valor t tabular nivel α 5%, con 8 gl = 2,336

4. Límite inferior: LI = 2,73 – (0,195 * 2,336) = 2,27

5. Límite superior: LS = 2,73 + (0,195 * 2,336) = 3,19

6. Intervalo de confianza al 95% para b:

2,27 2,73 3,19

Jorge Amores - ESTADISTICA

Coeficiente de Determinación (r2)

Indica el grado de ajuste de la recta de regresión a los valores de la

muestra, es decir, mide la proporción de la variación en Y que

explica la variación independiente X en el modelo de regresión.

Los valores de r2 varían de 0 a 1. Un valor cercano a 0 indica que no

hay relación lineal entre las variables. Un valor cercano a 1 indica

un ajuste lineal perfecto.

r2 =

SCR = Suma de Cuadrados de la Regresión

SCT = Suma de Cuadrados Total

Jorge Amores - ESTADISTICA

Coeficiente de Determinación (r2)

El valor del coeficiente r2 para el ejemplo de la relación entre precipitación y disminución de la contaminación, se calcula de la siguiente manera:

r2 = = 0.96

Es decir que el 96% de las variaciones en la disminución de la contaminación, es explicada por las variaciones en la precipitación

Jorge Amores - ESTADISTICA

Coeficiente de Correlación (r)

Representa el grado de la intensidad de asociación entre dos

variables, o el grado en que dos variables cambian una con

respecto a la otra. El coeficiente r toma valores entre -1 y +1,

de acuerdo a la fuerza de la asociación y si la relación es

inversa o directa.

r = ó también r = r2

El signo del coeficiente r es el mismo que el del coeficiente de

regresión b

El coeficiente r no varía al variar la escala de medición

Jorge Amores - ESTADISTICA

Coeficiente de Correlación (r)

r = +1 r = 0 r = -1

Correlación perfecta positiva Correlación perfecta negativa Sin correlación

Jorge Amores - ESTADISTICA

Prueba de Hipótesis para r Las hipótesis nula y alternativa se plantean como:

Ho: r = 0 Ha: r ≠ 0

Una forma de comprobar la Ho es comparar el valor calculado de

r con el valor tabular correspondiente para r al nivel α escogido

(5% o 1%) y con n – 2 grados de libertad.

Otra forma es calculando el valor de “t” de la siguiente manera:

t =

El valor calculado de t se compara con el valor tabular de la tabla

de t al nivel α escogido (5% o 1%) y con n – 2 grados de libertad Jorge Amores - ESTADISTICA

Cálculo del coeficente r

El valor de r para el ejemplo de la relación entre precipitación y

disminución de la contaminación, será:

r = = = 0,98

ó directamente:

r = r2 = 0,96 = 0,98

Jorge Amores - ESTADISTICA

Prueba de Hipótesis para r

Prueba de Ho: r = 0 Ha: r ≠ 0

r tabular al 5% con 8 gl = 0,632

Como r calculado (0,98) > r tabular (0,632), se rechaza Ho y se

acepta Ha

Comprobación usando valor tabular de t:

t = = = 13,86

t al 5% con 8 gl = 2,306

Como t calculado > a t tabular se rechaza Ho y se acepta Ha

Jorge Amores - ESTADISTICA

Prueba de Ji Cuadrado

(X2)

Bondad de Ajuste

Comprueba el ajuste entre

valores observados y

esperados

Independencia Comprueba la

independencia de variables

Jorge Amores - ESTADISTICA

Ji Cuadrado (X2) para Bondad

de Ajuste

Prueba el ajuste entre las frecuencias observadas de una

muestra y las frecuencias esperadas de una distribución

hipotética. Es decir las discrepancias entre la teoría y la

realidad.

Esta prueba puede utilizarse incluso con datos medibles en una

escala nominal.

La hipótesis nula (Ho) de la prueba Ji Cuadrado postula una

distribución de probabilidad totalmente especificada, como el

modelo matemático de la población que ha generado la

muestra, es decir:

Ho: valores observados = valores esperados

Jorge Amores - ESTADISTICA

Ji Cuadrado (X2) para Bondad

de Ajuste

El procedimiento es el siguiente:

1. Arreglar las observaciones en una tabla de contingencias

2. Determinar el valor teórico de las frecuencias para cada casilla

3. Calcular las diferencias entre valores observados y esperados

4. Elevar al cuadrado las diferencias y dividirlas entre el valor

esperado correspondiente

5. La sumatoria de los valores anteriores es el estadístico X2

6. Obtener el valor tabular crítico de X2 con k – 1 grados de

libertad y nivel de significación α

7. Decidir si se acepta o rechaza la hipótesis. Cuando X2c X2t

se rechaza Ho Jorge Amores - ESTADISTICA

Ejemplo de X2 para Bondad de

Ajuste Se conoce que la distribución del grupo sanguíneo es una característica típica de la población. Por estudios previos se ha establecido que cierta etnia presenta para los grupos sanguíneos A, B, AB y O los siguientes porcentajes: 35, 10, 6 y 49. Al tomar una muestra de 200 individuos de una zona cercana, los valores observados para estos grupos sanguíneos fueron 85, 38, 17 y 60 respectivamente.

Se desea conocer si la muestra de los 200 individuos pertenece a la etnia en mención.

Jorge Amores - ESTADISTICA

X2 para Bondad de Ajuste

1. Tabla de contingencia para valores observados y esperados

2. Cálculo de X2:

3. X2 = =

4. X2 = 3.21 + 16.20 + 2.08 + 14.73 = 36.22

Frecuencias Grupos Sanguíneos

A B AB O

Observadas 85 38 17 60

Esperadas 200 * 0.35 =

70

200 * 0.1 =

20

200 * 0.06 = 12 200 * 0.49 =

98

Jorge Amores - ESTADISTICA

Prueba de Hipótesis de X2

Ho: la población muestreada pertenece a la etnia

Ha: la población muestreada no pertenece a la etnia

1. Grados de libertad: k – 1: 4 – 1 = 3

2. X2 tabular, al 5% y 3 gl = 7.81

3. Dado que X2 calculado > X2 tabular, 36.22 > 7.81 se rechaza

Ho

4. Conclusión: la población muestreada no pertenece a la etnia

en referencia

Jorge Amores - ESTADISTICA

TALLER

Un estudio de mercado para lanzar un nuevo producto, determinó el siguiente comportamiento de una muestra de 200 personas tomadas como parte del universo de potenciales consumidores:

Muy satisfechos 110

Medianamente satisfechos 40

Poco satisfechos 20

Nada satisfechos 30

Estudios anteriores para productos similares, determinaron que la proporción esperada en el comportamiento de los consumidores debería ser:

Muy satisfechos 68%

Medianamente satisfechos 16%

Poco satisfechos 10%

Nada satisfechos 6%

Compruebe la hipótesis a nivel del 5% de que el nuevo producto tiene una aceptación en los consumidores que se ajusta a las proporciones esperadas

Jorge Amores - ESTADISTICA

Ji Cuadrado (X2) para Independencia

La prueba de X2 se usa también para probar la independencia

de variables.

Con los valores observados se construyen tablas de

contingencia, que son tablas de doble entrada en las que se

presentan las diferentes combinaciones de las variables que se

analizan.

Se calculan los valores esperados de la siguiente manera:

Valor esperado =

Jorge Amores - ESTADISTICA

Ejemplo de X2 para Independencia

Se realizó una encuesta al azar en la universidad a un grupo

de 250 estudiantes, para conocer su preferencia por ciencias

exactas (CE), sociales (CS) o humanas (CH), obteniéndose los

siguientes resultados:

Se quiere probar la Ho: no existe preferencia de género para

escoger las carreras en las tres áreas muestreadas de la

universidad

Género CE CS CH Total

Femenino 21 64 45 130

Masculino 34 38 48 120

Total 55 102 93 250

Jorge Amores - ESTADISTICA

Ejemplo de X2 para

Independencia 1. Cálculo de las frecuencias esperadas:

2. Cálculo de X2:

X2 =

X2 = 2.02 + 2.26 + 0.23 + 2.19 + 2.45 + 0.25 = 9.40

Género CE CS CH Total

Femenino =

28.60

= 53.04 =

48.36

130

Masculino =

26.40

=

48.96

=44.64

120

Total 55 102 93 250

Jorge Amores - ESTADISTICA

Prueba de Hipótesis para X2

Para probar Ho: no existe preferencia de género para

escoger las carreras, se procede:

El valor calculado de X2 debe ser contrastado con el valor

tabular de la distribución de X2 al nivel de significación α

escogido y con (r filas – 1) * (c columnas -1)

X2 tab 0.05, 2 gl = 5.99

Dado que X2 calculado (9.40) > X2 tabular (5.99) se

rechaza la Ho , consecuentemente se acepta Ha: si existe

preferencia de género para escoger las carreras

Jorge Amores - ESTADISTICA

TALLER

En una investigación sobre la enfermedad diarreica en niños menores de seis años, un

médico tuvo interés de conocer si existían diferencias en la incidencia de la enfermedad

respecto a la condición socioeconómica de una población a la que estudió.

El estudio se realizó con una muestra de 167 niños y se planteó la Ho: no existen

diferencias en la incidencia de la enfermedad en las tres clases socioeconómicas. La Ha: la

enfermedad incide de forma diferente de acuerdo a la condición socioeconómica.

Los siguientes fueron los datos observados:

Condición socioeconómica Con diarrea Sin diarrea Total

Alta 15 25 40

Media 20 32 52

Baja 60 15 75

Total 95 72 167

Calcule los valores esperados y realice la prueba de hipótesis de independencia de variables

a nivel del 5% e interprete los resultados

Jorge Amores - ESTADISTICA