Download - 03 cuad mat_aplic_01_2011

69

III.- ESTADISTICAINTRODUCCION.

Historia: Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es

una ciencia joven en su aplicación. Anteriormente, sólo era aplicada en los asuntos de estado

(de donde viene su nombre). Se dice que su desarrollo empezó cuando los jugadores trataron

de encontrar un método que les permitiera ganar en los dados y las cartas; para ello recurrieron

a las matemáticas. En el siglo XVIII Bernoulli estudió la probabilidad; posteriormente Laplace y

Gauss la aplicaron a la astronomía. En el siglo XIX Quetelet la aplica a la investigación social y

económica; Galton desarrolla métodos estadísticos en el campo social; Peanon estudia la

correlación y regresión. Fisher aporta conocimientos dentro del área biológica.

La necesidad de la estadística se presenta cuando hay que manejar un gran número de

datos. Es una herramienta utilizada por: sociólogos, psicólogos, economistas, ingenieros,

antropólogos, médicos, educadores, analistas de mercado, químicos, comunicadores, físicos,

administradores, políticos y en otros muchos campos de la actividad humana para tomar

decisiones dentro de su área de trabajo.

Definición: Es un conjunto de métodos científicos para la recopilación, representación

condensación y análisis de los datos extraídos de un sistema en estudio.

La Estadística no es una ciencia en sí misma. Se trata de un grupo de métodos con base

científica. Los métodos son modelos que optimizan matemáticamente los objetivos buscados.

De hecho, la Estadística Teórica es una rama de las Matemáticas. Recopilar datos significa

obtenerlos efectuando mediciones, muestreos, encuestas, censos, etc. La representación de

datos implica mostrarlos con gráficos, con tablas, en forma de texto, o cualquier combinación de

éstas. La condensación de los datos implica reducir su número a dos o tres valores

representativos de todo el grupo, denominados estadísticas, estadígrafos o números índices,

tales como la media, la mediana, la varianza, costo de vida, etc. El análisis se hace con las

herramientas estadísticas, empleando la información obtenida de los datos, para realizar

estimaciones o inferencias, testear hipótesis de trabajo y así, poder tomar las decisiones más

adecuadas en cada caso particular, basadas en la evidencia científica suministrada por estos

análisis.

De la definición anterior, surge que la Estadística puede ser usada en cualquier sistema en

estudio. En la práctica, esto significa una gran cantidad de posibilidades, pues, donde pueda

definirse un sistema, allí se podrá emplear la Estadística.

70

División de la estadística: La aplicación de la estadística se realiza mediante una serie de

pasos que se pueden resumir como sigue:

Recopilación.- Obtención de los datos mediante encuestas (investigación de mercado)

o recabándolos directamente de archivos (manejo de datos históricos).

Organización.- Principalmente mediante la elaboración de cuadros estadísticos los

datos son ordenados.

Análisis.- Es el procesamiento de los datos ordenados mediante el cálculo de ciertos

valores para obtener resultados.

Interpretación.- La interpretación es de suma importancia, ya que de ella dependen las

acciones que se efectuarán posteriormente, pues en esta etapa se presenta la

toma de decisiones.

Los pasos mencionados, quedan todos incluidos en las siguientes ramas de la estadística:

Teoría del muestreo (recopilación).

Estadística descriptiva (organización y análisis). Es la parte de la Estadística que se

ocupa de representar y condensar los datos obtenidos del sistema en estudio

Inferencia estadística (interpretación). Es la parte de la Estadística dedicada a la

formulación de supuestos y estimaciones, para hacer predicciones con los datos

obtenidos en el estudio de las muestras. Y así, poder sacar conclusiones para

tomar decisiones con base científica.

La Estadística se emplea en el estudio de los fenómenos naturales, tanto los generados en

los laboratorios por los científicos como aquellos más allá del control humano. En una gran

variedad de disciplinas como economía, sociología, política, ciencias de la salud, en estudios

demográficos, etc.

CONCEPTOS BASICOS

Población: Es el total de sujetos observables en la recopilación de datos, es el conjunto

de todas las muestras posibles, que pueden obtenerse del sistema en estudio de acuerdo al

método de selección empleado. Ejemplos:

En el estudio de un parque zoológico, el total de animales.

En el estudio de la estatura de 12 000 estudiantes, la estatura de todos ellos.

71

Muestra: Es la parte representativa de la población. Es un conjunto de datos obtenidos

de una población cualquiera, con el método de recopilación elegido. Se la puede imaginar como

un subconjunto del conjunto población.

Se toman muestras, cuando no se puede o no conviene, tomar la población entera. Si se

tiene una población de tamaño infinito, no se podrá nunca tomar todas las muestras posibles,

como por ejemplo, las mediciones repetidas de una misma magnitud, que se pueden repetir

indefinidamente mientras el ensayo no sea destructivo (repetidas pesadas en una balanza,

medir la temperatura de un cuerpo, etc.). Hay ocasiones, donde si bien la población es finita, es

tan grande que no resulta práctico tomar todos los casos como por ejemplo, cuando la

población es la especie humana. Otras veces, las determinaciones que se deben realizar en las

muestras son tan caras que resulta mucho más barato tomar muestras. Pueden haber razones

de tiempo que impidan analizar a toda la población. Si el método de ensayo es destructivo,

como ver si los fósforos funcionan, o abrir ampollas de medicamento para verificar su contenido,

entonces no hay más remedio que tomar muestras. En cambio, si se revisan diamantes para

determinar si son falsos, allí se tomará a cada uno de los elementos componentes de la

población, y nunca una muestra de los mismos. La idea básica es tomar muestras

representativas de la población desconocida, y a través del análisis de las mismas poder hacer

deducciones acerca de esa población. La clientela que concurre a una farmacia o a un

laboratorio de análisis clínicos proviene de una población relacionada con la cercanía a su

ubicación geográfica. Conocerla en sus preferencias, es algo fundamental para toda campaña

publicitaria destinada a incrementar las ventas. Ejemplos:

En el caso del parque zoológico, podrían ser 5 ardillas con sus características.

En el caso de la estatura de los 12 000 estudiantes, podrían ser 100 estudiantes.

Variable: Es una característica de los sujetos de la población que puede tomar cualquiera de

los valores de un conjunto definido y pueden ser:

Variables discretas: Son las que sólo pueden tomar valores enteros: número de

integrantes de una familia, color de la piel, etc. Los datos así definidos se llaman datos

discretos.

Variables continuas: Son aquellas que pueden tomar cualquier valor, ya sea entero o

fraccionario: kilómetros recorridos por un automóvil, el peso de una persona, la altura

sobre el nivel del mar, etc.. En este caso, los datos definidos se llaman datos continuos.

72

Variables constantes: Son las que únicamente pueden tomar un solo valor: el número de

madres de una persona, las razones sociales de una empresa, etc.

Estadística descriptiva: Organiza y analiza la información muestreada mediante el

cálculo de algunos valores como: medidas de tendencia central, medidas de dispersión,

medidas de forma, etc.

Inferencia estadística: Es la interpretación y proyección hacia el futuro de los resultados

obtenidos en la estadística descriptiva mediante la toma de decisiones.

TEORIA ELEMENTAL DE MUESTREO

Teoría de muestreo: La teoría de muestreo estudia las relaciones existentes entre una

población y muestras extraídas de la misma. Permite estimar cantidades desconocidas de la

población frecuentemente llamados parámetros poblacionales o brevemente parámetros

obtenidos a partir del conocimiento de las correspondientes cantidades muestrales (medias,

modas, desviaciones, etc. ) a las que se les llama estadísticos muestrales o brevemente

estadísticos.

MEDIDAPARAMETRO

(Población)

ESTADISTICO

(Muestra)

Media o Promedio μ xDesviación Estándar σ δ

Proporción o Porcentaje P p

Cantidad de elementos N n

La teoría de muestreo también sirve para determinar si las diferencias entre dos

muestras se deben a la aleatoriedad de las mismas o si realmente son significativas.

Muestras al azar: Para que el trabajo estadístico sea válido, la muestra elegida debe

ser representativa de la población. El proceso mediante el que se extrae una muestra

representativa de la población se conoce como muestreo al azar, este garantiza que cada

miembro de la población tiene la misma posibilidad de ser incluido en la muestra. La

aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el

que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos

aleatorios se llama muestra aleatoria.

73

Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio

simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.

Además, el muestreo aleatorio se puede plantear bajo dos puntos de vista: sin reposición

( muestreo sin reemplazamiento ) de los elementos y con reposición ( muestreo con

reemplazamiento ).

Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado

más de una vez en la muestra, para ello se extrae un elemento de la población, se observa y se

devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la

población aun siendo esta finita.

Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población

hasta que no se hallan extraídos todos los elementos de la población que conforman la

muestra.

Cuando se hace una muestra probabilística debemos tener en cuenta principalmente dos

aspectos: El método de selección y el tamaño de la muestra

Entre los métodos de muestreo probabilístico más utilizados en investigación encontramos:

Muestreo aleatorio simple

Muestreo estratificado

Muestreo sistemático

Muestreo polietápico o por conglomerados

Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna

un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas

dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una

calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el

tamaño de muestra requerido.

Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la

población que estamos manejando es muy grande.

Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior,

numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios

74

sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los

elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es

decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la

población entre el tamaño de la muestra: k = N/n. El número i que empleamos como punto de

partida será un número al azar entre 1 y k.

El riesgo en este tipo de muestreo está en los casos en que se dan periodicidades en la

población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)

podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos

seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones

y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k =10 siempre

seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los

dos sexos.

Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los

anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño

dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que

poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,

según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende

con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán

representados adecuadamente en la muestra. Cada estrato funciona independientemente,

pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los

elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que

plantean son demasiado grandes, pues exige un conocimiento detallado de la población.

(Tamaño geográfico, sexos, edades,...).

La distribución de la muestra en función de los diferentes estratos se denomina afijación, y

puede ser de diferentes tipos:

Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.

Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la

población en cada estrato.

Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo

que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele

conocer la desviación.

75

Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora

están pensados para seleccionar directamente los elementos de la población, es decir, que las

unidades muéstrales son los elementos de la población.

En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la

población que forman una unidad, a la que llamamos conglomerado. Las unidades

hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son

conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales

como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas

suele hablarse de "muestreo por áreas".

El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero

de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar

después todos los elementos pertenecientes a los conglomerados elegidos.

DISTRIBUCIONES MUESTRALES

Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se

le puede considerar como una variable aleatoria con su correspondiente distribución de

frecuencias.

Posteriormente un determinado estadístico ( x (media aritmética), s (desviación estándar) ,

p (probabilidad), etc.) podrá ser calculado para c/u de las muestras, en estos casos se habla de

Distribución Muestral del Estadístico.

Una distribución muestral es entonces todo el conjunto de muestras posibles más todo el

conjunto del estadístico de cada una de las muestras.

Aún más, si el estadístico es la media o promedio, entonces se habla de una Distribución

Muestral de Medias.

Si el estadístico es la proporción (p) entonces, se habla de una Distribución Muestral de

Proporciones.

A) DISTRIBUCIÓN MUESTRAL DE MEDIAS

Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población

grande. Se calcula la madia muestral x para cada muestra; la colección de todas estas medias

muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en

la siguiente figura:

76

Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se

calcula la desviación estándar de cada una. La colección de todas estas desviaciones estándar

muestrales se llama distribución muestral de la desviación estándar, y lo podemos ver en la

siguiente figura:

Cuando el tamaño de una muestra n es más pequeña que el tamaño N de una población,

2 o más muestras se pueden extraer de una población, ejemplos:

1).- Si tengo 30 alumnos como N y quiero muestras de tamaño 3 (n), entonces:

Se pueden obtener hasta ( 30

3 ) = 4060 muestras

2) Obtener todas las muestras posibles de tamaño 2 de la siguiente población:

N = {a, e, i, o, u} ; 5C2 = 10 ← Observar que se calcula con COMBINACIONES

={ae, ai, ao, au, ei, eo, eu, io, iu, ou}

3) El siguiente cuadro muestra el costo de cada perico en la jaula:

Perico 1 100.00

77

Perico 2 200.00

Perico 3 300.00

Perico 4 300.00

Perico 5 0.0

Cuantas y cuales muestras de tamaño 2 es posible obtener?

n = 5C2 = 10

MUESTRAS PIP2 PIP3 PIP4PIP

5P2P3 P2P4 P2P5 P3P4 P3P5 P4P5

150 200 200 50 250 250 100 300 150 150

P baratos

$0...$1000.5 0.5 0.5 1.0 0.0 0.0 0.5 0.0 0.5 0.5

4) El siguiente cuadro muestra las calificaciones del examen de estadística de los alumnos del

3o.”C”. Juan 4; Pedro 8; Damián 5; Rosa 4; Martha 6; Francisco 7;

Determinar:

a) El número total de muestras de tamaño tres que es posible obtener.

b) Distribución muestral de medias y de proporción de reprobados.

c) μ , la media poblacional.

d) σ , la desviación estándar poblacional.

e) μ x, la media de la distribución muestral de medias.

78

5) Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2,

4 y 6. Encuentre:

a) μ , la media poblacional.

b) σ , la desviación estándar poblacional.

c) μ x, la media de la distribución muestral de medias.

d) σ x, la desviación estándar de la distribución muestral de medias.

Además, grafique las frecuencias para la población y para la distribución muestral de

medias.

Solución:

a. La media poblacional es: μ = 0+2+4+6

4= 12

4= 3

f Gráfica de frecuencias para la población

1

0 2 4 6 x

b. .La desviación estándar de la población es:

MUESTRAS x p (reprobados) MUESTRAS x p (reprobados)

JPD 5.6 0.66 PDR 5.6 0.66

JPR 5.3 0.66 PDM 6.3 0.33

JPM 6.0 0.33 PDF 6.6 0.33

JPF 6.3 0.33 PRM 6.0 0.33

JDR 4.3 1.00 PRF 6.3 0.33

JDM 5.0 0.66 PMF 7.0 0.00

JDF 5.3 0.66 DRM 5.0 0.66

JRM 4.6 0.66 DRF 5.3 0.66

JRF 5.0 0.66 DMF 6.0 0.33

JMF 5.6 0.33 RMF 5.6 0.33

79

σ = √ (0−3 )2 + (2−3 )2+ (4−3 )2+ (6−3 )2

4= √ 20

4= 2. 236

c. A continuación se listan los elementos de la distribución muestral de la media y la

correspondiente distribución de frecuencias.

Muestr

ax

Distribución

frec. de

x

(0,0) 0 x f

(0,2) 1 0 1

(0,4) 2 1 2

(0,6) 3 2 3

(2,0) 1 3 4

(2,2) 2 4 3

(2,4) 3 5 2

(2,6) 4 6 1

(4,0) 2

(4,2) 3

(4,4) 4 Gráfica de frecuencias para las medias de las muestras

(4,6) 5 4

(6,0) 3 3

(6,2) 4 2

(6,4) 5 1

(6,6) 6

0 1 2 3 4 5 6

La media de la distribución muestral de medias es:

μx =Σ ( fx )Σf

=(0 ) (1 ) + (1 ) (2 ) + (2 ) (3 ) + (3 ) ( 4 ) + (4 ) (3 ) + (5 ) (2 ) + (6 ) (1 )16

= 4816

= 3

d) La desviación estándar de la distribución muestral de medias es:

80

σ x = √ Σ f ( x − μx ) 2

Σ f

σ x = √ (0 − 3 ) 2 ( 1 ) + (1 − 3 ) 2 ( 2 ) + (2 − 3 ) 2 (3 ) + (3 − 3 ) 2 (4 ) + (4 − 3 ) 2 (3 ) + (5 − 3 ) 2 ( 2 ) + (6 − 3 ) 2 ( 1 )16

= 1 .58

De aquí que podamos deducir que: σ x =

σ

√ n= 2 . 236

√ 2= 1 . 58

Como para cualquier variable aleatoria, la distribución muestral de medias tiene una media

o valor esperado, una varianza y una desviación estándar, se puede demostrar que la

distribución muestral de medias tiene una media igual a la media poblacional. Esto es:

μx = E ( x ) = μ = 3

Distribuciones muestrales

Después de haber realizado el ejercicio anterior se puede ver que una distribución

muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y

calculándoles a éstas su estadístico.

Si la población de la que se extraen las muestras es normal, la distribución muestral de

medias será normal sin importar el tamaño de la muestra.

Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la

muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una forma

acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución

muestral de ser normal.

Para muchos propósitos, la aproximación normal se considera buena si se cumple n =30.

La forma de la distribución muestral de medias sea aproximadamente normal, aún en casos

donde la población original es bimodal, es realmente notable.

81

B) DISTRIBUCIÓN MUESTRAL DE PROPORCIONES

La necesidad de encontrar la proporción, porcentaje o porciento de una situación dada en

una población es tarea frecuente en estadística.

Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino

que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos

reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar

respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución

muestral de medias, a excepción de que al extraer las muestras de la población se calcula el

estadístico proporción (p =x/n en donde "x" es el número de éxitos u observaciones de interés y

"n" el tamaño de la muestra) en lugar del estadístico media.

La distribución muestral de proporciones es el conjunto de todas las muestras posibles del

mismo tamaño extraídas de una población, junto con el conjunto de todas las proporciones

muestrales.

Ejemplo:

82

Existen 6 vendedores en una compañía, los vendedores A,B,C, fuman y los vendedores

X,Y,Z no fuman considerando los vendedores como población y el fumar como tipo de

porcentaje, se pide:

a) Proporción de números de fumadores considerando los datos de población.

P=n ( A )n ( )

donde:

P ⇒ Proporción Poblacional

n(A) ⇒ Cantidad de eventos pedidos

n ( )⇒ Tamaño de población

P = 3/6 = 0.50

b) Desviación Estándar de Población

σ P= √ P Q = √ P ( 1 − P ) ⇒ Población finita y sin reemplazo

P = Proporción poblacional

Q = 1 - P

σ P= √0 .5 ( 1 − 0. 5 ) = 0 . 5

c) Cantidad de muestras de tamaño 4

NCn ; N ⇒ Tamaño de Población ; n ⇒ Tamaño de Muestra

6C4 = (64 )

= 15 muestras

d) Distribución Muestral de Proporción

Recordar que es el cuadro de las muestras y las p muestrales.

Donde p es el número de elementos en la muestra que cumplen la característica pedida

dividida entre el tamaño de la muestra.

M abcx abcy abcz abxy abxz abyz acxy acxz acyz axyz bcxy bcxz bcyz bxyz cxyz

p 3/4 ¾ 3/4 2/4 2/4 2/4 2/4 2/4 2/4 1/4 2/4 2/4 2/4 1/4 1/4

x 0.75 0.75 0.75 0.50 0.50 0.50 0.50 0.50 0.50 0.25 0.50 0.50 0.50 0.25 0.25

p = 7.50

e) Media de proporciones muestrales

p = Σ pn

83

Nota: el valor esperado de la proporción es igual a la media de la población

proporcional.

p = Σ pn =

p = 7 .5015

= 0 .50

f) Error Estándar de la Proporción

f.1) Para Muestras menores de 30 elementos

σ p = √ Pqn √ N − n

N − 1 ; σ p = √ (0 .5 ) (0 .5 )

4 ( 6 − 46 − 1 ) σ p = √ 0 . 0625

0 . 4= 0 .15813883

;

Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos.

Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución

muestral de proporciones para el número de piezas defectuosas.

Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta

población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están

defectuosas.

El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos

es 12C5=792, las cuales se pueden desglosar de la siguiente manera:

Artículos

Buenos

Artículos

Malos

Proporción de

defectuosos

Número de maneras de

obtener la muestra

1 4 4/5=0.8 8C1*4C4=8

2 3 3/5=0.6 8C2*4C3=112

3 2 2/5=0.4 8C3*4C2=336

4 1 1/5=0.2 8C4*4C1=280

5 0 0/5=0 8C5*4C0=56

Total 792

Para calcular la media de la distribución muestral de proporciones se tendría que hacer la

sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total

de muestras. Esto es:

μp =(0 . 8 ) (8 ) + (0 . 6 ) (112 ) + ( 0. 4 ) (336 ) + (0 .2 ) (280 ) + (0 . 0 ) (56 )792

= 13

= 0 . 3333

84

Como podemos observar la media de la distribución muestral de proporciones es igual a la

Proporción de la población.

p = P

También se puede calcular la desviación estándar de la distribución muestral de

proporciones:

σ x = √ (0. 8 − 1/3 ) 2 (8 ) + (0 .6 − 1 /3 )2 (112) + (0 . 4 − 1 /3 )2 (336 ) + (0 . 2 − 1/3 )2 (280 ) + (0 . 0 − 1/3 )2 (56 )792

= 0 .1581

La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución

muestral de proporciones es 2p =(Pq)/n. Si se sustituyen los valores en esta fórmula tenemos

que:σ p = √ (1 /3 ) (2 /3 )

5= 0 .2108

, este valor no coincide con el de 0.1681, ya que nos falta

agregar el factor de corrección para una población finita y un muestreo sin reemplazo:

σ p = √ Pqn √ N − n

N − 1 ;σ p = √ (1 /3 ) (2 /3 )

5 √ 12 − 512 − 1

= 0 .1681

La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de

proporciones está basada en la aproximación de la distribución normal a la binomial . Esta

fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la

muestra.

z= p −P

√ PqnA esta fórmula se le puede agregar el factor de corrección de √ N − n

N − 1 si se cumple con las condiciones necesarias.

C) ERROR ESTÁNDAR

85

A la desviación estándar de una distribución muestral se le conoce como error estándar del

estadístico.

La diferencia entre la desviación estándar y el error estándar es que la desviación estándar

trabaja con datos originales y el error estándar con datos obtenidos de la distribución muestral.

Así se tienen, un error estándar de la media o desviación estándar de la distribución de

medias o se tendrá también un error estándar de la proporción o desviación estándar de la

distribución muestral de proporciones.

PROBLEMA 1.

Los salarios por hora de 6 trabajadores en un pequeño taller se muestran en la siguiente

tabla:

TRABAJADOR A B C D E F

SUELDO X HORA 1 2 3 3 4 5

Considerando los salarios como población se pide obtener:

a) Media de población.

b) Desviación estándar de población.

c) Cantidad de muestras tamaño 2.

d) Distribución muestral de medias.

e) Media de medias muestrales.

f) Error estándar de la media.

TRABAJADOR SUELDO

A 1

B 2

C 3

D 3

E 4

F 5

a) Media de población: μ= ΣX

N = 18/6 = 3

86

b) Desviación estándar de población.

σ=√ Σ ( x−μ )2

N

TRABAJADOR X = SUELDO

A 1 -2 4

B 2 -1 1

C 3 0 0

D 3 0 0

E 4 1 1

F 5 2 4

ΣX = 18 Σ (X−μ )2==10

σ=√106

= 1. 2909944487358056283930884665941

c) Cantidad de muestras de tamaño 2

6C2 = 15 muestras

d) Distribución Muestral de Medias

MUESTRA AB AC AD AE AF BC BD BE BF CD CE CF DE DF EF

x 1.5 2.0 2.0 2.5 3.0 2.5 2.5 3.0 3.5 3.0 3.5 4.0 3.5 4.0 4.5

Σx = 45

e) Media de medias muestrales o también se conoce como Valor Esperado de la

Media o Esperanza de la Media

Σx = x−

= ΣxN

= 4515

= 3

f) Error estándar de la media

1er método:

87

σ x=√ Σ f ( x−μ )2

n

X f

1.5 1 -1.5 2.25 2.25

2 2 -1 1 2.00

2.5 3 -0.5 0.25 0.75

3 3 0 0 0.00

3.5 3 0.5 0.25 0.75

4 2 1 1 2

4.5 1 1.5 2.25 2.25

Σ f ( X− μ )2 = 10. 0

σ x=√1015

= 0 .8164

2do método.- usarlo cuando el tamaño de muestra (n chiquita) es menor de 30.

σ x=σ√n √ N−n

N−1

σ x=1 . 29099

√2 √ 6−26−1

σ x=1 . 29099

√2 √ 45

σ x= 0 . 8164

D) TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA

Estimación es el proceso de usar un estadístico muestral para estimar el correspondiente

parámetro poblacional desconocido.

En esta unidad se analizan.

a) Método para estimar una media poblacional a partir de una media muestral x

b) Método para estimar una proporción poblacional P a partir de una proporción muestral p.

c) Método para determinar un tamaño adecuado de muestra para estimaciones de medias

o de proporciones.

http://www.estadisticafacil.com/estadistica:teoria_de_la_estimacion_estadistica

88

Estimación de parámetros, es un proceso para obtener información sobre una población

que se basa en la teoría del muestreo, se divide en:

a) ESTIMACION DE PUNTO:

Es un número único que es usado para representar la estimación del parámetro.

b) ESTIMACION DE INTERVALO:

Es un recorrido establecido dentro del cual podemos esperar que esté el parámetro.

E) ESTIMADOR INSEZGADO

*Un estadístico que es usado para obtener un parámetro se llama ESTIMADOR

*Un estimador es insezgado cuando el valor esperado del estadístico es igual al valor del

parámetro.

*El valor esperado o esperanza del estadístico es la media aritmética de la distribución

muestral del estadístico.

*Puesto que X =μ la media de medias muestrales es un estimador Insezgado.

*Ocurre lo mismo con μ−

que es un estimador Insezgado de la proporción poblacional.

F) ESTIMAR UNA MEDIA PROPORCIONAL A PARTIR DE UNA MEDIA MUESTRAL

En la estimación de μ a partir de x−

se prefiere encontrar tanto la estimación de punto

como la estimación de intervalo.

Cuando se calcula la estimación de intervalo la precisión o confianza de la estimación del

parámetro μ se deberá ser en términos de probabilidad.

PROCEDIMIENTO PARA ESTIMAR EL INTERVALO.

ler. Paso.

Encontrar la media muestral X esto es también la llamada estimación de punto.

2do. Paso. Calcula el error estándar de la media con sus fórmulas respectivas que son :

n<30

a) σ x=

σ√n √ N−n

N−1 n<30

b) σ x=

σ

√n n>30

http://www.estadisticafacil.com/estadistica:estimacion_media_proporcional

http://www.estadisticafacil.com/estadistica:estimador_insesgado

89

3er. Paso.

Calcular los limites o intervalos de confianza con las siguientes fórmulas.

a) Limite de confianza superior LCS = X + Z (σx )

b) Limite de confianza inferior LCI = X - Z (σx )

Z = Nos indica el grado de confianza que se le asigna a la variable dependiente en este

caso los propios limites.

En particular Z es un valor que se maneja en una curva normal o campana de Gauss,

algunos valores comunes de Z son :

Confianza 50% 68.27% 90% 95% 95.45% 99% 99.75%

Z 0.6745 1 1.645 1.96 2 2.57 3

PROBLEMA 1.

Se selecciona una muestra de estaturas de 100 estudiantes de la UABC, la media de la

muestra es de 68 pulgadas y se calcula que la desviación estándar de estaturas de todos los

estudiantes de la UABC es de 2”.

Se pide la media de estaturas de todos los estudiantes de la universidad con un nivel de

confianza del 68.27%

Respuesta:

DATOS

n = 100

x =68

σ = 2

CC (coeficiente confianza) = 68.27

Z = 1

CALCULOS

σ x=σ

√n n>30; usamos esta porque es mayor de 30

σ x=2

√100= 2

10= 0 .2

LCS = 68 + 1 * 0.2 = 68.2” ← primero multiplicación y suma al final

LCI = 68 - 1 * 0.2 = 67.8”

Respuesta:

90

El promedio de estaturas de todos los estudiantes de la UABC se encuentra entre 67.8

pulgadas y 68.2 pulgadas con un grado, nivel o coeficiente de confianza del 68.27%.

PROBLEMA 2.

Se selecciona una muestra de estaturas de 100 estudiantes de la UABC, la media de la

muestra es de 68” y se calcula que la desviación estándar de estaturas de todos los estudiantes

de la UABC es de 2 “, se pide la media de estaturas de todos los estudiantes de la universidad

con un nivel de confianza del 95%.

Respuesta:

n = 100; x =68; σ = 2

CC (coeficiente confianza) = 95%; Z = 1.96

CALCULOS

σ x=σ

√nusamos esta porque es mayor de 30

σ x=σ

√n =

2

√100= 2

10= 0 .2

LCS = 68 + 1.96 * 0.2 = 68.392” ← primero multiplicación y suma al final

LCI = 68 - 1.96 * 0.2 = 67.608”

El promedio de estaturas de todos los estudiantes de la UABC se encuentran entre 67.6 y

68.3 con un grado, nivel o coeficiente de confianza del 95%.

PROBLEMA 3.

Un despacho de mercadotecnia esta interesado en conocer el ingreso promedio de las

familias en una colonia de la localidad, dicha colonia tiene 3500 familias, una muestra aleatoria

de 25 familias arrojo un promedio de ingresos de $ 45 300.00 mensuales, se calcula

empíricamente que la desviación estándar en promedio de los ingresos en toda la colonia es de

$ 4 500.00, se pide estimar el ingreso promedio de la colonia con un nivel de confianza del 90%

Respuesta:

N = 3500; n = 25 ; σ = 4,500; CC = 90% ; Z =1.645 ; X = 45,300

Error estándar

Usando la fórmula para muestras menores de 30 el resultado debe darles 896.9080

91

σ x=σ√n √ N−n

N−1 = =4500

√25 √3500−253500−1 = 896.9080

LCS = 46,775.41 [LCS = X + Z (σx ) ] = 45300 + 1.645(896.9080)

LCI = 43,824.58 [LCS = X - Z (σx ) ] = 45300 - 1.645(896.9080)

RESPUESTA EL PROMEDIO DE INGRESOS DE LA COLONIA SE ENCUENTRA ENTRE

43,824.58 Y 46,775.41 CON UN NIVEL DE CONFIANZA DEL 90%

G) CONVERSIÓN DE PROPORCIÓN MUESTRAL EN POBLACIONAL

Convertir una proporción muestral (p) en una proporción poblacional (P).

PROCEDIMIENTO:

1er. Paso:

Obtener la proporción muestral (p) que en estimación de punto es también la proporción

poblacional P

P =n (A )n ( )

donde

n(A) ⇒ numero de elementos en la muestra que cumplen la característica deseada.

n ( ) ⇒ Tamaño de la muestra

2do. Paso:

Obtener el error estándar de la proporción con las formulas para mayor y menor de 30.

σ P= √ PQNσ P= √ PQN .

N−nN−1

NOTA:

Sin embargo las fórmulas normales de error estándar de proporción no se pueden aplicar

porque se pretende estimar ( P ), en su lugar se usara la siguiente formula.

SP= √P Qndonde:

Sp ⇒ Error estándar de la proporción muestral

http://www.estadisticafacil.com/estadistica:proporcion_muestral_a_proporcion_poblacional

92

p ⇒ Proporción muestral

q ⇒ 1-p

n ⇒ tamaño de la muestra

3er. Paso :

Calcular los limites o intervalos de confianza con.

LCS = p + (Z * Sp)

LCI = p - (Z * Sp )

PROBLEMA 1.

Un grupo político del estado desea conocer proporción, porcentaje, porciento de electores

que votarían por un candidato en las elecciones del año que entra, una muestra de 400

electores tomada al azar arroja que 140 electores votarían por el candidato, estimar la

proporción de población que votaría por el candidato con un intervalo, nivel o coeficiente de

confianza del 95%.

Respuesta:

P =n (A )n ( ) =

140400 = 0.35

SP= √P Qn = √ ( 0. 35 ) (0 . 65 )400

= 0 .02384

CC = 95% ; Z = 1.96

LCS = p + (Z * Sp) = 0.35 + 0.0466 = 0.3966 ⇒ 39.66%

LCI = p - (Z * Sp ) = 0.35 - 0.0466 = 0.3033 ⇒ 30.33%

Recordar en estos problemas cambiar el porcentaje a porcientos

El porciento de electores que votarían por el candidato se encuentra entre 30.33% y

39.66% con un grado de confianza del 95%

PROBLEMA 2.

Calcular el porciento de hombres varones en la facultad, si una muestra de 65 alumnos

arroja 38 hombres con un intervalo de confianza del 90%.

P =n (A )n ( ) =

3065 = 0.5846

93

SP= √P Qn = √ ( 0. 5846 ) (0 . 41538 )656

= 0. 0611

CC = 90% ; Z = 1.645

LCS = p + (Z * Sp) = 0.5846 + 0.1005 = 0.6851

LCI = p - (Z * Sp) = 0.5846 - 0.1005 = 0.4841

El porciento de varones en la facultad se encuentra entre 48.41% y 68.51% con un

intervalo de confianza del 90%

H) DE TERMINACIÓN DE TAMAÑO A DE CUADO DE MUESTRA

Determinar el tamaño adecuado de muestra es un problema importante en la tarea de

investigación, si la muestra es mas grande de lo necesario, tiempo y dinero se gastaran de mas,

si es menor de lo necesario las conclusiones quizás no sean validas.

1.- Tamaño adecuado de muestra para estimar una media proporcional.

n = (ZcE )2

n = Tamaño demuestra.

Z = Valor de eje X de un área seleccionada en la curva normal o campana de gauss.

σ = desviación estándar de población.

E = Error muestral o

PROBLEMA 1.

En un despacho de mercadotecnia se interesa en conocer el ingreso promedio de 360

familias de una colonia, la desviación estándar de los ingresos de población se calculan en

$4,500.00, determinar el tamaño adecuado muestral, si solo permite un máximo error muestral

de $1,200.00 y con un nivel de confianza del 90%.

⇒ n = 39 familias

PROBLEMA 2.

Nos interesa conocer el promedio de calificaciones de los estudiantes de Estadística 11 de

la escuela, se calcula la desviación estándar en promedio de calificaciones de todos los

http://www.estadisticafacil.com/estadistica:determinacion_tamano_de_muestra

94

estudiantes es de 1.2, determinar un tamaño adecuado de muestra con un máximo error

muestral de 0.355 y un intervalo de confianza del 99%.

n = (ZcE )2

= ((2 .58 )( 1 .2 )

0. 355 )2

= 76 .05

n = 77 estudiantes de estadística

PROBLEMA 3.

La Canacintra se interesa en conocer la producción promedio de la industria vinícola que

se compone de 460 unidades productoras o viñedos, se calcula que la desviación estándar en

la industria es de 2700 hectolitros, con un intervalo de confianza del 95% y un máximo error

muestral de 450 hectolitros, seleccionar un tamaño de muestra adecuado.

n = (ZcE )2

= ((1 . 96)(2700 )450 ) = 1369

il = 139 unidades de producción

I) DE TERMINAR TAMAÑO A DE CUADO DE PROPORCIÓN MUESTRAL

Tamaño Adecuado de muestra para proporción muestral

n = Tamaño demuestra; Z = Área bajo la curva

P = Proporción poblacional; Q = 1 - P

E = Máximo error muestral;

PROBLEMA 1.

El gerente de una compañía quiere comprobar los registros de inventarios físicos mediante

un estudio muestra], el gerente indica que:

a) El máximo error muestral no debe ser mayor del 5%.

b) El intervalo de confianza es de 99.75%

c) La proporción de registros inexactos de acuerdo a experiencias pasadas es del 15%

Se pide seleccionar un tamaño adecuado de muestra.

E = 5% = 0.05 ; Z = 99.75% = 3

P = 15% = 0.15 ; q = 0.85

http://www.estadisticafacil.com/estadistica:determinacion_tamano_proporcion_muestral

95

n ⇒ 459 registros

PROBLEMA 2.

En la ciudad de Tijuana las familias con ingresos mayores a 30 000 anuales constituyen el

10% de la población.

Determinar un tamaño adecuado de muestra con un nivel de confianza del 95% y un

máximo error muestral del 3%.

p = 10% = 0.10; q = 0.90; Z = 95% = 1.96; E = 3% = 0.03

n = 384.16 ⇒ 385 familias

96

BIBLIOGRAFÍA

[ 1 ] Cálculo

Colección DGETI

Hipólito Orduño Vega

Fondo de Cultura Económica

México, D.F. 2007

[ 2 ] Cálculo con geometría analítica

Dennis G. Zill

Mc Graw Hill

México, D.F.

[ 3 ] Cálculo Diferencial e Integral

Granville Smith

Editorial Limusa

México

[ 4 ] Estadística matemática de aplicaciones

Mendenhall, Scheaffer, Wockerly

Grupo editorial Iberoamérica

[ 5 ] Estadística (Serie Schaum)

Murria R. Spiegel

McGraw-Hill

97

[ 6 ] Teoría de conjuntos y temas afines

Seymour Lipschutz

Ed. McGraw-Hill

ESTADISTICADefinición

División de la estadística

Recopilación

Organización

Análisis

Interpretación

CONCEPTOS BASICOS

Población

Muestra

Estadísticos

Parámetros

Estadística descriptiva

Inferencia estadística

TEORIA ELEMENTAL DE MUESTREO

Teoría de muestreo

Muestras al azar

Muestreo con reemplazo

Muestreo sin reemplazo

Muestreo aleatorio simple

Muestreo aleatorio sistemático

Muestreo aleatorio estratificado

Muestreo aleatorio por

conglomerados

DISTRIBUCIONES MUESTRALESDistribución Muestral de Medias.

Distribución Muestral de

Proporciones.

98

INDICE

CONTENIDO PAGINA

UNIDAD I: ANALISIS DE FUNCIONES 1

I Introducción I.1 Conceptos 1

I.2 Ejemplos 3

I.3 Razón de cambio 7

I.4 Ejemplos DE RAZÓN DE CAMBIO 11

I.5 Solución de problemas de análisis de funciones 30

UNIDAD II:CALCULO INTEGRAL

II.1 La diferencial 37

II.2 Definición de integral 40

II.3 Reglas de integración 42

II.4 Aplicaciones de la integración 49

II.5 Integral definida 50

II.6 Cálculo de áreas 52

II.7 Cálculo de volúmenes 54

II.8 Solución de problemas 57

UNIDAD III: ESTADISTICA INFERENCIAL

III.1 Introducción 69

III.2 Teoría elemental de muestreo 72

III.3 Distribución muestral de medias 75

III.4 Distribución muestral de proporciones 80

99

III.4 Error estándar 84

III.5 Teoría de estimación estadística 87

BIBLIOGRAFIA 96

Download - 03 cuad mat_aplic_01_2011

Top Related