Download - 03 cuad mat_aplic_01_2011
69
III.- ESTADISTICAINTRODUCCION.
Historia: Aunque lleva cerca de 200 años de estudiarse teóricamente, la Estadística es
una ciencia joven en su aplicación. Anteriormente, sólo era aplicada en los asuntos de estado
(de donde viene su nombre). Se dice que su desarrollo empezó cuando los jugadores trataron
de encontrar un método que les permitiera ganar en los dados y las cartas; para ello recurrieron
a las matemáticas. En el siglo XVIII Bernoulli estudió la probabilidad; posteriormente Laplace y
Gauss la aplicaron a la astronomía. En el siglo XIX Quetelet la aplica a la investigación social y
económica; Galton desarrolla métodos estadísticos en el campo social; Peanon estudia la
correlación y regresión. Fisher aporta conocimientos dentro del área biológica.
La necesidad de la estadística se presenta cuando hay que manejar un gran número de
datos. Es una herramienta utilizada por: sociólogos, psicólogos, economistas, ingenieros,
antropólogos, médicos, educadores, analistas de mercado, químicos, comunicadores, físicos,
administradores, políticos y en otros muchos campos de la actividad humana para tomar
decisiones dentro de su área de trabajo.
Definición: Es un conjunto de métodos científicos para la recopilación, representación
condensación y análisis de los datos extraídos de un sistema en estudio.
La Estadística no es una ciencia en sí misma. Se trata de un grupo de métodos con base
científica. Los métodos son modelos que optimizan matemáticamente los objetivos buscados.
De hecho, la Estadística Teórica es una rama de las Matemáticas. Recopilar datos significa
obtenerlos efectuando mediciones, muestreos, encuestas, censos, etc. La representación de
datos implica mostrarlos con gráficos, con tablas, en forma de texto, o cualquier combinación de
éstas. La condensación de los datos implica reducir su número a dos o tres valores
representativos de todo el grupo, denominados estadísticas, estadígrafos o números índices,
tales como la media, la mediana, la varianza, costo de vida, etc. El análisis se hace con las
herramientas estadísticas, empleando la información obtenida de los datos, para realizar
estimaciones o inferencias, testear hipótesis de trabajo y así, poder tomar las decisiones más
adecuadas en cada caso particular, basadas en la evidencia científica suministrada por estos
análisis.
De la definición anterior, surge que la Estadística puede ser usada en cualquier sistema en
estudio. En la práctica, esto significa una gran cantidad de posibilidades, pues, donde pueda
definirse un sistema, allí se podrá emplear la Estadística.
70
División de la estadística: La aplicación de la estadística se realiza mediante una serie de
pasos que se pueden resumir como sigue:
Recopilación.- Obtención de los datos mediante encuestas (investigación de mercado)
o recabándolos directamente de archivos (manejo de datos históricos).
Organización.- Principalmente mediante la elaboración de cuadros estadísticos los
datos son ordenados.
Análisis.- Es el procesamiento de los datos ordenados mediante el cálculo de ciertos
valores para obtener resultados.
Interpretación.- La interpretación es de suma importancia, ya que de ella dependen las
acciones que se efectuarán posteriormente, pues en esta etapa se presenta la
toma de decisiones.
Los pasos mencionados, quedan todos incluidos en las siguientes ramas de la estadística:
Teoría del muestreo (recopilación).
Estadística descriptiva (organización y análisis). Es la parte de la Estadística que se
ocupa de representar y condensar los datos obtenidos del sistema en estudio
Inferencia estadística (interpretación). Es la parte de la Estadística dedicada a la
formulación de supuestos y estimaciones, para hacer predicciones con los datos
obtenidos en el estudio de las muestras. Y así, poder sacar conclusiones para
tomar decisiones con base científica.
La Estadística se emplea en el estudio de los fenómenos naturales, tanto los generados en
los laboratorios por los científicos como aquellos más allá del control humano. En una gran
variedad de disciplinas como economía, sociología, política, ciencias de la salud, en estudios
demográficos, etc.
CONCEPTOS BASICOS
Población: Es el total de sujetos observables en la recopilación de datos, es el conjunto
de todas las muestras posibles, que pueden obtenerse del sistema en estudio de acuerdo al
método de selección empleado. Ejemplos:
En el estudio de un parque zoológico, el total de animales.
En el estudio de la estatura de 12 000 estudiantes, la estatura de todos ellos.
71
Muestra: Es la parte representativa de la población. Es un conjunto de datos obtenidos
de una población cualquiera, con el método de recopilación elegido. Se la puede imaginar como
un subconjunto del conjunto población.
Se toman muestras, cuando no se puede o no conviene, tomar la población entera. Si se
tiene una población de tamaño infinito, no se podrá nunca tomar todas las muestras posibles,
como por ejemplo, las mediciones repetidas de una misma magnitud, que se pueden repetir
indefinidamente mientras el ensayo no sea destructivo (repetidas pesadas en una balanza,
medir la temperatura de un cuerpo, etc.). Hay ocasiones, donde si bien la población es finita, es
tan grande que no resulta práctico tomar todos los casos como por ejemplo, cuando la
población es la especie humana. Otras veces, las determinaciones que se deben realizar en las
muestras son tan caras que resulta mucho más barato tomar muestras. Pueden haber razones
de tiempo que impidan analizar a toda la población. Si el método de ensayo es destructivo,
como ver si los fósforos funcionan, o abrir ampollas de medicamento para verificar su contenido,
entonces no hay más remedio que tomar muestras. En cambio, si se revisan diamantes para
determinar si son falsos, allí se tomará a cada uno de los elementos componentes de la
población, y nunca una muestra de los mismos. La idea básica es tomar muestras
representativas de la población desconocida, y a través del análisis de las mismas poder hacer
deducciones acerca de esa población. La clientela que concurre a una farmacia o a un
laboratorio de análisis clínicos proviene de una población relacionada con la cercanía a su
ubicación geográfica. Conocerla en sus preferencias, es algo fundamental para toda campaña
publicitaria destinada a incrementar las ventas. Ejemplos:
En el caso del parque zoológico, podrían ser 5 ardillas con sus características.
En el caso de la estatura de los 12 000 estudiantes, podrían ser 100 estudiantes.
Variable: Es una característica de los sujetos de la población que puede tomar cualquiera de
los valores de un conjunto definido y pueden ser:
Variables discretas: Son las que sólo pueden tomar valores enteros: número de
integrantes de una familia, color de la piel, etc. Los datos así definidos se llaman datos
discretos.
Variables continuas: Son aquellas que pueden tomar cualquier valor, ya sea entero o
fraccionario: kilómetros recorridos por un automóvil, el peso de una persona, la altura
sobre el nivel del mar, etc.. En este caso, los datos definidos se llaman datos continuos.
72
Variables constantes: Son las que únicamente pueden tomar un solo valor: el número de
madres de una persona, las razones sociales de una empresa, etc.
Estadística descriptiva: Organiza y analiza la información muestreada mediante el
cálculo de algunos valores como: medidas de tendencia central, medidas de dispersión,
medidas de forma, etc.
Inferencia estadística: Es la interpretación y proyección hacia el futuro de los resultados
obtenidos en la estadística descriptiva mediante la toma de decisiones.
TEORIA ELEMENTAL DE MUESTREO
Teoría de muestreo: La teoría de muestreo estudia las relaciones existentes entre una
población y muestras extraídas de la misma. Permite estimar cantidades desconocidas de la
población frecuentemente llamados parámetros poblacionales o brevemente parámetros
obtenidos a partir del conocimiento de las correspondientes cantidades muestrales (medias,
modas, desviaciones, etc. ) a las que se les llama estadísticos muestrales o brevemente
estadísticos.
MEDIDAPARAMETRO
(Población)
ESTADISTICO
(Muestra)
Media o Promedio μ xDesviación Estándar σ δ
Proporción o Porcentaje P p
Cantidad de elementos N n
La teoría de muestreo también sirve para determinar si las diferencias entre dos
muestras se deben a la aleatoriedad de las mismas o si realmente son significativas.
Muestras al azar: Para que el trabajo estadístico sea válido, la muestra elegida debe
ser representativa de la población. El proceso mediante el que se extrae una muestra
representativa de la población se conoce como muestreo al azar, este garantiza que cada
miembro de la población tiene la misma posibilidad de ser incluido en la muestra. La
aleatorización se refiere a cualquier proceso de selección de una muestra de la población en el
que la selección es imparcial o no está sesgada; una muestra elegida con procedimientos
aleatorios se llama muestra aleatoria.
73
Los tipos más comunes de técnicas de muestreo aleatorios son el muestreo aleatorio
simple, el muestreo estratificado, el muestreo por conglomerados y el muestreo sistemático.
Además, el muestreo aleatorio se puede plantear bajo dos puntos de vista: sin reposición
( muestreo sin reemplazamiento ) de los elementos y con reposición ( muestreo con
reemplazamiento ).
Muestreo con reemplazo: Es aquel en que un elemento puede ser seleccionado
más de una vez en la muestra, para ello se extrae un elemento de la población, se observa y se
devuelve a la población, por lo que de esta forma se pueden hacer infinitas extracciones de la
población aun siendo esta finita.
Muestreo sin reemplazo: No se devuelve los elementos extraídos a la población
hasta que no se hallan extraídos todos los elementos de la población que conforman la
muestra.
Cuando se hace una muestra probabilística debemos tener en cuenta principalmente dos
aspectos: El método de selección y el tamaño de la muestra
Entre los métodos de muestreo probabilístico más utilizados en investigación encontramos:
Muestreo aleatorio simple
Muestreo estratificado
Muestreo sistemático
Muestreo polietápico o por conglomerados
Muestreo aleatorio simple: El procedimiento empleado es el siguiente: 1) se asigna
un número a cada individuo de la población y 2) a través de algún medio mecánico (bolas
dentro de una bolsa, tablas de números aleatorios, números aleatorios generados con una
calculadora u ordenador, etc.) se eligen tantos sujetos como sea necesario para completar el
tamaño de muestra requerido.
Este procedimiento, atractivo por su simpleza, tiene poca o nula utilidad práctica cuando la
población que estamos manejando es muy grande.
Muestreo aleatorio sistemático: Este procedimiento exige, como el anterior,
numerar todos los elementos de la población, pero en lugar de extraer n números aleatorios
74
sólo se extrae uno. Se parte de ese número aleatorio i, que es un número elegido al azar, y los
elementos que integran la muestra son los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es
decir se toman los individuos de k en k, siendo k el resultado de dividir el tamaño de la
población entre el tamaño de la muestra: k = N/n. El número i que empleamos como punto de
partida será un número al azar entre 1 y k.
El riesgo en este tipo de muestreo está en los casos en que se dan periodicidades en la
población ya que al elegir a los miembros de la muestra con una periodicidad constante (k)
podemos introducir una homogeneidad que no se da en la población. Imaginemos que estamos
seleccionando una muestra sobre listas de 10 individuos en los que los 5 primeros son varones
y los 5 últimos mujeres, si empleamos un muestreo aleatorio sistemático con k =10 siempre
seleccionaríamos o sólo hombres o sólo mujeres, no podría haber una representación de los
dos sexos.
Muestreo aleatorio estratificado: Trata de obviar las dificultades que presentan los
anteriores ya que simplifican los procesos y suelen reducir el error muestral para un tamaño
dado de la muestra. Consiste en considerar categorías típicas diferentes entre sí (estratos) que
poseen gran homogeneidad respecto a alguna característica (se puede estratificar, por ejemplo,
según la profesión, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de interés estarán
representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para elegir los
elementos concretos que formarán parte de la muestra. En ocasiones las dificultades que
plantean son demasiado grandes, pues exige un conocimiento detallado de la población.
(Tamaño geográfico, sexos, edades,...).
La distribución de la muestra en función de los diferentes estratos se denomina afijación, y
puede ser de diferentes tipos:
Afijación Simple: A cada estrato le corresponde igual número de elementos muéstrales.
Afijación Proporcional: La distribución se hace de acuerdo con el peso (tamaño) de la
población en cada estrato.
Afijación Optima: Se tiene en cuenta la previsible dispersión de los resultados, de modo
que se considera la proporción y la desviación típica. Tiene poca aplicación ya que no se suele
conocer la desviación.
75
Muestreo aleatorio por conglomerados: Los métodos presentados hasta ahora
están pensados para seleccionar directamente los elementos de la población, es decir, que las
unidades muéstrales son los elementos de la población.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la
población que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc., son
conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no naturales
como, por ejemplo, las urnas electorales. Cuando los conglomerados son áreas geográficas
suele hablarse de "muestreo por áreas".
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto numero
de conglomerados (el necesario para alcanzar el tamaño muestral establecido) y en investigar
después todos los elementos pertenecientes a los conglomerados elegidos.
DISTRIBUCIONES MUESTRALES
Como los valores de un estadístico, tal como x, varían de una muestra aleatoria a otra, se
le puede considerar como una variable aleatoria con su correspondiente distribución de
frecuencias.
Posteriormente un determinado estadístico ( x (media aritmética), s (desviación estándar) ,
p (probabilidad), etc.) podrá ser calculado para c/u de las muestras, en estos casos se habla de
Distribución Muestral del Estadístico.
Una distribución muestral es entonces todo el conjunto de muestras posibles más todo el
conjunto del estadístico de cada una de las muestras.
Aún más, si el estadístico es la media o promedio, entonces se habla de una Distribución
Muestral de Medias.
Si el estadístico es la proporción (p) entonces, se habla de una Distribución Muestral de
Proporciones.
A) DISTRIBUCIÓN MUESTRAL DE MEDIAS
Suponga que se han seleccionado muestras aleatorias de tamaño 20 en una población
grande. Se calcula la madia muestral x para cada muestra; la colección de todas estas medias
muestrales recibe el nombre de distribución muestral de medias, lo que se puede ilustrar en
la siguiente figura:
76
Suponga que se eligen muestras aleatorias de tamaño 20, de una población grande, y se
calcula la desviación estándar de cada una. La colección de todas estas desviaciones estándar
muestrales se llama distribución muestral de la desviación estándar, y lo podemos ver en la
siguiente figura:
Cuando el tamaño de una muestra n es más pequeña que el tamaño N de una población,
2 o más muestras se pueden extraer de una población, ejemplos:
1).- Si tengo 30 alumnos como N y quiero muestras de tamaño 3 (n), entonces:
Se pueden obtener hasta ( 30
3 ) = 4060 muestras
2) Obtener todas las muestras posibles de tamaño 2 de la siguiente población:
N = {a, e, i, o, u} ; 5C2 = 10 ← Observar que se calcula con COMBINACIONES
={ae, ai, ao, au, ei, eo, eu, io, iu, ou}
3) El siguiente cuadro muestra el costo de cada perico en la jaula:
Perico 1 100.00
77
Perico 2 200.00
Perico 3 300.00
Perico 4 300.00
Perico 5 0.0
Cuantas y cuales muestras de tamaño 2 es posible obtener?
n = 5C2 = 10
MUESTRAS PIP2 PIP3 PIP4PIP
5P2P3 P2P4 P2P5 P3P4 P3P5 P4P5
150 200 200 50 250 250 100 300 150 150
P baratos
$0...$1000.5 0.5 0.5 1.0 0.0 0.0 0.5 0.0 0.5 0.5
4) El siguiente cuadro muestra las calificaciones del examen de estadística de los alumnos del
3o.”C”. Juan 4; Pedro 8; Damián 5; Rosa 4; Martha 6; Francisco 7;
Determinar:
a) El número total de muestras de tamaño tres que es posible obtener.
b) Distribución muestral de medias y de proporción de reprobados.
c) μ , la media poblacional.
d) σ , la desviación estándar poblacional.
e) μ x, la media de la distribución muestral de medias.
78
5) Se eligen muestras ordenadas de tamaño 2, con reemplazo, de la población de valores 0, 2,
4 y 6. Encuentre:
a) μ , la media poblacional.
b) σ , la desviación estándar poblacional.
c) μ x, la media de la distribución muestral de medias.
d) σ x, la desviación estándar de la distribución muestral de medias.
Además, grafique las frecuencias para la población y para la distribución muestral de
medias.
Solución:
a. La media poblacional es: μ = 0+2+4+6
4= 12
4= 3
f Gráfica de frecuencias para la población
1
0 2 4 6 x
b. .La desviación estándar de la población es:
MUESTRAS x p (reprobados) MUESTRAS x p (reprobados)
JPD 5.6 0.66 PDR 5.6 0.66
JPR 5.3 0.66 PDM 6.3 0.33
JPM 6.0 0.33 PDF 6.6 0.33
JPF 6.3 0.33 PRM 6.0 0.33
JDR 4.3 1.00 PRF 6.3 0.33
JDM 5.0 0.66 PMF 7.0 0.00
JDF 5.3 0.66 DRM 5.0 0.66
JRM 4.6 0.66 DRF 5.3 0.66
JRF 5.0 0.66 DMF 6.0 0.33
JMF 5.6 0.33 RMF 5.6 0.33
79
σ = √ (0−3 )2 + (2−3 )2+ (4−3 )2+ (6−3 )2
4= √ 20
4= 2. 236
c. A continuación se listan los elementos de la distribución muestral de la media y la
correspondiente distribución de frecuencias.
Muestr
ax
Distribución
frec. de
x
(0,0) 0 x f
(0,2) 1 0 1
(0,4) 2 1 2
(0,6) 3 2 3
(2,0) 1 3 4
(2,2) 2 4 3
(2,4) 3 5 2
(2,6) 4 6 1
(4,0) 2
(4,2) 3
(4,4) 4 Gráfica de frecuencias para las medias de las muestras
(4,6) 5 4
(6,0) 3 3
(6,2) 4 2
(6,4) 5 1
(6,6) 6
0 1 2 3 4 5 6
La media de la distribución muestral de medias es:
μx =Σ ( fx )Σf
=(0 ) (1 ) + (1 ) (2 ) + (2 ) (3 ) + (3 ) ( 4 ) + (4 ) (3 ) + (5 ) (2 ) + (6 ) (1 )16
= 4816
= 3
d) La desviación estándar de la distribución muestral de medias es:
80
σ x = √ Σ f ( x − μx ) 2
Σ f
σ x = √ (0 − 3 ) 2 ( 1 ) + (1 − 3 ) 2 ( 2 ) + (2 − 3 ) 2 (3 ) + (3 − 3 ) 2 (4 ) + (4 − 3 ) 2 (3 ) + (5 − 3 ) 2 ( 2 ) + (6 − 3 ) 2 ( 1 )16
= 1 .58
De aquí que podamos deducir que: σ x =
σ
√ n= 2 . 236
√ 2= 1 . 58
Como para cualquier variable aleatoria, la distribución muestral de medias tiene una media
o valor esperado, una varianza y una desviación estándar, se puede demostrar que la
distribución muestral de medias tiene una media igual a la media poblacional. Esto es:
μx = E ( x ) = μ = 3
Distribuciones muestrales
Después de haber realizado el ejercicio anterior se puede ver que una distribución
muestral se genera extrayendo todas las posibles muestras del mismo tamaño de la población y
calculándoles a éstas su estadístico.
Si la población de la que se extraen las muestras es normal, la distribución muestral de
medias será normal sin importar el tamaño de la muestra.
Si la población de donde se extraen las muestras no es normal, entonces el tamaño de la
muestra debe ser mayor o igual a 30, para que la distribución muestral tenga una forma
acampanada. Mientras mayor sea el tamaño de la muestra, más cerca estará la distribución
muestral de ser normal.
Para muchos propósitos, la aproximación normal se considera buena si se cumple n =30.
La forma de la distribución muestral de medias sea aproximadamente normal, aún en casos
donde la población original es bimodal, es realmente notable.
81
B) DISTRIBUCIÓN MUESTRAL DE PROPORCIONES
La necesidad de encontrar la proporción, porcentaje o porciento de una situación dada en
una población es tarea frecuente en estadística.
Existen ocasiones en las cuales no estamos interesados en la media de la muestra, sino
que queremos investigar la proporción de artículos defectuosos o la proporción de alumnos
reprobados en la muestra. La distribución muestral de proporciones es la adecuada para dar
respuesta a estas situaciones. Esta distribución se genera de igual manera que la distribución
muestral de medias, a excepción de que al extraer las muestras de la población se calcula el
estadístico proporción (p =x/n en donde "x" es el número de éxitos u observaciones de interés y
"n" el tamaño de la muestra) en lugar del estadístico media.
La distribución muestral de proporciones es el conjunto de todas las muestras posibles del
mismo tamaño extraídas de una población, junto con el conjunto de todas las proporciones
muestrales.
Ejemplo:
82
Existen 6 vendedores en una compañía, los vendedores A,B,C, fuman y los vendedores
X,Y,Z no fuman considerando los vendedores como población y el fumar como tipo de
porcentaje, se pide:
a) Proporción de números de fumadores considerando los datos de población.
P=n ( A )n ( )
donde:
P ⇒ Proporción Poblacional
n(A) ⇒ Cantidad de eventos pedidos
n ( )⇒ Tamaño de población
P = 3/6 = 0.50
b) Desviación Estándar de Población
σ P= √ P Q = √ P ( 1 − P ) ⇒ Población finita y sin reemplazo
P = Proporción poblacional
Q = 1 - P
σ P= √0 .5 ( 1 − 0. 5 ) = 0 . 5
c) Cantidad de muestras de tamaño 4
NCn ; N ⇒ Tamaño de Población ; n ⇒ Tamaño de Muestra
6C4 = (64 )
= 15 muestras
d) Distribución Muestral de Proporción
Recordar que es el cuadro de las muestras y las p muestrales.
Donde p es el número de elementos en la muestra que cumplen la característica pedida
dividida entre el tamaño de la muestra.
M abcx abcy abcz abxy abxz abyz acxy acxz acyz axyz bcxy bcxz bcyz bxyz cxyz
p 3/4 ¾ 3/4 2/4 2/4 2/4 2/4 2/4 2/4 1/4 2/4 2/4 2/4 1/4 1/4
x 0.75 0.75 0.75 0.50 0.50 0.50 0.50 0.50 0.50 0.25 0.50 0.50 0.50 0.25 0.25
p = 7.50
e) Media de proporciones muestrales
p = Σ pn
83
Nota: el valor esperado de la proporción es igual a la media de la población
proporcional.
p = Σ pn =
p = 7 .5015
= 0 .50
f) Error Estándar de la Proporción
f.1) Para Muestras menores de 30 elementos
σ p = √ Pqn √ N − n
N − 1 ; σ p = √ (0 .5 ) (0 .5 )
4 ( 6 − 46 − 1 ) σ p = √ 0 . 0625
0 . 4= 0 .15813883
;
Suponga que se cuenta con un lote de 12 piezas, el cual tiene 4 artículos defectuosos.
Se van a seleccionar 5 artículos al azar de ese lote sin reemplazo. Genere la distribución
muestral de proporciones para el número de piezas defectuosas.
Como se puede observar en este ejercicio la Proporción de artículos defectuosos de esta
población es 4/12=1/3. Por lo que podemos decir que el 33% de las piezas de este lote están
defectuosas.
El número posible de muestras de tamaño 5 a extraer de una población de 12 elementos
es 12C5=792, las cuales se pueden desglosar de la siguiente manera:
Artículos
Buenos
Artículos
Malos
Proporción de
defectuosos
Número de maneras de
obtener la muestra
1 4 4/5=0.8 8C1*4C4=8
2 3 3/5=0.6 8C2*4C3=112
3 2 2/5=0.4 8C3*4C2=336
4 1 1/5=0.2 8C4*4C1=280
5 0 0/5=0 8C5*4C0=56
Total 792
Para calcular la media de la distribución muestral de proporciones se tendría que hacer la
sumatoria de la frecuencia por el valor de la proporción muestral y dividirla entre el número total
de muestras. Esto es:
μp =(0 . 8 ) (8 ) + (0 . 6 ) (112 ) + ( 0. 4 ) (336 ) + (0 .2 ) (280 ) + (0 . 0 ) (56 )792
= 13
= 0 . 3333
84
Como podemos observar la media de la distribución muestral de proporciones es igual a la
Proporción de la población.
p = P
También se puede calcular la desviación estándar de la distribución muestral de
proporciones:
σ x = √ (0. 8 − 1/3 ) 2 (8 ) + (0 .6 − 1 /3 )2 (112) + (0 . 4 − 1 /3 )2 (336 ) + (0 . 2 − 1/3 )2 (280 ) + (0 . 0 − 1/3 )2 (56 )792
= 0 .1581
La varianza de la distribución binomial es 2= npq, por lo que la varianza de la distribución
muestral de proporciones es 2p =(Pq)/n. Si se sustituyen los valores en esta fórmula tenemos
que:σ p = √ (1 /3 ) (2 /3 )
5= 0 .2108
, este valor no coincide con el de 0.1681, ya que nos falta
agregar el factor de corrección para una población finita y un muestreo sin reemplazo:
σ p = √ Pqn √ N − n
N − 1 ;σ p = √ (1 /3 ) (2 /3 )
5 √ 12 − 512 − 1
= 0 .1681
La fórmula que se utilizará para el cálculo de probabilidad en una distribución muestral de
proporciones está basada en la aproximación de la distribución normal a la binomial . Esta
fórmula nos servirá para calcular la probabilidad del comportamiento de la proporción en la
muestra.
z= p −P
√ PqnA esta fórmula se le puede agregar el factor de corrección de √ N − n
N − 1 si se cumple con las condiciones necesarias.
C) ERROR ESTÁNDAR
85
A la desviación estándar de una distribución muestral se le conoce como error estándar del
estadístico.
La diferencia entre la desviación estándar y el error estándar es que la desviación estándar
trabaja con datos originales y el error estándar con datos obtenidos de la distribución muestral.
Así se tienen, un error estándar de la media o desviación estándar de la distribución de
medias o se tendrá también un error estándar de la proporción o desviación estándar de la
distribución muestral de proporciones.
PROBLEMA 1.
Los salarios por hora de 6 trabajadores en un pequeño taller se muestran en la siguiente
tabla:
TRABAJADOR A B C D E F
SUELDO X HORA 1 2 3 3 4 5
Considerando los salarios como población se pide obtener:
a) Media de población.
b) Desviación estándar de población.
c) Cantidad de muestras tamaño 2.
d) Distribución muestral de medias.
e) Media de medias muestrales.
f) Error estándar de la media.
TRABAJADOR SUELDO
A 1
B 2
C 3
D 3
E 4
F 5
a) Media de población: μ= ΣX
N = 18/6 = 3
86
b) Desviación estándar de población.
σ=√ Σ ( x−μ )2
N
TRABAJADOR X = SUELDO
A 1 -2 4
B 2 -1 1
C 3 0 0
D 3 0 0
E 4 1 1
F 5 2 4
ΣX = 18 Σ (X−μ )2==10
σ=√106
= 1. 2909944487358056283930884665941
c) Cantidad de muestras de tamaño 2
6C2 = 15 muestras
d) Distribución Muestral de Medias
MUESTRA AB AC AD AE AF BC BD BE BF CD CE CF DE DF EF
x 1.5 2.0 2.0 2.5 3.0 2.5 2.5 3.0 3.5 3.0 3.5 4.0 3.5 4.0 4.5
Σx = 45
e) Media de medias muestrales o también se conoce como Valor Esperado de la
Media o Esperanza de la Media
Σx = x−
= ΣxN
= 4515
= 3
f) Error estándar de la media
1er método:
87
σ x=√ Σ f ( x−μ )2
n
X f
1.5 1 -1.5 2.25 2.25
2 2 -1 1 2.00
2.5 3 -0.5 0.25 0.75
3 3 0 0 0.00
3.5 3 0.5 0.25 0.75
4 2 1 1 2
4.5 1 1.5 2.25 2.25
Σ f ( X− μ )2 = 10. 0
σ x=√1015
= 0 .8164
2do método.- usarlo cuando el tamaño de muestra (n chiquita) es menor de 30.
σ x=σ√n √ N−n
N−1
σ x=1 . 29099
√2 √ 6−26−1
σ x=1 . 29099
√2 √ 45
σ x= 0 . 8164
D) TEORÍA DE LA ESTIMACIÓN ESTADÍSTICA
Estimación es el proceso de usar un estadístico muestral para estimar el correspondiente
parámetro poblacional desconocido.
En esta unidad se analizan.
a) Método para estimar una media poblacional a partir de una media muestral x
b) Método para estimar una proporción poblacional P a partir de una proporción muestral p.
c) Método para determinar un tamaño adecuado de muestra para estimaciones de medias
o de proporciones.
88
Estimación de parámetros, es un proceso para obtener información sobre una población
que se basa en la teoría del muestreo, se divide en:
a) ESTIMACION DE PUNTO:
Es un número único que es usado para representar la estimación del parámetro.
b) ESTIMACION DE INTERVALO:
Es un recorrido establecido dentro del cual podemos esperar que esté el parámetro.
E) ESTIMADOR INSEZGADO
*Un estadístico que es usado para obtener un parámetro se llama ESTIMADOR
*Un estimador es insezgado cuando el valor esperado del estadístico es igual al valor del
parámetro.
*El valor esperado o esperanza del estadístico es la media aritmética de la distribución
muestral del estadístico.
*Puesto que X =μ la media de medias muestrales es un estimador Insezgado.
*Ocurre lo mismo con μ−
que es un estimador Insezgado de la proporción poblacional.
F) ESTIMAR UNA MEDIA PROPORCIONAL A PARTIR DE UNA MEDIA MUESTRAL
En la estimación de μ a partir de x−
se prefiere encontrar tanto la estimación de punto
como la estimación de intervalo.
Cuando se calcula la estimación de intervalo la precisión o confianza de la estimación del
parámetro μ se deberá ser en términos de probabilidad.
PROCEDIMIENTO PARA ESTIMAR EL INTERVALO.
ler. Paso.
Encontrar la media muestral X esto es también la llamada estimación de punto.
2do. Paso. Calcula el error estándar de la media con sus fórmulas respectivas que son :
n<30
a) σ x=
σ√n √ N−n
N−1 n<30
b) σ x=
σ
√n n>30
89
3er. Paso.
Calcular los limites o intervalos de confianza con las siguientes fórmulas.
a) Limite de confianza superior LCS = X + Z (σx )
b) Limite de confianza inferior LCI = X - Z (σx )
Z = Nos indica el grado de confianza que se le asigna a la variable dependiente en este
caso los propios limites.
En particular Z es un valor que se maneja en una curva normal o campana de Gauss,
algunos valores comunes de Z son :
Confianza 50% 68.27% 90% 95% 95.45% 99% 99.75%
Z 0.6745 1 1.645 1.96 2 2.57 3
PROBLEMA 1.
Se selecciona una muestra de estaturas de 100 estudiantes de la UABC, la media de la
muestra es de 68 pulgadas y se calcula que la desviación estándar de estaturas de todos los
estudiantes de la UABC es de 2”.
Se pide la media de estaturas de todos los estudiantes de la universidad con un nivel de
confianza del 68.27%
Respuesta:
DATOS
n = 100
x =68
σ = 2
CC (coeficiente confianza) = 68.27
Z = 1
CALCULOS
σ x=σ
√n n>30; usamos esta porque es mayor de 30
σ x=2
√100= 2
10= 0 .2
LCS = 68 + 1 * 0.2 = 68.2” ← primero multiplicación y suma al final
LCI = 68 - 1 * 0.2 = 67.8”
Respuesta:
90
El promedio de estaturas de todos los estudiantes de la UABC se encuentra entre 67.8
pulgadas y 68.2 pulgadas con un grado, nivel o coeficiente de confianza del 68.27%.
PROBLEMA 2.
Se selecciona una muestra de estaturas de 100 estudiantes de la UABC, la media de la
muestra es de 68” y se calcula que la desviación estándar de estaturas de todos los estudiantes
de la UABC es de 2 “, se pide la media de estaturas de todos los estudiantes de la universidad
con un nivel de confianza del 95%.
Respuesta:
n = 100; x =68; σ = 2
CC (coeficiente confianza) = 95%; Z = 1.96
CALCULOS
σ x=σ
√nusamos esta porque es mayor de 30
σ x=σ
√n =
2
√100= 2
10= 0 .2
LCS = 68 + 1.96 * 0.2 = 68.392” ← primero multiplicación y suma al final
LCI = 68 - 1.96 * 0.2 = 67.608”
El promedio de estaturas de todos los estudiantes de la UABC se encuentran entre 67.6 y
68.3 con un grado, nivel o coeficiente de confianza del 95%.
PROBLEMA 3.
Un despacho de mercadotecnia esta interesado en conocer el ingreso promedio de las
familias en una colonia de la localidad, dicha colonia tiene 3500 familias, una muestra aleatoria
de 25 familias arrojo un promedio de ingresos de $ 45 300.00 mensuales, se calcula
empíricamente que la desviación estándar en promedio de los ingresos en toda la colonia es de
$ 4 500.00, se pide estimar el ingreso promedio de la colonia con un nivel de confianza del 90%
Respuesta:
N = 3500; n = 25 ; σ = 4,500; CC = 90% ; Z =1.645 ; X = 45,300
Error estándar
Usando la fórmula para muestras menores de 30 el resultado debe darles 896.9080
91
σ x=σ√n √ N−n
N−1 = =4500
√25 √3500−253500−1 = 896.9080
LCS = 46,775.41 [LCS = X + Z (σx ) ] = 45300 + 1.645(896.9080)
LCI = 43,824.58 [LCS = X - Z (σx ) ] = 45300 - 1.645(896.9080)
RESPUESTA EL PROMEDIO DE INGRESOS DE LA COLONIA SE ENCUENTRA ENTRE
43,824.58 Y 46,775.41 CON UN NIVEL DE CONFIANZA DEL 90%
G) CONVERSIÓN DE PROPORCIÓN MUESTRAL EN POBLACIONAL
Convertir una proporción muestral (p) en una proporción poblacional (P).
PROCEDIMIENTO:
1er. Paso:
Obtener la proporción muestral (p) que en estimación de punto es también la proporción
poblacional P
P =n (A )n ( )
donde
n(A) ⇒ numero de elementos en la muestra que cumplen la característica deseada.
n ( ) ⇒ Tamaño de la muestra
2do. Paso:
Obtener el error estándar de la proporción con las formulas para mayor y menor de 30.
σ P= √ PQNσ P= √ PQN .
N−nN−1
NOTA:
Sin embargo las fórmulas normales de error estándar de proporción no se pueden aplicar
porque se pretende estimar ( P ), en su lugar se usara la siguiente formula.
SP= √P Qndonde:
Sp ⇒ Error estándar de la proporción muestral
92
p ⇒ Proporción muestral
q ⇒ 1-p
n ⇒ tamaño de la muestra
3er. Paso :
Calcular los limites o intervalos de confianza con.
LCS = p + (Z * Sp)
LCI = p - (Z * Sp )
PROBLEMA 1.
Un grupo político del estado desea conocer proporción, porcentaje, porciento de electores
que votarían por un candidato en las elecciones del año que entra, una muestra de 400
electores tomada al azar arroja que 140 electores votarían por el candidato, estimar la
proporción de población que votaría por el candidato con un intervalo, nivel o coeficiente de
confianza del 95%.
Respuesta:
P =n (A )n ( ) =
140400 = 0.35
SP= √P Qn = √ ( 0. 35 ) (0 . 65 )400
= 0 .02384
CC = 95% ; Z = 1.96
LCS = p + (Z * Sp) = 0.35 + 0.0466 = 0.3966 ⇒ 39.66%
LCI = p - (Z * Sp ) = 0.35 - 0.0466 = 0.3033 ⇒ 30.33%
Recordar en estos problemas cambiar el porcentaje a porcientos
El porciento de electores que votarían por el candidato se encuentra entre 30.33% y
39.66% con un grado de confianza del 95%
PROBLEMA 2.
Calcular el porciento de hombres varones en la facultad, si una muestra de 65 alumnos
arroja 38 hombres con un intervalo de confianza del 90%.
P =n (A )n ( ) =
3065 = 0.5846
93
SP= √P Qn = √ ( 0. 5846 ) (0 . 41538 )656
= 0. 0611
CC = 90% ; Z = 1.645
LCS = p + (Z * Sp) = 0.5846 + 0.1005 = 0.6851
LCI = p - (Z * Sp) = 0.5846 - 0.1005 = 0.4841
El porciento de varones en la facultad se encuentra entre 48.41% y 68.51% con un
intervalo de confianza del 90%
H) DE TERMINACIÓN DE TAMAÑO A DE CUADO DE MUESTRA
Determinar el tamaño adecuado de muestra es un problema importante en la tarea de
investigación, si la muestra es mas grande de lo necesario, tiempo y dinero se gastaran de mas,
si es menor de lo necesario las conclusiones quizás no sean validas.
1.- Tamaño adecuado de muestra para estimar una media proporcional.
n = (ZcE )2
n = Tamaño demuestra.
Z = Valor de eje X de un área seleccionada en la curva normal o campana de gauss.
σ = desviación estándar de población.
E = Error muestral o
PROBLEMA 1.
En un despacho de mercadotecnia se interesa en conocer el ingreso promedio de 360
familias de una colonia, la desviación estándar de los ingresos de población se calculan en
$4,500.00, determinar el tamaño adecuado muestral, si solo permite un máximo error muestral
de $1,200.00 y con un nivel de confianza del 90%.
⇒ n = 39 familias
PROBLEMA 2.
Nos interesa conocer el promedio de calificaciones de los estudiantes de Estadística 11 de
la escuela, se calcula la desviación estándar en promedio de calificaciones de todos los
94
estudiantes es de 1.2, determinar un tamaño adecuado de muestra con un máximo error
muestral de 0.355 y un intervalo de confianza del 99%.
n = (ZcE )2
= ((2 .58 )( 1 .2 )
0. 355 )2
= 76 .05
n = 77 estudiantes de estadística
PROBLEMA 3.
La Canacintra se interesa en conocer la producción promedio de la industria vinícola que
se compone de 460 unidades productoras o viñedos, se calcula que la desviación estándar en
la industria es de 2700 hectolitros, con un intervalo de confianza del 95% y un máximo error
muestral de 450 hectolitros, seleccionar un tamaño de muestra adecuado.
n = (ZcE )2
= ((1 . 96)(2700 )450 ) = 1369
il = 139 unidades de producción
I) DE TERMINAR TAMAÑO A DE CUADO DE PROPORCIÓN MUESTRAL
Tamaño Adecuado de muestra para proporción muestral
n = Tamaño demuestra; Z = Área bajo la curva
P = Proporción poblacional; Q = 1 - P
E = Máximo error muestral;
PROBLEMA 1.
El gerente de una compañía quiere comprobar los registros de inventarios físicos mediante
un estudio muestra], el gerente indica que:
a) El máximo error muestral no debe ser mayor del 5%.
b) El intervalo de confianza es de 99.75%
c) La proporción de registros inexactos de acuerdo a experiencias pasadas es del 15%
Se pide seleccionar un tamaño adecuado de muestra.
E = 5% = 0.05 ; Z = 99.75% = 3
P = 15% = 0.15 ; q = 0.85
95
n ⇒ 459 registros
PROBLEMA 2.
En la ciudad de Tijuana las familias con ingresos mayores a 30 000 anuales constituyen el
10% de la población.
Determinar un tamaño adecuado de muestra con un nivel de confianza del 95% y un
máximo error muestral del 3%.
p = 10% = 0.10; q = 0.90; Z = 95% = 1.96; E = 3% = 0.03
n = 384.16 ⇒ 385 familias
96
BIBLIOGRAFÍA
[ 1 ] Cálculo
Colección DGETI
Hipólito Orduño Vega
Fondo de Cultura Económica
México, D.F. 2007
[ 2 ] Cálculo con geometría analítica
Dennis G. Zill
Mc Graw Hill
México, D.F.
[ 3 ] Cálculo Diferencial e Integral
Granville Smith
Editorial Limusa
México
[ 4 ] Estadística matemática de aplicaciones
Mendenhall, Scheaffer, Wockerly
Grupo editorial Iberoamérica
[ 5 ] Estadística (Serie Schaum)
Murria R. Spiegel
McGraw-Hill
97
[ 6 ] Teoría de conjuntos y temas afines
Seymour Lipschutz
Ed. McGraw-Hill
ESTADISTICADefinición
División de la estadística
Recopilación
Organización
Análisis
Interpretación
CONCEPTOS BASICOS
Población
Muestra
Estadísticos
Parámetros
Estadística descriptiva
Inferencia estadística
TEORIA ELEMENTAL DE MUESTREO
Teoría de muestreo
Muestras al azar
Muestreo con reemplazo
Muestreo sin reemplazo
Muestreo aleatorio simple
Muestreo aleatorio sistemático
Muestreo aleatorio estratificado
Muestreo aleatorio por
conglomerados
DISTRIBUCIONES MUESTRALESDistribución Muestral de Medias.
Distribución Muestral de
Proporciones.
98
INDICE
CONTENIDO PAGINA
UNIDAD I: ANALISIS DE FUNCIONES 1
I Introducción I.1 Conceptos 1
I.2 Ejemplos 3
I.3 Razón de cambio 7
I.4 Ejemplos DE RAZÓN DE CAMBIO 11
I.5 Solución de problemas de análisis de funciones 30
UNIDAD II:CALCULO INTEGRAL
II.1 La diferencial 37
II.2 Definición de integral 40
II.3 Reglas de integración 42
II.4 Aplicaciones de la integración 49
II.5 Integral definida 50
II.6 Cálculo de áreas 52
II.7 Cálculo de volúmenes 54
II.8 Solución de problemas 57
UNIDAD III: ESTADISTICA INFERENCIAL
III.1 Introducción 69
III.2 Teoría elemental de muestreo 72
III.3 Distribución muestral de medias 75
III.4 Distribución muestral de proporciones 80
99
III.4 Error estándar 84
III.5 Teoría de estimación estadística 87
BIBLIOGRAFIA 96