estadistica-scsf-03
TRANSCRIPT
-
MEDIDAS DE RESUMEN: MEDIDAS DE RESUMEN: MEDIDAS DE TENDENCIA MEDIDAS DE TENDENCIA CENTRAL Y DISPERSICENTRAL Y DISPERSINN
Lic. Esperanza GarcLic. Esperanza Garca a CribillerosCribilleros
-
ANANLISIS EXPLORATORIO DE LISIS EXPLORATORIO DE DATOSDATOS
Diagrama de tallo y hojasDiagrama de tallo y hojasDiagrama de cajaDiagrama de caja
-
DESCRIPCIDESCRIPCIN DE LOS DATOSN DE LOS DATOS
TablasTablas GrGrficosficosMedidas de resumenMedidas de resumen
-
Stem-and-Leaf Display: Perdida de peso
Stem-and-leaf of Prdida de peso N = 65Leaf Unit = 0.10
1 9 02 9 55 10 0008 10 56913 11 0000315 11 7826 12 0000000012329 12 566(11) 13 0000000022425 13 55566719 14 000002223338 14 5565 15 00033
Diagrama de Tallos y hojasLos datos tienen un decimal
Terminacin de dgitos del 0 al 4
Terminacin de dgitos del 5 al 9
8 datos menores e iguales que 10.9
11 datos entre 13 y 13.4 y uno de ellos es la mediana
8 datos mayores e iguales que 14.5
tallo hojas
-
BOXPLOT (Diagrama de Cajas)BOXPLOT (Diagrama de Cajas) Es un grEs un grfico que nos sirve para ver cfico que nos sirve para ver cmo estmo estn distribuidas las n distribuidas las
observaciones (distribuciobservaciones (distribucin sesgada a la derecha o izquierda), n sesgada a la derecha o izquierda), comparacicomparacin de la dispersin de la dispersin de dos o mas conjuntos de datos y si n de dos o mas conjuntos de datos y si existen valores extremos que afectan a la distribuciexisten valores extremos que afectan a la distribucin.n.
XmXmninonino : Es la observaci: Es la observacin de menor valor n de menor valor XmXmximoximo : Es la observaci: Es la observacin de mayor valor n de mayor valor Q1 : Primer Q1 : Primer CuartilCuartil Q3 : Tercer Q3 : Tercer CuartilCuartil Si aparece * en la grafica significa que es un valor extremoSi aparece * en la grafica significa que es un valor extremo
Mediana Q3Q1 XmximoXmnimo
-
EJEMPLO:EJEMPLO:Se tienen las edades de 35 pacientes:Se tienen las edades de 35 pacientes:
2833455635382227463820554536292234216423452653374554123628283943213235
Explorar los datos especialmente para ver la simetra.
-
DIAGRAMA DE CAJAS
Valor mximo
E
d
a
d
70
60
50
40
30
20
10
EDAD DE 35 MADRES
MeQ3
Q1
Valor Mximo
Valor mnimo
-
Diagrama de tallos y hojasDiagrama de tallos y hojas
Hojas
Tallo
12 madres tienen 29
aos o menos
11 madres tiene 43 aos o
ms
Stem-and-leaf of Edad N = 35Leaf Unit = 1.0
1 1 212 2 01122367889(12) 3 23455667888911 4 3555565 5 34561 6 4
-
MEDIDAS DE RESUMEN PARA MEDIDAS DE RESUMEN PARA VARIABLES CUANTITATIVASVARIABLES CUANTITATIVAS
MEDIDAS DE TENDENCIA CENTRAL O DE POSICIMEDIDAS DE TENDENCIA CENTRAL O DE POSICIN: N: MEDIA ARITMMEDIA ARITMTICA, TICA, MEDIANA, MEDIANA, MODAMODAOTRAS MEDIDAS : PERCENTILES Y CUARTILESOTRAS MEDIDAS : PERCENTILES Y CUARTILES
MEDIDAS DE DISPERSIMEDIDAS DE DISPERSIN: N: RANGORANGOVARIANZAVARIANZADESVIACION ESTANDARDESVIACION ESTANDARCOEFICIENTE DE VARIACIONCOEFICIENTE DE VARIACIONINTERVALO CUARTILARINTERVALO CUARTILAR
-
MEDIDAS DE TENDENCIA CENTRALMEDIDAS DE TENDENCIA CENTRALO POSICIO POSICINN
Son valores que indican el centro de la distribucin de los datos. Es el valor representativo de estos. Las ms usadas son: la media aritmtica o promedio, la mediana, moda, cuartiles y percentiles .
-
MEDIDA DE ASIMETRMEDIDA DE ASIMETRAA
DistribuciDistribucin simn simtrica:trica: Cuando su curva de Cuando su curva de frecuencia es simfrecuencia es simtrica con respecto al centro trica con respecto al centro de los datos, en este caso de los datos, en este caso =Me=Mo.=Me=Mo.
7654321
9
8
7
6
5
4
3
2
1
0
X
F
r
e
q
u
e
n
c
y
Distribucion simetrica
-
DistribuciDistribucin asimn asimtrica positiva trica positiva >Me>Mo>Me>Mo
654321
8
7
6
5
4
3
2
1
0
X
F
r
e
q
u
e
n
c
y
Distribucion asimetrica positiva
DistribuciDistribucin asimn asimtrica negativatrica negativa
-
MEDIA ARITMETICA:MEDIA ARITMETICA:Medida descriptiva de tendencia central, llamada Medida descriptiva de tendencia central, llamada tambitambin promedio. Resulta de sumar los valores de n promedio. Resulta de sumar los valores de todas las observaciones y dividir la sumatoria entre todas las observaciones y dividir la sumatoria entre el total de ellas.el total de ellas.
Nx i=
Parmetron
xxxxnxx ni ++++== ...321
Estadstica
Se caracteriza por:Ser nicaFcil de calcularEs afectada por todos los valores
DondeN es la poblacinn es la muestraxi Valores de x1, x2, , xn
la media muestralx
-
PASOS PARA CALCULAR LA MEDIA:PASOS PARA CALCULAR LA MEDIA:
1.1. Verificar la simetrVerificar la simetra de los datos: Edadesa de los datos: Edades
2833455635382227463820554536292234216423452653374554123628283943213235
E
d
a
d
70
60
50
40
30
20
10
EDAD DE 35 MADRES
aos....nxx i
093635
283635 =+++=
=
Las madres tuvieron en promedio 36.09 aos
2.
-
Es el valor que divide al conjunto ordenado de Es el valor que divide al conjunto ordenado de datos en dos grupos de igual tamadatos en dos grupos de igual tamao en cuanto al o en cuanto al nnmero de observaciones se refiere.mero de observaciones se refiere.Es Es nica, fnica, fcil de calcular y los valores extremos cil de calcular y los valores extremos no afectan su valor.no afectan su valor.
MEDIANA
Pasos:1. Los datos se ordenan en forma creciente: x1 + x2 ++xn2. Calcular la mediana teniendo en cuenta:
a) Si n es par: con la frmula
21 /)n(xMe +=n Tamao de muestra
Me es la mediana
Valor de la mediana21 /)n(x +
-
Donde: Me es la medianan es el tamao de la muestra(n+1)/2 es la posicin donde se
encuentra la mediana.
Datos ordenados
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29
13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39
25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
aosxMe /n 3621 == + n impar
-
b) Si b) Si n es par:n es par:
MODAMODAValor mValor ms frecuente en el conjunto. En el s frecuente en el conjunto. En el ejemplo es 45ejemplo es 45
2
122++
=nn xx
Me
Donde:
X n/2 Valor en la pesa posicin
X (n/2) +1 Valor en la posicin siguiente.
-
CuartilesCuartiles Tres valores que dividen a un conjunto de Tres valores que dividen a un conjunto de
datos en 4 partes iguales.datos en 4 partes iguales.
41
1+= nQ
4)1(3
3+= nQ
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 2913 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 3925 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
posicinQ 94135
1 =+=
Q1Q3
posicin)n(Q 274
133 =+=
-
Valor de Valor de Q=xQ=xnn/2/2+0. +0. ( x( x (n/2)+1(n/2)+1 ) ) (x(xn/2n/2))
Usos de los cuartiles: Para indicar el porcentaje igual o menor que el
valor de un cuartil
Para construir la curva endmica
Para describir el 50% central de las observaciones
Elaboracin del grfico de caja.
25% 25% 25% 25%
Q1 Q2 Q3
RICRIC
-
CURVA ENDCURVA ENDMICAMICA
Q3Q2 =Me
Q1
-
PERCENTILES:PERCENTILES: 99 valores que dividen a un conjunto de 99 valores que dividen a un conjunto de
datos en 100 partes iguales. Indica el datos en 100 partes iguales. Indica el porcentaje de la distribuciporcentaje de la distribucin igual o n igual o menor a su valor.menor a su valor.
Ejemplo: Se tienen las edades de 35 Ejemplo: Se tienen las edades de 35 madres.madres.
1 2 3 4 5 6 7 8 9 10 11 1212 20 21 21 22 22 23 26 27 28 28 29
13 14 15 16 17 18 19 20 21 22 23 2432 33 34 35 35 36 36 37 38 38 38 39
25 26 27 28 29 30 31 32 33 34 35 3643 45 45 45 45 46 53 54 55 56 64
-
Primero se ordenan los datos de menor a Primero se ordenan los datos de menor a mayor.mayor.
CClculo: lculo:
El valor del percentil 25 es 27 aEl valor del percentil 25 es 27 aos os Valor del percentil 70Valor del percentil 70
1001 )n(k
iP+= posicin)(P 9100 1352525 =+=
aos.)(..*P 44343452043225103670
70 =+==
-
Uso de los Uso de los percentilespercentiles:: Para comparar un valor de un individuo Para comparar un valor de un individuo
con un conjunto de normas.con un conjunto de normas. Para determinar Rangos normales de Para determinar Rangos normales de
ananlisis de laboratorio. Los llisis de laboratorio. Los lmites mites normales de muchos annormales de muchos anlisis se ubican lisis se ubican entre el percentil 2.5 y 97.5 .entre el percentil 2.5 y 97.5 .
TambiTambin se usa para establecer el rango n se usa para establecer el rango intercuartintercuartlicolico. .
-
MEDIDAS DE DISPERSIMEDIDAS DE DISPERSINNMiden la variabilidad de un conjunto de Miden la variabilidad de un conjunto de datos.datos.
RangoVarianza Desviacin estndarCoeficiente de variacinIntervalo cuartilar
-
RANGORANGOEs la diferencia entre el valor mEs la diferencia entre el valor ms s grande y el mgrande y el ms peques pequeo del conjunto de o del conjunto de datos.datos.
Rango = Valor mRango = Valor mximo ximo -- Valor mValor mnimonimo
R = 64 R = 64 12 = 5212 = 52
-
VARIANZAVARIANZAEs la medida que cuantifica la variabilidad Es la medida que cuantifica la variabilidad de los datos respecto al valor de la media.de los datos respecto al valor de la media.
Donde: xi valores de la variable, x1 , x2, etc. n es de la muestra
es la media aritmticax
1
22
=
n)xx(s i
-
USOS:USOS: En inferencia estadEn inferencia estadsticastica Para calcular la desviaciPara calcular la desviacin n
estestndar.ndar. Para calcular el tamaPara calcular el tamao de o de
muestra.muestra.
-
Ejemplo: Ejemplo: Los datos de la siguiente tabla son los mismos Los datos de la siguiente tabla son los mismos que se usaron para el cque se usaron para el clculo de las medidas de lculo de las medidas de tendencia central.tendencia central.
0)( = xxi Propiedad de la media, por eso se eleva al cuadrado
2833455635382227463820554536292234216423452653374554123628283943213235
( ) ( ) ( ) 4436145135
093628093632093635 2222 .......s =+++=
-
One-Sample Kolmogorov-Smirnov Test
2020.052.212
.111
.109-.111.496.966
NMeanStd. Deviation
Normal Parametersa,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)
respiracionesx minuti
(muestra)
Test distribution is Normal.a.
Calculated from data.b.
PRUEBA DE HIPTESIS
-
DESVIACION ESTANDAR: DESVIACION ESTANDAR: Es la raEs la raz cuadrada positiva de la varianza. Mide la z cuadrada positiva de la varianza. Mide la variabilidad de los datos en las unidades en que se variabilidad de los datos en las unidades en que se midieron originalmente. Los smidieron originalmente. Los smbolos son: mbolos son: s, s, si es si es una muestra y ; una muestra y ; si es una poblacisi es una poblacin.n.
CaracterCaractersticas de la desviacisticas de la desviacin estn estndar:ndar:1.1. Siempre es un valor positivoSiempre es un valor positivo2.2. EstEst influenciada por todos los valores de la influenciada por todos los valores de la
muestra o poblacimuestra o poblacin.n.3.3. Mayor influencia ejercen los valores extremos Mayor influencia ejercen los valores extremos
debido a que son elevados al cuadrado en el debido a que son elevados al cuadrado en el cclculo.lculo.
4.4. Sirve para definir la dispersiSirve para definir la dispersinn de los datos de los datos alrededor de la media. alrededor de la media.
2ss =
-
Aproximadamente el 68% de los alumnos tuvieron 36.09 12.06 aos.
061244361452 ..ss ===
Interpretacin:
Las madres tuvieron en promedio 36.09 aos con una desviacin estndar de 12.06
-
3.573.5766BB
1.311.3166AA
DesviaciDesviacin Estn EstndarndarVarianzaVarianzaMediaMediaGrupoGrupo
Tabla 1. Medidas Descriptivas de las Edades de dos Tabla 1. Medidas Descriptivas de las Edades de dos GruposGrupos
5. Sirve para comparar
Dos grupos teniendo la misma media podemos identificar el ms disperso. Cuando las medias son diferentes , para identificar cul es el ms variado se tiene que hacer utilizando el COEFICIENTE DE VARIACIN.
-
COEFICIENTE DE VARIACICOEFICIENTE DE VARIACIN:N:Medida de variabilidad relativa: Se usa para comparar la Medida de variabilidad relativa: Se usa para comparar la variabilidad entre dos o mvariabilidad entre dos o ms muestras medidas en las s muestras medidas en las mismas unidades o no.mismas unidades o no.
%...
xsCV 4233
09360612100 ===
Si el coeficiente es:< 10 % poca dispersin10 33% aceptable34 50% alta dispersin> 50% muy alta
El CV es til cuando se quieren comparar el efecto de un tratamiento en dos o ms grupos.
-
PorquPorqu se usa la media junto con la desviacise usa la media junto con la desviacin n estestndar en el anndar en el anlisis de datos?lisis de datos?
Se quiere expresar una medida que represente Se quiere expresar una medida que represente a todos los datos (media) pero al mismo tiempo se a todos los datos (media) pero al mismo tiempo se desea expresar la variacidesea expresar la variacin de los mismos respecto n de los mismos respecto a esa medida de tendencia central.a esa medida de tendencia central.CuCul es la medida que expresa homogeneidad de l es la medida que expresa homogeneidad de un conjunto de datos? un conjunto de datos?
El coeficiente de variaciEl coeficiente de variacinnCuCul es la ventaja de calcular medidas de resumen l es la ventaja de calcular medidas de resumen con los datos sin agrupar?con los datos sin agrupar?
La mayor exactitud de La mayor exactitud de stas.stas.
PREGUNTAS
-
MEDIDAS DEMEDIDAS DE RESUMEN CON DATOS RESUMEN CON DATOS AGRUPADOSAGRUPADOS
Presinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
Ejemplo: PRESIN SISTLICA EN 100 PACIENTESPresinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
-
CLCULO DE LA MEDIA ARITMTICA:
( )100
1
= =k
iii fm
x
mi es el punto mediofi frecuencia absoluta absolutan tamao de la muestra
( ) ( ) Hgmmx /1.133100
4162...21122)7112( =+++=
-
Presinsistlica(mmHg) N Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
PRESIN SISTLICA EN 100 PACIENTES
mmHgMe 24.13210422850127 =
+= mmHgMo 67.13110242121127 =
++=
If
Fan
LIMeMe
+= 2
Idd
dLIMo
++= 211
Clculo de la Mediana:
-
CClculo de la Varianza:lculo de la Varianza:PRESIPRESIN SISTN SISTLICA EN 100 PACIENTESLICA EN 100 PACIENTES
( ) ( )11
2222
=
=n
xnxn
xms i
Presinsistlica(mmHg)
N Pm Fa107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
( ) ( ) ( ) 22222 6.1899
41.133162...211.13312271.133112 mmHgs =+++=
-
mmHgs 31.46.18 ==DESVIACIN ESTNDAR
-
CALCULO DE CUARTILES Y PERCENTILESPresinsistlica(mmHg) N Pm Fa
107-116117-126127-136137-146147-156157-166
721421884
112122132142152162
728708896100
Total 100
If
Fank
LIQQ
k
+=
1
4)(
mmHgQ 57.1251021
7251171 =
+=
If
Fank
LIPkP
k
+= 100
)(mmHgP 75.15510
8889514795 =
+=