estadística descriptiva i - unex.esmatematicas.unex.es/~jmf/archivos/desciptiva1.pdf · medidas de...
Post on 29-Dec-2019
3 Views
Preview:
TRANSCRIPT
IntroducciónGráficos
Valores típicos
Estadística Descriptiva IMetodología de la Investigación en Enfermería
Cátedra de BioestadísticaUniversidad de Extremadura
31 de enero de 2012
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
¿De qué trata?
Descripción conjunto concreto de datos (sin generalizar)Clasificación Tablas de frecuenciaRepresentación GráficosResumen Valores típicos
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Tipos de variables
Según el programa SPSSCualitativas (factores)
Nominales: Grupo sanguíneo, sexoOrdinales: Grado enfermedad, encuesta satisfacción
Cuantitativas o de escala : Temperatura, estatura, glucemia,no hijos...
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Gráficos
Tipos de gráficosVariables cualitativas Diagrama sectores o de barrasVariables cuantitativas:
Discretas! Diagrama barrasContinuas! Histograma
*Nota: En este capítulo se estudiará una única variable.
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Variable cualitativa (Grupo sanguíneo)
Tablas de frecuenciasGráicos (sectores, barras)Valores típicos ¿?
Tabla de frecuencias
Grupo fi p̂i
0 2892 0,458A 2625 0,416B 570 0,090
AB 226 0,036Total 6313 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Diagrama de sectores
Figura: Grupo sanguíneo
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Otra opción: diagrama de barras
Rec
uen
to
3.000
2.000
1.000
0
Grupo sanguíneo
ABBA0
Página 1
Figura: Grupo sanguíneo
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Variable cuantitativa discreta
Edad alumnos titulación universitaria: tabla frecuencias
Edad fi p̂i
18 6 0.2419 5 0.2020 3 0.1221 3 0.1222 3 0.1223 3 0.1224 2 0.08
Total 25 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Gráfico:Diagrama de barras
Rec
uen
to6
5
4
3
2
1
0
Edad
24232221201918
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Variable cuantitativa continua
Colesterolemia n=30 Diagrama de barras
Rec
uen
to1,0
0,8
0,6
0,4
0,2
0,0207.0936342556276
201.50242574309618
196.52959391286672
188.18835541945276
187.9957284987757
182.5434655197335
181.1897043629511
179.9311189026346
174.3895958640551
173.64090329642116
170.2943128558843
164.40721169190735
157.21725341985768
155.5551931664666
132.1491201450705
Página 1
Agrupar datos por intervalos
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Histograma
Agrupamos por intervalos k=5
Colesterolemia
225200175150125
Fre
cuen
cia
15
10
5
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
¿Cuántos intervalos?
Glucemia k=3
Colesterolemia
225200175150125
Fre
cuen
cia
20
15
10
5
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
¿Cuántos intervalos?
Glucemia k=50
Colesterolemia
225200175150125
Fre
cuen
cia
3
2
1
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
¿Cuántos intervalos? Ley de Sturges
número de datos→ número de intervalos
Datos Intervalos16-31 532-64 665-125 7
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Histograma
Glucemia k=5-6
Colesterolemia
225200175150125
Fre
cuen
cia
15
10
5
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Otros gráficos para variables continuas
Tallo-hoja
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Diagrama de caja o box-plot
Figura: Concentración ozono
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Valores típicos
Resumir numéricamente la informaciónMedidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Medidas de centralización
Centro de los datos, número más representativoMedia aritmética (centro de gravedad):
x =
∑ni=1 xi
n
Mediana (orden): dato que queda en medio una vezordenados de menor a mayor.
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
La mediana es robusta: no se ve influenciada por la presencia devalores extremos
Ansiedad n=20
Puntuación de ansiedad de Hamilton
14,0012,0010,008,00
Fre
cuen
cia
8
6
4
2
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Otro caso de sesgo n=474
Current salary
60.00050.00040.00030.00020.00010.0000
Fre
cuen
cia
250
200
150
100
50
0
Media =13.767,83 Desviación típica =6.830,265
N =474
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Distribución normal: media
Colesterolemia
225200175150125
Fre
cuen
cia
12
10
8
6
4
2
0
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Medidas de posición
OrdenMediana: 50 %Cuartiles: Q1,Q2 y Q3: 25 %, 50 % y 75 %, resp.Deciles: D1,D2, . . . ,D9
Percentiles [Ejemplo :p50 = D5 = Q2 = mediana]
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Medidas de dispersión
Variabilidad de los datosEn relación con la media: varizanza desviación típica
s =
√∑ni=1(xi − x)2
n
En relación con el orden: amplitud intercuartil
RI = Q3 − Q1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
IMPORTANTE: Resumen de la información
Centralización + dispersión[media + desviación típica]
[mediana + amplitud intercuartil]
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
media-desviación típicaResumen perfectamente la información si la distribución de losdatos sigue un modelo normal
x± s 68%x± 2s 95%x± 3s 99%
Podemos construir la distribución partiendo exclusivamente dex y s.
Colesterolemia
225200175150125
Fre
cuen
cia
12
10
8
6
4
2
0
Media =179,18Desviación típica =19,
435N =30
Normal
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
mediana-rango intercuartilEn aquellas situaciones en que la media sea poco representativa:fuerte sesgo + valores extremos.
Current salary
60.00050.00040.00030.00020.00010.0000
Fre
cuen
cia
250
200
150
100
50
0
Media =13.767,83 Desviación típica =6.830,265
N =474
Página 1
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Medidas de forma
Cálculo complicadoCoeficiente de asimetríaCoeficiente de aplastamiento o curtosis.
Estadística Descriptiva I
IntroducciónGráficos
Valores típicos
Medidas de centralizaciónMedidas de posiciónMedidas de dispersiónMedidas de forma
Asimetría
-
6
X
p̂i
g1 < 0
-
6
X
p̂i
g1 > 0
-
6
X
p̂i
g1 = 0
Estadística Descriptiva I
top related