introducción a la estadística. tema2
DESCRIPTION
Estadística descriptiva univarianteTRANSCRIPT
![Page 1: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/1.jpg)
TEMA 2
ESTADÍSTICA DESCRIPTIVA PARA UNA VARIABLE
![Page 2: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/2.jpg)
JGM.03/09/04
TÉCNICAS ESTADÍSTICAS
❚ Las técnicas de estadística descriptiva que pueden aplicarse sobre las tablas de datos dependen de la naturaleza de las variables implicadas:
❙ Técnicas para variables cualitativas❙ Técnicas para variables cuantitativas
![Page 3: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/3.jpg)
JGM.03/09/04
VARIABLES CUALITATIVAS
❚ Lo único que podemos hacer con las variables cualitativas es “contar cuántas veces aparece cada una de sus modalidades en un conjunto de individuos”.
❚ Sólo cabe hacer RECUENTOS y CÁLCULO DE PORCENTAJES.
![Page 4: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/4.jpg)
JGM.03/09/04
FRECUENCIAS ABSOLUTAS Y RELATIVAS
❚ Frecuencias absolutas: recuento del número de individuos que pertenecen a cada una de las modalidades de la variable.
❚ Frecuencias relativas: cálculo del porcentaje de individuos que pertenecen a cada una de las modalidades de la variable.
![Page 5: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/5.jpg)
JGM.03/09/04
FRECUENCIAS ACUMULADAS
❚ Sólo tienen sentido en el caso de variables de tipo ordinal.
❚ Pueden ser absolutas o relativas.❚ Representan el número (o porcentaje) de
pertenecientes “a cada modalidad de la variable ordinal o a las anteriores”.❙ Ejemplo: Personas de clase media o menos,
es decir de clase baja o clase media.
![Page 6: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/6.jpg)
JGM.03/09/04
REPRESENTACIONES GRÁFICAS
❚ La fundamental es el gráfico de barras
(no confundir con un histograma).
❚ Caben otras representaciones como
pictogramas, gráficos de sectores,
etcétera.
![Page 7: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/7.jpg)
VARIABLES CUANTITATIVAS
◆ Medidas de posición.◆ Medidas de dispersión◆ Medidas de simetría◆ Representaciones gráficas
![Page 8: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/8.jpg)
JGM.03/09/04
LAS MEDIDAS RESUMEN
❚ Nos dan una idea de cómo son los valores de la variable que estamos estudiando.
❚ Veremos tres tipos:❙ Medidas de posición o de tendencia central❙ Medidas de dispersión❙ Medidas de asimetría
![Page 9: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/9.jpg)
JGM.03/09/04
MEDIDAS DE POSICIÓN
❚ Nos dan una idea acerca de los valores centrales de la variable, aquellos alrededor de los cuales se acumulan los demás.
❚ Hay tres medidas de posición fundamentales:❙ Media aritmética❙ Mediana❙ Moda
![Page 10: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/10.jpg)
JGM.03/09/04
MEDIA ARITMÉTICA
❚ Es la medida de posición más “popular”❚ Es muy sensible a la existencia de datos
extremos (menos robusta que la mediana).
N
XN
ii
X
∑== 1µ
![Page 11: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/11.jpg)
JGM.03/09/04
MEDIANA
❚ Es aquel valor de la variable que es mayor que la mitad de las observaciones y menor que la otra mitad.
❚ En caso de que el número de observaciones sea par, es la media aritmética de los dos valores centrales.
❚ Es una medida muy robusta, esto es, poco sensible a la existencia de valores extremos.
Es un caso particular del concepto de PERCENTIL
Mediana vs. media
![Page 12: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/12.jpg)
JGM.03/09/04
MODA
❚ Es el valor de la variable que más se repite
❚ Se habla de variables unimodales y multimodales
❚ Es la menos empleada de las medidas de posición
![Page 13: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/13.jpg)
JGM.03/09/04
MEDIDAS DE DISPERSIÓN
❚ Nos dan una idea acerca de la heterogeneidad de la variable.
❚ Estudiamos tres medidas de dispersión:❙ Varianza❙ Desviación estándar o típica❙ Coeficiente de variación
![Page 14: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/14.jpg)
JGM.03/09/04
VARIANZA
❚ Es la medida de dispersión más “popular” junto con la desviación estándar.
❚ Siempre toma valores no negativos.❚ Cuanto mayor sea su valor mayor es la heterogeneidad
de la variable.
( )N
XN
iXi
X
∑=
−= 1
2
2
µσ
MENOS VARIANZA MÁS VARIANZA
![Page 15: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/15.jpg)
JGM.03/09/04
DESVIACIÓN ESTÁNDAR
❚ La varianza está en unidades “al cuadrado”.
❚ Por eso se calcula su raíz cuadrada, la desviación estándar (o desviación típica).
( )N
XN
iXi
XX
∑=
−== 1
2
2
µσσ
![Page 16: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/16.jpg)
JGM.03/09/04
COEFICIENTE DE VARIACIÓN
❚ Ni la varianza ni la desviación estándar están acotadas.
❚ Es necesario contar con un coeficiente relativo: el coeficiente de variación.❙ Ejemplo: elefantes y gatos:
❚ Un CV superior a 1 indica heterogeneidad
X
XCVµσ=
![Page 17: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/17.jpg)
JGM.03/09/04
MEDIDAS DE ASIMETRÍA
❚ Asimetría positiva: cuando existen unos pocos valores extremadamente elevados y la mayoría son bajos.❙ El índice de asimetría es positivo❙ La media es mayor que la mediana
❚ Asimetría negativa: cuando existen unos pocos valores extremadamente bajos y la mayoría son altos.❙ El índice de asimetría es negativo❙ La media es menor que la mediana
❚ Variable simétrica:❙ Índice de asimetría cero❙ La media coincide con la mediana
![Page 18: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/18.jpg)
JGM.03/09/04
MEDIDAS DE ASIMETRÍA
ASIMETRÍA POSITIVA
ASIMETRÍA NEGATIVA
SIMETRÍA
![Page 19: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/19.jpg)
JGM.03/09/04
REPRESENTACIONES GRÁFICAS
❚ La representación gráfica básica es el histograma❙ “Agrupamos” los valores en clases, intervalos (de la
misma longitud) de la variable inicial.❙ Sobre cada intervalo dibujamos un rectángulo de
altura proporcional a la frecuencia absoluta o relativa.
![Page 20: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/20.jpg)
JGM.03/09/04
FUNCIÓN DE DENSIDAD
❚ Si el histograma de la variable representa frecuencias relativas, el área que recoge es 1.
❚ En el límite, cuando el número de clases tiende a infinito, las irregularidades del histograma se suavizan y llegamos al concepto de función de densidad.
![Page 21: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/21.jpg)
JGM.03/09/04
FUNCIÓN DE DENSIDAD (II)
❚ Para ser función de densidad, una función R->R debe cumplir dos propiedades:❙ Tomar siempre valores positivos.❙ El área que encierra bajo ella vale 1.
❚ Un ejemplo muy común de función de densidad es la distribución NORMAL.
![Page 22: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/22.jpg)
JGM.03/09/04
LA DISTRIBUCIÓN NORMAL
• Es unimodal, y la moda y la mediana coinciden con la media.
• Es simétrica alrededor de la media.
• Nunca “toca” el eje de abscisas (es asintótica)
• El área bajo la función es 1.
![Page 23: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/23.jpg)
JGM.03/09/04
LA DISTRIBUCIÓN NORMAL (II)
❚ Tiene dos parámetros que la determinan inequívocamente:❙ Media ❙ Varianza
❚ Por tanto, existen infinitas distribuciones normales.
❚ La tipificación nos permite emplear una única tabla.
µ2σ
![Page 24: Introducción a la Estadística. Tema2](https://reader034.vdocuments.co/reader034/viewer/2022052622/5595ff471a28ab96308b4675/html5/thumbnails/24.jpg)
JGM.03/09/04
TIPIFICACIÓN
❚ Es el proceso de convertir una variable normal cualquiera en una normal estándar
❚ La puntuación Z mide la lejanía de un individuo respecto a la media y la compara con la lejanía respecto a la media del conjunto de todos los individuos.
❚ A partir de la tipificación (y consultando las tablas adecuadas) podemos calcular probabilidades.
ZX
X
X ≈−σ
µ