tema i. introducción - rolan.webs.uvigo.esrolan.webs.uvigo.es/statistics_course/tema1.pdf ·...

20
1 Tema I. Introducción 1.1. La ciencia de la estadística: . El origen de la estadística: . Ciencia descriptiva . Evaluación de juegos de azar Ciro el Grande (560 - 530 A.C.) Si tengo 1 As y 2 reyes, ¿que descarte es mas conveniente (1 As, 2 Reyes, 1+2)? UNIVERSIDAD DE VIGO

Upload: vukhanh

Post on 21-Sep-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

1

Tema I. Introducción

1.1. La ciencia de la estadística:. El origen de la estadística:

. Ciencia descriptiva

. Evaluación de juegos de azar

Ciro el Grande (560 - 530 A.C.)

Si tengo 1 As y 2 reyes, ¿que descartees mas conveniente (1 As, 2 Reyes, 1+2)?

UNIVERSIDAD DE VIGO

2

Tema I. Introducción

1.1. La ciencia de la estadística:. Definición formal e informal. Aplicaciones de la Estadística:

. Resumen de datos

. Análisis de muestras

. Contraste de hipótesis

. Cuantificación de relaciones

. Predicción de variables. El modelo estadístico:

. Paramétrico/No Paramétrico

. Clásico/Bayesiano

Ciencia que permite obtener conclusiones de la investigación empírica basándose en modelos matemáticos

(33 º C en promedio)

Variable estudiada = Efecto Sistemático + Efecto Aleatorio

UNIVERSIDAD DE VIGO

3

UNIVERSIDAD DE VIGO

Tema I. Introducción

1.2. Algunas definiciones:. Población. Variable aleatoria. Distribución de frecuencias

Cuando en una población conocemos los posibles valores o medidas de un atributo y su probabilidad correspondiente

4

Tema I. Introducción

1.3. La estadística descriptiva:- Tipos de variable:

. Cualitativa

. Rangos

. Numérica

Variables Cualitativas

UNIVERSIDAD DE VIGO

5

UNIVERSIDAD DE VIGO

Tema I. Introducción

1.3. La estadística descriptiva:- Tipos de variable:

. Cualitativa

. Rangos

. Numérica

Posiciones en el Mundial F1

Poles en el Mundial, en los últimos 6 premios:

Alonso: 4, 3, 2, 4, 6, 2

Hamilton: 3, 1, 2, 1, 3, 1

Se pueden utilizar los métodos de las cualitativas y de las numéricas

6

Tema I. Introducción

1.3. La estadística descriptiva:- Tipos de variable:

. Cualitativa

. Rangos

. Numérica:. Discreta. De intervalo (“cuantitativa”)

Discreta (nº de pelos)

De intervalo (longitud de pelos, en mm)

Las de intervalo pueden tener∞ valores entre cada dos valores cualesquiera

UNIVERSIDAD DE VIGO

7

Tema I. Introducción

1.3. La estadística descriptiva:- Descripción de una variable de intervalo en una población:

. Medidas de centralidad:. Media. Moda. Mediana

13

11

12

10

11

14

9

12

10

11

Población de 10 medidas

Tabla de Frecuencias:

Valor 9 10 11 12 13 14

Frecuencia 1 2 3 2 1 1

Media = ∑ (Xi) = 11.3n

Moda = 11

Mediana = 11 (el segundo 11)

0

0.5

1

1.5

2

2.5

3

3.5

9 10 11 12 13 14

UNIVERSIDAD DE VIGO

8

Tema I. Introducción

1.3. La estadística descriptiva:- Descripción de una variable en una población:

. Medidas de dispersión:. Varianza. Desviación típica. Coeficiente de variación

Var = 1,2 y 3

(∑xi)2

∑xi2 - n

σ2 =n

Fórmula práctica:∑(xi

2) = 1297(∑xi) = 113

σ2 = 2,23333

σ = 1,4944

σ2

CV (adimensional) = x 100 = 19,8% μ

Tabla de Frecuencias

Valor 9 10 11 12 13 14

Frecuencia 1 2 3 2 1 1

UNIVERSIDAD DE VIGO

9

Tema I. Introducción

1.4. La probabilidad y sus reglas:. Probabilidad . Distribución de probabilidades

Cuando un evento puede ocurrir de N maneras mutuamente excluyentes (las 6 caras de un dado), la probabilidad de que ocurra una de ellas (el 6) es 1/N (1/6 en el ejemplo)

Probabilidad en ruleta

Probabilidad en dados

Distribución de probabilidad de tirada de 3 dados

La probabilidad de sacar negro será 4/8 = 0,5

UNIVERSIDAD DE VIGO

10

Tema I. Introducción

1.4. La probabilidad y sus reglas:- Propiedades elementales de la probabilidad

. Siempre mayor que 0; P(Ei) ≥ 0

. La suma de probabilidades de todos los eventos posibles es 1:P(E1) + P(E2) + … P(En) = 1

. La probabilidad de que ocurra E1 ó E2 es la sumaP(E1 ó E2) = P(E1) + P(E2)

. La probabilidad de dos sucesos independientes es el productoP(E1 y E2) = P(E1) x P (E2)

¿Probabilidad de 1 ó 3?

1/8 + 1/8 = 0,25

¿Probabilidad de 4 y 2, sucesivamente?

1/8 x 1/8 = 0,015625

UNIVERSIDAD DE VIGO

11

Tema I. Introducción

1.4. La probabilidad y sus reglas:- Necesidad de trucos de conteo para estimar probabilidades

. Factoriales de n (ordenaciones posibles sin restricciones)n! = n x (n-1) x (n-2) x …1

. Permutaciones (arreglo ordenado de objetos) n!nPr = n x (n-1) x (n-2) x (n-r+1) =

(n-r)!. Combinaciones (permutaciones sin importar el orden)

Permutaciones de 4 objetos de dos

En algunas permutacionessólo cambia el orden:

n n!r r! (n-r)!=

combinaciones de 4 de dos en dos 4! 4 x 3 x 2! 4 x 3

2! X 2! 2! x 2! 2 x 1 = 2 x 3 = 6= =

UNIVERSIDAD DE VIGO

12

1.4. La probabilidad y sus reglas:- Ejemplos sencillos de estimación de probabilidades:

. Probabilidad empleado < 30

. Probabilidad enfermería

. Probabilidad enfermería y < 30

. Probabilidad <30 siendo enfermero

Trabajo <30 31-35 >35 Tot

Médicos 5 25 75 105Laboratorio 50 35 35 120Enfermería 575 442 203 1220Farmacia 13 8 3 24Otros 135 101 69 305

TOTAL 778 611 385 1774

Nº de empleados por clases de edad en un Hospital

778/1774 = 0,44

1220/1774 = 0,69

575/1774 = 0,32

575/1220 = 0,47

5/105 = 0,05Otra estrategia de obtención de las probabilidades:la probabilidad de ser enfermero y menor de 30

0,69 x 0,44 = 0,30

Tema I. IntroducciónUNIVERSIDAD DE VIGO

13

Tema I. Introducción

1.5. La distribución de probabilidad y la inferencia estadística:- Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:

. Representamos el número de caras que salen: 0, 1, 2, 3, 4, 5 y 6

. Probabilidad de una tirada ½

. Probabilidad de una tirada n veces (½)n

6 6!5 5!x1!= = 6

Nº de tiradas

Nº de caras

c c c c c c Probabilidad = (½)6 = 0,015625

+ + + + + + Probabilidad = (½)6 = 0,015625

+ c c c c cc + c c c cc c + c c cc c c + c c

etc.

Combinaciones de 6 de 5 en 5

Probabilidad = 6 x (½)6 = 0,09375

6 6!6 6!= = 1

Tabla Resumen

Nº caras 0 1 2 3 4 5 6Probabilidad 0.016 0.094 0,234 0,312 0,234 0.094 0.016

+ + c c c c

etc.

UNIVERSIDAD DE VIGO

14

Tema I. Introducción

1.5. La distribución de probabilidad y la inferencia estadística:- Cálculo de la distribución de probabilidad de tirar una moneda 6 veces:

. Obtención de la distribución de probabilidad

. Utilización de la inferencia estadística:. ¿Que probable sería que de 6 tiradas se obtuviesen?:

. A) 6 caras

. B) 1 cara

. C) Al menos 2 caras

. D) entre 1 y 5

a) p = 0,016

0

0,05

0,1

0,15

0,2

0,25

0,3

0,35

0,016 0,094 0,234 0,312 0,234 0,094 0,016

0 1 2 3 4 5 6

b) p = 0,094

c) p = 1- (0,016 + 0,094) = 0,89

d) p = 0,968

El test estadístico de una/dos colas

UNIVERSIDAD DE VIGO

15

Tema I. Introducción

1.6. El modelo estadístico general para poblaciones:- Estamos interesados en un determinado atributo (estadístico):

. Por ejemplo la media de un carácter (μ)- Conocemos su distribución de probabilidad en la población- Nos hacemos preguntas sobre la probabilidad de que ciertos valores puedan darse

en nuestra población

Estadística Paramétrica

. La función se describe matemáticamente

. La función es integrableDistribución de Probabilidad

hipotética

Valores del estadístico

Prob

abilid

ad

Estadística NO Paramétrica

. La función se genera empíricamente (mediante ordenadores y númerospseudo-aleatorios)

. Se tabulan los resultados empíricos o seevalúa mediante conteo

UNIVERSIDAD DE VIGO

16

Tema I. Introducción

Se puede conocer la probabilidad de un área bajo la curva, en relación por ejemplo a su σ

1.7. La distribución normal y la estadística paramétrica:- ESTADÍSTICA PARAMÉTRICA (asumimos una distribución normal)- Una distribución muy frecuente y muy conveniente:

. Función matemática depende de μ y σ

. Es simétrica, con media = moda = mediana

. La función matemática es integrable

UNIVERSIDAD DE VIGO

17

Tema I. Introducción1.7. La distribución normal y la estadística paramétrica:

- Conjunto de distribuciones normales, con μ y σ- La conversión a una sola distribución normal:

distribución normal unitaria (Distribución Z; 0 y 1)- Interpretación de tablas…

UNIVERSIDAD DE VIGO

18

Tema I. Introducción

1.8. La inferencia paramétrica para poblaciones:- Conocemos TODOS los valores de la población- Estimación de intervalos de confianza.

Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X?

Estadística descriptiva:Media de población conocida (μ) = 10,07 Varianza (σ2) = 0,499Desviación típica (σ) = 0,707

OBTENCIÓN DE INTERVALO DE CONFIANZA

Distribución Z Población Real INT1 INT2

0 ± 15% (65%=0,39) 10,07 ± 0,27 (0,39 x 0,707) 9,8 10,340 ± 30% (80%=0,84) 10,07 ± 0,59 (0,84 x 0,707) 9,5 10,70 ± 47,5% (97,5%=1,96) 10,07 ± 1,38 (1,96 x 0,707) 8,7 11,40 ± 49,5% (99,5%=2,58) 10,07 ± 1,82 (2,58 x 0,707) 8,2 11,9

IC 95%IC 99%

Método General → Media ± z × σ

UNIVERSIDAD DE VIGO

19

Tema I. Introducción

Nivel significación 5% (p una cola 0.025)

Si X = 11; H0 = pertenece a la población; H1 =no

(valor – μ)/σ = (11 – 10,07)/0,707 = 1,32 : p en tabla z = 0.09; (0,18 dos colas)

Según NS del 5% se acepta H0

1.8. La inferencia paramétrica para poblaciones:- Realización de un test de hipótesis (la otra cara del mismo fenómeno):

. Dos hipótesis alternativas (H0 y H1)

. Evaluación de la Ho en función de un nivel de significación (5%)

Ejemplo de Población ALUMNOS DE UNA CLASE: 10,2 9,7 10 9,6 8,7 11 10,5 10,9 X?

Si X = 11,9; H0 = pertenece a la población; H1 =no

(valor – μ)/σ = (11,9 – 10,07)/0,707 = 1,32 : p en tabla z = 0.005; (0,01 dos colas)

Se rechaza H1 (p = 0.01; significativo para NS de 0,05)

Método General → Valor – μσ = z

UNIVERSIDAD DE VIGO

20

Referencias Bibliográficas

Daniel, W.W. 1989. Bioestadística. Base para el análisis de las ciencias de la salud. Limusa, México.

Sokal,R.R., Rohlf, F.J. 1995. Biometry. Freeman and co., New York

LIBROS:

PÁGINAS WEB:

http://www.statsoft.com/textbook/sttable.html(tablas en línea para ver probabilidades de la distribución Z)

http://personal5.iddeo.es/ztt/Tem/T11_Estadistica_Introduccion.htm(algunos conceptos básicos de estadística)

http://home.ubalt.edu/ntsbarsh/excel/excel.htm(programación de cálculos estadísticos en EXCEL)

UNIVERSIDAD DE VIGO