estadística aplicada al periodismo2010).pdf · su valor es 1 para todos los puntos situados a la...

30
1 Temario de la asignatura Introducción. Análisis de datos univariantes. Análisis de datos bivariantes. Series temporales y números índice. Probabilidad y Modelos probabilísticos. Introducción a la inferencia estadística. Estadística aplicada al Periodismo

Upload: nguyenquynh

Post on 05-Oct-2018

213 views

Category:

Documents


0 download

TRANSCRIPT

1

Temario de la asignatura

• Introducción.

• Análisis de datos univariantes.

• Análisis de datos bivariantes.

• Series temporales y números índice.

• Probabilidad y Modelos probabilísticos.

• Introducción a la inferencia estadística.

Estadística aplicada al Periodismo

2

Introducción a la probabilidad:

Experimentos aleatorios, espacio muestral, sucesos elementales y compuestos.

Definición de probabilidad. Propiedades de la probabilidad. Regla de la multiplicación e independencia. Ley de la probabilidad total y Teorema de Bayes.

Lecturas recomendadas:Capítulos 13 y 14 del libro de Peña y Romo (1997)

Tema 5 (Parte I): Probabilidad.

3

Supongamos que vamos a realizar un EXPERIMENTO ALEATORIO y estamos interesados en la PROBABILIDAD de que ocurra un determinado SUCESO.

EXPERIMENTO: Lanzamiento de una moneda

ESPACIO MUESTRAL: Conjunto de todos los resultados básicos de unexperimento. Lo designaremos con la letra Ω.

Por ejemplo: en la tirada de una moneda Ω=c,xPor ejemplo: en la tirada de un dado Ω=1,2,3,4,5,6

SUCESO ELEMENTAL: Cada uno de los resultados básicos del espaciomuestral.

En la tirada de una moneda: S1=c y S2=xEn la tirada de un dado: S1=1, S2=2, S3=3, S4=4, S5=5 y S6=6

SUCESO COMPUESTO: Son sucesos formados por más de un suceso elemental.

En la tirada de un dado: S=2,4,6

Introducción a la probabilidad

4

A veces, suele ser útil utilizar un gráfico de árbol para hallar el espacio muestral de un determinado experimento aleatorio

El diagrama de árbol de la figura corresponde al experimento aleatorio de lanzar una moneda tres veces (o tres monedas) y considerar el resultado obtenido

El espacio muestral se obtiene fácilmente sin más que ir recorriendo todas las ramas. Ω = CCC, CC+, C+C, C++, +CC, +C+, ++C, +++

Introducción a la probabilidad

5

Ejemplo: Diagrama de árbol del lanzamiento de una moneda y la extracción de una bola.

Existen dos urnas U1 y U2:

La urna U1 tiene tres bolas blancas y una negra.La urna U2 tiene dos bolas blancas, dos negras y dos rojas.Se lanza una moneda, de manera que si sale cara (C), se coge una bola de la urna U1, mientras que si sale cruz (+), se coge de la urna U2.

El espacio muestral es C,B, C,N, +,B ,+,N ,+,R

Introducción a la probabilidad

6

Ejercicio: Dado el experimento consistente en lanzar un dado y una moneda.

a) Indicar el espacio muestral.

b) Sean los siguientes sucesos:Suceso A: Sacar cara en el lanzamiento de la moneda.Suceso B: Sacar 1 en el lanzamiento del dado. Suceso C: Sacar impar en el lanzamiento del dado.

Escribe los sucesos A, B y C

Introducción a la probabilidad

7

Introducción a la probabilidad

Probabilidad clásica: Considera un experimento para el que todos los sucesos elementales son equiprobables. Si tenemos K sucesos elementales, entonces la probabilidad de un suceso A es

Enfoque frecuentista: Si repetimos el experimento muchas veces, la frecuencia (relativa) con que ocurre el suceso sería una aproximación de la probabilidad

Probabilidad = el valor límite de la frecuencia

Probabilidad subjetiva: Depende de la información que tengamos en ese momento

Probabilidad = creencia o certeza de que ocurra

1Probabilidad(A) = P(A) Tamaño de A

K= ×

8

Introducción a la probabilidad

Propiedades de la probabilidad

Si A es un suceso de Ω entonces 0 ≤ P(A) ≤ 1

Si A=e1,e2, …,en, entonces

P(Ω)=1 y P(Ø)=0

Ley del complementario:

Ley de la adición:

Si A y B son incompatibles, entonces y

1

( ) ( )n

ii

P A P e=

=∑

( ) 1 ( )P A P A= −

( ) ( ) ( ) ( )P A B P A P B P A B∪ = + − ∩

( ) ( ) ( )P A B P A P B∪ = +

( ) 0P A B∩ =

9

Repaso del álgebra de conjuntos

INTERSECCIÓN

UNIÓN

COMPLEMENTARIO

Introducción a la probabilidad

10

Ejemplo: Se lanzan tres monedas de 1 ct., 2 ct. y 5 ct., respectivamente. Para cada uno de los siguientes sucesos compuestos:

a) Enumerar los sucesos elementales

b) Calcular la probabilidad de:a) Cara en 1 ct.b) Exactamente dos carasc) Exactamente una carad) Todas crucese) 2 ct. y 5 ct. con diferente resultadof) 2 ct. y 5 ct. con igual resultado

Introducción a la probabilidad

11

820Profesionales

12626Ejecutivos

144016Obreros

6268Ama casa

AltoMedioBajo

Se elige una persona de forma aleatoria. Calcular la probabilidad de:

a) Ama de casa b) Obrero c) Ejecutivo d) Profesional

e) Ingreso bajo f) Ingreso medio g) Ingreso alto

h) Ejecutivo con ingreso alto i) Ama casa con ingreso bajo

Introducción a la probabilidad

Ejemplo: Dada la siguiente tabla (ocupación versus ingresos familiares)

12

PROBABILIDAD CONDICIONADA de A dado B

Ley de la MULTIPLICACIÓN

Se dice que dos sucesos A y B son independientes si

( ) ( ) ( )P A B P A P B∩ =

( )( | )

( )P A B

P A BP B

∩=

Introducción a la probabilidad

( ) ( | ) ( )P A B P A B P B∩ =

13

Introducción a la probabilidad

Ejemplo. En una cadena de televisión se hizo una encuesta a 2500 personas para saber la audiencia de un debate y de una película que se emitieron en horas distintas: 2100 vieron la película, 1500 vieron el debate y 350 no vieron ninguno de los dos programas. Si elegimos al azar a uno de los encuestados:

a) ¿Cuál es la probabilidad de que viera la película y el debate?

b) ¿Cuál es la probabilidad de que viera la película, sabiendo que vio el debate?

c) Sabiendo que vio la película, ¿cuál es la probabilidad de que viera el debate?

14

1 2 ... K

i j

B B B

B B

Ω = ∪ ∪ ∪

∩ = ∅

1 2

1 1 2 2

.

es un suceso:

P(A) (A )+ (A )+...+P(A )

(A | )P( )+ (A | )P( )+...+P(A| )P( )K

K K

A

A

P B P B B

P B B P B B B B

⊂ Ω

= ∩ ∩ ∩ =

=

Introducción a la probabilidad

Ley de la probabilidad total

15

Teorema de Bayes

1 1

ha sucedido, la probabilidad de que haya sucedido es:

( ) ( | ) ( )P( |A)

P(A) P(A| )P( ) ... (A| )P( )

i

i i ii

K K

Si A B

P A B P A B P BB

B B P B B

∩= =

+ +

Ejemplo: Tenemos tres urnas con la composición:

Se elige una urna al azar y se toma una bola. Se pide:

a) Probabilidad de que sea roja.

b) Ha resultado ser blanca. Probabilidad de que proceda de la tercera urna.

Introducción a la probabilidad

16

Variable aleatoria Concepto. Variables discretas y continuas. Función de probabilidad (densidad) y función de distribución. Media y varianza de una variable aleatoria.

Modelos probabilísticos Bernoulli. Binomial. Normal. Aproximación de binomial a normal.

Lecturas recomendadas: Capítulos 15, 16 y 18 del libro de Peña y Romo (1997)

Tema 5 (Parte II) Modelos probabilísticos.

17

Concepto de variable aleatoria

Se llama variable aleatoria a toda función que asocia a cada elemento del espacio muestral, un número real.

Se utilizan letras mayúsculas para designar las variables aleatoria: X, Y, Z; y sus respectivas letras minúsculas para los valores concretos de las mismas: x, y, z.

Variable aleatoria discreta Es la que solo puede tomar una cantidad numerable de valores.

Variable aleatoria continua Es aquella que puede tomar infinitos valores dentro de un intervalo de la recta real.

Variable aleatoria

:X Ω → ℝ

18

pk...p2p1P(X=xi)

xk...x2x1X

Toda función de probabilidad se verifica que 1 2 3 1kp p p p+ + + + =⋯

Función de distribución de una v.a. discreta: Sea X una v.a. cuyos valores suponemos ordenados de menor a mayor. Se llama función de distribución de la variable X a la función que asocia a cada valor de la v.a. la probabilidad acumulada hasta ese valor, es decir, ( ) ( )F x P X x= ≤

Variable aleatoria

Función de probabilidad de una v.a. discreta: Es la función que asocia a cada valor x de la v.a. X su probabilidad p.

Los valores que toma una v.a. discreta X y sus correspondientes probabilidades suelen disponerse en una tabla con dos filas o dos columnas llamada tabla de distribución de probabilidad:

19

Media, varianza y desviación típica de una variable aleatoria discreta.

Se llama media o esperanza de una v.a. discreta X, que toma los valores x1, ,x2, ....con probabilidades p1, p2,... al valor de la siguiente expresión:

La varianza viene dada por la siguiente fórmula:que puede calcularse mediante:

1 1( )

k k

i i i ii ix P X x x pµ

= == = =∑ ∑

2 2 2

1

k

i iix pσ µ

== −∑

2 2

1( )

k

i iix pσ µ

== −∑

Ejemplo: La distribución de probabilidad de una v.a. X viene dada por la siguiente tabla:

¿Cuánto vale P(X=3)? Calcula la media y la varianza.

0.30.2a0.30.1pi

54321Xi

Variable aleatoria

20

MODELOS DISCRETOS

Modelo BERNOULLI: Es un experimento que tiene las siguientes características:

En cada prueba del experimento sólo son posibles dos resultados: el suceso A que llamaremos éxito y el suceso complementario, Ac, llamado fracaso.

El resultado obtenido en cada prueba es independiente de los resultados anteriores.

La probabilidad del suceso A es constante y no varía de unas pruebas a otras.

Modelos probabilísticos

21

MODELOS DISCRETOS

Modelo BINOMIAL:

Este experimento lo forman repeticiones de pruebas del tipo Bernoulli y recibe el nombre de distribución binomial de parámetros n y p donde n es el número de pruebas del experimento y p es la probabilidad del éxito.

Si denotamos por X la variable aleatoria binomial que representa el número de éxitos obtenidos en las n pruebas del experimento, su función de probabilidad viene dada por:

P( ) ( ) (1 )r n rnObtener r éxitos P X r p p

r

− = = = −

Media:

Varianza:

npµ =

2 (1 ) np pσ = −

Modelos probabilísticos

22

EJEMPLOCalcula la probabilidad de que una familia que tiene 4 hijos, 3 de ellos sean varones.

EJEMPLOLa probabilidad de que un alumno repita curso es de 0,3. Elegimos 20 alumnos al azar. ¿Cuál es la probabilidad de que haya exactamente 4 alumnos repetidores?

EJEMPLOLa probabilidad de que un reloj salga de fábrica defectuoso es del 4%. Halla: El número esperado de relojes defectuosos en un lote de 1000.

Modelos probabilísticos

23

FUNCIÓN DE DENSIDAD DE UNA V.A. CONTINUA:

La función de densidad de una v.a. continua cumple las siguientes condiciones:

Sólo toma valores no negativos, f(x) ≥ 0.

El área encerrada bajo la curva es igual a:

Función de distribución. Como en el caso de la v.a. discreta, la función de distribución proporciona la probabilidad acumulada hasta un determinado valor de la variable, es decir,

Cumple las siguientes condiciones:Su valor es cero para todos los puntos situados a la izquierda del menor valor de la variable.Su valor es 1 para todos los puntos situados a la derecha del mayor valor de la variable.

( ) ( )F x P X x= ≤

Variable aleatoria

( ) ( )b

aP a X b f x dx≤ ≤ = ∫

24

MODELO NORMAL o GAUSSIANO

Hay muchas v.a. continuas cuya función de densidad tiene forma de campana de Gauss.

Ejemplos:• La variable peso en una población de personas de la misma edad y sexo.• La variable altura de la población citada.• Las notas de una asignatura (mito urbano).

Para expresar que una v.a. continua X, tiene una distribución normal de media µµµµ y desviación típica σσσσ , escribimos:

( , )X N µ σ∼

Modelos probabilísticos

25

Distribución normal estándar

De las infinitas distribuciones normales, tiene especial interés la que tiene media igual a 0 y desviación típica igual a 1, es decir, N(0,1). Esta distribución recibe el nombre de normal estándar o tipificada.

Existen tablas que permiten calcular probabilidades de la distribución N(0,1).

Por ello cuando tenemos una v.a. X que sigue una distribución normal de media µ y desviación típica σ pasamos a otra variable Z que sigue una distribución N(0,1) mediante la siguiente transformación:

XZ

µ

σ

−=

Modelos probabilísticos

26

Modelos probabilísticos

Halla, en una distribución N(0, 1), las siguientes probabilidades:

[ ]( )a P Z > − 0,2 [ ]( )b P Z > 1,27 [ ]( )c P Z− < <0,52 1,03

[ ] [ ]0,2 0,2 0,5793P Z P Z> − = < =

[ ] [ ]1,27 1 1,27 1 0,8980 0,1020P Z P Z> = − < = − =

[ ] [ ] [ ]

[ ] [ ]( )( )

0,52 1,03 1,03 0,52

1,03 1 0,52

0,8485 1 0,6985 0,5470

P Z P Z P Z

P Z P Z

− < < = < − < −

= < − − ≤

= − − =

27

Modelos probabilísticos

Ejemplo de tipificación: Dada una X~N(3,2)

( )

3 5 3( 5) ( 1) ( 1) 0,1587

2 2

a

XP X P P Z P Z

− − > = > = > = < − =

( )

( ) 0,25

3 30,25

2 2

30,25

2

30,67; 1,66

2

b

P X a

X aP

aP Z

aa

< =

− − < =

− < =

−= − =

28

Modelos probabilísticos

29

Modelos probabilísticos

30

Aproximación de la distribución binomial mediante la normal

Cuando n es suficientemente grande (n>30) el comportamiento de una distribución binomial, X~B(n, p), es aproximadamente igual a una distribución normal,

Suele considerarse que la aproximación es buena cuando np>5 y nq>5

( ), (1 )N np np p−

EJEMPLOSe lanza una moneda correcta al aire 400 veces. Calcula la probabilidad de obtener un número de caras comprendido entre 180 y 210, ambos inclusive.

Modelos probabilísticos