probabilidad unidad i ordenamiento de la información 1

50
PROBABILIDAD Unidad I Ordenamiento de la Información 1

Upload: heriberto-cadiz

Post on 21-Jan-2015

17 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: PROBABILIDAD Unidad I Ordenamiento de la Información 1

1

PROBABILIDADUnidad I Ordenamiento de la Información

Page 2: PROBABILIDAD Unidad I Ordenamiento de la Información 1

2Captura de datos muestrales

Page 3: PROBABILIDAD Unidad I Ordenamiento de la Información 1

3

Conceptos básicos de la estadística

Población (o universo): Totalidad de elementos o cosas bajo consideración

Muestra: Es una parte de la población seleccionada para el análisis.

Parámetro: Es una medida numérica que describe una característica de la población

Estadístico: Es la medida numérica que describe alguna característica de la muestra

Page 4: PROBABILIDAD Unidad I Ordenamiento de la Información 1

4

Tipos de Muestras

Tipos de muestras usadas

Muestras no probabilísticas

Muestra de juicio

Muestra de cuota

De parte

Grande

Muestras de probabilidad

Muestra

Aleatoria

simple

Muestra

sistemátic

a

Muestra

estratificada

Muestra de agrupación

Page 5: PROBABILIDAD Unidad I Ordenamiento de la Información 1

5

Recolección de Datos

Proporcionados por una organización o un individuo.

El diseño de un Experimento Una encuesta Un estudio observacional

Page 6: PROBABILIDAD Unidad I Ordenamiento de la Información 1

6

Tipos de Datos

Tipo de Dato Tipo de Preguntas Respuestas

Categórico

Numérico

¿Posee actualmente algunas acciones o bonos? Si | No

Discreto

Continuo

¿A cuántas revistas estáSuscrito actualmente?

¿Cuánto mide?

______ Número

______ Metros

Page 7: PROBABILIDAD Unidad I Ordenamiento de la Información 1

7

Diseño del cuestionario

Propósito: Recabar información significativa que nos ayude en el proceso de toma de decisiones.

Formular preguntas cortas, libres de ambiguedades. ¿Fuma Usted? ____ Si ____No ¿Cuántos Años tiene? ____ (en años)

Pruebas piloto

Page 8: PROBABILIDAD Unidad I Ordenamiento de la Información 1

8

Elección de la muestra

Para seleccionar la muestra pueden usarse 2 métodos básicos: Con remplazo Sin remplazo

Uso de tabla de números aleatorios

Page 9: PROBABILIDAD Unidad I Ordenamiento de la Información 1

9

Organización de los datos numéricos

Arreglo Ordenado

Diagrama de tallo y hojas

Page 10: PROBABILIDAD Unidad I Ordenamiento de la Información 1

10

Distribución de frecuencias

Es una tabla de resumen en la que los datos se disponen en agrupamientos o categorías convenientemente establecidas de clases ordenadas numéricamente.

Page 11: PROBABILIDAD Unidad I Ordenamiento de la Información 1

11

Tipos de frecuencias

Frecuencia absoluta La frecuencia absoluta es el número de

veces que aparece un determinado valor en un estudio estadístico.

Se representa por fi

La suma de las frecuencias absolutas es igual al número total de datos, que se representa por N.

Para indicar resumidamente estas sumas se utiliza la letra griega Σ (sigma mayúscula) que se lee suma o sumatoria.

Page 12: PROBABILIDAD Unidad I Ordenamiento de la Información 1

12

Tipos de frecuencias

Frecuencia relativa La frecuencia relativa es

el cociente entre la frecuencia absoluta de un determinado valor y el número total de datos.

Se puede expresar en tantos por ciento y se representa por ni.

La suma de las frecuencias relativas es igual a 1.

Page 13: PROBABILIDAD Unidad I Ordenamiento de la Información 1

13

Tipos de frecuencias

Frecuencia acumulada La frecuencia acumulada es la suma de las

frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

Se representa por Fi.

Frecuencia relativa acumulada La frecuencia relativa acumulada es

el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos. Se puede expresar en tantos por ciento.

Page 14: PROBABILIDAD Unidad I Ordenamiento de la Información 1

14

Ejemplo

Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas:

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29.

xiRecuento

fi Fi ni Ni

Page 15: PROBABILIDAD Unidad I Ordenamiento de la Información 1

15

32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29

xiRecuento

fi Fi ni Ni

27 I 1 1 0.032 0.032

28 II 2 3 0.065 0.097

29 IIIII I 6 9 0.194 0.290

30 IIIII II 7 16 0.2260.0516

31 IIIII III 8 24 0.258 0.774

32 III 3 27 0.097 0.871

33 III 3 30 0.097 0.968

34 I 1 31 0.032 1    31   1

Este tipo de tablas de frecuencias se utiliza con variables discretas.

Page 16: PROBABILIDAD Unidad I Ordenamiento de la Información 1

16

Distribución de frecuencias agrupadas

La distribución de frecuencias agrupadas o tabla con datos agrupados se emplea si las variables toman un número grande de valores o la variable es continua.

Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases. A cada clase se le asigna su frecuencia correspondiente.

Page 17: PROBABILIDAD Unidad I Ordenamiento de la Información 1

17

Límites de la clase Cada clase está delimitada por el límite inferior de

la clase y el límite superior de la clase.

Amplitud de la clase La amplitud de la clase es la diferencia entre

el límite superior e inferior de la clase.

Marca de clase La marca de clase es el punto medio de

cada intervalo y es el valor que representa a todo elintervalo para el cálculo de algunos parámetros.

Page 18: PROBABILIDAD Unidad I Ordenamiento de la Información 1

18

Construcción de una tabla de frecuencias agrupadas

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

1º Se localizan los valores menor y mayor de la distribución. En este caso son 3 y 48.2º Se restan y se busca un número entero un poco mayor que la diferencia y que sea divisible por el número de intervalos queramos establecer.Es conveniente que el número de intervalos oscile entre 5 y 15.En este caso, 48 - 3 = 45, incrementamos el número hasta 50 / 5 = 10 intervalos.Se forman los intervalos teniendo presente que el límite inferior de una clase pertenece al intervalo, pero el límite superior no pertenece intervalo, se cuenta en el siguiente intervalo.

Page 19: PROBABILIDAD Unidad I Ordenamiento de la Información 1

19

3, 15, 24, 28, 33, 35, 38, 42, 43, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13.

  ci fi Fi ni Ni

[0, 5) 2.5 1 1 0.025 0.025

[5, 10) 7.5 1 2 0.025 0.050

[10, 15) 12.5 3 5 0.075 0.125

[15, 20) 17.5 3 8 0.075 0.200

[20, 25) 22.5 3 11 0.075 0.2775

[25, 30) 27.5 6 17 0.150 0.425

[30, 35) 32.5 7 24 0.175 0.600

[35, 40) 37.5 10 34 0.250 0.850

[40, 45) 42.5 4 38 0.100 0.950

[45, 50) 47.5 2 40 0.050 1

    40   1

Page 20: PROBABILIDAD Unidad I Ordenamiento de la Información 1

20

Ejercicios

 Las puntuaciones obtenidas por un grupo en una prueba han sido:

15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.

Construir la tabla de distribución de frecuencias

Page 21: PROBABILIDAD Unidad I Ordenamiento de la Información 1

21

El número de estrellas de los hoteles de una ciudad viene dado por la siguiente serie:

3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.

Construir la tabla de distribución de frecuencia

Page 22: PROBABILIDAD Unidad I Ordenamiento de la Información 1

22

Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100)

[100, 110)

[110, 120)

fi 8 10 16 14 10 5 2

Page 23: PROBABILIDAD Unidad I Ordenamiento de la Información 1

23

Definición de parámetro estadístico Un parámetro estadístico es

un número que se obtiene a partir de los datos de una distribución estadística.

Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una gráfica.

Page 24: PROBABILIDAD Unidad I Ordenamiento de la Información 1

24

Tipos de parámetros estadísticos Hay tres tipos parámetros

estadísticos: De centralización. De posición De dispersión.

Page 25: PROBABILIDAD Unidad I Ordenamiento de la Información 1

25

Medidas de Centralización

Nos indican en torno a qué valor (centro) se distribuyen los datos.

Media aritmética La media es el valor promedio de la distribución.

Mediana La mediana es la puntación de la escala

que separa la mitad superior de la distribución y la inferior, es decir divide la serie de datos en dos partes iguales.

Moda La moda es el valor que más se repite en una

distribución.

Page 26: PROBABILIDAD Unidad I Ordenamiento de la Información 1

26

Medidas de posición

Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

La medidas de posición son: Cuartiles

Los cuartiles dividen la serie de datos en cuatro partes iguales.

Deciles Los deciles dividen la serie de datos en diez partes iguales.

Percentiles Los percentiles dividen la serie de datos en cien partes

iguales.

Page 27: PROBABILIDAD Unidad I Ordenamiento de la Información 1

27

Medidas de dispersión

Rango o recorrido El rango es la diferencia entre el mayor y el menor de

los datos de una distribución estadística. Desviación media

La desviación media es la media aritmética de los valores absolutos de las desviaciones respecto a la media.

Varianza La varianza es la media aritmética del cuadrado de

las desviaciones respecto a la media. Desviación típica

La desviación típica es la raíz cuadrada de la varianza.

Page 28: PROBABILIDAD Unidad I Ordenamiento de la Información 1

28

Trabajo Parcial 1

Fecha de entrega: 10 Septiembre de 2010 Encuestar a 50 estudiantes de la escuela de

sistemas sobre Cultura y Deporte Elaborar la Distribución de frecuencias para

cada una de las preguntas Para Cada distribución calcular los parámetros

estadísticos de centralización y de dispersión Graficar los resultados de las distribuciones. Minimo de preguntas para la encuesta: 7 Incluir evidencias de encuesta!!!!!

Page 29: PROBABILIDAD Unidad I Ordenamiento de la Información 1

29

Moda

La moda es el valor que tiene mayor frecuencia absoluta.

Se representa por Mo.

Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribución: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4

Page 30: PROBABILIDAD Unidad I Ordenamiento de la Información 1

30

Moda

Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la máxima, la distribución esbimodal o multimodal, es decir, tiene varias modas. 1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9

Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9

Si dos puntuaciones adyacentes tienen la frecuencia máxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8Mo = 4

Page 31: PROBABILIDAD Unidad I Ordenamiento de la Información 1

31

Moda (datos agrupados)

Li es el límite inferior de la clase modal. fi es la frecuencia absoluta de la clase

modal. fi-1 es la frecuencia absoluta

inmediatamente inferior a la clase modal. fi+1 es la frecuencia absoluta

inmediatamente posterior a la clase modal.

ai es la amplitud de la clase.

Page 32: PROBABILIDAD Unidad I Ordenamiento de la Información 1

32

Moda

También se utiliza otra fórmula de la moda que da un valor aproximado de ésta:

Page 33: PROBABILIDAD Unidad I Ordenamiento de la Información 1

33

Ejemplo (Moda)

Calcular la moda de una distribución estadística que viene dada por la siguiente tabla:

Page 34: PROBABILIDAD Unidad I Ordenamiento de la Información 1

34

Ejemplo (Moda)

Page 35: PROBABILIDAD Unidad I Ordenamiento de la Información 1

35

Mediana

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor.

La mediana se representa por Me.

La mediana se puede hallar sólo para variables cuantitativas.

Page 36: PROBABILIDAD Unidad I Ordenamiento de la Información 1

36

Calculo de la Mediana

1 Ordenamos los datos de menor a mayor.

2 Si la serie tiene un número impar de medidas la mediana es la puntuación central de la misma.

2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un número par de

puntuaciones la mediana es la media entre las dos puntuaciones centrales.

7, 8, 9, 10, 11, 12Me= 9.5

Page 37: PROBABILIDAD Unidad I Ordenamiento de la Información 1

37

Calculo para datos agrupados

La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas.

Es decir tenemos que buscar el intervalo en el que se encuentre .

Li es el límite inferior de la clase donde se encuentra la mediana.

fi es la frecuencia absoluta. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase.

Page 38: PROBABILIDAD Unidad I Ordenamiento de la Información 1

38

Ejemplo (Mediana)

Page 39: PROBABILIDAD Unidad I Ordenamiento de la Información 1

39

Media aritmética

La media aritmética es el valor obtenido al sumar todos los datos y dividir el resultado entre el número total de datos.

 es el símbolo de la media aritmética.

Page 40: PROBABILIDAD Unidad I Ordenamiento de la Información 1

40

Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

Page 41: PROBABILIDAD Unidad I Ordenamiento de la Información 1

41

Ejercicio (Media Aritmética)

En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuación media.

Page 42: PROBABILIDAD Unidad I Ordenamiento de la Información 1

42

Page 43: PROBABILIDAD Unidad I Ordenamiento de la Información 1

43

Los pesos de 65 Empleados de una fabrica

Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100)

[100, 110)

[110, 120)

fi 8 10 16 14 10 5 2

Encontrar para datos agrupados Me, Mo ,x

Page 44: PROBABILIDAD Unidad I Ordenamiento de la Información 1

44

Cuartiles

Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.

Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.

Q2 coincide con la mediana.

Page 45: PROBABILIDAD Unidad I Ordenamiento de la Información 1

45

Cálculo de los cuartiles

1 Ordenamos los datos de menor a mayor.

2 Buscamos el lugar que ocupa cada cuartil mediante la expresión .

Page 46: PROBABILIDAD Unidad I Ordenamiento de la Información 1

46

Cálculo de Cuartiles

Page 47: PROBABILIDAD Unidad I Ordenamiento de la Información 1

47

Cuartiles para datos agrupados En primer lugar buscamos la clase donde se

encuentra  , en la tabla de las frecuencias acumuladas.

Li es el límite inferior de la clase donde se encuentra el cuartil.

N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la

clase del cuartil. ai es la amplitud de la clase

Page 48: PROBABILIDAD Unidad I Ordenamiento de la Información 1

48

Ejercicio

Page 49: PROBABILIDAD Unidad I Ordenamiento de la Información 1

49

Page 50: PROBABILIDAD Unidad I Ordenamiento de la Información 1

50