apunte: herramientas de excel para estadística

114
APUNTE: HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA PROFESORES: ÁLVARO TOLEDO SAN MARTÍN INÉS VICENCIO PARDO Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Upload: phamnga

Post on 04-Jan-2017

226 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: apunte: herramientas de excel para estadística

APUNTE: HERRAMIENTAS DE EXCEL

PARA ESTADÍSTICA

PROFESORES: ÁLVARO TOLEDO SAN MARTÍN INÉS VICENCIO PARDO

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Page 2: apunte: herramientas de excel para estadística

APUNTE: HERRAMIENTAS DE EXCEL

PARA ESTADÍSTICA

CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA

2015

PROFESOR: ÁLVARO TOLEDO SAN MARTÍN

Licenciado en Matemáticas, Estadístico y

Magíster en Estadística de la Pontificia

Universidad Católica de Chile.

Coordinador de Estadística del

Departamento de Matemática y Física ,

Universidad Bernardo O´Higgins. Atiende

las cátedras de Estadística I y Estadística

II, Matemática Básica, Álgebra y Cálculo I

de la Universidad Bernardo O`Higgins

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Page 3: apunte: herramientas de excel para estadística

APUNTE: HERRAMIENTAS DE EXCEL

PARA ESTADÍSTICA

CÁTEDRA: ESTADÍSTICA I – ESTADÍSTICA APLICADA

2015

PROFESORA: INÉS VICENCIO PARDO

Profesora de Matemática y Computación,

Universidad de Santiago de Chile. Magíster

en Estadística Pontificia Universidad

Católica de Chile.

Coordinadora de Matemática y Álgebra del

Departamento de Matemática y Física ,

Universidad Bernardo O´Higgins. Atiende

las cátedras de Estadística I y Estadística II,

Matemática Básica, Álgebra y Cálculo I.

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Page 4: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 5

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

CONTENIDO

PRESENTACIÓN .................................................................................................................................... 7

1. Activación de la herramienta de análisis de datos de MS Office Excel. ...................................... 8

2. Confección de Tabla de frecuencias con función tabla dinámica .............................................. 10

2.1 Despliegue de opciones en Tabla Dinámica ........................................................................ 12

3. Estadística Descriptiva con la función Análisis de datos. ........................................................... 14

4. Construcción de un Histograma. ............................................................................................... 20

4.1 Una aplicación de medidas descriptivas. ............................................................................. 27

4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E

HISTOGRAMA ................................................................................................................................ 37

5. Tablas de contingencia .............................................................................................................. 39

5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA ........................... 46

6. Probabilidades y Teorema de Bayes .......................................................................................... 47

6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES ....... 56

6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y TEOREMA

DE BAYES ....................................................................................................................................... 58

7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos de MS

Excel. ................................................................................................................................................. 75

7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la

herramienta Análisis de datos de MS Excel. ................................................................................. 78

7.1.1 Distribución discreta: .................................................................................................... 79

7.1.2 Distribución Uniforme: ................................................................................................. 81

7.1.3 Distribución Normal: ..................................................................................................... 82

7.1.4 Distribución de Bernoulli: ............................................................................................. 83

Page 5: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 6

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.5 Distribución Binomial: ................................................................................................... 84

7.1.6 Distribución Poisson: .................................................................................................... 86

7.1.7 Frecuencia Relativa: ...................................................................................................... 87

8. Distribuciones de probabilidad Discreta .................................................................................... 89

8.1. Probabilidad con distribución Binomial. ............................................................................. 90

8.2. Probabilidad con distribución Binomial Inversa. ................................................................ 91

8.3. Probabilidad con distribución Hipergeométrica. ................................................................ 91

8.4. Probabilidad con Distribución de Poisson. ......................................................................... 92

8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA

DISCRETA ....................................................................................................................................... 94

9. Distribuciones de probabilidad Continua .................................................................................. 95

9.1. Probabilidad con distribución Exponencial. ........................................................................ 96

9.2. Probabilidad con distribución Normal. ............................................................................... 97

9.3. Distribución Normal Inversa. .............................................................................................. 97

9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA

CONTINUA ..................................................................................................................................... 99

10. Tablas bivariadas continuas y cálculo de probabilidades ...................................................... 100

10.1 ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS ............................... 112

10.2 EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA ................................... 113

CONCLUSIÓN ................................................................................................................................... 114

BIBLIOGRAFÍA .................................................................................................................................. 115

Page 6: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 7

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

PRESENTACIÓN

Dentro del ámbito de la Estadística como ciencia aplicada, un estudiante de Ingeniería debe adquirir

conocimientos que abarcan temas de análisis descriptivo de variables, problemas de probabilidad,

estimación de modelos probabilístico y simulación de distribuciones de probabilidad, además de la

inferencia estadística y el estudio de modelos estadísticos multivariados.

El propósito de este material de apoyo es proveer al estudiante de Ingeniería (y de otras carreras) los

conocimientos aplicados en software para desarrollar y comprender los contenidos del curso Estadística I

(Estadística Aplicada) impartido por el Departamento de Matemática y Física para la Facultad de Ingeniería y

Administración. El software a utilizar será Microsoft Excel. Se ha seleccionado Excel dado que es un

programa de uso masivo que cuenta con las herramientas básicas suficientes para realizar tablas, gráficos,

análisis de dados y que nuestro futuro profesional Ingeniero sin duda, podrá utilizar en el campo laboral.

La organización de este documento sigue el orden de un programa de Estadística Matemática habitual y que

es similar al orden de los contenidos que se tratan el curso de Estadística I (Estadística Aplicada). Incluye en

un principio los pasos para activar la herramienta “Análisis de datos” que dispone Excel para Estadística,

luego, se concentra el documento en el análisis descriptivos de datos y el análisis gráfico, luego, ejemplifica

el cálculo de probabilidad abarcando hasta el importante Teorema de Bayes, para luego, entrar en el análisis

de las variables aleatorias discretas y continuas haciendo énfasis en la capacidad de Excel para realizar

simulaciones de este tipo de variables. Finalmente se complementa con la construcción de tablas bivariadas

para datos continuos (y discretos) como extensión al caso de variables cualitativas.

Este material es de carácter inédito, pues corresponde a la recolección de cursos y experiencias de análisis

en el software Excel realizada por los autores en distintos cursos de estadística realizados en distintas casas

de estudio. Algunos de los problemas propuestos se recopilaron de textos de Estadística que son citados

habitualmente en la bibliografía de un curso formal de Estadística Matemática.

Page 7: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 8

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

1. Activación de la herramienta de análisis de datos de MS Office Excel. Para la activación de la herramienta análisis de datos de Excel, realice los siguientes pasos: Abra una hoja de Excel Haga “click” en la pestaña de “Archivo” ubicada en la parte superior izquierda de la hoja de Excel.

Figura 1: Ubicación de la opción archivo en planilla Excel

Se desplegará un menú en el costado izquierdo de la hoja.

Figura 2: Ubicación de “Opciones” en la planilla Excel

En el menú haga “click” en “Opciones”

Se desplegará la siguiente ventana, de la cual debe seleccionar la opción “complementos”, luego haga “click”

en “herramientas para análisis” y finalmente “click” en “ir”.

Page 8: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 9

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 3. Esquema de pasos para seleccionar la herramienta de análisis del menú complementos.

En la ventana siguiente debe hacer “click” en la opción “herramienta para análisis” y luego aceptar.

Figura 4. Ventana de complementos.

La herramienta de análisis de datos ha sido activada. Para visualizarla se debe ir a la opción “Datos” de la

barra superior de la hoja de Excel. En la parte final aparecerá activada la opción “Análisis de datos”.

Page 9: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 10

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 5. Visualización de la herramienta de análsis de datos .

2. Confección de Tabla de frecuencias con función tabla dinámica La siguiente tabla dinámica, será confeccionada con la base de datos dado.xlsx

1, la cual representa el

resultado obtenido del lanzamiento en 100 oportunidades de un dado equilibrado.

Figura 6. Ubicación de función Tabla dinámica

1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar.

2. Seleccionar la opción “Tabla dinámica”.

1 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 10: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 11

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 7. Ingreso de datos en función tabla dinámica.

3. Ingresar los datos en la opción “Tabla o rango”. Cabe destacar que por defecto Excel usará el dato ubicado en la primera fila como el título de la tabla dinámica.

4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es posible indicar que aparezcan en una hoja nueva.

5. Hacer “click” en “Aceptar”

Page 11: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 12

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

2.1 Despliegue de opciones en Tabla Dinámica

Figura 8. Opciones Tabla Dinámica.

3. En el recuadro “Seleccionar campos para agregar al informe” desplazar el campo con el nombre de la

variable (N°caraDado) hasta el recuadro “Etiqueta de fila”.

Figura 9. Ilustración de construcción de tabla dinámica.

Page 12: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 13

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de N°caraDado”, y

seleccionar la opción “configuración de campo de valor”.

Figura 10. Menú configuración “Campo de Valor”

5. Cambiar la opción “Suma” por la opción “Cuenta”.

6. Hacer “click” en “Aceptar”.

Figura 11. Tabla dinámica

Con esto se ha generado una tabla de frecuencias absolutas para la variable de estudio N°caraDado, la cual,

resume la cantidad de veces que se obtuvo cierta cara del dado.

Por ejemplo, la cara del dado con el valor 1, se obtuvo 22 veces de los 100 lanzamientos.

Page 13: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 14

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

3. Estadística Descriptiva con la función Análisis de datos. El objetivo de este video es mostrar el uso de la herramienta Análisis de Datos para la obtención de

estadísticas descriptivas y confección de un histograma de frecuencias.

Primero debemos seleccionar el menú de DATOS y hacer ““click”” en la herramienta “Análisis de Datos”

Figura 12. Selección de opción análisis de datos.

Cabe notar que cuando se utiliza un programa estadístico para los cálculos de estadísticos descriptivos, no es

necesario confeccionar tablas de frecuencias.

Las tablas de frecuencias serán de utilidad para la confección de gráficos y para presentar resumen de la

información en el informe final.

Para nuestro ejemplo utilizaremos la información que tenemos de las estaturas de 100 personas, disponibles

en el archivo “Ejemplo descriptivas.xlsx2”.

Abrimos el archivo y tenemos:

2 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 14: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 15

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 13. Base de datos “Ejemplo descriptivas.xlsx”.

Con esta base de datos mostraremos lo que entrega la herramienta “Análisis de Datos” en su opción,

“Estadísticas Descriptivas”.

Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la

opción Estadísticas Descriptivas y finalmente ““click”” en aceptar.

Figura 14. Opción Estadísticas Descriptivas.

Se despliega el siguiente cuadro:

Page 15: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 16

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 15. Ventana de ingreso de datos.

En esta ventana debemos ingresar el rango de datos que analizaremos, en este caso serán la columna donde

se encuentran las estaturas de las 100 personas, si se incluye en el rango de entrada el nombre de la

variable, entonces se debe marcar la opción “Rótulos en la primera fila”.

Figura 16. Ingreso de datos.

Page 16: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 17

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Para las opciones de salida, marcaremos la opción Rango de Salida, y le indicamos una celda contigua a la

columna de datos, por ejemplo la D1, entonces los resultados que nos entregue Excel quedarán a partir de

esta celda.

También si se estima por orden, podemos optar por dejar los resultados en una nueva hoja.

Marcamos Resumen de estadísticas y Aceptar.

Figura 17. Resumen de estadísticas.

Excel nos entrega el listado de estadísticas descriptivas para la Variable Estatura

Figura 18. Salida computacional de la opción análisis de datos.

Page 17: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 18

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Las estaturas están medidas con dos decimales que indican los centímetros, podemos entonces dejar las

estadísticas descriptivas que obtuvimos también con dos decimales, esto facilitará la interpretación.

Seleccionamos el rango de los valores de las medidas y con el botón derecho seleccionamos “Formato de

celdas”.

Figura 19. Opciones de presentación de datos.

Y luego seleccionar formato número, “posición de decimales”: 2, y Aceptar

Figura 20. Modificar decimales de la salida de datos.

Page 18: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 19

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Queda la siguiente presentación:

Figura 21. Resumen de estadísticas con dos decimales.

Las interpretaciones de las medidas de tendencia central son las siguientes:

Media:

- La media o promedio de las estaturas de las 100 personas es 1,60 metros, un metro y sesenta centímetros.

Mediana:

- El 50% de las personas con menores estaturas miden a lo más 1,61 metros , un metro y 61 centímetros,

también podemos decir que el 50% de las personas más altas miden más de 1,61 metros.

Moda:

- Lo más frecuente en estas 100 personas es que midan aproximadamente 1,49 metros.

Por otra parte la Desviación Estándar, que es la raíz cuadrada de la varianza, nos da una aproximación del

promedio de las desviaciones de los datos respecto de su media.

En nuestro ejemplo la desviación estándar es de 0,15 metros, es decir 15 cm, por lo que podemos decir que

los datos tienen una desviación promedio aproximada respecto de los datos de 15 cm. Si tuviésemos las

edades de otro grupo de personas, entonces podríamos comparar homogeneidad entre ellos, a menor

desviación estándar entonces los datos son más homogéneos (datos más cercanos a promedio, menor

dispersión de los datos)

Page 19: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 20

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4. Construcción de un Histograma. Veamos ahora la construcción del histograma de frecuencia para los datos disponibles en la planilla

“Ejemplo descriptivas”.

Vamos al menú DATOS, hacemos ““click”” en “Análisis de Datos”, posteriormente hacemos ““click”” en la

opción Histograma y finalmente ““click”” en aceptar.

Figura 22. Función Histograma.

Al hacer ““click”” en Aceptar, nos muestra el siguiente Cuadro

Page 20: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 21

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 23. Ventana de ingreso de datos .

Aquí en el “rango de entrada” seleccionamos los datos que tenemos de las estaturas, en la opción “Rango

de clase” no ingresaremos información, ya que queremos que el programa determine el número de clases

de nuestro Histograma, marcamos “rótulo”, seleccionamos un “rango de salida”, finalmente marcamos las

opciones “Porcentaje acumulado” , “Crear gráfico” y aceptamos.

Page 21: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 22

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 24. Opciones “Porcentaje acumulado” y “Crear gráfico (Histograma)”.

Excel nos entrega una tabla de frecuencias con los porcentajes acumulados de dichas frecuencias, asociados

a una clase que Excel determina, aquí el programa para las 100 estaturas determinó un resumen

construyendo 11 intervalos.

Figura 25. Salida computacional de opción “Histograma”.

Page 22: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 23

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

El histograma de frecuencias, además, muestra el gráfico de líneas con los porcentajes acumulados.

Para visualizar mejor, agrandamos el gráfico y nos posesionamos sobre las barras para cambiar el ancho de

estas, recordemos que la variable estaturas es continua y las barras se deben visualizar juntas formando un

polígono de frecuencias.

Hacemos “click” con el botón derecho del mouse sobre una de las barras, seleccionamos dar formato a

serie de datos

Figura 26. Opciones de formato.

Luego cambiamos el Ancho del intervalo, de 150% a 0% y presionamos Enter.

Page 23: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 24

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 27. Modificaciones al ancho del intervalo.

Con esta misma opción, seleccionamos ahora el ícono del balde que es para relleno y líneas, y hacemos

“click”.

Figura 28. Opciones de serie.

Page 24: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 25

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Luego elegimos un color negro para las líneas de las barras, cerramos la ventana.

Figura 29. Ingreso de nombre a histograma.

Lo único que falta es escribir un título adecuado y dar nombre al eje de las clases.

Hacemos “click” sobre el título y lo modificamos, escribiremos “Histograma de frecuencia de las Edades”, de

igual forma hacemos “click” sobre clase en el eje de las abscisas y lo modificamos, escribiremos allí “clase de

las edades”.

Tenemos finalizado el histograma de frecuencias.

Page 25: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 26

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 30. Histograma completo.

Page 26: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 27

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4.1 Una aplicación de medidas descriptivas.

Una sociedad de Ingenieros consultores, decidió adquirir un nuevo Odómetro para tomar mediciones de

larga distancia, la decisión de hacer esta inversión fue necesaria dado que el que tienen actualmente ya

tiene 6 años de antigüedad y las últimas muestras de medición a un cierto punto que se han hecho con tal

instrumento, han tenido diferencias notorias.

La medición que la empresa entrega entre dos puntos es el promedio de las mediciones hechas en tres

días distintos y a distintas horas del día, esto para no tener sesgo por factores como clima, luminosidad o

interrupciones externas.

El nuevo instrumento es tecnológicamente más avanzado y de mayor precisión (menor margen de error,+/-

0,5% ), según lo que asegura la compañía que lo vendió.

La empresa además de empezar a utilizar el nuevo odómetro, sigue utilizando el antiguo, dado la gran

demanda de proyectos en los cuales sus servicios de medición han sido contratados.

Los ingenieros está consciente de la necesita contar con dos de estos instrumentos pero quieren tener

alguna evidencia de que las mediciones tomadas por el antiguo odómetro son realmente más inexactas

con respecto a su media, que las mediciones tomadas por el nuevo.

Para esto los ingenieros deciden, ya conociendo una distancia entre dos puntos de 61,5 metros, tomar dos

muestras donde se harán 10 mediciones de esta distancia conocida, (10 días distintos), cada una con los dos

odómetros respectivamente (en metros), con las que calcularan medidas descriptivas, principalmente para

comparar medidas de tendencia central y de dispersión.

Los resultados de estos cálculos ayudaran a tomar la decisión de desechar o seguir utilizando el antiguo

odómetro

Las medidas obtenidas se encuentran en el archivo “medidas_odometro.xlsx3” , abriendo el archivo ,

tenemos:

3 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 27: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 28

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 31. Base de datos “medidas_odometro.xlsx”.

Para los cálculos de las medidas de tendencia central, utilizaremos la herramienta de análisis de datos

“Estadísticas descriptivas.

En el menú principal, elegimos la opción “datos”, luego “Análisis de datos”, y “Estadística descriptiva

Figura 32. Opción Estadística Descriptiva.

Page 28: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 29

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Calculamos primero las estadísticas descriptivas de las mediciones hechas con el odómetro antiguo, en el

rango de entrada marcamos el rango donde están las medidas que se tomaron con el odómetro antiguo, de

la B2 a la B11, y en el rango de salida la celda F1, desde esa celda se desplegarán, los resultados y ACEPTAR

Figura 33. Ingreso de datos.

Page 29: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 30

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Hacemos doble “click” entre las columna F y G, para ajustar el tamaño de la columna F al contenido.

Tenemos entonces:

Figura 34. Desciptivos de Odómetro Antiguo.

El mismo procedimiento hacemos ahora para obtener las estadísticas descriptivas de las medidas tomadas

con el odómetro Nuevo, los ubicamos a partir de la celda I1 para poder tener una mirada conjunta de los

cálculos obtenidos, tenemos entonces:

Figura 35. Comparación de descriptivos de odómetros (Antiguo y Nuevo)

Page 30: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 31

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Observado los resultados obtenidos, marcaremos con un color de relleno gris, las estadísticas relevantes

Figura 36. Comparación de algunos descriptivos.

Con respecto a las medias obtenidas, tenemos entre ellas una diferencia de 0,425 metros, es decir 42, 5 cm,

puede ser bastante dependiendo del contexto de la medición, y lo más importante que en relación al valor

exacto, el odómetro nuevo, entrega una media más cercana a la medida real que es 61,5.

Con respecto a la desviación estándar obtenida, claramente las medidas tomadas por el odómetro antiguo,

presentan una mayor dispersión entre ellas, esto puede generar una mayor diferencia entre los promedios

finales cuando se tomen sólo tres medidas.

Otro dato importante acá es el Rango, indicador también de dispersión de los datos, el rango que se dan en

las medidas tomadas por el odómetro antiguo es un metro superior con respecto a lo que presentan las

medidas tomadas por el odómetro nuevo.

Si observamos también el coeficiente de asimetría, nos podemos dar cuenta de que las mediciones tomadas

con el odómetro nuevo presentan una marcada asimetría negativa, esto quiere decir que los tatos en su

mayoría, se presentan superiores al promedio

Figura 37. Comparación de coeficientes de asimetría.

Page 31: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 32

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Ahora obtendremos los histogramas de frecuencias para visualizar mejor el comportamiento de los datos.

Usando la misma herramienta “Datos”, “Análisis de Datos” , “Histograma”

Figura 38. Confección de histogramas.

Para las medidas tomadas con el odómetro antiguo, el rango de entrada es desde la celda B2 a la B11, y el

rango de salida desde la celda F17, ACEPTAR

Figura 39. Ingreso de datos.

Excel para confeccionar el histograma de frecuencias, genera intervalos para agrupar las frecuencias, en este caso generó cuatro intervalos, donde las marcas de clases se muestran a partir de la celda que indicamos

Page 32: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 33

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

para la salida.

Figura 40. Salida de histograma 1.

Como las variables son continuas, corresponde ajustar el histograma con intervalos continuos, nos

posesionamos sobre las barras y haciendo clic con el botón derecho elegimos la opción “Dar formato a la

serie de datos”.

Page 33: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 34

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 41. Formato de serie de datos.

Y luego indicamos un 0% en el ancho del intervalo

Figura 42. Modificación del ancho del histograma.

Con la misma opción “Formato serie de datos”, ahora elegimos “Relleno y Líneas”, marcamos “línea sólida”,

color negro, para visualizar mejor las barras en el histograma

Page 34: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 35

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 43. Resultado de la modificación del ancho del histograma.

En la gráfica se visualiza la asimetría negativa que daba el coeficiente de asimetría,-0,6527, mayores

frecuencias sobre el promedio.

Ahora repetimos los pasos anteriores para obtener el histograma de frecuencias para las medidas tomadas

con el odómetro nuevo

Nos queda:

Page 35: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 36

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 44. Comparación de Histogramas de Odómetros.

La gráfica aquí se visualiza más simétrica con respecto al su promedio, y se corrobora con el coeficiente de

asimetría obtenido que es de 0,3266, que en este caso sería una leve asimetría positiva.

Con la información obtenida se puede concluir que de acuerdo a la diferencia que se presenta en el

promedio calculado por el odómetro antiguo respecto de la verdadera distancia y además respecto del

promedio más preciso entregado por el odómetro nuevo, más la mayor dispersión indicada tanto por la

desviación estándar, como por el rango de los datos de las mediciones obtenidas también por el odómetro

antiguo y la marcada asimetría negativa que se genera en la distribución de estos, se debería dar de baja el

odómetro antiguo y comprar otro nuevo.

Page 36: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 37

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4.2 EJERCICIOS PROPUESTOS, TEMA: TABLAS DE FRECUENCIAS, ESTADÍSTICA DESCRIPTIVA E

HISTOGRAMA

1. Considere la base de datos “Examenes.xlsx”4 la cual contiene información sobre el número de

preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Confecciones una tabla de frecuencias para la variable Exámenes . Ingrese el archivo Excel generado

en el buzón habilitado en la plataforma del laboratorio.

2. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Realice un resumen de descriptivos para la variable Exámenes. Ingrese el archivo Excel generado en

el buzón habilitado en la plataforma del laboratorio.

Preguntas independientes:

a. Indique el valor de la media. b. Indique el valor de la moda. c. Determine el valor de la desviación estándar (corregida) d. Determine el coeficiente de variación. e. Determine los cuartiles de la distribución de los datos. f. Determine el rango intercuartil.

3. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Realice un histograma para la variable Exámenes. Ingrese el archivo Excel generado en el buzón

habilitado en la plataforma del laboratorio.

4. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Confecciones una tabla de frecuencias para la variable alumnos. Ingrese el archivo Excel generado

en el buzón habilitado en la plataforma del laboratorio.

4 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 37: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 38

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

5. Considere la base de datos “Examenes.xlsx5” la cual contiene información sobre el número de

preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Realice un resumen de descriptivos para la variable alumnos. Ingrese el archivo Excel generado en

el buzón habilitado en la plataforma del laboratorio.

Preguntas independientes:

a. Indique el valor de la mediana. b. Indique el valor del coeficiente de asimetría. c. Determine el valor de la desviación estándar (corregida) d. Determine el coeficiente de variación. e. Determine los cuartiles de la distribución de los datos. f. Determine el rango intercuartil.

6. Considere la base de datos “Examenes.xlsx” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad.

Realice un histograma para la variable alumnos. Ingrese el archivo Excel generado en el buzón

habilitado en la plataforma del laboratorio.

5 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 38: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 39

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

5. Tablas de contingencia El objetivo de este video es mostrar la forma de construir una tabla de contingencia a partir de una tabla

bivariada para dos variables cualitativas y que posteriormente servirá de base para la construcción de una

tabla de contingencia.

Recordemos que una tabla bivariada es aquella que resume las frecuencias absolutas conjuntas y

marginales, a partir de ellas se pueden obtener medidas de estadísticos marginales y condicionales, además

la tabla de contingencia resume la misma información pero en términos de probabilidades.

Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos, esta

base contiene dos variables que son: el “sexo” y el “nivel de estudios” de 20 personas.

Lo primero que haremos es construir la tabla bivariada, para estos utilizaremos una Tabla dinámica.

Tomando posición en cualquiera de las celdas donde se encuentran los datos, seleccionamos del menú la

opción insertar y posteriormente la opción Tablas dinámicas, (primera opción que aparece en el menú).

Figura 45. Base de datos “Ejemplo tabla contingencia.xlsx6”

Aparecerá el siguiente cuadro:

6 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 39: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 40

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 46. Ingreso de matriz de datos.

Al habernos posicionado en una celda de los datos Excel toma por defecto los datos adyacentes que no

tienen celdas vacías y es lo que muestra marcado con las líneas punteadas y que además aparece como

rango de entrada en el recuadro. Cuando se trabaja con este tipo de tablas la base de datos no puede tener

celdas vacías.

En este recuadro también se solicita que se elija dónde queremos que esté la tabla, aquí seleccionaremos

una celda adyacente a los datos, a veces por orden los más conveniente será una nueva hoja.

Seleccionamos aceptar y se crea automáticamente la tabla dinámica, pero vacía

Page 40: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 41

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 47. Pantalla de campos de tabla dinámica.

Excel muestra a la derecha las opciones de la tabla dinámica, agrega automáticamente los campos que identificó de la base de datos, que son justamente los nombres de los rótulos de cada variables. La tabla dinámica espera que le indiquemos cuales de estos campos incluiremos en ella. Como queremos

construir una tabla bivariada debemos incluir las dos variables, dejando una de ellas asociada a área de las

filas y la otra al área de las columnas.

Seleccionamos entonces ambas variables, por defecto la tabla dinámica las deja automáticamente

asociadas a las columnas, pero sólo dejamos ahí la variable “Nivel de Estudios” y arrastramos la variable

“Sexo”, hacia el área de las filas.

Figura 48. Ingreso de variables en filas y columnas.

Para que aparezcan el conteo de los datos debemos arrastrar nuevamente cualquiera de los dos campos a la

casilla “Valores”, para este ejemplo arrastraremos el campo Sexo.

Page 41: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 42

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 49. Tabla dinámica final.

En esta tabla de doble entrada podemos observar las frecuencias conjuntas absolutas y marginales.

Por ejemplo tenemos que 6 mujeres tienen un nivel de estudios Medio, también del total de las personas 10

son hombres y 10 son mujeres.

Ahora llevaremos esta tabla en términos de probabilidades, que es la tabla de contingencia.

Posicionándonos sobre la tabla dinámica construida, hacemos “click” sobre el botón derecho y elegimos la

opción, “Mostrar valores como” y luego % del total general.

Page 42: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 43

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 50. Modificación de valores en tabla dinámica.

La tabla queda ahora mostrando las frecuencias porcentuales conjuntas y marginales

Figura 51. Valores como porcentajes en tabla dinámica.

Finalmente posicionados nuevamente sobre la tabla, hacemos “click” con el botón derecho del Mouse y elegimos la opción “Formato del número” y luego “número” y dos decimales.

Page 43: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 44

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 52. Modificación de valores a probabilidades.

La tabla queda ahora mostrando las probabilidades de ocurrencia condicionales y marginales.

Figura 53. Valores como probabilidades en tabla dinámica.

Ahora esta tabla de contingencia contiene las probabilidades conjuntas y marginales calculadas a partir de

las frecuencias conjuntas y marginales que teníamos en la tabla bivariada.

Page 44: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 45

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 54. Interpretación de algunos valores en tabla dinámica.

Page 45: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 46

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

5.1 ESQUEMA RESUMEN DE CONSTRUCCIÓN DE TABLA DE CONTINGENCIA

El objetivo de este video es mostrar la forma de construir una tabla de contingencia con la función

Tabla dinámica

Abriremos el archivo “Ejemplo tabla contingencia”, que contiene la base de datos que utilizaremos.

Esta base contiene dos variables que son: “género” y “nivel de estudios” de 20 personas.

1. Ir a la opción “Insertar”, en la parte superior de la planilla Excel que contiene los datos a trabajar.

2. Seleccionar la opción “Tabla dinámica”.

3. Ingresar los datos en la opción “Tabla o rango”.

4. Por defecto las opciones de la tabla dinámica aparecerán en la hoja de trabajo actual, pero es posible indicar que aparezcan en una hoja nueva.

5. Hacer “click” en “Aceptar”

6. En el recuadro “Seleccionar campos para agregar al informe” desplazamos el campo “nivel de

estudio” hasta el recuadro “Etiqueta de fila” y el campo “sexo” hasta el recuadro “Etiqueta de

columna”. Finalmente desplazar cualquiera de los campos hasta el recuadro “Valores”

7. Luego, en el recuadro “valores” hacer “click” sobre la opción por defecto “Suma de

N°caraDado”, y seleccionar la opción “configuración de campo de valores”.

8. Cambiar la opción “Suma” por la opción “Cuenta”.

9. Hacer “click” en “Aceptar”.

Ejemplos de lectura de la tabla: En el estudio participaron 10 hombres y 10 mujeres.

4 individuos tienen un nivel de estudio “Básico”

3 individuos en el estudio son de sexo “masculino” y tiene un nivel de estudio “Medio”

Page 46: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 47

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

6. Probabilidades y Teorema de Bayes El objetivo de este video es estudiar la obtención de probabilidades condicionales y a través del el teorema

de Bayes.

Ya en el video 3, se estudió el cálculo de probabilidades simples, obtenidas las frecuencias marginales de una

tabla de contingencia. Recordemos también que la tabla de contingencia fue construida con una tabla

dinámica.

Rescatando la tabla de contingencia construida en el video 3, ahora la utilizaremos para obtener

probabilidades condicionales y aplicar el teorema de Bayes.

Las variables asociadas son “sexo” y “nivel de estudios” de 20 personas, construiremos el diagrama de árbol

para mostrar las probabilidades conjuntas y condicionales.

Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de

los eventos

Page 47: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 48

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 55. Definición de eventos asociados a las variables de estudio.

Ahora utilizando la herramienta para escribir formulas, escribiremos las probabilidades conjuntas en términos de la intersección de los eventos.

Page 48: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 49

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 56. Opción ingreso de ecuación en planilla Excel.

Entonces:

La probabilidad de que la persona tenga educación básica y sea de género femenino es igual a 0,1

La probabilidad de que la persona tenga educación media sea de género femenino es igual a 0,3

La probabilidad de que la persona tenga educación superior y sea de género femenino es igual a 0,1

De igual forma:

La probabilidad de que la persona tenga educación básica y sea de género masculino es igual a 0,1

La probabilidad de que la persona tenga educación media y sea de género masculino es igual a 0,15

La probabilidad de que la persona tenga educación superior y sea de género masculino es igual a 0,25

Page 49: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 50

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 57. Ingreso de probabilidades con editor de ecuaciones.

Observemos que la suma de todas las probabilidades conjuntas es 1.

Comenzamos ahora a confeccionar el diagrama de árbol para representar las probabilidades condicionales.

Escribimos en una misma columna pero con separación de seis celdas, el recorrido de la variable sexo, es

decir Femenino y Masculino, y en la celda de abajo colocamos las probabilidades totales correspondientes, y

centramos el contenido de las celdas.

Page 50: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 51

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 58. Formato para ingreso de diagrama de árbol.

En la siguiente columna y celda por medio, colocamos los tipos de educación definidos en los eventos, estos

son EB, EM, ES, y los alineamos estos a la derecha.

Figura 59. Ingreso de probabilidades en para árbol de probabilidad.

Page 51: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 52

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Para dibujar las flechas del diagrama de árbol, usando del menú principal la opción “Insertar “y luego

elegimos la opción “formas”, y el icono de la flecha

Figura 60. Ingreso de “ramas” del árbol de probabilidad.

Dibujamos tres flechas para hacer el diagrama.

Figura 61. Árbol de probabilidades.

Page 52: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 53

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Una vez dibujadas las flechas, colocaremos en la columna siguiente, las probabilidades condicionales

asociada a cada evento, debemos recordar que cuando dos eventos son independientes se cumple que la

probabilidad de la intersección de ellos es igual a la multiplicación de las probabilidades de cada evento.

Dejando una columna de separación y nuevamente haciendo uso de la herramienta para escribir

ecuaciones, expresamos y obtenemos las probabilidades condicionales que corresponden a cada rama del

diagrama de árbol según la propiedad vista en clases.

Hacemos “click” en Insertar y luego ecuación, arrastramos el cuadro hasta la celda contigua a la primera

rama del árbol, y escribimos

“La probabilidad de que la persona tenga educación básica dado que es de género femenino es igual a la

probabilidad de que tenga educación básica y sea de género femenino dividido por la probabilidad de que la

persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2”.

Conviene copiar las fórmulas y solo cambiar los eventos correspondientes. Con el botón derecho hacemos

“click” en copiar y luego pegamos frente a la segunda rama del árbol y así sucesivamente.

Ahora modificamos cada formula quedando:

La probabilidad de que la persona tenga educación media dado que es de género femenino es igual a la

probabilidad de que tenga educación media y sea de género femenino dividido por la probabilidad de que la

persona sea de género femenino, esto es 0,3 dividido por 0,5, igual a 0,6

Para la tercera rama:

La probabilidad de que la persona tenga educación superior dado que es de género femenino es igual a la

probabilidad de que tenga educación superior y sea de género femenino dividido por la probabilidad de que

la persona sea de género femenino, esto es 0,1 dividido por 0,5, igual a 0,2

De igual forma para la cuarta rama:

La probabilidad de que la persona tenga educación básica dado que es de género masculino es igual a la

probabilidad de que tenga educación básica y sea de género masculino dividido por la probabilidad de que la

persona sea de género masculino, esto es 0,1 dividido por 0,5, igual a 0,2

Para la quinta rama:

La probabilidad de que la persona tenga educación media dado que es de género masculino es igual a la

probabilidad de que tenga educación media y sea de género masculino dividido por la probabilidad de que la

persona sea de género masculino, esto es 0,15 dividido por 0,5, igual a 0,3

Y para la sexta rama:

La probabilidad de que la persona tenga educación superior dado que es de género masculino es igual a la

probabilidad de que tenga educación superior y sea de género masculino dividido por la probabilidad de que

la persona sea de género masculino, esto es 0,25 dividido por 0,5, igual a 0,5

Page 53: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 54

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 62. Ejemplos de cálculo de probabilidad condicional.

Observemos acá que la suma de las probabilidades condicionales de los niveles de educación dado los

géneros Femenino y Masculino indistintamente, también suman uno.

Entonces podemos decir por ejemplo que:

La probabilidad de que una persona tenga un nivel de educación medio, dado que es de sexo femenino es

de un 60%

La probabilidad de que una persona tenga nivel de educación superior dado que es de sexo masculino es de

un 50%.

Veamos que pasa ahora si queremos responder a la pregunta:

¿Cuál es la probabilidad de que una persona sea mujer sabiendo que su nivel de educación es Básico?

La respuesta nos las da el teorema de Bayes.

Para poder calcular esta probabilidad necesitamos conocer la probabilidad total de tener Educación básica, y

esta es :

Page 54: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 55

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

“P de EB, educación básica, es igual a P de EB inter F(femenino), más P de EB y M(masculino) y esto de

acuerdo a la propiedad de la probabilidad condicional, es igual a “P de F por P de EB dado F”, más “P de M

por P de EB dado F”

Una vez más utilizando la herramienta para escribir ecuaciones, escribiremos la probabilidad que deseamos

obtener

Elegimos insertar, ecuación y arrastramos la ecuación para responder la pregunta

Escribimos, probabilidad de que una persona sea de género femenino, sabiendo que tiene educación básica

es igual, seleccionamos en el menú superior herramientas de ecuaciones y luego fracción, en el numerador

colocamos la probabilidad conjunta “P de F inter EB, educación básica y en el denominador “P de ED,

educación básica”, que es la probabilidad de lo que está dado o conocido.

Y es igual a la probabilidad de que la persona sea de género femenino por la probabilidad de que tenga

estudios básicos sabiendo que es de género femenino, dividido por la probabilidad total de tener estudios

básicos.

Figura 63. Ejemplo de aplicación del teorema de Bayes.

Page 55: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 56

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

6.1 ESQUEMA RESUMEN CON PROBLEMAS DE PROBABILIDADES Y TEOREMA DE BAYES

En este video practicaremos el cálculo de probabilidad y el teorema de Bayes en base a la tabla de

contingencia creada en el video de Tablas de contingencia.

Primero, adaptaremos la tabla de contingencia a una tabla de probabilidades, para esto marcamos el

recuadro de la tabla dinámica y hacemos “click” con el botón derecho. De la lista de opciones

seleccionamos “Mostrar valores como” y elegimos “% del total general”, luego seleccionamos solo el

área de la tabla dinámica donde hay porcentajes y hacemos “click” con el botón derecho,

seleccionamos la opción “Formato de número” y luego elegimos “número” con esto logramos que

nuestra tabla de contingencia ahora sea una tabla de probabilidades.

Resolución de los problemas propuestos:

1. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este tenga un nivel de

estudio Básico?

Esta pregunta es una probabilidad marginal, la obtenemos directamente de la tabla de

probabilidades, específicamente en el total fila del nivel de estudio básico.

2. ¿Cuál es la probabilidad de que al seleccionar un individuo al azar este sea hombre y tenga

nivel de estudio Superior?

Esta pregunta es una probabilidad conjunta, la obtenemos directamente de la tabla de

probabilidades, específicamente en la intersección de “Hombre” y “Superior”.

3. Si se sabe que un individuo seleccionado al azar es mujer. ¿Cuál es la probabilidad de que tenga

un nivel de estudio Medio?

Esta pregunta está condicionada, se sabe que el individuo es mujer y lo que se pregunta es por la

probabilidad que tenga nivel de estudio Medio. Para resolverlo dividimos la probabilidad conjunta

de Mujer y nivel de estudio Medio, entre la probabilidad de que el individuo sea mujer.

Page 56: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 57

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4. Si se sabe que un individuo seleccionado al azar tiene un nivel de estudio Medio,

¿Cuál es la probabilidad que sea Mujer?

Indicación: debe utilizar el resultado de la pregunta anterior

Esta pregunta puede ser resuelta igual que la pregunta anterior, pero utilizaremos el

teorema de Bayes tal como pide la indicación. Por lo que, multiplicaremos la

probabilidad obtenida en la pregunta anterior por la probabilidad de que el individuo sea

mujer, esto nos da la probabilidad conjunta de Mujer y nivel de estudio medio, luego, lo

dividimos por la probabilidad de que el individuo tenga un nivel de estudio Medio

Page 57: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 58

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

6.2 EJERCICIOS PROPUESTOS, TEMA: TABLA DE CONTINGENCIA, PROBABILIDADES Y

TEOREMA DE BAYES

1. Considere la base de datos Favoritos.xlsx7 la cual contiene información sobre 23 personas a las

cuales se les consultó respecto a color y mascota favoritos. Con los datos confecciones una tabla de contingencia utilizando la función Tabla dinámica, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio.

2. Considere la base de datos Favoritos.xlsx la cual contiene información sobre 23 personas a las cuales se les consultó respecto a color y mascota favoritos. Con los datos confeccione una tabla de probabilidades, luego ingrese el documento en el buzón habilitado en la plataforma de laboratorio.

Preguntas independientes en base a los datos Favoritos.xlsx:

3. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color rojo y su mascota preferida sea un perro?

4. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color morado y su mascota preferida sea un hámster?

5. ¿Cuál es la probabilidad que un individuo seleccionado al azar le guste el color negro?

6. ¿Cuál es la probabilidad que un individuo seleccionado al azar su mascota preferida sea un conejo?

7. Si se sabe que a una persona seleccionada al azar le gusta el color amarillo. ¿Cuál es la probabilidad de que su mascota favorita sea un hámster?

8. Si se sabe que a una persona seleccionada al azar le gusta el color azul. ¿Cuál es la probabilidad de que su mascota favorita sea un gato?

9. Si se sabe que una persona seleccionada al azar su animal favorito es un conejo . ¿Cuál es la probabilidad de que su color favorito sea negro?

7 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 58: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 59

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

El caso es el siguiente:

Una Empresa minera adquirió instaló hace una un año una estación de monitoreo para medir la

concentración de material particulado en el aire, esta estación está programada para tomar mediciones

cada 8 hora y en caso de que la medición detecte que los niveles de polución superan los 150 µg/m³

(PM10), la alarma se activará automáticamente.

De sonar la alarma, la empresa debe parar la faena hasta lograr bajar los niveles de polución bajo el nivel

máximo permitido, de lo contrario se venir una inspección en ese momento, la empresa será multada.

Ya con un año de funcionamiento, la empresa minera ha detectado errores en el funcionamiento de la

estación de monitoreo, pero no tiene presupuestado la renovación de esta, por el alto costo de inversión.

Por lo anterior la empresa pide al departamento de prevención de riesgos que de acuerdo a los registros de

las mediciones tomadas por dicha estación en relación al funcionamiento de la alarma en los últimos 6

meses, determine por una parte

1. ¿Cuál es la probabilidad de que la empresa sea multada?

2. ¿Cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?

3. ¿Cuál es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener

alerta ninguna?

4. ¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se

activa la alarma?

La información antes pedida servirá como evidencia para tomar la decisión de quedarse con esta estación de

monitoreo o adquirir otra.

Para dar respuesta a los requerimientos de la gerencia se pueden obtener por una parte, preguntas 1 y 2,

calculando una probabilidad condicional y por otra parte, preguntas 3 y 4, utilizando el teorema de Bayes.

Veamos como:

Abrimos el archivo que contiene la base de datos Monitoreo_polucion.xlsx8

Observamos que tenemos cuatro campos de información, que son, la Fecha, la hora, el nivel de polución y el

registro de si activó o no la alarma.

Para generar la tabla de contingencia no es adecuado usar la variable cuantitativa Nivel de polución dado

que se hará el conteo según categorías y estas no existen, por lo que será conveniente antes categorizarlas.

Recordemos que la empresa tiene establecido como norma, que los niveles de polución P10, no pueden

sobrepasar los 150 µg/m³, entonces de acuerdo a esto categorizaremos.

8 Base de datos disponible en la página web del Departamento de Matemática y Física.

Page 59: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 60

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Para esto utilizaremos la función SI, insertamos una nueva columna adyacente a la que tiene los registros

del Nivel de Polución

Figura 64. Categorización de la variable Nivel de polución.

La nueva variable la llamaremos “Condición del Nivel de Polución”, que tendrá como recorrido P: si el nivel de polución cumple con la norma establecida, <=150 µg/m³

NP: Si el nivel de polución supera la norma establecida, es decir >150 µg/m³

Escribimos el nombre al inicio de la columna

Page 60: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 61

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 65. Ingreso de columna adyacente para la categorización.

Posicionados en la celda B2, insertamos la función lógica SI, esta función permitirá categorizar la variable

numérica, asociando la categoría P o NP, según corresponda

Figura 66. Uso de función lógica =SI().

Page 61: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 62

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

La función SI, requiere de ingresar la prueba lógica, y la asignación que se hará en caso de que la evaluación

sea verdadera o falsa

Figura 67. Ingreso de variable a categorizar.

En nuestro ejemplo la prueba lógica es evaluar si cada dato de la variable nivel de polución cumple con la norma establecida por la empresa, luego escribiremos

Figura 68. Ingreso de valores “Verdadero” y “Falso”.

Page 62: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 63

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Hacemos clic en aceptar y nos queda para la primera celda asociado “P”, permitido cuando la medición fue

127.

Posicionados en la esquina inferior derecha de la celda evaluada, arrastramos el mouse para copiar en el

resto de las celdas

Figura 69. Extensión de función SI al resto de la columna adyacente.

Page 63: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 64

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

La base de datos ahora se presenta

Figura 70. Base de datos luego del ingreso de variable categorizada.

Ya estamos listos para crear la tabla de contingencia que finalmente nos permitirá obtener las

probabilidades condicionales.

En la tabla de contingencia estarán resumidas las frecuencias de las variables

Condición del nivel de polución (Permitido/ No Permitido)

Activación de la alarma ( SI / NO)

Posicionados en la primera celda de nuestra base de datos, insertamos la tabla dinámica, recordemos que

este procedimiento ya fue estudiado en el video 3 , de construcción de tablas de contingencia.

Page 64: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 65

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 71. Confección de tabla dinámica para el problema.

Quedó seleccionado el rango que contempla nuestra base de datos, y le indicamos que la tabla dinámica

quede en la misma hoja donde están los datos, dando como referencia la celda G2

Figura 72. Ingreso de celda para salida de opciones de tabla dinámica.

Page 65: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 66

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Se crea la tabla dinámica

Figura 73. Opciones de tabla dinámica.

Marcamos los campos “Condición del nivel de polución “y “Activación de la Alarma”

Figura 74. Ingreso de variables en fila y columna.

Arrastramos el campo activación de la alarma hacia las columnas y luego para completar la tabla con los

valores resumidos, debemos arrastrar cualquiera de los campos incluidos en la tabla hacia el recuadro

Valores.

Aparece ahora completa la tabla bivariada con las frecuencias conjuntas, marginales y totales.

Page 66: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 67

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 75. Tabla dinámica para el problema.

Ahora a partir de la tabla bivariada generaremos la tabla de contingencia

Posicionados sobre alguna frecuencia conjunta de la tabla bivariada, hacemos “click” con el botón derecho y

elegimos la opción “mostrar valores como” y luego “porcentaje del total general”

Figura 76. Modificación de valores de tabla dinámica.

La tabla se muestra ahora con porcentajes del total, nuevamente hacemos “click” con el boton derecho para

elegir la opción formato número

Page 67: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 68

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 77. Valores de tabla dinámica en porcentajes.

Y luego “número“, dos decimales y ACEPTAR.

Figura 78. Modificación de valores de porcentaje a probabilidades.

Automaticamente aparece la tabla de contingencia.

Page 68: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 69

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 79. Valores de tabla dinámica en probabilidades.

Lo primero que haremos es escribir las probabilidades conjuntas como la probabilidad de la intersección de

los eventos y las probabilidades totales

Nuestros eventos son:

NP: Nivel de Polución no permitido

P : Nivel de Polución Permitido

NO : No se activa la alarma

SI : Se activa la alarma

Probabilidades conjuntas

Probabilidades Totales

P( )

P( ) 81 P( )

( )

( )

( )

( )

( )

Page 69: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 70

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 80. Cálculo de probabilidades conjuntas y marginales (totales).

Antes de calcular las probabilidades pedidas, contruiremos el arbol de las probabilidades condicionales que

nos permitirán aplicar el teorema de bayes.

Partiremos el árbol con la variable “Nivel de Polución”, dado que es natural entender que la alarma sonará

dependiendo del nivel de polución que haya en la faena.

Confeccionamos el árbol, utilizando herramientas de dibujo e insertando las fórmulas correspondientes.

Figura 81. Ingreso de árboles de probabilidad.

Para responder a las pregunta de la gerencia, antes debemos plantear las probabilidades que darán las

respuesta.

Page 70: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 71

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

1. ¿Cuál es la probabilidad de que la empresa sea multada?

Debemos entender que la empresa será multada sólo si los trabajadores siguen trabajando con niveles de

polución no permitidos, y esto ocurrirá si en ese momento no suena la alarma.

Entonces debemos calcular la probabilidad condicional de que no suene la alarma, sabiendo que hay niveles

de polución no permitido.

( ) ( )

( )

Luego existe un 70% de probabilidad de que la empresa sea multada

Contestemos ahora la segunda pregunta:

2. ¿cuál es la probabilidad de la empresa detenga sus faenas sin haber sido necesario?

Para responder a esta pregunta debemos entender que debemos calcular la probabilidad de suene la alarma

sabiendo que los niveles de polución están dentro de las normas permitidas.

( )

( ) ( )

( )

La probabilidad de que la empresa detenga sus faenas sin haber sido necesario es de un 10%

Para completar el árbol con las otras probabilidades condicionales, las calcularemos

( ) ( )

( )

( ) ( )

( )

Page 71: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 72

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 82. Cálculo de probabilidades condicionales.

Respondamos ahora la tercera y cuarta pregunta

3.- ¿Cual es la probabilidad de que los trabajadores estén respirando aire con mucha polución sin tener

alerta ninguna?

( )

Al plantear la probabilidad nos damos cuenta que es a priori, es decir según lo planteado en el diagrama de

árbol, necesitamos saber cuál es la probabilidad de que suene la alarma sabiendo que no ha sonado la

alarma.

Utilizando el teorema de Bayes

( ) ( ) ( )

( ) ( ) ( ) ( )

La probabilidad de que los trabajadores estén respirando un aire con nivel de polución no permitida, sin

que haya sonado la alarma es de un 8%

Page 72: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 73

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 83. Lectura de “ramas” en árbol de probabilidad.

El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información

que tenemos en la tabla de contingencia

( ) ( )

( )

La probabilidad de que los trabajadores estén respirando niveles de polución no permitidos, sabiendo que la

alarma no se ha activado es de un 8%

Finalmente respondemos a la última pregunta:

4.-¿Cuál es la probabilidad de que la medida de parar las faenas esté bien aplicada, después de que se

activa la alarma?

Aquí debemos calcular la probabilidad de que realmente los niveles de polución son altos cuando sabemos

que ha sonado la alarma, es decir

( )

Esta probabilidad según nuestro diagrama de árbol, también es a priori, por lo que debemos aplicar el

teorema de Bayes

( ) ( ) ( )

( ) ( ) ( ) ( )

Page 73: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 74

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 84. Lectura de “ramas” en árbol de probabilidad.

El mismo cálculo nos resulta, aplicando las probabilidad conjunta y marginal, de acuerdo a la información

que tenemos en la tabla de contingencia

( ) ( )

( )

La probabilidad de que los niveles de polución realmente no estén dentro de la norma permitida, sabiendo

que la alarma se ha activado es de un 25%

Conclusión:

De acuerdo a las probabilidades obtenidas, por una parte en relación a la empresa, la alta probabilidad de

ser multados 70%, aun cuando el riesgo tener pérdidas al detener las faenas no siendo necesario sea de un

10%, conjuntamente con un 25% de probabilidad de que los niveles de polución realmente no estén dentro

de la norma permitida, sabiendo que la alarma se ha activado , y , en relación a la seguridad de los

trabajadores, baja probabilidad, un 8% , de tener niveles de polución no permitidos cuando la alarma no se

ha activado, se puede concluir que la sugerencia, para evitar multas y perdidas, considerando que ya

existiendo aunque sea un 1% de riesgo para los trabajadores, la empresa debe tomar la decisión de invertir

en un nuevo instrumento que alerte con precisión sobre los niveles de polución no permitidos.

Page 74: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 75

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7. La opción “Generación de números aleatorios” de la herramienta Análisis de datos

de MS Excel.

Ir a la opción “datos” en la barra superior y seleccionar “Análisis de datos”.

De la ventana de opciones seleccionar “Generación de números aleatorios”

Figura 85. Opción “Generación de números aleatorios”.

Hacer “click” en aceptar.

Descripción del menú de la opción generación de números aleatorios:

Figura 86. Ventana de opciones de Números aleatorios.

1: número de variables: Corresponde a la cantidad de columnas de datos que queremos generar. En este

caso, ingresaremos el valor 1 para así generar una sola columna con datos simulados.

Page 75: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 76

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

2: cantidad de números aleatorios: indica la cantidad de datos por columna que serán simulados. En este

caso ingresaremos 100, es decir, por cada columna de datos ingresada en la parte anterior, aparecerán 100

datos asociados.

3: Distribución: Ofrece un conjunto de distribuciones de probabilidad de uso frecuente en estadística.

Seleccionaremos “Normal” para este ejemplo. Para más detalle sobre el uso de cada distribución disponible

en esta opción, ir al video: “Anexo de distribuciones”

4: Parámetros: Esta opción depende de la distribución seleccionada. Como hemos seleccionado la opción

“Normal” dejaremos los valores por defecto de la opción, es decir, el valor 0 para la media y 1 para la

desviación estándar.

Figura 87. Opción distribución Normal.

5: Iniciar con: Corresponde al valor semilla con el cual se genera la secuencia de números aleatorios, si se ingresa un valor, entonces Excel guardará la misma secuencia de números cada vez que en este campo se ingrese tal número. En este caso, lo dejaremos en blanco.

6: Opciones de salida:

Rango de salida: se debe ingresar una celda donde se desea que se inicie la presentación de los

resultados del análisis. Es una opción útil si se quiere visualizar el resultado de la generación de números

aleatorios en la misma hoja donde se está trabajando.

En una hoja nueva: Corresponde a la opción por defecto, el resultado aparecerá en una hoja nueva

dentro de la misma planilla de Excel.

En un libro nuevo: Los resultado de la simulación de datos aparecerán en un libro nuevo de Excel.

En este caso seleccionaremos la opción “Rango de Salida”, luego, seleccionaremos la celda A1.

Page 76: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 77

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 88. Opción distribución Normal del ejemplo.

Page 77: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 78

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1 “Anexo de distribuciones” de la opción “Generación de números aleatorios” de la

herramienta Análisis de datos de MS Excel.

Revisaremos en esta sección las distintas opciones para generar números aleatorios disponibles en la opción

“Análisis de datos”.

Figura 89. Lista de distribuciones para simular.

La opción “Generación de números aleatorios” permite simular números aleatorios para ocho distribuciones

que se describen a continuación:

Page 78: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 79

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.1 Distribución discreta:

Se generan números aleatorios para un conjunto de valores enteros a los cuales se asocia a priori una

probabilidad de aparición del valor de la variable.

Figura 90. Opción distribución Discreta.

Para utilizar esta opción, se debe tener una tabla de probabilidades “a priori” para una variable aleatoria

discreta.

A modo de ejemplo simularemos el lanzamiento en 100 oportunidades de un dado de seis caras equilibrado.

A esta variable se le asocia en la literatura la distribución Uniforme Discreta.

Construiremos la Tabla de probabilidades a priori relacionada al problema:

X P(X=x)

1 0,16666667

2 0,16666667

3 0,16666667

4 0,16666667

5 0,16666667

6 0,16666667 Tabla 1. Tabla de probabilidad para la aparición de una cara en un dado de 6 caras

Page 79: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 80

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Ingreso de datos en la ventana de opciones:

Figura 91. Ingreso de tabla a “priori” en distribución discreta.

Hacer ““click”” en Aceptar.

Page 80: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 81

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.2 Distribución Uniforme:

Genera números con igual probabilidad en un intervalo de valores predeterminado. Por defecto los

valores aparecen entre 0 y 1, lo cual, es equivalente a la función “=ALEATORIO()”.

Figura 92. Opción distribución Uniforme.

A modo de ejemplo se simularán 100 valores de la distribución Uniforme entre 0 y 1.

Figura 93. Ingreso de valores en opción distribución Uniforme.

Hacer ““click”” en Aceptar.

Page 81: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 82

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.3 Distribución Normal:

Simula números aleatorios de una distribución Normal con media y desviación estándar definidas por el

usuario. Por defecto el programa proporciona una media 0 y desviación estándar 1, la cual, corresponde a

los valores de la distribución Normal Estándar.

Figura 94. Opción distribución Normal.

A modo de ejemplo se simularán 100 valores de la distribución Normal Estándar.

Figura 95. Ingreso de valores en opción distribución Normal.

Hacer ““click”” en Aceptar.

Page 82: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 83

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.4 Distribución de Bernoulli:

Genera números aleatorios correspondientes a la distribución de Bernoulli. Es decir, para un experimento

aleatorio con dos posibles resultados donde el valor 0 indica “fracaso” y 1 “éxito”.

Se debe ingresar la probabilidad de éxito.

Figura 96. Opción distribución de Bernoulli.

A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es decir con Probabilidad = 0,5 donde la variable recibe el valor 0 si se obtiene un “sello” y un 1 si se obtiene “cara”. Es decir, la variable de estudio sería: X: número de veces que se obtiene una cara al lanzar una moneda 1 vez.

Figura 97. Ingreso de valores en opción distribución de Bernoulli.

Page 83: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 84

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar una moneda honesta. Hacer ““click”” en Aceptar.

7.1.5 Distribución Binomial:

Genera números aleatorios correspondientes a una distribución Binomial. Es decir, para N experimentos

de Bernoulli independientes, con probabilidad de éxito “p”.

Figura 98. Opción distribución Binomial

A modo de ejemplo se simularán 100 valores correspondientes al lanzamiento de una moneda honesta, es

decir probabilidad=0,5 en 5 ocasiones, donde los valores representan el número de caras obtenidas en los 5

lanzamientos.

Figura 99. Ingreso de valores en opción distribución Binomial.

Page 84: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 85

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Ingresar en la opción “probabilidad” el valor 0,5. El cuál indica la probabilidad de obtener una cara al lanzar una moneda honesta. En la opción “Número de muestras” ingresar el valor 5, el cual indica la cantidad de veces que se lanza la

moneda, es decir, el número de experimentos de Bernoulli independientes.

Hacer ““click”” en Aceptar.

Page 85: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 86

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.6 Distribución Poisson:

Genera números aleatorios correspondientes a la distribución de Poisson para un valor esperado de la

variable denominada Lambda.

Figura 100. Opción distribución de Poisson.

A modo de ejemplo, se simularan 100 valores correspondientes a una distribución de Poisson con valor

esperado de la variable igual a 2. Esta simulación podría representar, por ejemplo, a una variable aleatoria X:

número de hermanos que tiene un alumno del curso de Estadística.

Figura 101. Ingreso de valores en opción distribución de Poisson.

En la opción “Lambda” ingresar el valor 2, el cual indica el valor esperado de hermanos que tiene un alumno

del curso de Estadística.

Hacer ““click”” en Aceptar.

Page 86: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 87

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

7.1.7 Frecuencia Relativa:

Genera una secuencia predeterminada de valores en un incremento y repeticiones definidas por el

usuario.

Figura 102. Opción frecuecia relativa.

A modo de ejemplo, se simulará una serie de valores entre 1 y 4, con incrementos de 1 unidad donde el

número será repetido dos veces y la secuencia en 3 ocasiones.

Figura 103. Ingreso de valores en opción frecuencia relativa.

Detalle de la función Frecuencia Relativa:

Parámetros: indica el rango de valores a generar

Page 87: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 88

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

De: es el mínimo de los valores a generar A: es el máximo valor a generar Incremento: indica la cantidad a incrementar luego de generar el mínimo En este caso se define De: 1 a 4 , incremento 1, es decir, se generarán números del 1 al 4, de 1 en 1. Repitiendo cada número: indica la cantidad de veces que se repetirá un número antes de pasar al siguiente. En este caso ingresamos el valor 2. Repitiendo la secuencia: indica la cantidad de veces que se repite la secuencia de valores, es decir, números de 1 a 4, con incremento 1, repetidos 2 veces. En este caso ingresamos el valor 3. Hacer ““click”” en Aceptar.

Observación: En este ejemplo se han simulado tres secuencias de números del 1 al 4 con incremento 1 y repetición 2 veces para cada número. Con un cálculo simple notamos que la cantidad de números a generar serán 24, por lo que no coincidirá con los 100 valores ingresados en la opción “cantidad de números aleatorios”, o sea, si los parámetros ingresados generan una secuencia superior a la “cantidad de números aleatorios” predefinida, la secuencia finalizará en este valor.

Page 88: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 89

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

8. Distribuciones de probabilidad Discreta

En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad en variables

aleatorias discretas.

A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono .

Figura 104. Opción “Insertar función”.

Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran

disponibles las funciones asociadas al tema a tratar.

Figura 105. Función “Estadísticas”.

Otra opción es ingresar directamente la función asociada.

Page 89: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 90

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad discreta.

Si usted desea replicar estos cálculos, descargue la planilla “Video 6-Ejercicios de variable discreta”.

8.1. Probabilidad con distribución Binomial.

Figura 106. Opción probabilidad con distribución Binomial.

Ejemplos:

Figura 107. Ejemplo cálculo Binomial exacta.

Para resolver este problema, realice los siguientes pasos:

1. Seleccionamos la opción asociada a la distribución Binomial

2. Ingresamos el número de éxitos

3. Ingresamos el número de ensayos totales

4. Luego, la probabilidad de éxito asociada al problema

5. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada

sea exacta.

Figura 108. Ejemplo cálculo Binomial acumulada.

1. Seleccionamos la opción asociada a la distribución Binomial

2. Ingresamos el número de éxitos

3. Ingresamos el número de ensayos totales

Page 90: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 91

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

4. Luego, la probabilidad de éxito asociada al problema

5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad

entregada, sea la acumulada hasta el valor ingresado

8.2. Probabilidad con distribución Binomial Inversa.

Figura 109. Opción cálculo inversa de probabilidad Binomial.

Figura 110. Ejemplo cálculo inversa de probabilidad Binomial.

1. Seleccionamos la opción asociada a la distribución Binomial Inversa

2. Ingresamos el número de ensayos totales

3. Luego, la probabilidad de éxito asociada al problema

4. Finalmente ingresamos la probabilidad acumulada del problema

8.3. Probabilidad con distribución Hipergeométrica.

Figura 111. Opción probabilidad con distribución Hipergeométrica.

Page 91: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 92

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 112. Ejemplo cálculo de probabilidad Hipergeométrica exacta.

1. Seleccionamos la opción asociada a la distribución Hipergeométrica

2. Ingresamos el número de éxitos

3. Ingresamos el número de extracciones sin reposición

4. Ingresamos el tamaño de la población de éxitos

5. Luego, el tamaño de la población total, es decir, la suma de fichas azules y rojas

6. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada

sea exacta.

8.4. Probabilidad con Distribución de Poisson.

Figura 113. Opción probabilidad con distribución de Poisson.

Figura 114. Ejemplo cálculo de probabilidad Poisson exacta.

1. Seleccionamos la opción asociada a la distribución de Poisson

2. Ingresamos el número de éxitos

3. Ingresamos el valor promedio asociado a la variable de estudio

4. Finalmente escribimos la palabra FALSO, la cual indica que deseamos que la probabilidad entregada

sea exacta.

Page 92: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 93

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 115. Ejemplo cálculo de probabilidad Poisson acumulada.

1. Seleccionamos la opción asociada a la distribución de Poisson

2. Ingresamos el número de éxitos

3. Ingresamos el valor promedio asociado a la variable de estudio

4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad

entregada sea la acumulada hasta el valor especificado.

Page 93: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 94

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

8.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA

DISCRETA

1. ¿Cuál es la probabilidad de obtener 3 caras al lanzar una moneda 5 veces?

2. ¿Cuál es la probabilidad de obtener a lo más 3 caras al lanzar una moneda 5 veces?

3. En 7 lanzamientos, ¿Cuál es el número más grande de caras que se puede esperar, con una probabilidad de 0.98?

4. Genera 100 observaciones provenientes de una distribución binomial con probabilidad de éxito 0.4 y n=7.

5. Si X es binomial con probabilidad de éxito 0.4 y n=7. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)?

6. Si X es binomial con probabilidad de éxito 0.9 y n=6. ¿Cuál es la probabilidad de que X sea 4. Es decir P(X = 4) ?

7. ¿Qué valor tiene una distribución de Poisson con varianza 6, cuya probabilidad acumulada es 0.92?

8. Genere 100 observaciones provenientes de una distribución de Poisson de parámetro lambda = 6.

9. Calcule la probabilidad de que una variable que tiene distribución Hipergeométrica de parámetros N=9 r=4 y n=3 sea igual a 2.

10. Genere 100 observaciones provenientes de una distribución Poisson con probabilidad de éxito 0.9.

11. Si X es Poisson con media 6. ¿Cuál es la probabilidad de que X sea a lo más 4. Es decir P(X ≤ 4)?

12. Sea X Hipergeométrica(N=20,r=7,n=8). ¿Cuál es la probabilidad de que X sea a lo más 4, es decir, P(X ≤ 4)?

Page 94: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 95

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

9. Distribuciones de probabilidad Continua

En esta sección analizaremos algunas opciones disponibles para el cálculo de probabilidad para variables

aleatorias continuas.

A las funciones asociadas a estos cálculos se puede acceder haciendo ““click”” en el ícono .

Figura 116. Opción “Insertar función”.

Luego , en la opción “O seleccionar una categoría” elegir “Estadísticas”. En este menú se encuentran

disponibles las funciones asociadas al tema a tratar.

Figura 117. Función “Estadísticas”.

Page 95: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 96

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Realizaremos ahora una serie de problemas que involucra el cálculo de probabilidad continua.

Si usted desea replicar estos cálculos, descargue la planilla “Video 7-Ejercicios de variable continua”.

9.1. Probabilidad con distribución Exponencial.

Figura 118. Opción Probabilidad con distribución Exponencial.

Figura 119. Ejemplo cálculo de probabilidad Exponencial acumulada.

1. Seleccionamos la opción asociada a la distribución Exponencial.

2. Ingresamos el valor de la variable.

3. Ingresamos el valor del parámetro asociado a la variable de estudio.

4. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad

entregada sea la acumulada hasta el valor especificado.

Nota: Si se ingresa la opción “FALSO” solo entregará la imagen del valor de la variable en la función de

densidad exponencial, esto, no es una probabilidad.

Page 96: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 97

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

9.2. Probabilidad con distribución Normal.

Figura 120. Opción Probabilidad con distribución Normal.

Figura 121. Ejemplo cálculo de probabilidad Exponencial acumulada.

1. Seleccionamos la opción asociada a la distribución Normal

2. Ingresamos el valor de la variable

3. Ingresamos el valor de la media

4. Ingresamos el valor de la desviación estándar

5. Finalmente escribimos la palabra VERDADERO, la cual indica que deseamos que la probabilidad

entregada sea la acumulada hasta el valor especificado.

9.3. Distribución Normal Inversa.

Figura 122. Opción distribución Normal Inversa.

Page 97: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 98

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 123. Ejemplo uso de función Normal Inversa.

1. Seleccionamos la opción asociada a la distribución Normal Inversa.

2. Ingresamos el valor del percentil, es decir, la probabilidad que acumula bajo él, el valor del

contenido del envase de leche desconocido.

3. Ingresamos el valor de la media.

4. Ingresamos el valor de la desviación estándar.

Page 98: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 99

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

9.1 EJERCICIOS PROPUESTOS, TEMA: NÚMEROS ALEATORIOS Y VARIABLE ALEATORIA

CONTINUA

1. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la probabilidad de que tal variable sea al menos 3,8.

2. Si X es una variable aleatoria con distribución Normal de media 3 y varianza 5. Determine la probabilidad de que tal variable sea a lo más 4.

3. Sea X una variable aleatoria con distribución Normal de media 100 y desviación estándar 50. Simule 1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos.

4. Si X es una variable aleatoria con distribución Uniforme, donde 0<x<2. Determine la probabilidad de que tal variable tome valores entre 1 y 1,5.

5. Sea X una distribución Uniforme entre 0 y 1. Simule 1000 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos.

6. Sea X una distribución Uniforme entre 0 y 1. Determine la probabilidad de que tal variable tome valores entre 0,2 y 0,3.

7. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 0,2. Simule 10 observaciones aleatorias desde X, calcula su promedio y varianza. Compara con los resultados teóricos. Luego repita lo mismo para 100 y 1000 simulaciones.

8. Sea X una variable aleatoria con distribución Exponencial con valor esperado igual a 1. Determine la probabilidad de que la variable aleatoria tome valores de al menos 0,5.

9. Sea X una variable aleatoria con distribución Exponencial con valor Varianza igual a 1/25. Determine la probabilidad de que la variable aleatoria tome valores de al menos 5.

Page 99: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 100

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

10. Tablas bivariadas continuas y cálculo de probabilidades

El objetivo de este video es mostrar la construcción de tablas bivariadas utilizando la herramienta de Excel,

tablas dinámicas.

En nuestro ejemplo tenemos la fluctuación del dólar y el euro en un mismo mes, las variables con las que

trabajaremos son continuas y el interés será poder ver las frecuencias conjuntas en intervalos del mes.

Construiremos una tabla bivariada con 4 intervalos, entonces las frecuencias conjuntas resumidas en la

tabla mostrará la cantidad de días en que las monedas en conjunto tienen según su valor.

Lo primero que haremos es abrir el archivo “datos tabla bivariada”, hacemos ““click”” en “abrir”, archivo

Ahora que tenemos los datos, observamos que son 20 datos correspondientes a las variaciones de dólar y

euro en 20 días del mes de diciembre de 2014.

Posesionándonos en la primera celda de los datos hacemos ““click”” en insertar, tabla dinámica, tal como lo

hemos hecho en el video 3 referido a tablas bivariadas para variables cualitativas.

La primera columna corresponde al día del mes en que ocurrió la variación, este dato no es variable en

estudio, por lo que modificaremos el rango de entrada, incluyendo solo las columnas donde están los

valores del dólar y el euro.

La tabla la dejaremos en la misma hoja donde están los datos, para esto indicaremos en el rango de salida la

celda F1, y aceptamos.

Page 100: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 101

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 124. Ventana de opciones tabla dinámica.

Tenemos ahora la tabla dinámica, debemos indicarle los campos o variables que se incluirán, para este

ejemplo serán ambas variables.

Arrastramos el campo dólar hacia la casilla de las filas y el campo euros hacia la casilla de las columnas.

Page 101: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 102

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 125. Ingreso de variables fila y columna.

Observamos que la presentación de la tabla no es adecuada, dado que por ser variables continuas los datos

en su mayoría son distintos.

Lo que haremos será construir intervalos para ambos recorridos a modo de poder tener una mejor

presentación y resumen de las frecuencias conjuntas y marginales.

El número de intervalos se puede determinar por una formula conocida o bien según el objetivo del estudio.

En este caso será de interés visualizar el comportamiento de la variación de las monedas en cuatro niveles

de sus valores, entonces tendremos las frecuencias conjuntas resumidas en cuatro intervalos para ambas

variables.

Necesitaremos obtener los valores extremos y el rango, antes de construir los intervalos.

Para esto nos ubicaremos en las celdas por debajo de los datos, usted puede colocarlas donde desee o sea

más conveniente.

Colocaremos las fórmulas que permiten obtener el máximo, mínimo, rango y amplitud de lo s intervalos.

En la columna A a partir de la fila 23, escribiremos Máximo, Mínimo, Rango y amplitud.

Page 102: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 103

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 126. Elementos para cálculo de amplitud de “dólar” y “euro”.

En la celda B23, escribimos la fórmula igual MAX, paréntesis y marcamos el rango de los datos, en este caso

de la “variación del dólar”, ENTER

Figura 127. Cálculo de máximo.

Page 103: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 104

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

En celda B24, escribimos la formula igual MIN, paréntesis el rango de los datos, cierre de paréntesis

Figura 128. Cálculo de mínimo.

En celda B25, escribimos la fórmula para obtener el Rango, igual B23 menos B24, ENTER

Page 104: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 105

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 129. Cálculo de Rango.

Finalmente escribimos la fórmula para obtener la amplitud de los intervalos, es igual B25 dividido por 4,

ENTER

Page 105: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 106

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 130. Cálculo de amplitud.

Ahora copiamos estas mismas fórmulas para obtener máximo, mínimo, rango y amplitud de los intervalos,

para la variable “variación del euro”. Marcamos las celdas B23 a B26 y ubicando la cruz negra en la esquina

inferior derecha, arrastramos hacia las celdas C23 a C26, ENTER

Page 106: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 107

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 131. Ampliación de cálculo a variable “euro”.

Ahora que ya conocemos la amplitud de los intervalos de ambas variables, volveremos a la tabla dinámica

para generar los intervalos que resumirán las frecuencias conjuntas.

Primero nos posesionamos sobre cualquier valor de variación del dólar, con el botón derecho elegimos

agrupar

Page 107: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 108

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 132. Modificación de columna “dólar”.

Luego aparece un recuadro que muestra el máximo, el mínimo y pide que ingresemos la amplitud de los

intervalos, fijarse que son los mismos valores de máximo y mínimo que ya habíamos obtenido, en “POR”,

colocaremos la amplitud 3,99, y ACEPTAR

Figura 133. Ventana de modificación de columna “dólar”.

Page 108: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 109

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Automáticamente genera cuatro intervalos para la variable “variación del dólar”

Figura 134. Variable “dólar” modificada a intervalos.

Los mismos pasos haremos para la variable “variación del euro”

Figura 135. Ventana de modificación de columna “euro”.

La tabla ahora queda

Page 109: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 110

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 136. Variable “euro” modificada a intervalos.

Para finalizar solo basta arrastrar cualquiera de los campos a la casilla valores, esto hará que la tabla

entregue las frecuencias conjuntas que deseamos tener

Figura 137. Ingreso de variable a campo de valores.

Ahora podemos interpretar algunas frecuencias en ellas:

Page 110: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 111

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

Figura 138. Valores seleccionados para ejemplificar uso de tabla.

En cuatro de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron ambas en su

valor más bajo.

De igual forma, en tres de los 20 días del mes en que hubo variación de ambas monedas, estas estuvieron

ambas en su valor más alto.

Page 111: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 112

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

10.1 ESQUEMA RESUMEN TABLA BIVARIADA PARA DATOS CONTINUOS

Analizaremos la construcción de una tabla bivariada para el caso donde las variables de origen

son de naturaleza continua. Si una variable de estudio es continua, esta debe ser segmentada en

intervalos.

Previo a la construcción de la tabla como tal, se debe realizar el cálculo de la amplitud de los

intervalos que se utilizarán para la representación de la tabla bivariada. Debemos recordar que la

amplitud de un intervalo se determina dividiendo el rango de la variable por la cantidad de

intervalos que deseamos. Para nuestro ejemplo calcularemos 4 intervalos para cada variable.

Ahora, realizamos los mismos pasos que para una tabla bivariada discreta, es decir:

1. En el menú seleccionamos “Insertar”

2. Seleccionamos “Tabla Dinámica”

3. Ingresamos los datos en “Tabla o rango”

4. Desplazamos el campo “dólar” a la “etiqueta de filas”

5. Desplazamos el campo “euro” a la “etiqueta de columna”

6. Desplazamos cualquiera de los campos a “Valores”

7. Seleccionamos la opción “cuenta” en la “Configuración de campo de valor”

Como se observa la tabla hasta ahora construida no es muy estética, para mejorarla se hará el

ingreso de los intervalos para las variables continuas.

8. Hacer “click” con el botón derecho sobre un valor de la fila “dólar”

9. Seleccionar la opción “Agrupar”

10. En la opción “por” ingresar el valor de la amplitud del dólar

11. Repetir los mismos pasos para la columna “euro”

Page 112: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 113

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

10.2 EJERCICIOS PROPUESTOS, TEMA: TABLA BIVARIADA CONTINUA

1. Utilice la base de datos “PruebaEst.xls9” para confeccionar una tabla de frecuencias bivariada. Esta

base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en años) y Prueba (Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos básicos de estadística. Se pide ingresar en el buzón de la plataforma de laboratorio la tabla bivariada para las variables Edad y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables continuas.

2. Utilice la base de datos “PruebaEst.xls” para confeccionar una tabla de frecuencias bivariada. Esta base de datos contiene tres variables: Sexo (H: hombre, M: mujer), Edad (en años) y Prueba (Puntaje obtenido) de un grupo de personas que rindieron una prueba de conocimientos básicos de estadística. Se pide ingresar en el buzón de la plataforma de laboratorio la tabla bivariada para las variables Sexo y Prueba. Nota: usted debe determinar la cantidad de cortes sobre las variables continuas.

3. Utilice la base de datos “Examenes.xlsx10

” la cual contiene información sobre el número de preguntas que se realizaron en 17 exámenes de distintas disciplinas y la cantidad de alumnos que rindieron el respectivo examen en cierta universidad. Se pide ingresar en el buzón de la plataforma de laboratorio la tabla bivariada para tales variables. Nota: usted debe determinar la cantidad de cortes sobre las variables continuas.

4. Utilice la base de datos “SalarioUSA.xls11

” la cual contiene las siguientes variables: SEXO (0: hombre, 1:mujer), SALARIO HORA (dólares por hora de trabajo), EDAD (en años) e HIJOS (número de hijos del encuestado). Confecciones una tabla bivariada para las variables SALARIO HORA y EDAD. Esta tabla debe ser ingresada en el buzón habilitado en la plataforma de laboratorio. Nota: usted debe determinar la cantidad de cortes sobre las variables continuas.

5. Utilice la base de datos “SalarioUSA.xls” la cual contiene las siguientes variables: SEXO (0: hombre, 1:mujer), SALARIO HORA (dólares por hora de trabajo), EDAD (en años) e HIJOS (número de hijos del encuestado). Confecciones una tabla bivariada para las variables SEXO y SALARIO HORA. Esta tabla debe ser ingresada en el buzón habilitado en la plataforma de laboratorio. Nota: usted debe determinar la cantidad de cortes sobre las variables continuas.

9 Base de datos “PruebaEst.xls” disponible en la página web del Departamento de Matemática y Física. 10 Base de datos “Examenes.xlsx” disponible en la página web del Departamento de Matemática y Física. 11 Base de datos “SalarioUSA.xls” disponible en la página web del Departamento de Matemática y Física.

Page 113: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 114

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

CONCLUSIÓN

El análisis de datos es una habilidad fundamental que cualquier ingeniero debe dominar. La herramienta

análisis de datos presenta una solución eficaz y de fácil manejo para tratar un conjunto de datos dado. La

tabulación de datos (tema 2 del apunte) es el punto inicial en la presentación de un informe pues resume en

forma estética los datos, el resumen descriptivo (tal como se trato en el tema 3) es de gran relevancia pues

permite dar una primera mirada al comportamiento de los datos, cabe notar que Excel en esta opción

(Estadística Descriptiva) no proporciona medidas de posición por lo que, el alumno debe internalizar en la

obtención de tales medidas. El análisis gráfico aquí presentado en la forma del Histograma es uno de los

tantos tipos de presentación gráfica que se pueden realizar. Se recomienda al alumno internalizar en la

opciones de gráfico en Excel disponible en el menú superior, específicamente en la opción “Insertar”). El

cruce de variables también es un complemento importante en una investigación, buscar relaciones entre

variable de naturaleza cualitativa y/o cuantitativa podría denotar comportamientos no observados a simple

vista en los resúmenes individuales de información, por ello se presentó en el tema 5 (caso cualitativo) y

tema 10 (caso cuantitativo) la función “Tabla dinámica”. Se recomienda al alumno internalizar en el uso de

tablas bivariadas, por ejemplo, para un alumno de Ingeniería comercial podría interesarle la aplicación en

Carteras de Inversión y a un alumno de otras ingenierías los test Estadísticos asociados a la independencia de

variables u homogeneidad de ésta (Test Chi-cuadrado).

Los temas relacionados a variables discretas y continua, además de los métodos de simulación son el punto

inicial de las teorías que se desarrollan es cursos de Investigación de Mercados, Econometría y Simulación. El

alumno debe interiorizar el uso de distribuciones de probabilidad discreta y continua, ya que, muchos

fenómenos están relacionados con estos en otras ciencias. En este Apunte sólo se muestran las

distribuciones que son de uso habitual en cursos de Estadística, por lo que, se recomienda investigar sobre

otras distribuciones de probabilidad (ejemplo: Distribución Geométrica, Binomial Negativa, Gamma, Beta,

Triangular, ente otras) y la relación con las tratadas en este apunte que son las que dispone Excel en la

opción “Generación de números aleatorios”.

Finalmente se espera que este apunte sea el pie para el desarrollo de habilidades computacionales y

estadísticas en los futuros ingenieros de la Universidad Bernardo O’Higgins. También, que desarrolle interés

por temas de estadística avanzada y sea motivación para internalizar temas de inferencia estadística los

cuales se tratan en el curso de Estadística II.

Page 114: apunte: herramientas de excel para estadística

HERRAMIENTAS DE EXCEL PARA ESTADÍSTICA 115

Vicerrectoría Académica Facultad de Ingeniería y Administración Departamento de Matemática y Física

BIBLIOGRAFÍA

Jay L. Devore. (2001). Probabilidad y Estadística para Ingeniería y Ciencias. México: Thomson Learning.

Richard I. Levine y David S. Rubin. (2010). Estadística para la Administración. México: Pearson.

Robert Johnson y Patricia Kuby. (2004). Estadística elemental, Lo esencial. México: Thomson.

Ronald E. Walpole, et al. (2007). Probabilidad y Estadística para ingeniería y ciencias. México: Pearson Prentice Hall.

Paul Newbold, Williams L. Carlson y Betty Thorne. (2008). Estadística para administración y economía. España: Pearson Prentice Hall.