conceptos basicos a 37666 completo
TRANSCRIPT
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 1/49
Conceptos básicos deestadística
Autor: Mario Blacutt Mendoza
1
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 2/49
Presentación del curso
Este es un curso de estadística básica está dirigido principalmente a la
aplicación por profesionales, estudiantes y hombres de negocios. Particularmente,
para administradores, economistas, psicólogos, sociólogos y, en general, para todas
las personas que deseen contar con un instrumento ágil y oportuno para usar einterpretar datos.
En este primer curso aprenderemos conceptos relacionados con la variable y
la escala de medida. A continuación profundizaremos en los conceptos relativos a
la recolección de datos, tales como la muestra las encuestas, etc.
Seguidamente analizaremos las diferentes medidas de tendencia central,
como son la mediana aritmética, la mediana aritmética ponderada, la media
geométrica, la mediana y las varianzas, entre otras. Es importante conocer estasmedidas ya que nos aportarán datos muy valiosos a la hora de analizar los
resultados de una encuesta.
Finalmente atenderemos la distribución de frecuencias y las gráficas que nos
van a permitir transmitir de una manera muy visual y atractiva las conclusiones
extraídas de los datos estadísticos. También haremos una pincelada a la
probabilidad.
2
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 3/49
1. Conceptos fundamentales de estadística
Variable
Una variable es una magnitud que varía pero, en todo caso, que puede ser
medida, manipulada, controlada o simplemente tomada en cuenta tal como está.
Las variables pueden estar relacionadas con otras variables y cambiar de
acuerdo con la modificación de alguna; desde esta óptica, las variables se
clasificarán en dependientes e independientes.
Una variable será considerada dependiente, en el marco de un estudio
concreto si su magnitud cambia debido a los cambios de otra u otras variables.
Por ejemplo, el consumo es una variable que está relacionada al ingreso; si el
ingreso aumenta, el consumo de un bien determinado también aumentará, aunqueno se puede saber, a priori, en cuánto.
En este caso, dentro del marco del estudio concreto que estamos realizando,
el Ingreso sería la variable independiente, pues cambia sin estar ligado a otra, se
reitera, para los efectos del análisis concreto.
Las variables independientes pueden ser manipuladas por el diseñador de un
estudio estadístico para ver reaccionaría la variable dependiente en la realidad,
cuando se produzcan variaciones en el Ingreso.
Escalas de medida
Las variables se dividen en tres grandes grupos: Cuantitativas, Categóricas y
de Intervalo.
Variables cuantitativas son las que conocemos como variables numéricas; son
este tipo de variables las que generalmente se usa en los estudios estadísticos, pues
son las que varían en su magnitud.
Variables categóricas , son las que conocemos como variables cualitativas;
ahora bien, las variables categóricas se dividen en dos grandes ramas: las variables
nominales y las variables ordinales.
Variables nominales son aquéllas que no pueden ser clasificadas ni en una
magnitud cuantitativa ni en una magnitud de jerarquía; por ejemplo, las categorías
3
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 4/49
de género; varón, mujer , son variables de tipo nominal.
Variables ordinales , son las que aceptan una jerarquización de importancia; el
ingreso familiar, por ejemplo, es una variable nominal, puesto que puede ser
calificado de acuerdo a un orden, v.g, descendente.
Variables de intervalo , son las que nos permiten expandir un tanto el radio de
las variables numéricas; por ejemplo, el promedio del ingreso semanal de un grupo
de estudiantes puede encontrarse entre $30 y 32.
Relación de las variables
Desde el punto de vista de la relación, hay tres clases de variables.
Variables dependientes : son las que cambian debido a que otra variable o
variables también han cambiado.
Variables Independientes , son las que cambian sin depender del cambio de
otras.
Una de las principales tareas del estadístico en este campo es establecer
cuáles serán las variables independientes y cuáles las dependientes en el análisis
concreto que debe realizar.
En otros capítulos más avanzados veremos que una variable X puede cambiar
de magnitud si cambia una variable Y; el mismo tiempo, ésta cambia cuando cambia
la primera.
Variables neutras son las que no están relacionadas con ninguna otra.
Hay dos requerimientos sobre las variables: que obedezcan a una teoría pre
establecida o a una hipótesis racional, lógico y que el grado de relación entre ellas
sea suficientemente sólido.
Por ejemplo, puede suceder que los precios en España cambien en relación
directa con los nacimientos en Corea; esta aparente relación no es aceptable, puesto
que no hay ninguna teoría científica que la avale.
La relación entre el consumo y el ingreso es una relación que proviene de una
teoría. Una vez que aceptamos teóricamente la relación entre dos variables, toca
establecer cuándo esa relación es sólida; para ello se cuenta con un estadístico
4
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 5/49
denominado valor p .
El valor p
Estima la significancia estadística de una relación al mostrarnos que las
relaciones observadas pueden deberse al azar o a la existencia de una verdadera
relación entre las variables que estamos estudiando.
El valor p nos cuantifica la probabilidad de que estemos cometiendo un error
al interpretar una relación; esta cuantificación está directamente relacionada con el
grado de confianza que deseamos de los resultados.
Como se verá después, por lo general decimos que aceptamos un error del
5% en el grado de relación de las variables; el valor p será el que determine si los
resultados están o no dentro de ese margen de error.
El 5%, que escribimos 0.05 nos dice que de 100 casos corremos el riesgo deque tomemos por ciertos 5 casos que son errados; el concepto del valor p se
asentará a medida que los vayamos usando.
Todos estos datos son computados por el SPSS; pero podemos adelantar que
mientras más numerosa es la muestra en la que trabajamos más explícita se hará la
relación o neutralidad de las variables.
En la anterior afirmación también estamos adelantando algo que luego será
analizado con mayor detalle: los estudios estadísticos se basan, en la gran mayoría
de los casos en muestras tomadas de alguna población.
También nos enteraremos, en el capítulo relativo a la Muestra, que los
elementos de una población, de la que extraemos la muestra, están distribuidos de
diferentes maneras, pero que habrá una que nos interesará.
Esa distribución se llama Distribución Normal, y es la que se apega más a la
forma en que los sucesos se distribuyen en la realidad que deseamos analizar.
Por otra parte, la Estadística en general se divide en Estadística Descriptiva eInferencia Estadística.
La Estadística Descriptiva usa gráficas, tablas y diagramas para conocer las
características más importantes de los datos con los cuales debemos trabajar; es
con el estudio de esta rama que empezamos este curso.
5
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 6/49
Esta parte de la Estadística nos ilustra sobre las medidas denominadas de
tendencia central, tales como la media aritmética, la mediana, la moda; muy pronto
nos haremos expertos en estos y otros temas.
También se ocupa de mostrar las medidas de dispersión: la varianza, la
desviación típica, las diferentes distribuciones de cada conjunto de datos.
Seguiremos con lo concerniente al muestreo y, finalmente, terminaremos este
primer curso test de hipótesis material para el que se reserva la Inferencia Estadística.
La metodología
La parte teórica del curso se limitará a ofrecer los conceptos y exponer
algunos ejemplos muy sencillos para mostrar lo que hará la computadora por
nosotros, cuando le pidamos resultados sobre el análisis de datos.
Por esa razón, este curso de Estadística Aplicada I, incluirá también laenseñanza del uso del programa de estadística SPSS, versión 19; en realidad,
estaremos aprendiendo un par de materias al mismo tiempo.
En virtud de que se trata de un curso de Estadística Aplicada orientado a
resolver los problemas prácticos que se presentan todos los días, no habrá
demostraciones matemáticas; la operatividad la realiza el SPSS.
6
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 7/49
2. La Recolección de datos
Datos, son la materia prima de las operaciones a la Estadística.
Información, pero los datos por sí solos nada nos dicen; para que sean útiles
al objetivo propuesto es preciso que los agrupemos y sistematicemos de la manera
adecuada; es decir, que los convirtamos en información.
Las fuentes de datos pueden provenir de registros que tienen otras
instituciones; también de la recopilación directa que realizamos; en este último
caso, uno de los medios más conocidos es la encuesta.
Los datos que recopilamos y sistematizamos, sobre la base de métodos ya
conocidos, nos permiten hacer suposiciones sobre las causas y los efectos de los
fenómenos que observamos en la realidad.
Por otra parte, nos sirven para establecer tendencias sobre los
comportamientos de las personas, objetos y fenómenos, tendencias que son muy
útiles, pues sus resultados nos orientan para obrar adecuadamente.
Una investigación sobre las preferencias por nuestros productos y la
competencia que se debe enfrentar debe acudir a las técnicas estadísticas para
lograr ese conocimiento y aplicar las políticas necesarias.
El concepto de Población
En la disciplina estadística, la Población es el total de los elementos
potencialmente observables; v.g. el número de familias tienen un ingreso que les
permite satisfacer sus necesidades básicas.
Con el objeto de lograr esos datos exactos, es posible que se formule el
programa para realizar un censo nacional de todos los habitantes que hay en la
nación, en todos y cada una de las regiones que lo componen
En la disciplina estadística muy raras veces se usa la Población, pues es muy
difícil llegar a ella; además, es cara; más bien, se usa lo que se llama la Muestra.
La Muestra
Es una parte, proporcionalmente pequeña de la Población, la que, utilizando
las técnicas que aprenderemos en este curso, representa todas las características de
7
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 8/49
la Población.
Hay varias maneras de lograr los datos que necesitamos en una muestra;
nosotros usaremos la encuesta.
La encuesta , es la recopilación sistematizada de datos que luego
transformaremos en información útil.
Una aclaración: en vez de enseñar primero el manejo del SPSS y luego
empezar con los temas del curso, más bien iremos aprendiendo ambos sobre la
marcha; esto es,Aprenderemos haciendo.
Elaboración de la hoja de encuesta en SPSS
Supongamos que el gerente de la empresa quiere averiguar nuestros
conocimientos en la elaboración de hojas de encuesta, utilizando métodos
computarizados, por medio de una prueba “a la vista”
Supongamos que nos deja a libre arbitrio el nombre de las columnas, pero
quiere estar seguro de que vamos a incluir diferentes clases de variables: desde
variables nominales hasta variables de escala.
Es en ese momento en que empezamos a explayarnos sobre la materia, para
lo cual, acudiremos a nuestro irremplazable amigo el SPSS, el que nos acompañará a
lo largo de éste y otros cursos.
El gerente, al pedirnos que realicemos una tarea como ésa, nos da una gran
oportunidad para explicarle, paso a paso, lo que estaremos haciendo para cumplir el
mandato
Para ello, hacemos click en el nombre del programa, el que debe estar en la
sección “archivos” con el nombre de IBM SPSS Statistics, versión 19; al hacer el click
respectivo, aparecerán dos archivos.
Escogeremos el segundo de ellos: IBM SPSS Statistics 19; luego de la espera
correspondiente, cuya duración dependerá de la potencia del equipo que se tiene,aparecerá una hoja de diálogo.
En esa hoja habrá una pregunta en el lado izquierdo: ¿Qué desea hacer?
En el lado derecho aparecerán cuatro opciones; en esta oportunidad, haremos c
click en la tercera opción: “introducir los datos”; una vez que hemos escogido la
8
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 9/49
opción, pulsamos Aceptar.
De inmediato se muestra ante nosotros una hoja con celdas constituidas por
columnas y filas.
Esa hoja se llama el Editor de Pantalla o Pantalla de Datos.
En ella veremos que hay columnas y filas; en la parte superior de cada una delas columnas se lee la misma palabra: var, que es la abreviación de variable.
Es una invitación para que pongamos los nombres de las variables que vamos
a utilizar.
Para ello, bajamos la vista y vemos que en la parte inferior de la hoja hay dos
casillas: una, con la leyenda Vista de datos y la otra: Vista de Variables ; también
observamos que Vista de datos tiene un fondo a color.
Eso quiere decir, que actualmente estamos en la sección de Vista de Variables
que es la que nos presentará los nombres de las variables y los registros
correspondientes.
Nuestra primera tarea será poner nombres a las columnas y registrar los
datos que nos interesen.
Pulsemos Vista de Variables; la hoja que veíamos cambiará a una nueva.
Esta nueva hoja sí tiene nombres en las columnas, las que usaremos de la
siguiente manera.
Nuestra primera variable se llamará sexo, porque define el género de las
personas encuestadas.
Ahora bien, vemos que la variable sexo no es una variable cuantitativa, sino,
cualitativa, pero el SPSS la va a transformar para que nos sirva en nuestra tarea de
hacer cálculos.
En consecuencia, en la primera casilla de la izquierda de Vista de Variables ,anotamos la palabra sexo
Inmediatamente, las demás casillas horizontales de la misma fila se llenan
por defecto.
Nosotros vamos a la segunda casilla, donde dice numérico, al pulsar esa
9
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 10/49
casilla, aparece una pequeña fila de puntos suspensivos; pulsamos esa pequeña fila
y se nos presente un cuadro de diálogo.
En ese cuadro hay opciones para los tipos de variables que vamos a necesitar;
en este caso, nos es útil, la opción Numérico, que ya estaba registrada por defecto;
pulsamos Numérico y aceptamos.
La tercera columna de Vista de Variables dice Anchura , lo que nos indica cuán
ancho ha de ser el espacio que ocupará el nombre de la variable sexo; por defecto
aparece 8 , pero nosotros queremos cambiar a 6.
Pulsamos en 8 y se nos aparecen dos flechas: la de arriba para aumentar el
ancho y la de abajo, para reducirlo; como la palabra sexo es más bien corta,
pulsamos la inferior hasta que aparezca 6.
Hacemos exactamente lo mismo para los decimales; no los necesitamos,
presionamos hasta 0.
Seguimos en la misma fila y llegamos a la casilla Etiqueta.
El nombre que pondremos a sexo en esta casilla será más formal, puesto que
será ese nombre (etiqueta) que se mostrará en el informe final; en la casilla debajo
de Etiqueta escribimos Sexo (con mayúscula)
Una vez realizada estas operaciones nos encontramos con la casilla Valores;
aquí es donde convertiremos esta variable sexo, que es cualitativa, en una
cuantitativa, asignándole un valor numérico.
Ahora nos corresponde convertir una variable categórica nominal en una
variable cuantitativa.
10
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 11/49
3. Elaboración del Formulario de Encuesta
Vamos a identificar al sexo femenino con el número 0 y al masculino con el
número 1.
Para convertir la variable cualitativa sexo en una variable cuantitativa,
pulsamos la casilla que registra la palabra Valores; aparecerán tres puntos
suspensivos en fila; hacemos click en ellos.
Al hacerlo, veremos un cuadro de diálogo; en la casilla donde dice Valor
inscribimos un 0.
En la casilla donde dice Etiqueta, registramos la palabra mujer ; y pulsamos Aña
Añadir.
Al hacerlo, veremos que en el cuadro inferior aparece “0 = mujer”.Aceptamos; la casilla Valores está vacía
Inscribimos en ella el número 1, y en la casilla Etiqueta registramos la palabra
hombre .
Pulsamos Añadir y en el cuadro aparecerá “1 = Hombre ”. Aceptamos
De ahora en adelante, el SPSS registrará con esos números el sexo de las
personas encuestadas.
Pasamos a la pantalla Vista de datos, pulsando la casilla del mismo nombre,
al pie de la hoja.
Allí vemos que la primera columna ya tiene un nombre: sexo.
Si queremos conocer el nombre que irá en el Informe Final, apuntamos con el
cursor la casilla sexo.
En unos segundos aparecerá la palaba Sexo, que es el nombre formal de la
casilla.
Supongamos que el gerente general quiere constatar las características que
tiene la variable sexo.
Haremos click en la casilla Vista de variables , que está al final de la hoja y
volvemos a la hoja anterior.
11
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 12/49
El nombre de la variable es sexo; el tipo es numérico; la anchura es de 6
espacios, tiene 0 decimales
Luego hacemos click en la siguiente casilla, lo que nos lleva al cuadro de
diálogo que ya conocemos.
En él, constatamos que el número 0 identifica a mujer y el 1 se reserva para ho
hombre.
Supongamos que hemos cometido un error y anotamos 3 para hombre.
En el cuadro de diálogo aparecerá lo siguiente: Valor 3; Etiqueta hombre y en
el cuadro tendremos:
0 = mujer; 3 = hombre.
Es preciso que modifiquemos la última entrada.
Hacemos click en el dato “3 = hombre” en el cuadro inferior; de inmediato se
activará la casilla eliminar .
El dato equivocado se elimina y procedemos a modificarlo de acuerdo con los
valore que habíamos asignado a cada género.
Ahora nos toca registrar las particularidades de la variable Edad.
Este procedimiento es mucho más fácil, porque la Edad es una variable
cuantitativa, no hay necesidad de hacer ninguna modificación.
Vamos a la hoja Vista de variables y hacemos click en la casilla que está
debajo de sexo.
Allí anotamos: edad, dejamos la palabra que ya está allí Numérico, escogemos
una anchura de 4 y en la siguiente casilla anotamos 0 para el número de decimales.
En la casilla que corresponde a Etiqueta anotamos Edad en años cumplidos y
dejamos Ninguna en Valores puesto que la variable es cuantitativa.
Ya tenemos registrada la segunda variable; vamos a Vista de datos ; pulsamos
unos segundos con el cursor en la casilla edad y el nombre formal, la Etiqueta, nos
dice que la variable se llama Edad en años cumplidos.
La tercera variable que nos interesa, según la encuesta virtual que estamos
haciendo, será Estado Civil.
12
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 13/49
Consideramos que hay cinco categorías: Soltero, Casado, Divorciado, Viudo,
Conviviente.
Cada una de estas variables, al igual que sexo, es cualitativa, por lo que
realizamos las mismas operaciones que hicimos para sexo .
Vamos a Vista de variables y pulsamos en la casilla que está debajo de edad; allí anotamos la siguiente palabra: estci , que significa Estado Civil ; la razón por la
que recurrimos a la abreviación será dada después.
Vamos a suponer los cinco estados civiles siguientes, en ese orden:
soltero, casado, divorciado, viudo y conviviente
La variable estci será numérica con 6 espacios, 2 decimales y la Etiqueta :
Estado Civil.
Llegamos a Valores; pulsamos la casilla correspondiente donde dice Ninguna.
Aparecerán los tres puntos, para ser pulsados por el cursor y tener acceso al
cuadro de diálogo.
Tal como hicimos antes, en la casilla Valo r escribimos 1, en la casilla Etiqueta ,
registramos soltero , pulsamos la casilla Añadir y aceptamos.
Procedemos a llenar la casilla Valor con el número 2 y la casilla Etiqueta con la
palabra casado
Pulsamos Añadir y aceptamos; así, hasta que tengamos los cinco estados
civiles que hemos establecido.
Observemos que tanto la variable sexo como la de estado civil sólo nos
permite una opción: hombre o mujer, en el primer caso y cualquiera de los cinco
estados civiles, en el segundo.
En la siguiente variable, idiomas que habla, tendremos más de una opción.
Establezcamos los siguientes idiomas: Español, Inglés, Alemán y Francés.
En virtud de que tenemos más de una opción, cada idioma tendrá su columna
por separado
Empezamos con Español; esp, numérico, 8, 0, Espanol (sin la ñ)
13
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 14/49
Lo mismo para todos los demás idiomas.
Ahora archivamos estos datos en el archivo que hemos escogido para el efecto
Ahora vamos a realizar una pequeña prueba para ver si el diseño de la hoja de
encuesta es correcto.
Para ello, hacemos haciendo click en Vista de datos y llenamos cinco filas condatos supuestos.
Recordemos que cada fila es una hoja de encuesta que los encuestadores nos
han entregado.
Tomamos la primera hoja hipotética y llenamos la primera fila con los datos
inventados.
Una vez que llenamos los datos supuestos, archivamos todo en el archivo que
hemos abierto.
En este caso el nombre del archivo que hemos habilitado es: ESTADISTICA
APLICADA EJERCICIO 1.sav
Ahora bien, una vez que el gerente ha visto que podemos usar el SPSS, nos
confía la tarea de analizar las características principales del personal de la empresa
en la que trabajamos.
Esas características incluyen estimar la media aritmética de los sueldos, la
mediana, la varianza, la desviación estándar, los intervalos de confianza, la
probabilidad de que el resultado sea cierto y otros.
Todo eso lo hará la computadora; pero nosotros tenemos que conocer los
conceptos de lo que se nos pide y, claro, interpretar los resultados que el SPSS nos
brindará al respecto.
14
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 15/49
4. Medidad de Tendencia Central I
Una medida es de tendencia central se define como el punto medio de una
distribución; de inmediato vemos las más importantes con unos breves ejemplos
manuales para tener idea de lo que hace el SPSS.
La Media Aritmética
Generalmente la conocemos como el promedio de una serie de datos.
Supongamos que deseamos saber el promedio de la edad de 6 personas que están
en un consultorio médico.
Para sacar ese promedio, simplemente sumamos las edades de todos y cada y
dividimos el resultado entre 6, que es el número de personas que nos interesa.
Media aritmética = (40 + 34 +28 + 10 + 23 + 50)/6 = 30.83
El resultado nos dice que la media aritmética o promedio de las edades de las
seis personas es 30.83 años.
Si queremos saber el ingreso promedio de cinco amigos que desean ir al cine,
preguntamos a cada uno cuanto tiene y luego hacemos lo mismo que en el caso
anterior:
Media aritmética = (4 + 20 + 12 + 9 + 13)/5 = 11,60
El resultado dirá que, en promedio, cada uno tiene 11 dólares con 60
centavos.
Ese es el concepto fundamental de la media aritmética, no importa cuán
pequeña o grande pueda ser el conjunto de datos que se nos presente, la media
aritmética siempre tendrá la misma definición:
Será la suma de todos los valores, dividida entre el número de casos.
Usando el lenguaje matemático, tendremos:
X* = X i / n
En esta igualdad, X* es la media aritmética de la muestra que hemos tomado;
Xi, son los valores que serán sumados; n es el número de observaciones.
Tomaremos un ejemplo cualquiera
15
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 16/49
X* = (9 +7 + 7 + 6+ 4+ 4 + 2)/7 = 5.6
En este ejemplo, hay dos valores repetidos (el 7) pero eso no importa, igual se
lo toma en cuenta como cualquiera de los demás valores.
En los libros de Estadística se pone ejemplos sobre las formas de estimar la
media aritmética cuando los datos están ordenados o están desordenados; esto no
tiene importancia para el SPSS.
Después aprenderemos a usar rangos, pero eso será cuando ya sepamos
desenvolvernos mejor.
Ventajas y desventajas de la media aritmética
Su principal característica es que un solo número representa a un conjunto de
datos; por otra parte es un concepto con el que todos estamos familiarizados y cada
conjunto de datos tiene una sola media.
También porque permite realizar comparaciones de medias de varios
conjuntos de datos.
Pero también tiene desventajas; v.g. puede haber valores extremos que no
son representativos del conjunto de los datos que estamos tomando en cuenta.
Derivemos la media aritmética de los siguientes datos, los que representan
los ingresos mensuales de 7 personas que trabajan en una empresa determinada.
2400, 3200, 2580, 3260, 2500, 2840, 19000
La media aritmética será: X* = (2400 + 3200 + 2580 + 3260 + 2500 + 2840
+ 19000)/ = 5111
De inmediato nos damos cuenta de que la media está muy influida por el
ingreso de 19000
En este caso, será más útil calcular la media anulando el valor extremo.
Para un conjunto grande de datos, la computadora
La media aritmética ponderada
Tomemos el siguiente ejemplo (del libro “Estadística para Administradores”
Levin y. Rubin)
16
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 17/49
Tipo de trabajo Salario por hora Sillas Mesas
No calificado
Semicalificado
Calificado
5
7
9
1
2
5
4
3
3
Observemos que el costo por producto incluye diferentes grados de
calificación de la mano de obra.
Ahora bien, si utilizáramos la media aritmética simple, tendríamos que salario
promedio sería:
X* = (5 + 7 + 9)/3 = $7
Si aplicamos ese salario promedio para estimar el costo de los sillas,
veríamos que la producción de este producto toma 5 hs. de trabajo no calificado; 2
hs. de semi calificado y 5 hs. de calificado
En consecuencia, estimaríamos el costo de producir una silla sería: 7(1 + 2 +
5) = $56
El costo de producir mesas sería: 7(4 + 3 + 3) = $70
Pero estos costos no sería los reales, puesto que el número de horas de cada
categoría de trabajo varía en la producción de las sillas y mesas.
El costo promedio correcto de la producción de sillas es: (5 x 1) + (7 x 2) + ( 9
x 5) = $64
En razón de que se invirtieron 8 horas de trabajo, el costo promedio del
trabajo por hora es:
64/8 = $8 por hora de trabajo.
En el caso de las mesas: (5 x 4) + ( 7 x 3) + (9 x 3) = $68
Como se invirtieron 10 hs. de trabajo en la producción de mesas, el promedio
salarial sería:
68/10 = $6.8 por hora de trabajo.
La media geométrica
17
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 18/49
Se usa, principalmente, para estimar los promedios de cantidades que
cambian con el tiempo.
Por ejemplo, tomemos una cuenta de ahorro que paga intereses.
Si dejamos el dinero depositado por algunos años, sin retirar, a una tasa
anual determinada, el depósito inicial se irá acumulando, de tal manera que cada
nuevo monto sumará los intereses y así sucesivamente.
Supongamos que dejamos $ 1000 en una caja de ahorros a una tasa anual de
10%.
Al final del primer año se tendrá un monto de $1100, es decir, los $1000
originales más el 10% que es $100. Al final del segundo año, tendremos una
ganancia del 10% de $1100, ya no de 1000.
Nuestra cuenta acumulada a fines del segundo año será 1100 x 0.10 = 110,los que sumados a los $1100 que ya teníamos, nos dará un total de 1210 y así
sucesivamente.
Pero hay todavía otros estadísticos de tendencia central.
18
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 19/49
5. Medidad de Tendencia Central II
La Mediana
Es el valor que está más al centro de un conjunto de datos ordenados de
menor a mayor.
Tomemos los siguientes datos ordenados de menor a mayor, los que
representan los ingresos semanales de 11 personas tomados al azar como una
muestra:
120, 140, 200, 240, 260, 380,450, 500, 630, 700, 750
De acuerdo con la definición dada, la Mediana será $380, pues ese monto
está exactamente al medio del conjunto de datos de la muestra.
Nos damos cuenta de ello, porque constatamos que hay cinco observaciones
a la izquierda de la Mediana y cinco a la derecha; esa simetría se da porque el
número total de observaciones es impar
Si agregamos un dato más a la muestra, tendremos:
120, 140, 200, 240, 260, 380, 390, 450, 630, 700, 750, 780
Vemos que el número de datos de la muestra es par (12) por lo que para
calcular la Mediana tendremos que usar una fórmula en la que n = número dedatos.
Mediana = (n + 1)/2 = (12 + 1)/2 = 13/2 = 6.5
El resultado, 6.5, nos indica que es preciso sacar la media de los datos sexto
y séptimo de la serie.
El sexto dato es 380; el séptimo es 450; la media aritmética de ambos: (380 +
450)/2 = $415
El SPSS Calculará inmediatamente la Mediana de series de prácticamente
cualquier tamaño.
Ventajas de la Mediana
A diferencia de la media aritmética, la mediana no está influida por los
valores extremos.
19
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 20/49
La Moda
La moda el valor que más se repite en el conjunto de datos; tomemos los
datos utilizados en la mediana, pero lo transformemos de tal manera que el valor
260 se repite dos veces; en ese caso la Moda será 260.
120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780
La Moda no es muy utilizada; pero puede aplicarse cuando vemos valores
repetidos en la muestra.
Cuando lleguemos al capítulo de las distribuciones, haremos una
comparación entre la media aritmética, la mediana y la moda, con relación a la
posición central que ocupan en una gráfica de distribución.
Mientras tanto, diremos que no hay reglas generales que nos permitan
escoger alguna de ellas; en todo caso diremos que la media aritmética es la medida
de tendencia central más usada.
La Media Armónica
También se la conoce como H, de una cantidad de números y es igual al
recíproco de la media aritmética.
La media armónica resulta poco influida por la existencia de determinados
valores mucho más grandes que el conjunto de los otros, pero es muy sensible a
valores mucho más pequeños.
Tales son las medidas de tendencia central más importantes.
Medidas de dispersión
Si las medidas de tendencia central nos sirven para identificar un valor que se
acerque más al centro de una serie de datos; las medidas de dispersión nos
muestran el grado en que se alejan del centro.
El Rango: Es la diferencia entre el valor más alto y el más pequeño de los
datos.
Acudamos otra vez a las serie de datos utilizados para calcular la Mediana: el
rango 780 – 120 = 660
120, 140, 200, 240, 260, 260, 380, 390, 450, 630, 700, 750, 780
20
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 21/49
Medidas de desviación promedio
Estas medidas nos sirven para calcular la desviación promedio que hay entre
los valores de una serie de datos y una medida de tendencia central. (Estos ejemplos
son sólo conceptuales, pues el SPSS las calcula)
La Varianza: Concepto
Es la media aritmética del cuadrado de las desviaciones respecto a la
media de una distribución estadística.
La varianza de la muestra se representa por S2
Para aclarar el concepto, tomemos los siguientes datos: 2, 4, 6, 8, 10
La media aritmética será: (2 + 4 + 6 + 8 + 10)/5 = 30/5 = 6
Ahora bien, tomemos los datos originales vemos que el valor 2 se desvía en -
4 de la media aritmética que (2 - 6 = - 4): el valor 4 se desvía en - 2 unidades: (4 –
6 = - 2) el valor 6 no se desvía de la media aritmética
Pero el valor 8 sí se desvía en 2 (8 – 6 = 2) que es una desviación positiva
Si deseáramos sacar la media aritmética de estas desviaciones nos
encontraríamos que su valor sería 0, pues los valores positivos anularían a los
negativos.
Para calcular la varianza y eliminar este problema no tomamos en cuenta la
desviación simple de cada observación con la media aritmética, sino que recurrimos
a elevar cada desviación al cuadrado.
Los hacemos así, porque una cantidad elevada el cuadrado, ya sea positiva o
negativa, siempre nos dará un resultado positivo, que es lo que se busca.
La suma de los cuadrados de esas diferencias será dividida por el número de
observaciones (5) menos 1, lo que nos dará la varianza = S2
S2 = [(2 – 6)2 + (4 – 6)2 (6 – 6)2 + (8 – 6)2 + (10 – 6)2]]/(5 – 1)
S2 = [(-4)2 + (-2)2 + (0)2 + (2)2 + (4)2]4= [(16 + 4 + 4 + 16)]/4 = 40/4=
1 0
En consecuencia diremos que la varianza de la Muestra es 10
21
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 22/49
La Desviación Típica de la Muestra = s
Es la raíz cuadrada de la Varianza: s = raíz cuadrada de S2
En este caso, s = raíz cuadrada de 10 = 3.16
Como al principio tuvimos que elevar las diferencias al cuadrado para obtener
el estadístico denominado La Varianza, ahora hacemos la operación inversa ysacamos la raíz cuadrada de S2.
Las medidas de tendencia central y de dispersión son los estadísticos básicos
de la Estadística.
Por supuesto, son también los más usados en todos los niveles.
Este ejercicio, fácil, se vuelve complicado cuando la muestra tiene, digamos,
20000 observaciones.
Calcular una muestra para esos valores es una de las tareas más simples que
realiza el SPSS
22
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 23/49
6. El Uso del SPSS
Una vez definidas conceptualmente las medidas de tendencia central y las
medidas de dispersión, vamos al SPSS para aprender cómo las obtenemos.
Supongamos que deseamos saber las medidas de tendencia central y de
dispersión de los sueldos actuales que reciben los empleados de la empresa donde
trabajamos.
Abrimos el SPSS, pulsamos la tecla registrar datos del cuadro de diálogo; una
vez que tenemos el editor de datos, pulsamos archivo, para abrir Employee dadt.sav
del archivo que viene con el SPSS 19.
Una vez que tenemos en la pantalla los datos de Empoyee data.sav,
colocamos el cursor en cada uno de los títulos de las columnas para saber cuáles
datos muestran los salarios actuales de los empleados
Cuando apuntamos el cursor en la columna “salary” vemos que el nombre
formal es Current Salary.
Es de esa columna que deseamos pedirle al SPSS que calcule las medidas
deseadas.
Pero, de entrada tenemos un problema; los salarios están registrados con el
signo $ = dólar; para calcular sin problemas los indicadores que deseamos, vamos acambiar los datos al tipo Numérico.
Para eso, vamos a Vista de Variables; encontramos la variable “salary” y vemos
que está con tipo dólar.
Hacemos click en la casilla que dice Dólar en la columna “Tipo”, ingresamos al
cuadro de diálogo y allí vemos que, efectivamente, la variable “salary” está medida
en Dólar; pulsamos Numérico y aceptamos.
Volvemos a Vista de datos y vemos que el signo Dólar ($) ha desaparecido;
ahora podemos instruirle al SPSS que nos calcule los indicadores que deseamos
sobre la variable “salary”.
En el menú superior pulsamos en “Analizar”, se nos presentará un cuadro de
opciones; pulsamos “Estadísticos Descriptivos”; a la derecha aparecerá otro cuadro,
23
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 24/49
del cual escogemos “Descriptivos”
Se nos presentará un cuadro con todas las variables de Employee data.sa y un
cuadro en blanco a la derecha; pulsamos en “Current salary”, inmediatamente
pulsamos la flecha que apunta a ese cuadro.
La variable Current salary ya está en el cuadro blanco; pulsamos “options” y
en el cuadro que aparece, escogemos: Rango, Salario Mínimo, Salario Máximo,
Media Aritmética, Desviación Típica y Varianza
Volvemos al anterior cuadro de diálogo y pulsamos aceptar; se nos
presentará el Editor con los datos.
Para ver los resultados, vamos al menú superior del Editor y pulsamos
“Ventana”.
Aparecerán dos líneas: escogemos la primera que dice “Resultados”; así nostrasladamos hasta la hoja de resultados en la que vemos una pequeña tabla, la que
se muestra a continuación.
Estadísticos descriptivos
N Rango Mínimo Máximo Media Desv. típ. Varianza
Current Salary 474 119250 15750 135000 34419,57 17075,661 2,916E8
N válido(según lista)
474
N significa el número de observaciones, en este caso nos dice que en la
empresa hay 474 empleados y que el SPSS los ha tomado a todos; el Rango, es decir,
la diferencia entre el salario mayor y el menor, es $473
El Salario Mínimo es $15740 al año; el máximo es $135000; la Media
aritmética o el promedio de los salarios es $34419.57; la desviación típica es
17075.661 y la Varianza tiene un valor de 29160000.
Supongamos ahora que deseamos saber los mismos estadísticos pero paralos salarios que los empleados ganaban al momento de ser contratados por la
empresa.
Para volver al cuadro de datos, pulsamos “Ventana” en el menú superior y
escogemos la opción adecuada.
24
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 25/49
Pero ahora nos encontramos que en el cuadro derecho aún está la variable
“salary·
Hacemos click en la variable “salary”, pulsamos la flecha, la que ahora indica
la dirección opuesta, y la variable “salary” vuelve a formar parte de las variables
consignadas en el cuadro izquierdo.
Pulsamos la columna donde se registra “salbegin” que tiene el nombre formal
de “Beginning Salary” y repetimos el proceso anterior; la tabla de resultados es:
Estadísticos descriptivos
N Rango Mínimo Máximo Media Desv. típ. Varianza
BeginningSalary
4 74 70980 9000 79980 17016,09 7870,638 61946944,959
N válido
(segúnlista) 474
Una comparación de los promedios salariales entre ambas dimensiones, los
salarios actuales y los que se recibían al comienzo nos muestra una gran diferencia:
34419 para los primeros y 17016 para los otros.
A medida que avancemos con el programa podremos establecer si la
diferencia de dos promedios es o no significativa; lo que es muy útil en una
investigación de tipo estadístico.
Borrar información de la Pantalla de Resultados
Cada vez que deseamos tener una nueva pantalla de resultados, borramos las
que se encuentran en ella; lo hacemos de dos maneras: llevando el cursor a la
izquierda y pulsando el botón de “Resultado”.
Con esa instrucción, el SPSS borrará todos los elementos que constan en la
pantalla.
Si deseamos borrar sólo uno o algunos elementos de la pantalla, vamos
también a la izquierda y pulsamos cada uno de los elementos que deseamos borrar.
Sin embargo, la manera más práctica es hacer click en los elementos que ya
no necesitamos y apretar la tecla “suprimir” en el teclado de nuestra computadora.
El Coeficiente de Variación
25
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 26/49
Es la relación entre la desviación típica y la media de la muestra: s/X*
Tomemos la desviación típica de la tabla de Begining salary que es 7870 y la
media, 17016
El coeficiente de variación será 7870/17016 = 0,462
Si deseamos expresar este coeficiente en porcentaje, lo multiplicamos por
100 = 46.62 %
Por lo general, se usa este coeficiente para comparar la variabilidad que
tienen diferentes unidades de medida; supongamos que se desea comparar el grado
de variabilidad de dos poblaciones
La primera población tiene datos referidos al ingreso y la segunda a los años
de educación; en este caso, se usará el Coeficiente de Variación de cada una sobre
los datos de sus medias y desviaciones típicas.
La diferencia entre ambos coeficientes nos podrá dar alguna información
relevante.
26
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 27/49
7. Distribución de Frecuencias
Una distribución de frecuencias es una tabla en la que organizamos los datos
dividiéndolos en Clases o grupos que describen alguna característica de los datos.
Si no dividimos los datos en grupos o clases, entonces, cuando pidamos, v.g,
las frecuencias de los salarios, el SPSS nos dará un cuadro con el salario de cada uno
de los empleados.
Si la fábrica tiene 2000 empleados, tendremos un cuadro de 2000 salarios;
pero, cuando necesitamos las medidas de tendencia central o cualquier otra, el SPSS
acudirá a los datos originales, no a los grupos.
A no ser que, por alguna razón, necesitemos la media u otro estadístico de
los grupos.
Una distribución de frecuencias muestra el número de observaciones del
conjunto de datos que caen en cada una de las clases en las que hemos dividido los
datos originales.
Para hacerlo, utilizaremos el SPSS y el archivo Employee.sav .
Vamos a construir el cuadro de frecuencias del salario actual de los
empleados de la empresa
Lo que debemos hacer es tomar una variable y sobre ella crear otra variable
que nos permita clasificar los datos en clases, de este modo podremos iniciar la
tarea de diseñar un cuadro de frecuencias.
Menú Principal Transformar ; en el cuadro que aparece escogemos
Recodificar en distintas variables . Cuando se abre el cuadro de diálogo vemos dos
pantallas.
La pantalla de la izquierda contiene todas las variables; escogemos Current
Salaly y la trasladamos a la pantalla de la derecha, haciendo click en la flecha de
dirección.
Una vez en la casilla, vemos que la variable Current Salalry ha cambiado a
salary , que es el nombre que aparece al comienzo de la columna respectiva,
mientras que Current Salary , es la etiqueta formal.
27
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 28/49
En el cuadro aparece un signo de interrogación después de salary , eso
significa que el SPSS nos pide dar un nuevo nombre a la variable que vamos a
recodificar.
En la parte derecha hay dos casillas: una que dice “nombre” y la otra
“etiqueta”; entramos a “nombre” y registramos el nombre que deseamos ponerle a la
nueva variable: rsalary (Podría ser cualquier otro)
En la casilla Etiqueta ponemos el nombre formal Salario Actual .
Pulsamos la casilla Cambiar” y la nueva variable aparece en la pantalla donde
está la variable salary .
La nueva variable rsalary ocupa el lugar donde estaba el signo de
interrogación.
Con esa operación hemos estructurado una nueva variable, rsalary , sobre labase de la variable salary, desde este momento, el SPSS tratará a la nueva variable
como independiente.
En la parte inferior hay una casilla que dice Valores antiguos y nuevos ; la
pulsamos y se nos presenta un cuadro de diálogo; éste cuadro es el que nos
ayudará a dividir nuestros datos en clases.
Vamos a dividir los datos en cuatro clases; para ello pulsamos el botón que
dice: rango, en la parte izquierda del cuadro; al hacerlo, se habilitarán dos casillas
en blanco.
En la primera registramos 15000 (el valor mínimo de los salarios) en la casilla
que está debajo, escribimos 35000; luego vamos a la parte superior derecha para
pulsar el botón de valor y en la casilla anotamos 1.
Click en “Añadir” y en la casilla inferior aparece 15000 trhu 45000 1.
Esto quiere decir que la primera de nuestras clases incluirán todos los valores
desde 15000 hasta 25000.
Otra vez vamos a la izquierda click “rango” y anotamos 45001 en la casilla
de abajo.
Vamos a la casilla inferior, donde dice “hasta” y anotamos 75000.
Nos trasladamos al lado derecho “Valor”, anotamos 2 en la casilla
28
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 29/49
respectiva click en “Añadir”.
En la pantalla inferior aparecerá un nuevo registro después del anterior.
Esta vez con la leyenda que dice: 45001 thru 75000 2.
Repetimos la operación para la tercera clase: anotamos 75001 en la casilla
“rango” y 105000 en la que dice thru; vamos al lado derecho, pulsamos el botón“valor” y anotamos 3 en la casilla; luego pulsamos “Añadir”.
La tercera clase aparece en la parte de abajo con la leyenda: 105001 thru
135000 anotamos 4 OK.
Manchamos “current salary” de la pantalla, pulsamos la flecha direccional y la
devolvemos a la izquierda.
En la última columna de la pantalla de datos aparecerán los intervalos
codificados 1, 2, 3 y 4, de acuerdo con los valores de cada rango salarial.
Pero, lo que deseamos es que en la Pantalla de Datos aparezcan los intervalos,
tales como 15000 – 45000 para todos los rangos que hemos recodificado.
Para ello vamos a la sección Vista de Datos , al final de la misma está la
variable creada rsalary; hacemos click en la columna Cambios e iniciamo el proceso
de recodificación, tal como lo hicimos en Transform
En la columna Valores correspondiente a la variable creada “rsalary, aparece el
rótulo Ninguna…
Hacemos click en los puntos y se nos presente un cuadro de diálogo.
En la casilla Valor anotamos 1 y en la que dice Etiqueta registramos 15000 –
45000, pulsamos Añadir y esta primera clase aparece registrada en la pantalla;
hacemos lo mismo con 45001 – 75000.
Seguimos dando los mismos intervalos anteriores; estamos recodificando la
nueva variable “rsalary”, cuyo nombre formal Salario Actual incluimos en la casillacorrespondiente a la columna Etiqueta .
Continuamos del mismo modo, variando las clases de 75001 en 105000
hasta llegar a la última, la clase número que será 105001 – 135000; aceptamos y en
la pantalla de datos tendremos los intervalos creados.
29
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 30/49
Hay dos cosas que es necesario tener en cuenta; primero, luego de que la
primera clase 15000 – 25000 ha sido registrada, la siguiente empieza con 25001,
para no repetir el valor de 25000; lo mismo con las demás.
Frecuencias
Lo primero que deseamos saber es cuántas observaciones se incluyen en
cada intervalo.
En la pantalla de Vista de datos , vamos al menú superior y pulsamos Analizar
Analizar ”; se abrirá el cuadro de opciones; de allí escogemos Estadísticos
Descriptivos Frecuencias .
Se abre el cuadro en el que la lista de variables está a la izquierda; si a la
derecha todavía figura la variable que habíamos transformado, “current salary”, la
manchamos con el mouse y la trasladamos a la izquierda.
Hacemos click en la variable Salario actual y con la flecha de dirección la
llevamos a la derecha.
Aceptamos; en la pantalla de Resultados aparece el cuadro de frecuencias con
las clases respectivas.
Este es el cuadro que nos servirá para diseñar nuestra primera distribución de
frecuencias.
Eso es lo que haremos en el próximo capítulo.
30
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 31/49
8. Estructurar una Distribución de Frecuencias
El cuadro que aparece en la pantalla de resultados nos muestra el número
total de casos, 474, y el número de observaciones clasificados por los grupos
salariales que habíamos estructurado.
La clasificación de los salarios en clases, con los rangos determinados, nos
permite no sólo saber cuántas personas hay en cada clase, sino que podemos
graficar con mayor claridad los datos que usemos.
Hacemos click en el cuadro, pulsamos el botón derecho del mouse y
escogemoscopy , y posteamos en la presente página de manera tal que podamos
realizar las modificaciones necesarias.
Salario Actual Frecuencia Porcentaje
Porcentajeválido
Porcentajeacumulado
Válidos
15000 -45000
391 82,5 82,5 82,5
45001 -75000
6 6 13,9 13,9 96,4
75001 -105000
1 5 3,2 3,2 99,6
105001 -135000
2 ,4 ,4 100,0
Total 474 100,0 100,0
Para formular nuestro cuadro de distribución de frecuencias, reemplazamos el
título “Porcentaje válido” por “Probabilidad” y anulamos la última columna haciendo
click con el botón derecho del mouse Delete Cells
En las opciones que aparecen hacemos click en Delete Entire Colum; ponemos
el título Distribución de Frecuencias de los salarios; el cuadro queda estructurado dela siguiente manera
Distribución de Frecuencias de los Salarios
Frecuencia Porcentaje Probabilidad
15000 - 45000 391 82,5 0,825
31
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 32/49
Válidos
45001 - 75000 6 6 13,9 0,139
75001 - 105000 1 5 3,2 0,032
105001 - 135000 2 ,4 0,004
Total 474 100,0 100,0
El cuadro de probabilidad resulta de la división entre 100 de todos y cada
uno de los datos que aparecen como porcentaje en la tabla anterior.
Los datos de la nueva tabla se interpretan de la siguiente manera
En la empresa hay 391 empleados que ganan un salario comprendido entre
15000 – 45000; lo que representa una porcentaje del 82.5%
La probabilidad de que escojamos a uno de ellos, de entre todos los
empleados, es 0,825
En la empresa hay 66empleados que perciben un salario comprendido entre45001 – 75000 y constituyen el 13,9% del total; la probabilidad de que escojamos a
uno de ellos es 0,139; y así con los demás registros.
El total de las probabilidades suma 1, tal como se ve en la tabla; cada
probabilidad se obtiene dividiendo el porcentaje respectivo entre 100; para los
decimales se usa la coma.
Gráficas de las distribuciones de frecuencias.
A continuación mostraremos las principales gráficas que representan a los
datos inscritos en una tabla de frecuencia; las gráficas son muy necesarias para
darnos una imagen más rápida de la información.
El Histograma
Es una de las gráficas más conocidas; consiste en una serie de rectángulos
cuya anchura la distancia que existen entre las dos cantidades que estructuran una
clase.
Para obtener el Histograma respectivo, vamos al Menú Principal Gráf icas
Cuadros de diálogos antiguos Histograma
Antes de cerrar vemos en la parte superior derecha la casilla Títulos: hacemos
click y en la primera línea escribimos Salarios Actuales; en la segunda, Niiveles
Salariales Estratificados.
32
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 33/49
La clase 1 (15000 – 45000) está representada por la base de un rectángulo.
La altura de cada rectángulo señala el número de frecuencias que se
encuentran entre ese intervalo
A la derecha del histograma se muestra la media, la desviación típica y el
número total de empleados.
El histograma, como veremos, es útil para el técnico, pero no es muy claro
para los ejecutivos.
El Histograma es una gráfica muy útil, especialmente cuando queremos
comprobar si la distribución de una variable se aproxima a la distribución normal, tal
como veremos en otro capítulo.
Así, las clases simplemente están representadas por números, los que no dice
mucho cuando deseamos presentar un informe a los ejecutivos de la empresa.
Para presentar un informe más claro a los ejecutivos, recurrimos a la gráfica
de barras.
El SPSS nos presenta varias opciones de gráficas, las que iremos usando y
aprendiendo a diseñarlas a medida que vamos avanzando en el curso y tocamos
nuevo temas que exigen otros usos del SPSS.
En el próximo capítulo usaremos las gráficas de barras.
33
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 34/49
34
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 35/49
9. Gráficas
Para obtener las barras de frecuencias, pulsamos Gráficas en el Menú
Principal; elegimosCuadros de diálogos antiguos Barras Simple Definir No.
De Casos
Introducimos Salario Actual en la casilla que dice Definir sectores por; e n la
parte superior derecha hacemos click en Títulos ; allí escribimos: Salarios Actuales en
la Primera Línea y Salarios Actuales Estratificados.
Copiamos la gráfica y vemos que nos ha dado los intervalos y las frecuencias
de cada uno anotando el intervalo en cada caso; no sólo como categorías 1, 2, ….
Si se quiere cambiar las características del gráfico, por ejemplo, el color, la
textura, la letra….
Hacemos doble click en la gráfica de barras; aparecerá un nuevo menú;escogemos editar y allí elegimos la opción que nos parezca más adecuada.
Otra gráfica muy útil es la de “Sectores” (Pie)
35
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 36/49
Gráficas Cuadros de diálogos antiguos Sectores Títulos; la gráfica que
aparece en el cuadro de resultados muestra los datos que le habíamos pedido; la
traemos a la presente página a través de Copy.
Podemos cambiar todo lo que nos parezca, haciendo doble clik en la torta del
cuadro de resultados.
Observemos cómo vamos aprendiendo Estadística y, al mismo tiempo, el uso
del SPSS; me pareció más conveniente este método de “aprender sobre la marcha”
en vez de dar un curso completo de una sola vez.
Cuando terminemos el curso de Estadístico, en todos sus niveles, éste es el
primero de ellos, habremos concluido también con el aprendizaje del SPSS en todo
lo que se refiere al campo concreto de la Estadística.
Podemos lograr un resultado más completo a través del Menú Gráficas –
Generador de Gráficas
36
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 37/49
Se nos presenta una pantalla blanca, bajo de la cual hay varias opciones de
gráficas.
Escogemos la de barras, se nos presentará una advertencia, aceptamos y se
nos presenta un cuadro con una pantalla blanca arriba y varios modelos de gráficas,
abajo.
Pero, en vez de hacer click en la gráfica de barras, más bien la arrastramos
hasta la pantalla blanca.
Del mismo modo, de la casilla de archivos a la derecha, hacemos click en la
variable Salarios Actuales y la arrastramos hasta el eje de las abscisas de la gráfica
de barras.
Dejamos disponible el eje de la y’s para que consigne las frecuencias
(Recuento) de los intervalos.
En la casilla de títulos ponemos los mismos de la anterior barra.
También hacemos clic propiedades del elemento para especificar lo que
deseamos; luego hacemos clic Opciones y allí, escogemos en Nota al pie del espacio
inferior, la que aparece como el error aceptado.
En ese cuadro vemos la presencia de unas figuritas extrañas, cuyo significado
37
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 38/49
aprenderemos luego.
38
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 39/49
10. Probabilidad
Introducción
Los principales precursores del cálculo de probabilidades fueron Jacob
Bernoulli (1674-1705) Abraham de Moivre (1667-1754) Thoma Bayes (1702-1761) y
Joseph Lagrange (1736-1813)
La teoría de la probabilidad es la base es la base de las investigaciones
estadísticas en las investigaciones de las ciencias sociales y en la toma de decisiones.
En realidad, las llamadas “leyes” en las ciencias sociales no son sino
tendencias estadísticas en el tiempo, las que pueden ser estimados con un grado de
probabilidad.
Conceptos básicos
Probabilidad es la posibilidad cuantificada de que algo suceda
Evento : Uno más de los posibles resultados de hacer algo
Si lanzamos una moneda al aire, saldrá “cruz” o “cara”, cada resultado es
considerado un evento.
Experimento, la actividad que produce un evento; en este caso, el lanzar la
moneda.
¿Cuál será la probabilidad de que una moneda, al ser lanzada, caiga y nos
muestre “cara”? será ½ o 05.
Espacio muestral : al lanzar la moneda el espacio muestral es: {cara, cruz}
Si dos eventos pueden ocurrir al mismo tiempo, entonces decimos que los
eventos no son mutuamente excluyentes ; si dos eventos no pueden ocurrir
simultáneamente serán mutuamente excluyentes.
La probabilidad de sacar una carta de un paquete de 52 cartas, será 1/52
La de sacar una reina será 4/52, pues existen cuatro reinas en el mazo.
La de sacar un trébol será 13/52, pues hay 13 tréboles en un mazo.
La probabilidad de sacar una carta roja es 26/52, dado que hay 26 cartas
39
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 40/49
rojas.
La probabilidad de sacar un “as” al lanzar un dado es 1/6, porque hay seis
números y un solo as.
Del mismo modo con los otros números.
Probabilidad Clásica
La probabilidad de que un evento ocurra es definida del siguiente modo:
E = F/(T)
E = Evento; F número de casos favorables; T, el total de casos
En los ejemplos de las cartas, el número favorable de sacar una reina era 4 y
el total de casos, 52
En el ejemplo de los dados, el número favorable de sacar un “as” es 1 y el
total de casos es 6.
La probabilidad clásica nos dice que los resultados posibles deben ser iguales
entre sí.
La probabilidad clásica es conocida también como probabilidad a priori,
porque los resultados puede ser conocidos de antemano, tal como sucede con los
experimentos de las cartas o los dados.
Frecuencia relativa de la presentación
Es el porcentaje del resultado de casos favorables de un experimento con
relación al total de casos.
Probabilidades subjetivas
Se basan en las creencias de las personas que diseñan el experimento; sería la
probabilidad asignada a un evento por parte de un individuo.
La probabilidad subjetiva es útil cuando no hay antecedentes para establecer
una probabilidad objetiva
¿Cuál es la probabilidad de que un reactor atómico a ser instalado en cierto
lugar irradie radiactividad?
Dado que no existe un antecedente, entonces se recurrirá a las suposiciones y
40
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 41/49
al sentido común.
Los responsables de tomar decisiones en una empresa usan la subjetividad
para los casos únicos que se presentan a diario en asuntos de mercado, precios,
insumos y otros similares.
Reglas de la Probabilidad
Los siguientes símbolos son los que mayormente se utilizan en el cálculo de
probabilidades:
P(A) = Es la probabilidad de que el evento A suceda.
Si puede llevarse a cabo sólo un evento, la probabilidad será sencilla; esta
clase de probabilidad también es conocida como probabilidad marginal o
incondicional .
Si hay un sorteo para ganar un premio y el total de casos es 60, la
probabilidad de que alguien saque el número premiado es 1/60 = 0,0167; en este
caso, sólo un participante puede ganar.
Eventos mutuamente excluyentes
Hay casos en los que pueden realizarse dos eventos: uno o el otro
Supongamos que hay 5 candidatos a un cargo público y que todos tienen los
mismos méritos.
Si utilizamos el concepto marginal de probabilidad, diremos que la
probabilidad de que uno de ellos sea elegido será 1/5; pero, si estamos interesados
en saber la probabilidad de dos candidatos, la cosa cambia.
Supongamos que tenemos un interés especial en saber las probabilidades de
que Juan Monasterios o María Zeballos ganen el concurso de méritos; en este caso
tenemos dos eventos que se suman entre sí.
Diremos que la probabilidad de Juan es de 1/5 y la de María también es 1/5;entonces de probabilidad de que alguno de los dos sea elegido será 1/5 + 1/5 =
2/5 = 0,40
En el primer caso, el de que uno de los cinco gane, la probabilidad será P(A) =
1/5 = 0,20
41
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 42/49
En el segundo caso, la probabilidad se representará del siguiente modo: P(A o
B) que suceda uno de los dos
Para mostrar gráficamente lo que la suma de probabilidades significa, los
teóricos recurren a los símbolos de los conjuntos en matemáticas; esos símbolos
son muy útiles en la tarea de comprender los teoremas.
Tomemos la siguiente tabla, del libro de Levin y Rubin, en la que se consigna
datos sobre el número de hijos
Número de hijos 0 1 2 3
4 5 6 o más
Proporción de familias
Que tienen esa cantidad 0.05 0.10 0.30 0.25
0.15 0.10 0.05
De hijos
En el cuadro anterior tenemos una muestra para establecer las
probabilidades de que una familia tenga un número determinado de hijos; v. g: la
probabilidad de que una familia no tenga hijos es 0.05.
La probabilidad de que una familia tenga 4 hijos es 0.15 y así sucesivamente.
Ahora deseamos saber la probabilidad de que una familia del pueblo donde
se hizo la encuesta tenga 4 o más hijos; de inmediato nos damos cuenta de que ya
no estamos hablando de un solo evento sino de varios.
42
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 43/49
11. Probabilidad en varios eventos
La condiciones del anterior capítulo se representan de la siguiente manera:
P(4,5,6 o más) = P(4) + P(5) + P(6 o más)
= 0.5 + 0.10 + 0.05 = 0.30
Ahora ingresamos a una situación que puede darse en muchas oportunidades.
Supongamos que deseamos obtener un diez o un trébol de un mazo de 52
cartas; en este caso, debemos tener en cuenta que también podemos sacar un “diez
de trébol”.
Nos damos cuenta que sacar un diez o trébol no son eventos mutuamente
excluyentes, debido a que hay la probabilidad conjunta de un diez y un trébol al
mismo tiempo.
Debemos ajustar la ecuación para evitar el conteo doble, es decir, hay que
reducir la probabilidad de obtener ambos eventos juntos cuando deseamos saber la
probabilidad de un as o un corazón.
De este modo tendremos: P(diez) + P(trébol) – P(diez y trébol)
4/52 + 13/52 – 1/52 = 16/52 = 4/13
Otro ejemplo; los empleados de la empresa han elegido a 5 de ellos para que
los representen en el consejo de administración; los perfiles de los elegidos son:
Hombre, edad 30
Hombre 32
Mujer 45
Mujer 20
Hombre 40
Una vez elegidos, los cinco deciden, a su vez, elegir un portavoz
¿Cuál será la probabilidad de que la persona elegida sea mujer o tenga una
edad por encima de 35 años?
43
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 44/49
P(mujer o mayor a 35) = P(mujer) + P(mayor a 35) – P(mujer y mayor a 35) =
2/5 + 2/5 – 1/5 = 3/5 = 0.60
Probabilidad bajo condiciones de independencia estadística
En primer lugar, definiremos el concepto de “Independencia”
Dos eventos serán estadísticamente independientes entre sí cuando el eventoo resultado de uno de ellos no tiene influencia en el resultado o evento del otro.
Existen tres tipos de probabilidad independiente: Marginal, Conjunta,
Condicional
Probabilidades marginales en condiciones de independencia
Vimos que una probabilidad es marginal o incondicional cuando es la
representación simple de un evento; v.g el lanzamiento de una moneda normal
tendrá un evento: cara o cruz, con una probabilidad de 0,5 c/u.
No importa cuántas veces lancemos la moneda, la probabilidad de que salga
cara o cruz será la misma; cada lanzamiento es único y no tiene influencia sobre el
próximo lanzamiento.
Probabilidades conjuntas bajo condiciones de independencia estadística
La probabilidad de dos o más eventos independientes que se presentan
juntos es el producto de sus probabilidades marginales.
Usando la simbología aprendida, representamos ese caso de la siguiente
manera: P(AB) = P(A) x P(B)
P(AB) = probabilidad de que ambos eventos se presenten juntos o
probabilidad conjunta de A y B
P(A) = probabilidad marginal de que se presente el evento A
P(B) = probabilidad marginal de que se presente el evento B
Ejemplos
¿Cuál es la probabilidad cruz, cara y cruz, en ese orden, en tres lanzamientos
consecutivos de una moneda?
El resultado será: 0.5 x 0.5 x 0.5 = 0.125.
44
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 45/49
¿Cuál es la probabilidad de obtener cruz, cruz y cara, en ese orden luego de
tres lanzamientos consecutivos? 0.5 x o.5 x 0.5 = 0.125
¿Cuál es la cara de obtener al menos dos caras en 3 lanzamientos
consecutivos?
Estamos ante el caso mixto de probabilidad de eventos mutuamente
excluyentes, las que son aditivas (la probabilidad de obtener una cara más la
probabilidad de obtener otra cara) y un evento independiente.
Para visualizar mejor este proceso, tomemos la tabla 4.2 del texto de Levin y
Rubin, en la que se descomponen todas las probabilidades posibles de los eventos
que conforman el total del experimento
Denominaremos cara = H; cruz = T
Un lanzamiento Dos lanzamientos Tres lanzamientoR. Posibles Probalilidad R. Posibles Probabilidad R. Posibles Probabilidad
H1 0,5 H1,H2 0.25 H1, H2, H3 0.125
T1 0,5 H1,T2 0.25 H1, H2, T3 0.125
T1,H2 0.25 H1, T2, H3 0.125
T1.Y2 0.25 H1, T2, T3 0.125
T1, H3, H3 0.125
T1, H2, T3 0.125
T1, T2, H3 0.125
T1, T2, T3 0.125
1000
En la parte superior del cuadro se registra los tres lanzamientos de la moneda.
H1 significa “cara” y T1 es igual a “Cruz”
En el primer lanzamiento los posibles resultados son o una cara (H1) o una
cruz (T1) y la probabilidad para cada uno de estos resultados, tal como vimos es 0.5.
Tomemos en cuenta que 1 y 2 representan el primer y el segundo
lanzamiento, en todos los casos
Cuando lanzamos la moneda por segunda vez, nos trasladamos a la columna
45
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 46/49
“Dos lanzamientos”. Los resultados posibles son: el primer lanzamiento fue cara
(H1) y el segundo también (H2)
Vemos que los eventos del segundo lanzamiento están ligados a los eventos
que resultaron en el primero.
El segundo evento posible en la columna del segundo lanzamiento es H1, T2,
esto asume que en el primer lanzamiento salió una cara (H1) y en el segundo
lanzamiento salió una cruz (T”).
El tercer evento muestra que en el primer lanzamiento se obtuvo una cruz
(T1) y en el segundo, cara (H2)
El cuarto evento muestra que en el primer lanzamiento salió cruz (T1) y en el
segundo, cara (H2)
Las probabilidades en cada caso son 0.25, que resultan de
cara = probabilidad de 0.5
cruz = probabilidad de 0.5
La probabilidad, digamos del primer evento del segundo lanzamiento H1,H2
es 0.5 x 0.5 = 0.25
Lo mismo con las demás probabilidades
En la columna del tercer lanzamiento se anotan, como en las dos anteriores,los respectivos eventos; v.g en el primer lanzamiento se obtuvo una cara (H1) en el
segundo también (H2) y en el tercero, una cruz (T3).
La probabilidad de este evento será 0.5 x 0.5 x 0.5 = 0,125
El mismo razonamiento para los siguientes eventos, hasta que agotamos
todas las probabilidades posibles de los tres lanzamientos de la moneda.
Ahora ya podemos responder a la pregunta que nos hicimos al iniciar este
capítulo: ¿Cuál es la probabilidad de obtener cruz, cruz y cara, en ese orden luego
de tres lanzamientos consecutivos?
La pregunta ya nos hace saber que se trata de un experimento de tres
lanzamientos; en nuestra tabla vemos que los eventos que la pregunta exige son:
T1, T2, T3 = 0.125
46
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 47/49
Estos ejercicios nos muestran lo que hace la computadora, en el programa
SPSS, cuando le pedimos que calcule las probabilidades de un problema en el que
estamos interesados.
Probabilidades condicionales
Hasta ahora vimos dos clases de probabilidad: la probabilidad marginal (o
incondicional) y la probabilidad conjunta; la probabilidad marginal se representa por
(PA) y la conjunta por P(AB)
La Probabilidad Condicional que analizaremos ahora se representa por P(A/B)
que muestra dos eventos:
A, el primer evento y B, el segundo.
De esta manera, la Probabilidad Condicional P(A/B) representa el caso en que
el segundo evento B ocurre luego que el primero, A, ya ha tenido lugar.
Es decir, nos dice cuál será la probabilidad del evento B una vez que el evento
A ya ocurrió.
Antes de continuar, recordemos que para dos eventos independientes, A y B,
la ocurrencia de A nada tiene que ver con el la ocurrencia del evento B.
Así la probabilidad de lograr una cara en un segundo lanzamiento de la
moneda, después de que el primer lanzamiento dio como resultado, seguirá siendo
0.5, debido a que ambos eventos son independientes.
A continuación diseñaremos una pequeña ayuda-memoria para eventos
estadísticamente independientes.
Vemos allí que la probabilidad marginal, llamada también “incondicional” es
(PA)
La probabilidad Conjunta de dos eventos independientes estadísticamente es
P(AB) = P(A) x P(B)
La probabilidad condicional P(A/B) es P(B)
47
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 48/49
Tipo de Probabilidad Símbolo Fórmula
Marginal P(A) P(A)
Conjunta P(AB) P(A) x P(B)
Condicional P(A/B) P(B)
Probabilidad Condicional Bajo Dependencia Estadística
Antes de proponer la definición formal, vayamos a un ejemplo ilustrativo.
Hay una caja que contiene diez bolas de colores distribuidas de la manera
siguiente:
Tres bolas son de color y tienen puntos
Una es de color y tiene franjas
Dos son grises y tienen puntos
Cuatro son grises y tienen franjas
Siguiendo a Levin y Rubin, hacemos un pequeño cuadro para visualizar mejor
las condiciones del problema
La distribución de las diez bolas
Evento Probabilidad del Evento
1 0.1
2 0.1 (De color y con puntos)
3 0,1
4 0.1 (De color y con franjas)
5 0.1 (Grises y con puntos)
6 0.1
7 0.1
48
mailxmail - Cursos para compartir lo que sabes
5/10/2018 Conceptos Basicos a 37666 Completo - slidepdf.com
http://slidepdf.com/reader/full/conceptos-basicos-a-37666-completo 49/49
8 0.1 (Grises y con franjas)
9 0.1
10 0.1
Como hay diez bolas, la probabilidad de sacar una cualquiera de ella es 1/10
= 0.10
Supongamos que alguien saca una bola de color: ¿cuál es la probabilidad de
que ésta tenga puntos?
Simbólicamente, el problema puede representarse como P(D/C), es decir
¿cuál es la probabilidad de que la bola tenga puntos (D) dado que es de color (C)?
(Vemos que D representa una bola con puntos, C, de color)
La probabilidad de que la bola que se sacó era de color, queremos saber la
probabilidad de que, siendo de color, tenga puntos; para ello, ignoramos las bolas
grises, pues no cumplen con ninguna condición dada.
Sólo tomaremos en cuenta las que restan; hay cuatro bolas de color, tres de
las cuales tienen puntos y la cuarta tiene franjas; con esa información sólo tenemos
que encontrar las probabilidades sencillas.
Es decir, la probabilidad de que la bola tenga puntos y de que tenga franjas;
para ello nos damos cuenta que el total de bolas que tienen color son 4 y las que
tienen color y puntos son tres.
Por lo tanto, la probabilidad de una bola a color con puntos es = ¾ = 0.75
La probabilidad de color con franjas es = ¼ =0.25; ambas suman 1.
En el próximo capítulo veremos la fórmula general sobre la probabilidad
condicional
salto de capitulo}
49
mailxmail - Cursos para compartir lo que sabes