semana01 pye

Probabilidad y estadística UVM En Línea 1

En esta semana identificaremos la importancia y conceptos básicos de la esta-

dística:

¿Cómo puede ayudar la estadística en mi profesión?

¿Qué es un muestreo?

¿Cuál es la diferencia entre un parámetro y un estadístico?

Propósito de

la Unidad

El estudiante aplicará las principales medidas estadísticas de acuerdo al tipo de datos con el fin de resolver proble-

mas.

Unidad 1 Estadística Descriptiva

Temas 1.1. Introducción

Probabilidad y Estadística

Unidad 1. Estadística descriptiva

Resumen


Introducción

En esta Unidad se presentará una visión general de la estadística y su uso, te-

niendo a lo largo de la misma, las definiciones básicas, muestreo estadístico,

las funciones de la estadística y de qué manera nos puede ayudar la estadística

en nuestra profesión.

Unidad 1. Estadística Descriptiva


Importancia de la estadística

En el proceso de toma de decisiones la estadística juega un papel primordial. El

control de calidad, la minimización de costos, la combinación de productos e

inventarios y una gran cantidad de otros asuntos, pueden manejarse efectiva-

mente a través del uso de procedimientos estadísticos comprobados.

En la era actual, al contar con una gran cantidad de información y analizarla,

puede ser la diferencia entre el éxito. Al analizar la información puede ser de

gran ayuda el poder determinar el éxito de un producto o seleccionar oportuni-

dades de inversión. Médicos, contadores, área de recursos humanos, la gene-

ración de nuevos productos, la efectividad de un medicamento, pueden ser

algunas de las muchas áreas que se benefician con el uso del análisis estadísti-

co.

El campo de la estadística es un conjunto de procedimientos para reunir, me-

dir, clasificar, codificar, computar, analizar y resumir información numérica ad-

quirida sistemáticamente.

En este curso se asume que los datos están disponibles, y se deben organizar

y representar de manera significativa y descriptiva (estadística descriptiva), y

posteriormente deben ser analizados e interpretados (estadística inferencial).

Oportunidad que ofrece la estadística

Mediante el uso apropiado de los procedimientos estadísticos, se puede lograr

tomar decisiones y solucionar problemas. El análisis estadístico puede ser de

gran utilidad cuando se formulen de manera acertada preguntas esenciales.

Gran cantidad de disciplinas dependen del análisis estadístico como: mercado-

tecnia, finanzas, investigación de operaciones.

1.1. Introducción


Las habilidades cuantitativas permiten a los analistas financieros y económicos

proporcionar soluciones a problemas difíciles, encontrar soluciones viables y

tomar decisiones.

Como consecuencia de la globalización, los negocios deben hacer un esfuerzo

por promover la calidad de sus productos. La Gerencia de la Calidad Total tiene

como objetivo la promoción de las cualidades de los productos que el consumi-

dor considera importantes. Estos atributos incluyen la ausencia de defectos

hasta el servicio eficiente y la respuesta rápida a las posibles quejas del con-

sumidor. Actualmente muchas empresas cuentan con departamentos de con-

trol de calidad, que se encargan de recolectar datos y solucionar problemas,

por lo que la gerencia de calidad total representa un área creciente de oportu-

nidades para quienes tienen conocimientos en estadística.

La Gerencia de Calidad Total involucra el uso de equipos multidisciplinarios que

pueden contribuir a la satisfacción del cliente. La formación de estos equipos,

se denomina “Despliegue de la función de Calidad” y está diseñada para pro-

mover la calidad del producto y para satisfacer las necesidades y preferencias

del consumidor.

Los Círculos de Control de Calidad, son un grupo pequeño de empleados (5 a

12) que se reúnen regularmente para solucionar problemas relacionados con el

trabajo, los miembros pertenecen a la misma área de trabajo y reciben capaci-

tación en control estadístico de calidad y en planeación de grupos. Mediante el

análisis estadístico y discusiones abiertas, estos círculos pueden lograr mejoras

significativas en diversas áreas que van desde el mejoramiento de la calidad,

el diseño del producto, la productividad y los métodos de producción, hasta la

reducción de costos y seguridad. Se estima que el 90% de las 500 mejores

compañías que aparecen en la revista Fortune utilizan de manera efectiva los

círculos de control calidad.

Conceptos básicos

Analizar significa descomponer algo y examinarlo con detalle de manera orga-

nizada. Al realizar trabajo estadístico, analizamos grupos de personas, objetos

o eventos y medimos variables para obtener promedios, tendencias o porcen-

tajes. La medición de una persona u objeto es una observación, por ejemplo la


edad de Juan es 18; sin embargo al determinar la edad promedio de un grupo

de estudiantes es calcular un estadístico con base en un conjunto de observa-

ciones. En la estadística se llevan a cabo cálculos resumidos de muchas obser-

vaciones, el cual se logra observando muchos casos, recabar información de

estos y hacer declaraciones concisas sobre el grupo, no sobre los individuos.

Una población incluye todas las entidades u observaciones de in-

terés. Algunas poblaciones típicas son: todos los votantes poten-

ciales en una elección presidencial, todos los suscriptores a una

televisión de cable.

Una muestra es un subgrupo pequeño de la población; la mues-

tra se observa y se mide y después se utiliza para obtener con-

clusiones sobre la población.

Una población incluye todas las entidades de interés en un estu-

dio, sean personas, máquinas, o lo que sea. Una muestra es un

subconjunto de la población, generalmente seleccionadas al azar

y preferentemente que sean representativos de la población. La

mayoría de las poblaciones son tan grandes que no se podrían in-

vertir tiempo y recursos para medir a todos los miembros; por

ejemplo, sería absurdo medir la estatura de todos los adultos de

un país; sin embargo el muestreo nos permite estimar paráme-

tros con precisión. Con la muestras calculamos estadísticos en vez

de parámetros.

Un parámetro es una medida descriptiva de la población total de

todas las observaciones de interés para el investigador.

Un estadístico es una medida descriptiva de la muestra. Elemen-

to que describe una muestra y sirve como una estimación del pa-

rámetro de la población correspondiente.


Un ejemplo para comprender que una muestra nos proporciona estimacio-

nes, consiste en comparar los resultados de varias muestras de la misma

población. Por ejemplo, un profesor puede mandar a cada uno de sus 30

estudiantes a reunir una muestra de 10 compañeros estudiantes y estimará

el promedio de edad de los estudiantes, cada miembro obtendrá un resul-

tado diferente. Esta variabilidad en los resultados de las muestras refleja el

hecho de que es estadístico de una muestra única es sólo una estimación

del verdadero parámetro de la población.

Variables y observaciones

Para estandarizar el análisis de datos, especialmente en computadora, es

recomendable presentar los datos en filas y columnas. Cada columna repre-

senta una variable (campo) y cada fila corresponde a una observación (caso

o registro), esto es, un miembro de la población o muestra.

Una variable (campo) es un atributo, o medida en los miembros de una po-

blación, tal como altura, género, salario. Una observación (registro, caso)

es una lista de todos los valores de las variables para un miembro de la po-

blación.

Población

X X X X X X X X

X X X X X X X X X

X X X X X X X X X

X X X X X X X X

X X X X X X X

Muestra

X X X X X

X X X X X X

X X X X X X

X X X X X X

X X

X X X X X

X X

Parámetro Estadístico


En el ejemplo de la tabla se muestran las variables o campos: nombre,

edad, sexo e hijos (las columnas). Existen en este ejemplo dos registros u

observaciones.

Tipos de datos

Una variable puede ser cuantitativa, cuando se puede expresar numérica-

mente, como por ejemplo: ingresos, veces que toma el autobús; y es cuali-

tativa, cuando se mide de manera no numérica, estado civil, sexo, raza,

etc.

Las variables numéricas pueden ser clasificadas como discretas o continuas.

Una variable es discreta si es posible llevar un conteo. Una variable conti-

nua es el resultado de una medida esencialmente continua y puede tomar

cualquier valor dentro de un rango dado.

Muestreo

El trabajo en estadística se realiza con muestras, ya que las poblaciones son

demasiado grandes para estudiarlas en su totalidad, además de ser costoso y

demandaría mucho tiempo. Por lo que se deberá tomar una muestra de la po-

blación y calcular el estadístico de la muestra para estimar el parámetro co-

rrespondiente de la población.

Nombre Edad Sexo Hijos

Claudia 23 F 0

Susana 32 F 2

observaciones

variables


Este análisis sobre las muestras implica una distinción entre las dos principales

ramas del análisis estadístico, la estadística descriptiva y la estadística inferen-

cial.

Error de muestreo

La exactitud de toda estimación es de enorme importancia y depende de la

forma como se tomó la muestra y del cuidado que se tenga para garantizar

que la muestra proporciona una imagen confiable de la población; sin embar-

go, con mucha frecuencia se comprueba que la muestra no es representativa

de la población y resulta un error de muestreo.

El error de muestreo es la diferencia entre el estadístico de la muestra utilizada

para calcular el parámetro de la población y el valor real pero desconocido del

parámetro.

Existen dos causas posibles del error de muestreo.

La estadística descriptiva es el proceso de recolectar, agrupar y presen-

tar datos de una manera que describa fácilmente los datos, utilizando ta-

blas o gráficas. Una de las características de la estadística descriptiva con-

siste en explicar cuántas observaciones fueron registradas y qué tan fre-

cuentemente ocurrió en los datos cada puntuación o categoría de las ob-

servaciones.

Un segundo propósito del análisis estadístico es extraer conclusiones sobre

las relaciones matemáticas entre las características de un grupo de persona

u objetos. Este tipo de análisis se denomina estadística inferencial. La

estadística inferencial involucra la utilización de una muestra para sacar

alguna inferencia o conclusión sobre la población de la cual se obtuvo la

muestra.


Para manejar exitosamente el error de muestreo debemos enfocarnos en sus

fuentes específicas: el tamaño y representatividad de la muestra. El tamaño

de la muestra se refiere al número de casos y observaciones que constituyen

una muestra: el número de personas u objetos observados. Cuanto mayor sea

la muestra, menor será el rango de error.

Otro factor que afecta la exactitud del muestre es hasta qué punto todos los

segmentos de una población realmente están incluido en la muestra. Una

muestra representativa es aquella en la que todos los segmentos de la po-

blación están incluidos en la muestra en sus proporciones correctas de la po-

blación.

Escalas de medidas

Las variables se pueden clasificar con base en su escala de medida. Las varia-

bles pueden ser (1) nominales (2) ordinales, (3) de intervalo o (4) de razón.

a) el azar en el proceso de muestreo, ya que es posible seleccionar

elementos atípicos que no representan a la población y,

b) el sesgo muestral ocurre cuando hay una tendencia a seleccionar

determinados elementos de muestra en lugar de otros. Si el proceso

de muestreo tiende a promover la selección de demasiadas unidades

con una característica en especial, a expensas de la unidades que no

tienen dicha característica se dice que la muestra está sesgada, por

ejemplo, seleccionar a hombres excluyendo mujeres.


Las variables nominales, son aquellas donde los códigos sólo indi-

can una diferencia en categoría, clase, calidad o tipo. Estas variables

tienen categoría de nombre. Ejemplo:

- lugar de nacimiento (Chicago, Atlanta, Monterrey, etc.)

- Fruta favorita (melón, plátano, fresa, etc.)

- Carrera académica (psicología, química, ingeniería eléctrica)

Este tipo de variables no admiten puntuaciones numéricas ordenadas

significativamente. A veces numeramos las categorías de estas va-

riables en códigos, por ejemplo: 1: Chicago, 2: Atlanta, etc., pero el

número no representará ningún orden, ya que de la misma manera

se puede representar 1: Atlanta, 2: Chicago. Las variables dicotómi-

cas tienen sólo dos categorías: “Si” o “No”, o “ausencia” o “presen-

cia”.

Las variables ordinales designan categorías, pero tienen la propie-

dad adicional de permitir clasificar las categorías desde la mayor has-

ta la menor, de la mejor a la peor, de la última a la primera. Las

preguntas de estudio que miden actitudes y opiniones a menudo

emplean puntuaciones ordenadas. Por ejemplo “actitud hacia el abor-

to legal”, puede ser: “totalmente de acuerdo”, “de acuerdo”, “no sa-

be”, “en desacuerdo”, “totalmente en desacuerdo”.

Las variables de intervalo tienen las características de las variables

nominales y ordinales, y además una unidad numérica de medición

definida. Ejemplo: temperatura, coeficiente de inteligencia CI

[0,200].

Con las variables de intervalo, los intervalos o distancias entre pun-

tuaciones son las mismas entre cualquier par de puntos entre la es-

cala de medición. Proporcionan la habilidad para sumar, restar, mul-

tiplicar y dividir puntuaciones y calcular promedios.


A continuación en la tabla siguiente se resumen las características de los cua-

tro niveles de medición.

Nivel de

medición

Ejemplo Cualidades Operaciones matemáticas

permitidas

Nominal Género, raza, preferencia reli-

giosa, estado civil

Clasificación en cate-

gorías; denominación

de categorías

Conteo del número de casos

de cada categoría de la varia-

ble; comparación de los ta-

maños de las categorías

Ordinal Rango de clase social, preguntas

de actitud y opinión

Clasificación de cate-

gorías; ordenamiento

de los rangos de cate-

gorías de la menor a la

mayor

Todas las anteriores y los

juicios de mayor que y menor

que y el cálculo de diferencias

y promedios de rangos

De intervalo Temperatura, índices resumidos,

escalas de actitud y opinión

Todas las anteriores y

las distancias entre las

puntuaciones tienen

una unidad determina-

da de medición

Todos los anteriores y las

operaciones matemáticas

como suma, resta, multiplica-

ción, división, raíz cuadrada

De razón Peso, ingreso, edad, años de

educación, tamaño de la pobla-

ción

Todo lo anterior y un

punto cero real

Todas las anteriores y el

cálculo de razones con signifi-

cado

Las variables de razón tienen las características de las

variables de intervalo y un punto cero verdadero, donde una puntua-

ción cero significa ninguno. Ejemplo: peso, altura, duración en tiem-

po. Una razón es la cantidad de una observación con respecto a otra.

Por ejemplo: la población de una ciudad “x”, es dos veces la pobla-

ción de la ciudad y, 2:1.


En la tabla que se muestra a continuación, se presenta la elaboración de un

índice para transformar diversas variables nominales en una variable de razón.

Número y nombre de

la variable

Definición operacional Nivel de medición Código

1. Fuma ¿Es fumador habitual? Nominal 0=no 1 = sí

2. Alcohol Ha consumido cinco o más

bebidas alcohólicas en una

sola ocasión en el último mes

Nominal 0=no 1 = sí

3. Ejercicio No se ejercita regularmente Nominal 0=no 1 = sí

4. Drogas Ha usado una droga ilícita en

el último mes


5. Conduce Ha manejado mientras se

encuentra en estado de ebrie-

dad


6. Riesgo Reporte del número de con-

ductas de riesgo

Razón Suma de las respues-

tas “sí”, para la va-

riable 1 a la 5


Ritchey, F. (2008). Estadística para las Ciencias Sociales. México: McGrawll

Hill.

Allen L.W. (2001). Estadística aplicada a los negocios y la economía. México:

Mc Graw Hill.

Referencias Bibliográficas

semana01 pye

Documents