unidad 1

11
Fundamentos de la estadistica Unidad 1 La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico. En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos, así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple. 1.1 introduccion a la estadística La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva. La palabra estadística también se utiliza para referirse a la información estadística (descripción de parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo, cuando leemos las estadísticas de los equipos o escuchamos la estadística muestra que el índice de reprobación en las escuelas es tal , se hace referencia a los datos y no al procedimiento o metodología de análisis. Utilidad e importancia de la estadística La palabra estadística también se utiliza para referirse a la información estadística (descripción de parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo, cuando leemos las estadísticas de los equipos o

Upload: victor-ceron

Post on 08-Dec-2014

24 views

Category:

Documents


3 download

TRANSCRIPT

Page 1: Unidad 1

Fundamentos de la estadistica

Unidad 1

La palabra estadística a menudo te remite a gráficas y tablas; cifras relativas a nacimientos, muertes, impuestos, demografía, ingresos, deudas, créditos, etc. No obstante, para aprovechar las herramientas de análisis estadístico, es necesario comprender qué representa cada concepto y la metodología mediante la cual se obtiene un dato estadístico.

En esta unidad se hablará sobre la importancia de la estadística, conocerás sus conceptos básicos, así como la metodología del muestreo para que al final, obtengas una muestra aleatoria simple.

1.1 introduccion a la estadística

La estadística es la ciencia cuyo objetivo es reunir información cuantitativa relacionada a individuos, grupos, series de hechos, entre otros. Gracias al análisis de estos datos se pueden deducir algunos significados precisos o algunas previsiones para el futuro. La estadística, en general, es la ciencia que trata la recopilación, la organización, la presentación, el análisis y la interpretación de datos numéricos con el fin de realizar una toma de decisiones más efectiva.

La palabra estadística también se utiliza para referirse a la información estadística (descripción de parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo, cuando leemos las estadísticas de los equipos o escuchamos la estadística muestra que el índice de reprobación en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodología de análisis.

Utilidad e importancia de la estadística

La palabra estadística también se utiliza para referirse a la información estadística (descripción de parámetros); es decir, a series de datos, tablas y gráficas que presentan resultados. Por ejemplo, cuando leemos las estadísticas de los equipos o escuchamos la estadística muestra que el índice de reprobación en las escuelas es tal, se hace referencia a los datos y no al procedimiento o metodología de análisis.

División de la estadística

La estadística, por su aplicación se divide en:

1) Estadística descriptiva.La función descriptiva de la estadística se enfoca en la presentación y clasificación de los datos obtenidos de la población que se analiza.

2) Estadística inferencial.

Page 2: Unidad 1

Esta aplicación de la estadística busca plantear y resolver problemas específicos y/o hacer previsiones a partir de los datos de una muestra, dado que es muy difícil estudiar a la población completa.

Conceptos básicos de estadística

Los conceptos más utilizados en estadística son los que a continuación se presentan.

Población: Conjunto de todos los elementos que permiten resolver un problema, que presentan una característica común determinada, observable y medible. Por ejemplo, si el elemento es una persona, se pueden estudiar las características edad, peso, nacionalidad, sexo, etc. Los elementos que integran una población pueden corresponder a personas, objetos o grupos (por ejemplo, familias, las manzanas de una cosecha, empleados de una empresa, etc.).Individuo: Un individuo o unidad estadística es cada uno de los elementos que componen la población. Nota que un individuo en estadística puede ser distinto a un individuo como persona. Por ejemplo, en los censos económicos se obtienen datos de los negocios. En este caso cada negocio, que está formado por varias personas, es un individuo de la población.Muestra: Cuando es difícil estudiar la población debido a su gran tamaño o que provenga de un proceso que no se detiene (como la producción de un bien), se debe analizar un subconjunto o parte de ésta que la represente, llamado muestra, partiendo del supuesto de que este subconjunto presenta el mismo comportamiento y características que la población. En general el tamaño de la muestra es mucho menor al tamaño de la población.

Muestreo: Es el proceso de recabar los datos que se desean analizar, obtenidos de una proporción reducida y representativa de la población.

Dato: El dato es cada uno de los valores que se han obtenido al realizar un estudio estadístico. Por ejemplo: Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.Variable: Se llama variable a una característica que se observa en una población o muestra, y a la cual se desea estudiar. La variable puede tomar diferentes valores dependiendo de cada individuo. Las variables se pueden clasificar en dos tipos:

1. Variable cuantitativa. Puede ser escala continua o discreta.

2. Variable cualitativa. Puede ser escala nominal u ordinal.

Page 3: Unidad 1

 

Tipos de variables

La variable es una característica de la población o muestra que desea estudiarse. Las variables pueden ser:

Como utilizamos los conceptos

En el ejemplo La estadística y la saludidentificaste algunos conceptos básicos de estadística. Ahora, revisemos juntos(as) los conceptos que estaban en el texto. 

La población de estudio es la sangre del individuo, de la cual se toma una muestra que representa una pequeña parte de esta población. Esta muestra contiene información sobre las características que se desean observar.Los (las) expertos(as) de laboratorio preparan la sangre para observar en un microscopio electrónico los elementos (variables) que contiene, por ejemplo pueden observar la cantidad de plaquetas o neutrófilos (las plaquetas y los neutrófilos son los individuos y la cantidad que contiene la sangre de estos elementos son los datos) que contiene la muestra por unidad de volumen

Se realiza un conteo, en este caso, del número de plaquetas y del número de neutrófilos, esta información se representa por medio de un estadístico, característica numérica que refleja la información contenida en la muestra, en la que se observa el total de plaquetas. 

Aunque, en realidad, lo que nos interesa conocer o estimar es el total de plaquetas en el total de la sangre (población) del individuo.

Page 4: Unidad 1

¿Cuántos conceptos identificaste en la lectura?

La metodología para solucionar un problema estadístico comprende los siguientes pasos:

1. Planteamiento del problema. En el planteamiento se define si se requiere de una muestra o es posible estudiar la población, las características a estudiar (las variables), si es necesario establecer  una hipótesis, entre otros. En este punto también se analizan los medios de los que se dispone y el procedimiento a seguir.2. Elaboración de un modelo. Se establece un modelo teórico de comportamiento de las variables de estudio. En ocasiones no es posible diseñar el modelo hasta realizar un estudio previo. Los posibles modelos son normal, binomial, poisson, uniforme, y otros como binomial negativa, geométrico.

3. Extracción de la muestra. Se usa alguna técnica de muestreo o un diseño experimental para obtener información de una pequeña parte de la población.

4. Tratamiento de los datos. En esta fase se eliminan posibles errores, se depura la muestra, se tabulan los datos y se calculan los valores que serán necesarios en pasos posteriores, como la media y la varianza de la muestra. Los métodos de esta etapa corresponden a los métodos de la estadística descriptiva. Algunas de las etapas de esta fase son: recopilación, clasificación y presentación de la información.

5. Estimación de los parámetros. La estadística inferencial nos proporciona herramientas para la predicción o estimación de los parámetros de la población que nos ayudarán a resolver el problema. Un ejemplo de estas herramientas son las pruebas de hipótesis que se obtienen del análisis de los datos y los intervalos de confianza.

Page 5: Unidad 1

Muestreo aleatorio

Introducción

Los estudios estadísticos normalmente se hacen con una parte de la población, ya que realizarlos sobre la totalidad resultaría demasiado complicado. Para que la información obtenida tenga validez y confiabilidad es necesario que la muestra cumpla con ciertas condiciones específicas.

Page 6: Unidad 1

Estas condiciones están relacionadas con el método para determinar el tamaño y características de la muestra y los individuos que la componen.

El muestreo aleatorio simple es el procedimiento por medio del cual se obtiene una muestra aleatoria simple.

Una muestra aleatoria simple es la que resulta de aplicar un método por el cual todos los elementos de la población tienen la misma probabilidad de ser elegidos.

A continuación, conocerás cuáles son los pasos para obtener una muestra aleatoria simple.

Paso 1. Definir la población de estudio y el parámetro a estudiar.

Paso 2. Enumerar a todas las unidades de análisis que integran la población, asignándoles un número de identidad o identificación.

Paso 3. Determinar el tamaño de la población, determinar el porcentaje de error y el porcentaje de confianza y obtener una muestra preliminar.

Paso 4. Determinar el tamaño óptimo de la muestra para el estudio.

Paso 5. Seleccionar los sujetos dela muestra usando números aleatorios.

Pasos para obtener una muestra aleatoria simple

Has visto una descripción general del procedimiento que debes seguir para obtener una muestra aleatoria simple, ahora revisarás cada paso específico.

Paso 1. Definir la población de estudio y las variables a estudiar.

Recuerda que la población es el grupo formado por el conjunto total de individuos, objetos o medidas que poseen algunas características comunes, observables en un lugar y en un momento determinado. Por lo tanto, el paso 1 es determinar qué se estudiará.

Ejemplo 

Un investigador realiza un estudio sobre las relaciones de género en el noviazgo, su objeto de estudio son las manifestaciones de violencia física y psicológica entre los (las) estudiantes del último año de la carrera de química. Su población es el total de estudiantes del último año de ingeniería química que tengan novio o novia; el total de individuos con esta característica es de 386. Por lo que, la población es de 386 individuos y las variables son: violencia física y violencia psicológica.

Page 7: Unidad 1

Paso 2. Numerar todas las unidades de análisis que integran la población, asignándoles un número de identificación.

Una vez que has definido la población y las variables a estudiar, es necesario asignar un número de identificación a cada individuo de la población.

Siguiendo con el ejemplo de la relaciones de género en el noviazgo de los (las) estudiantes de química, lo que sigue es numerar a los 386 estudiantes un número del 1 al 386.

Paso 3. Definir la población, determinar el porcentaje de error y el porcentaje de confianza.

Para calcular el tamaño de una muestra hay que tomar en cuenta tres factores:

1. El porcentaje de confianza con el que se quiere generalizar los datos, desde la muestra hacia la población total. 2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización. 3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

A continuación definiremos estos conceptos.

Ahora veamos una definición de los conceptos implicados en el paso 3.

Definir el tamaño de la población. Significa determinar el número de individuos que la constituyen; la variable N representa el tamaño de la población. N=XPorcentaje de confianza. Es el grado o nivel de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados, pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto se busca un porcentaje de confianza menor, comúnmente es un 95%. El nivel de confianza es la probabilidad que establecemos (sin hacer ningún cálculo) para poder acertar al valor verdadero de la población . Este dato se obtiene a partir de la distribución normal estándar.orcentaje de error. Este error es una distancia alrededor del valor que deseamos estimar y nos da un margen de aproximación. Al igual que en el caso de la confianza, si se quiere eliminar el riesgo del error y considerarlo como 0%, entonces la muestra es del mismo tamaño que la población, por lo que conviene correr un cierto riesgo de equivocarse. Comúnmente se aceptan entre el 4% y el 6% como error, tomando en cuenta de que no son complementarios la confianza y el error.

Page 8: Unidad 1

Variabilidad. Es la probabilidad (o porcentaje) con el que se aceptó y se rechazó la hipótesis que se quiere comprobar. El porcentaje con que se aceptó tal hipótesis se denomina variabilidad positiva y se indica con p (también llamada probabilidad de éxito ), y el porcentaje con el que se rechazó la hipótesis es la variabilidad negativa, identificada por q (también llamada probabilidad de fracaso y se obtiene 1-p).Variabilidad positiva=p= a la probabilidad de que suceda el eventoVariabilidad negativa=q=a la probabilidad de que no suceda el eventoLa variabilidad positiva (p) al sumarla con la negativa (q) siempre nos debe dar la unidad p+q=1.Cuando no se tienen antecedentes sobre la investigación, entonces los valores de variabilidad sonp=q=0.5

Paso 4. Determinar el tamaño de la muestra óptimo para el estudio.

Una vez que la población, el porcentaje de confianza, el porcentaje de error y el nivel de variabilidad han sido determinados, se debe determinar el tamaño de la muestra.

Puedes calcularlo mediante alguna de las dos fórmulas que examinarás: una para los casos en que se conoce el tamaño de la población y la otra para cuando este dato se desconoce.

Fórmula para cuando no se conoce el tamaño de la población

Fórmula para cuando se conoce el tamaño de la población

Nota. En este momento no conoces los procedimientos para obtener todos los componentes de las fórmulas, en los ejemplos, estos componentes ya están dados. Estos procedimientos se verán más adelante.

1.Haz clic sobre las fórmulas para ver un ejemplo de cómo se aplican.

2.Observa el video “Determinar el tamaño de la población”, que se encuentra en la pestaña Material de apoyo, en la página de inicio del curso.

Page 9: Unidad 1