términos básicos en estadística

32
Instituto Universitario Politécnico Santiago Mariño Extensión Oriente Ingeniería Industrial Estadística Estadística

Upload: cesar-sanchez

Post on 09-Aug-2015

92 views

Category:

Education


3 download

TRANSCRIPT

Instituto Universitario Politécnico Santiago Mariño Extensión Oriente

Ingeniería IndustrialEstadística

Estadística

Cesar GuaracoCI: 23.519.781

Es posible hacer que una vaca suba escaleras pero no que las baje je

Definición, tipos y ejemplos de variables

Definición:

Variable: también se les llama características cuantitativas, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente la magnitud de dichas variaciones.

Tipos:

• Variables continuas: se caracterizan por el hecho de que para todo par de valores, siempre se puede encontrar un valor intermedio. (Peso, distancia, etc.)

•Variables discretas: será aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas solo toma un determinado número de valores. Porque entre dos valores consecutivos no pueden tomar ningún otro. (Número de hijos, números de votos)

Se estima que globalmente en el mundo siempre hay al menos un 7% de la población que se encuentra borracha

Definición, y ejemplo de población y muestra

Definición:

Muestra: una parte de la población a estudiar qué sirve para representarla. Su estudio es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo.

Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.

Muestra y Población: son conceptos relativos: una población es un todo y una muestra es un segmento de un todo.

Muestreo: Tiene que ver con el tamaño de la muestra y la manera de obtenerla.

Para calcular el tamaño de una muestra hay que tomar en cuenta 3 factores:

1.  El  porcentaje  de  confianza  con  el  cual  se  quiere  generalizar  los  datos  desde  la muestra hacia la población total.

2.  El  porcentaje  de  error  que  se  pretende  aceptar  al  momento  de  hacer  la generalización

3. El nivel de variabilidad que se calcula para comprobar la hipótesis.

     La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para  generalizar  los  resultados  obtenidos.  Esto  quiere  decir  que  un  porcentaje  del   100% equivale  a  decir  que no existe ninguna duda para  generalizar  tales  resultados pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto para el estudio debido a que en ocasiones  llega a  ser prácticamente  imposible  el  estudio  de  todos  los  casos,  entonces  se  busca  un porcentaje de confianza menos. Se busca un 95%.El  porcentaje  de  error  equivale  a  elegir  una  probabilidad  de  aceptar  unas  hipótesis que sea falsa como si fuera verdadera o a la inversa.Si  los  resultados de una encuesta electoral  indicara que un partido  iba a obtener, el 55% de los votos y el error estimado que es el porcentaje ideal de votos estará en el intervalo 52 -58% = 6 (55% ± 3%)

En el caso de que se conozca el tamaño de la población entonces se aplica la siguiente fórmula: 

K 1,15 1,28 1,44 1,05 1,96 2 2,58

Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99%

• n = el tamaño de la muestra.• N = el tamaño de la población.• K es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos.Un 95,5% de confianza es lo mismo que decir, que nos podemos equivocar con una probabilidad del 4.5%Los valores K más utilizados y sus niveles de confianza:

Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la formula K=1,96• e = el error muestral deseado.•p = la proporción de individuos que poseen en la población la característica de estudio

. Este dato es generalmente desconocido y se suele suponer que: P = q = 0,5 que es la opción más segura.• q = la proporción de individuos que no poseen la característica es decir 1 – p

Sabias que más del 50% de la gente del mundo nunca ha hecho o recibido una llamada telefónica.

Definición, y ejemplo de

sumatoria, razón, proporción, tasa y frecuencia

Definición:

Sumatoria (Σ): La sumatoria es un símbolo muy utilizado en matemáticas que sirve para simplificar formulas estadísticas. Por lo general después de una sumatoria, aparece una variable con un suscrito representado por la letra (i) = , este suscrito indica que valores de la variable se deben sumar. Para determinar cuáles valores es necesario sustituir la (i) por los valores que se indican.

Una sumatoria se define como:

• La variable (i) es el índice de suma al que se le asigna un valor inicial llamado límite inferior (m).

• La variable (i) recorrerá los valores enteros hasta alcanzar el límite superior (n), (m < n).

Por ejemplo si queremos expresar la suma de los diez primeros números naturales podemos hacerlo así con una sumatoria.

Definición:

Razón: Es el valor que se obtiene dividiendo una cantidad por otra. Es el cociente de dos variables, los valores del numerador y del denominador son independientes, ninguno está contenido en el otro.

Ejemplo:

• Razón de masculinidad = 

• Razón de mortalidad marteña = 

Definición:

 Proporción: es un caso especial de razón en la cual el numerador está formado por parte de los individuos del denominador. Proporción es el cociente de dos variables, el numerador está contenido en el denominador.

Ejemplo: Proporción de masculinidad =

Definición:

Tasa: es una razón que expresa un cambio en una cantidad con respecto a otra. Tasa es un tipo de proporción que toma en cuenta el variable tiempo. Es la medida que expresa la dinámica de los eventos o la magnitud del cambio de la variable que mide un evento por unidad de cambio a otra (el tiempo) en relación con el tamaño de la población.

Tipos:

Las Tasas Brutas, son calculadas para toda la población.

Las Tasas Específicas, se calculan para un subgrupo específico que está en riesgo de presentar el evento.

Tasa general de fecundidad, relaciona el número de nacimientos con el de mujeres de 15 a 44 años de edad (EDAD FERTIL), dando una visión de cuántos niños están naciendo por cada mil mujeres.

Tasa de Fecundidad = 

Definición:

Frecuencia: Cuando se reúnen gran cantidad de datos primarios es útil distribuirlo en clases y categorías y determinar las frecuencias de las clases, ósea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencia.Frecuencia de un dato es el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma (r) valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serian (N), siendo (N) la suma de las respectivas frecuencias de cada dato.  

Tipos:

• Frecuencia Absoluta : es el número de veces que aparece un determinado valor en un estudio estadístico. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por (N).

  Para indicar resumidamente estas sumas se utiliza la letra griega (Σ) que se lee sumatoria .

• Frecuencia Relativa : Es el cociente entre las frecuencia absoluta de un determinado valor y el número total de datos. , la suma de las frecuencias relativas es igual a 1.

• Frecuencia Acumulada : Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.

• Frecuencia Relativa Acumulada : Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.

Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas.27-28-28-29-29-29-29-29-2930-30-30-30-30-30-30-31-31-31-31-31-31-31-31-32-32-32-33-33-33-34

En la primera columna de la tabla colocamos la variable ordenad de menor a mayor, en la segunda anotamos la frecuencia absoluta.

Xi fi Fi hi Hi27 1 1 0,032 0,03228 2 3 0,065 0,09729 6 9 0,194 0,29030 7 16 0,226 0,51631 8 24 0,258 0,77432 3 27 0,097 0,87133 3 30 0,097 0,96834 1 31 0,032 1

N= 31 1

Un hombre tiene seis veces más de probabilidad de ser alcanzado por un rayo que una mujer

Definición, y ejemplos de

parámetros estadísticos

Definición:

Parámetro estadístico: Es  un  número  que  se  obtiene  a    partir  de  los  datos  de  una distribución estadística.

Los parámetros estadísticos sirven para sintetizar  la  información dada por una tabla o por una grafica. 

Tipos:

Existen tres tipos de parámetros estadísticos los cuales son:

1. De centralización.2. De posición3. De dispersión.

Definición:

Medidas de Centralización: Nos indican en torno a que valor (centro) se distribuyen los datos. Son estadígrafos de posición que son interpretados como valores que permiten resumir a un conjunto de datos dispersos, podría asumirse que estas medidas equivalen a un centro de gravedad que adopta un valor representativo para todo un conjunto de datos predeterminados.

Tipos:

1. Media: la media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta todos los casos solamente puede utilizarse con variables cuantitativas.

Ejemplo de media:

Un grupo de 11 estudiantes saco las siguientes notas: 04-10-16-09-11-16-18-20-05-14-16

La media = 12,64

Propiedades de la media aritméticaDe cálculo sencillo.Su valor es único.

Desventajas de la media aritméticaSu significado afecta de sobremanera la dispersiónSe ve afectada por valores externos

Definición:

Moda: Es el dato más repetido, su cálculo es muy sencillo, solo se necesita un recuento.

Ejemplo:

04, 10, 16, 09, 11, 16, 18, 20, 05, 14, 16

La moda es: 16

Definición:

Mediana: es un valor de la variable que deja por debajo de si a la mitad de los datos, una vez que estos están ordenados de menor a mayor.

Ejemplo:

 04, 10, 16, 09, 11, 16, 18, 20, 05, 16, 14En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los valores del medio.Ordenas los datos; 04 – 05 – 09 – 10 – 11 – 14 – 16 – 16 – 16 – 18 – 20

Buscamos cual ocupa la posición central; La Mediana es: 14

En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los valores del medio.

Definición:

Medidas de posición: Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.

Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.

Tipos:

Las medidas de posición son:

1. Cuartiles: Dividen la serie de datos en cuatro partes iguales.2. Deciles: Dividen la serie de datos en diez partes iguales.3. Percentiles: Dividen la serie de datos en cien partes iguales. 

Definición:

Medidas de dispersión: Son estadígrafos de dispersión que permiten evaluar el grado de homogeneidad, dispersión o variabilidad de un conjunto de datos.Muestran la variabilidad de una distribución, indicando por medio de un numero, si las diferentes puntuaciones de una variable están muy alejadas de la media.Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.

Tipos: 

1. Amplitud o rango2. Varianza3. Desviación estándar4. Coeficiente de variabilidad 

Definición:

Rango (R): Es la diferencia en el valor mínimo y el valor máximo en un grupo de números aleatorios.

Requisitos• Ordenar los números según su tamaño.• Restamos el valor mínimo del valor máximo.

Ejemplo:

Para una muestra (20, 45, 50, 55, 100) el dato menor es 20 y el dato mayor es 100.

Sus valores se encuentran en un Rango= 100 – 20 = 80 

Definición:

Medio Rango ( )Es la medida que un conjunto de valores numéricos se encuentra en la mitad del camino entre el dato de menor valor y el dato de mayor valor.

Ejemplo:

Para una muestra de valores (3, 3, 5, 8, 6), el dato de menor es él 3  y el dato de mayor valor es el 8.

R = 8+3 = 11

= = 5,5 

Definición:son  una  sucesión  de medidas  que  permiten  organizar  datos  en  orden  jerárquico.  Las escalas  de  medición,  pueden  ser  clasificadas  de  acuerdo  a  una  degradación  de  las características  de  las  variables.  Estas  escalas  son:  nominales,  ordinales,  intervalares  o racionales.  Según  pasa  de  una  escala  a  otra  el  atributo  o  la  cualidad  aumenta.  Las escalas de medición ofrecen  información sobre  la clasificación de variables discretas o continuas,  también  más  conocidas  como  escalas  grandes  o  pequeñas.  Toda  vez  que dicha clasificación determina la selección de la gráfica adecuada.

tipos: 1. La escala nominal sólo permite asignar un nombre al elemento medido. Esto la 

convierte en la menos informativa de las escalas de medición.2. La escala ordinal, además de las propiedades de la escala nominal, permite 

establecer un orden entre los elementos medidos. 3. La escala de intervalo, además de todas las propiedades de la escala ordinal, hace 

que tenga sentido calcular diferencias entre las mediciones.

 

El 20% de los datos de un Curriculum son falsos

Ejemplo General

Xi fi Fi hi Hi fiXi σ σ2 fiσ2

1 6 6 0,1090 0,1090 6 -4,4727 20,0050 120

2 3 9 O,0545 0,1636 6 -3,4727 12,0596 24,1192

3 4 13 0,0727 0,2363 12 -2,4727 6,1142 18,3426

4 7 20 0,1272 0,3636 28 -1,4727 2,1688 8,6752

5 9 29 0,1636 0,5272 45 -0,4727 0,2234 1,1170

6 8 37 0,1454 0,6727 48 0,5273 0,2788 1,6728

7 6 43 0,1090 0,7818 42 1,5273 2,3326 16,3282

8 1 44 0,0181 0,8000 8 2,5273 6,3872 51,0976

9 4 48 0,0727 0,8727 36 3,5273 12,4418 111,9762

10 7 55 0,1272 1 70 4,5273 20,4964 204,9640

X= 5,47Mo= 5Me= 27,50R= 9Rx= 5,5σ2= 8,33σ= 2,88Cv= 52,74%Ak= -24,4515

Resultados:

Bibliografía:

GLASS, Gene V. y STANLEY, Julián C. Métodos estadísticos aplicados a las ciencias sociales.México: Prentice-Hall Hispanoamericana, 1996

HOPKINS, Kenneth, HOPKINS, B.R., GLAS, Gene V. Estadística básica para las ciencias sociales y del comportamiento. México; Tercera Edición. Prentice-Hall Hispanoamericana, 1997.

http://www.taringa.net/post/info/15247481/Sabias-Que.html?utm_source=taringa&utm_medium=recommendations&utm_campaign=post-recommendations