Download - Términos Básicos en Estadística
Instituto Universitario Politécnico Santiago Mariño Extensión Oriente
Ingeniería IndustrialEstadística
Estadística
Cesar GuaracoCI: 23.519.781
Es posible hacer que una vaca suba escaleras pero no que las baje je
Definición, tipos y ejemplos de variables
Definición:
Variable: también se les llama características cuantitativas, son aquellas cuyas variaciones son susceptibles de ser medidas cuantitativamente la magnitud de dichas variaciones.
Tipos:
• Variables continuas: se caracterizan por el hecho de que para todo par de valores, siempre se puede encontrar un valor intermedio. (Peso, distancia, etc.)
•Variables discretas: será aquellas que pueden tomar solo un número limitado de valores separados y no continuos; son aquellas solo toma un determinado número de valores. Porque entre dos valores consecutivos no pueden tomar ningún otro. (Número de hijos, números de votos)
Se estima que globalmente en el mundo siempre hay al menos un 7% de la población que se encuentra borracha
Definición, y ejemplo de población y muestra
Definición:
Muestra: una parte de la población a estudiar qué sirve para representarla. Su estudio es más sencillo que el estudio de la población completa; cuesta menos y lleva menos tiempo.
Población: conjunto de todos los individuos (personas, objetos, animales, etc.) que porten información sobre el fenómeno que se estudia. Por ejemplo, si estudiamos el precio de la vivienda en una ciudad, la población será el total de las viviendas de dicha ciudad.
Muestra y Población: son conceptos relativos: una población es un todo y una muestra es un segmento de un todo.
Muestreo: Tiene que ver con el tamaño de la muestra y la manera de obtenerla.
Para calcular el tamaño de una muestra hay que tomar en cuenta 3 factores:
1. El porcentaje de confianza con el cual se quiere generalizar los datos desde la muestra hacia la población total.
2. El porcentaje de error que se pretende aceptar al momento de hacer la generalización
3. El nivel de variabilidad que se calcula para comprobar la hipótesis.
La confianza o el porcentaje de confianza es el porcentaje de seguridad que existe para generalizar los resultados obtenidos. Esto quiere decir que un porcentaje del 100% equivale a decir que no existe ninguna duda para generalizar tales resultados pero también implica estudiar a la totalidad de los casos de la población. Para evitar un costo muy alto para el estudio debido a que en ocasiones llega a ser prácticamente imposible el estudio de todos los casos, entonces se busca un porcentaje de confianza menos. Se busca un 95%.El porcentaje de error equivale a elegir una probabilidad de aceptar unas hipótesis que sea falsa como si fuera verdadera o a la inversa.Si los resultados de una encuesta electoral indicara que un partido iba a obtener, el 55% de los votos y el error estimado que es el porcentaje ideal de votos estará en el intervalo 52 -58% = 6 (55% ± 3%)
En el caso de que se conozca el tamaño de la población entonces se aplica la siguiente fórmula:
K 1,15 1,28 1,44 1,05 1,96 2 2,58
Nivel de confianza 75% 80% 85% 90% 95% 95,5% 99%
• n = el tamaño de la muestra.• N = el tamaño de la población.• K es una constante que depende del nivel de confianza que asignemos. El nivel de confianza indica la probabilidad de que los resultados de nuestra investigación sean ciertos.Un 95,5% de confianza es lo mismo que decir, que nos podemos equivocar con una probabilidad del 4.5%Los valores K más utilizados y sus niveles de confianza:
Por tanto si pretendemos obtener un nivel de confianza del 95% necesitamos poner en la formula K=1,96• e = el error muestral deseado.•p = la proporción de individuos que poseen en la población la característica de estudio
. Este dato es generalmente desconocido y se suele suponer que: P = q = 0,5 que es la opción más segura.• q = la proporción de individuos que no poseen la característica es decir 1 – p
Sabias que más del 50% de la gente del mundo nunca ha hecho o recibido una llamada telefónica.
Definición, y ejemplo de
sumatoria, razón, proporción, tasa y frecuencia
Definición:
Sumatoria (Σ): La sumatoria es un símbolo muy utilizado en matemáticas que sirve para simplificar formulas estadísticas. Por lo general después de una sumatoria, aparece una variable con un suscrito representado por la letra (i) = , este suscrito indica que valores de la variable se deben sumar. Para determinar cuáles valores es necesario sustituir la (i) por los valores que se indican.
Una sumatoria se define como:
• La variable (i) es el índice de suma al que se le asigna un valor inicial llamado límite inferior (m).
• La variable (i) recorrerá los valores enteros hasta alcanzar el límite superior (n), (m < n).
Por ejemplo si queremos expresar la suma de los diez primeros números naturales podemos hacerlo así con una sumatoria.
Definición:
Razón: Es el valor que se obtiene dividiendo una cantidad por otra. Es el cociente de dos variables, los valores del numerador y del denominador son independientes, ninguno está contenido en el otro.
Ejemplo:
• Razón de masculinidad =
• Razón de mortalidad marteña =
Definición:
Proporción: es un caso especial de razón en la cual el numerador está formado por parte de los individuos del denominador. Proporción es el cociente de dos variables, el numerador está contenido en el denominador.
Ejemplo: Proporción de masculinidad =
Definición:
Tasa: es una razón que expresa un cambio en una cantidad con respecto a otra. Tasa es un tipo de proporción que toma en cuenta el variable tiempo. Es la medida que expresa la dinámica de los eventos o la magnitud del cambio de la variable que mide un evento por unidad de cambio a otra (el tiempo) en relación con el tamaño de la población.
Tipos:
Las Tasas Brutas, son calculadas para toda la población.
Las Tasas Específicas, se calculan para un subgrupo específico que está en riesgo de presentar el evento.
Tasa general de fecundidad, relaciona el número de nacimientos con el de mujeres de 15 a 44 años de edad (EDAD FERTIL), dando una visión de cuántos niños están naciendo por cada mil mujeres.
Tasa de Fecundidad =
Definición:
Frecuencia: Cuando se reúnen gran cantidad de datos primarios es útil distribuirlo en clases y categorías y determinar las frecuencias de las clases, ósea, el número de elementos que pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente con las frecuencias de clases se denomina distribución de frecuencia.Frecuencia de un dato es el número de veces que este aparece en el colectivo; consecuentemente, si una variable estadística toma (r) valores, cada uno de los cuales puede repetirse un cierto número de veces, podríamos decir que el número de datos representado por la variable serian (N), siendo (N) la suma de las respectivas frecuencias de cada dato.
Tipos:
• Frecuencia Absoluta : es el número de veces que aparece un determinado valor en un estudio estadístico. La suma de las frecuencias absolutas es igual al número total de datos, que se representa por (N).
Para indicar resumidamente estas sumas se utiliza la letra griega (Σ) que se lee sumatoria .
• Frecuencia Relativa : Es el cociente entre las frecuencia absoluta de un determinado valor y el número total de datos. , la suma de las frecuencias relativas es igual a 1.
• Frecuencia Acumulada : Es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado.
• Frecuencia Relativa Acumulada : Es el cociente entre la frecuencia acumulada de un determinado valor y el número total de datos.
Ejemplo: Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas máximas.27-28-28-29-29-29-29-29-2930-30-30-30-30-30-30-31-31-31-31-31-31-31-31-32-32-32-33-33-33-34
En la primera columna de la tabla colocamos la variable ordenad de menor a mayor, en la segunda anotamos la frecuencia absoluta.
Xi fi Fi hi Hi27 1 1 0,032 0,03228 2 3 0,065 0,09729 6 9 0,194 0,29030 7 16 0,226 0,51631 8 24 0,258 0,77432 3 27 0,097 0,87133 3 30 0,097 0,96834 1 31 0,032 1
N= 31 1
Un hombre tiene seis veces más de probabilidad de ser alcanzado por un rayo que una mujer
Definición, y ejemplos de
parámetros estadísticos
Definición:
Parámetro estadístico: Es un número que se obtiene a partir de los datos de una distribución estadística.
Los parámetros estadísticos sirven para sintetizar la información dada por una tabla o por una grafica.
Tipos:
Existen tres tipos de parámetros estadísticos los cuales son:
1. De centralización.2. De posición3. De dispersión.
Definición:
Medidas de Centralización: Nos indican en torno a que valor (centro) se distribuyen los datos. Son estadígrafos de posición que son interpretados como valores que permiten resumir a un conjunto de datos dispersos, podría asumirse que estas medidas equivalen a un centro de gravedad que adopta un valor representativo para todo un conjunto de datos predeterminados.
Tipos:
1. Media: la media aritmética es el valor obtenido sumando todas las observaciones y dividiendo el total por el número de observaciones que hay en el grupo. La media resume en un valor las características de una variable teniendo en cuenta todos los casos solamente puede utilizarse con variables cuantitativas.
Ejemplo de media:
Un grupo de 11 estudiantes saco las siguientes notas: 04-10-16-09-11-16-18-20-05-14-16
La media = 12,64
Propiedades de la media aritméticaDe cálculo sencillo.Su valor es único.
Desventajas de la media aritméticaSu significado afecta de sobremanera la dispersiónSe ve afectada por valores externos
Definición:
Moda: Es el dato más repetido, su cálculo es muy sencillo, solo se necesita un recuento.
Ejemplo:
04, 10, 16, 09, 11, 16, 18, 20, 05, 14, 16
La moda es: 16
Definición:
Mediana: es un valor de la variable que deja por debajo de si a la mitad de los datos, una vez que estos están ordenados de menor a mayor.
Ejemplo:
04, 10, 16, 09, 11, 16, 18, 20, 05, 16, 14En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los valores del medio.Ordenas los datos; 04 – 05 – 09 – 10 – 11 – 14 – 16 – 16 – 16 – 18 – 20
Buscamos cual ocupa la posición central; La Mediana es: 14
En caso de un número par de datos, la mediana no correspondería a ningún valor de la variable, por lo que se conviene en tomar como mediana el valor intermedio entre los valores del medio.
Definición:
Medidas de posición: Las medidas de posición dividen un conjunto de datos en grupos con el mismo número de individuos.
Para calcular las medidas de posición es necesario que los datos estén ordenados de menor a mayor.
Tipos:
Las medidas de posición son:
1. Cuartiles: Dividen la serie de datos en cuatro partes iguales.2. Deciles: Dividen la serie de datos en diez partes iguales.3. Percentiles: Dividen la serie de datos en cien partes iguales.
Definición:
Medidas de dispersión: Son estadígrafos de dispersión que permiten evaluar el grado de homogeneidad, dispersión o variabilidad de un conjunto de datos.Muestran la variabilidad de una distribución, indicando por medio de un numero, si las diferentes puntuaciones de una variable están muy alejadas de la media.Cuanto mayor sea ese valor, mayor será la variabilidad, cuanto menor sea, más homogénea será a la media. Así se sabe si todos los casos son parecidos o varían mucho entre ellos.
Tipos:
1. Amplitud o rango2. Varianza3. Desviación estándar4. Coeficiente de variabilidad
Definición:
Rango (R): Es la diferencia en el valor mínimo y el valor máximo en un grupo de números aleatorios.
Requisitos• Ordenar los números según su tamaño.• Restamos el valor mínimo del valor máximo.
Ejemplo:
Para una muestra (20, 45, 50, 55, 100) el dato menor es 20 y el dato mayor es 100.
Sus valores se encuentran en un Rango= 100 – 20 = 80
Definición:
Medio Rango ( )Es la medida que un conjunto de valores numéricos se encuentra en la mitad del camino entre el dato de menor valor y el dato de mayor valor.
Ejemplo:
Para una muestra de valores (3, 3, 5, 8, 6), el dato de menor es él 3 y el dato de mayor valor es el 8.
R = 8+3 = 11
= = 5,5
Definición:son una sucesión de medidas que permiten organizar datos en orden jerárquico. Las escalas de medición, pueden ser clasificadas de acuerdo a una degradación de las características de las variables. Estas escalas son: nominales, ordinales, intervalares o racionales. Según pasa de una escala a otra el atributo o la cualidad aumenta. Las escalas de medición ofrecen información sobre la clasificación de variables discretas o continuas, también más conocidas como escalas grandes o pequeñas. Toda vez que dicha clasificación determina la selección de la gráfica adecuada.
tipos: 1. La escala nominal sólo permite asignar un nombre al elemento medido. Esto la
convierte en la menos informativa de las escalas de medición.2. La escala ordinal, además de las propiedades de la escala nominal, permite
establecer un orden entre los elementos medidos. 3. La escala de intervalo, además de todas las propiedades de la escala ordinal, hace
que tenga sentido calcular diferencias entre las mediciones.
Xi fi Fi hi Hi fiXi σ σ2 fiσ2
1 6 6 0,1090 0,1090 6 -4,4727 20,0050 120
2 3 9 O,0545 0,1636 6 -3,4727 12,0596 24,1192
3 4 13 0,0727 0,2363 12 -2,4727 6,1142 18,3426
4 7 20 0,1272 0,3636 28 -1,4727 2,1688 8,6752
5 9 29 0,1636 0,5272 45 -0,4727 0,2234 1,1170
6 8 37 0,1454 0,6727 48 0,5273 0,2788 1,6728
7 6 43 0,1090 0,7818 42 1,5273 2,3326 16,3282
8 1 44 0,0181 0,8000 8 2,5273 6,3872 51,0976
9 4 48 0,0727 0,8727 36 3,5273 12,4418 111,9762
10 7 55 0,1272 1 70 4,5273 20,4964 204,9640
Bibliografía:
GLASS, Gene V. y STANLEY, Julián C. Métodos estadísticos aplicados a las ciencias sociales.México: Prentice-Hall Hispanoamericana, 1996
HOPKINS, Kenneth, HOPKINS, B.R., GLAS, Gene V. Estadística básica para las ciencias sociales y del comportamiento. México; Tercera Edición. Prentice-Hall Hispanoamericana, 1997.
http://www.taringa.net/post/info/15247481/Sabias-Que.html?utm_source=taringa&utm_medium=recommendations&utm_campaign=post-recommendations