resumen de formulas 745[1]
TRANSCRIPT
![Page 1: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/1.jpg)
ESTADÍSTICA GENERAL (CÓD 745)Objetivo de la materia: Aplicar métodos y Técnicas para Estadística descriptiva y Cálculo de Probabilidades.Evaluación: Ocho (8) Objetivos; 2 Integrales (objetivos 2 al 8) y 1 Trabajo Práctico (Objetivo 1). Mínimo para aprobación: 5 Objetivos.Material Instruccional: Estadística Aplicada a los negocios y a la economía (Webster); Estadística (Spiegel); Probabilidad (Meyer)
Objetivo 1: Tratamiento de datos estadísticosPoblación: Recolección completa de todas las observaciones de interés para el investigador Parámetro: Medida descriptiva de la población total de todas las observacionesMuestra: Parte representativa de la población que se selecciona para ser estudiadaEstadístico: Medida descriptiva de una muestra que sirve para estudiar el parámetroVariable: Característica de la población o la muestra que se está observando- Cuantitativa: Las que se pueden expresar de manera numérica - Cualitativa: Las que se expresan de manera no numérica- Contínua: Las que toman cualquier valor dentro de un rango dado (ej. mediciones)- Discreta: Las que están limitadas a ciertos valores (por lo general números enteros)Estadística Descriptiva: Proceso de recolectar, agrupar y presentar datos de manera que puedan describirse fácilmente dichos datos.Estadística Inferencial: Utiliza la muestra para sacar alguna inferencia o conclusión sobre la población de la cual hace parte la muestra.Error de muestreo: Diferencia entre el parámetro desconocido de la población y el estadístico de la muestra utilizado para calcular el parámetro. Sesgo muestral: Tendencia a favorecer la selección de ciertos elementos de la muestra en lugar de otros.Medición en Escalas Nominal: Nombre o clasificaciones que se utilizan para datos en categorías distintas y separadas. Ej.: Crecimiento Agresivo, Reembolso Total, Cambio.Medición en Escalas Ordinal: Las que clasifican las observaciones en categorías con un orden significativo. Ej.: Alto, Medio, Bajo. Medición en intervalos: Medidas en escala numérica en la que el valor de cero es arbitrario pero que la diferencia entre valores es importante. Ej.: la temperatura. Medición en escala de razón: Medida numérica en la que cero es un valor fijo en cualquier escala y la diferencia entre valores es importante. Distribución de Frecuencias: Forma de organizar datos dividiéndolos en clases y registrando el número de casos por cada clase. Reglas:: 1. Determinar el nº mayor y menor de los datos sueltos para calcular el rango (diferencia entre ambos); 2. Dividir el rango entre el nº de clases deseada; 3. Determinar el nº de observaciones por cada clases (frecuencia).Punto Medio o Marca de la clase (M): Promedio de los límites de cada clase.Intervalo de Clase (IC): Rango de valores dentro de una clase.Tamaño, Longitud o Amplitud de clase: Diferencia entre límites superior e inferior de cada clase.Frecuencia Acumulada “más que”: Se forma restando las frecuencias de las clases anteriores.Frecuencia Acumulada “menos que”: Se forma sumando las frecuencias de las clases anteriores.Frecuencia Relativa: Refleja la frecuencia de la clase en relación con el total de observaciones.Frecuencia Relativa Porcentual: Refleja la frecuencia de la clase como porcentaje en relación al total de observacionesOjiva: Polígono de frecuencias acumuladas “menos que”.Tabla de Contingencia: Sirve para examinar o comparar dos variables a la vezHistograma: Gráfico que muestra las clases en el eje horizontal y las frecuencias en el eje vertical a través de rectángulos unidos entre si .Diagrama de Barras: Muestra dos o más valores en el eje horizontalPolígono de Frecuencia: Es un gráfico de línea de las frecuencias dibujada respecto a la marca de clase.Diagrama Circular: Muestra las proporciones (porcentajes) relativos de una variableDiagrama de Máximos, Mínimos y cierres: Muestra valores a través de una línea vertical (mín y máx) u una pequeña marca horizontal (cierre)
Objetivo 2: Medidas de Tendencia Central, de Dispersión y de Sesgo
1
![Page 2: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/2.jpg)
Para datos no agrupadosMedia: Medida de tendencia central que normalmente era considerada como promedio.
Media Poblacional (μ): Suma de todas las observaciones divididas entre la cantidad de observaciones.
Media Muestral ( ): Suma de todas las observaciones de la muestra entre la cantidad de observaciones de la muestra
Media Ponderada: ( ) Es el cálculo de la media que incluye la importancia de cada observación. Se calcula sumando todas las observaciones multiplicadas por su ponderación y dividas por la sumatoria de todas las ponderaciones.
Media geométrica (MG): Representa el cambio promedio con el tiempo y siempre será menor que la media aritmética salvo en caso de que todos los incrementos porcentuales sean iguales. Se calcula tomando la raíz enésima del producto de n números.
Media Armónica (H): Es el recíproco de la media aritmética de los recíprocos de los números. o mejor
Mediana o Media Posicional: Observación de la mitad después de que se han colocado los datos en una serie ordenada.
Posición de la mediana: Cantidad de observaciones más 1 divididas entre dos. Si el conjunto de datos contienen un número par de observaciones es necesario promediar los dos valores medios
Moda: Es la observación que más se repite
Medidas de dispersión: Miden que tanto se dispersan las medidas alrededor de su media
Rango: Diferencia entre la observación más alta y la más baja
Varianza o : Promedio de las observaciones respecto a su media elevadas al cuadrado
Poblacional
Muestral:
Desviación Estándar o : Es la raíz cuadrada de la varianza
Poblacional
Muestral:
2
![Page 3: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/3.jpg)
3
![Page 4: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/4.jpg)
Para datos agrupados.Media:
= Media de datos agrupados
= Frecuencia o número de observaciones en cada clase
= Punto medio de cada clase= Tamaño de la muestra = suma de todas las
frecuenciasClase mediana: Es la clase cuya frecuencia acumulada es ≥ n/2Mediana:. = Límite inferior de la clase que contiene la
mediana= Frecuencia acum. de la clase que antecede a la
clase de la mediana
= Frecuencia de la clase de la mediana
= Intervalo de clase de la clase de la mediana.Clase modal: La clase que tiene mayor frecuenciaModa: Observación más frecuente. Se calcula usando como base la clase Modal
= Límite inferior de la clase modal
= Diferencia entre la frecuencia de la clase modal y la clase anterior
= Diferencia entre la frecuencia de la clase modal y la clase sigiente
= Intervalo de clase de la clase modal.
Varianza:
Desviación estándar:
= Media de datos agrupados = Frecuencia o número de observaciones en
cada clase= Punto medio de cada clase
= Tamaño de la muestra = suma de todas las frecuencias
Cuartiles: Son las medidas que dividen un conjunto de datos en 4 partes iguales (son 3 en total Q1, Q2, Q3). Se calculan igualando los cuartiles al equivalente en percentiles
1er. Cuartil = Q1= percentil 25 = P25
2do. Cuartil = Q2 =percentil 50 = P50
3er. Cuartil = Q3 = percentil 75 = P75
Deciles: Son las medidas que dividen un conjunto de datos en 10 partes iguales(son 9 en total) Se calculan igualando los cuartiles al equivalente en percentiles
1er. Decil = percentil = 10 = P10
2do. Decil = percentil = 20 = P20
:9no. Decil = percentil = 90 = P90
Percentiles: Son las medidas que dividen un conjunto de datos en 100 partes iguales (son 99 en total)
= Sitio del percentil deseado en una serie ordenada
= Número de observaciones
= Percentil deseado
Cálculo del Percentil en datos agrupados Cálculo del Decil o cuartil
Se coloca el percentil equivalente al decil o al cuartil deseado.
Rango o recorrido: Diferencia entre la observación mayor y la menor de todas las observaciones.Rango de clase: Diferencia entre la observación mayor y la menor de la clase
Rango de todas las observaciones = Dato mayor – Dato menorRango de clase = Límite mayor – Límite menor
Rango o recorrido intercuartílico: Diferencia entre el primer cuartil y el tercer cuartil Rango intercuartílico = Q3 - Q1 = P75 – P25
4
![Page 5: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/5.jpg)
Teorema de Chevyshev: Para todo conjunto de datos por lo menos
de las observaciones están dentro
de K desviaciones estándar de la media, en donde K es cualquier número mayor a 1.
Distribución Normal: Distribución de datos continuos (no discretos) que produce una curva simétrica en forma de campana. En ella la media la mediana y la moda son todas iguales
f (x)
0 5 10 15 20 x (minutos)
MediaMediana
Moda
f (x)
0 5 10 15 20 x (minutos)
f (x)
0 5 10 15 20 x (minutos)
MediaMediana
Moda
Regla empírica: Si se incluyen todas las observaciones que están a una desviación estándar de la media (por encima y por debajo), éstas serán el 68,3% de todas las observaciones, sin importar cual sea la media ni cual la desviación estándar.
Observaciones a + 1 desviación estándar de la media: 68.3%Observaciones a + 2 desviaciones estándar de la media: 95.5%Observaciones a + 3 desviaciones estándar de la media: 99.7%
Distribución Sesgada: Es una distribución que al tener una curva cuya moda está hacia la izquierda, produce un sesgo hacia la derecha y viceversa.
Coeficiente de Sesgo de Pearson:
Si P < 0 los datos están sesgados a la izquierda.Si P > 0 los datos están sesgados a la derecha
Sesgo a la Derecha
Sesgo a la Izquierda
Coeficiente de Variación: Medida que determina el grado de dispersión de un conjunto de datos relativo a su media, sobre todo cuando se consideran dos o más distribuciones que tienen medias significativamente diferentes o que están en medidas diferentes.
Fórmula:
Objetivo 3: Principios de Probabilidad
Objetivo 6: Distribuciones discretas importantes (Binomiales, Hipergeométricas, de Poisson)
Distribución de Poisson: Distribución discreta que mide el número de ocurrencias sobre algún intervalo de tiempo o espacio. Ej. Número de clientes que pueden llegar durante algún período de tiempo.
Objetivo 7: Distribución Normal
5
Moda
Mediana
Media
Moda
Mediana
Media
Moda
Mediana
Media
Moda
Mediana
Media
![Page 6: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/6.jpg)
Distribución Normal: Distribución de datos continuos (no discretos) que produce una curva simétrica en forma de campana. En ella la media la mediana y la moda son todas iguales se utiliza para reflejar variables como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. La forma y posición están determinadas por la media μ y la desviación estándar σ. Más del 50% de las observaciones están por encima de la media y 50% están por debajo. Igualmente el 50% de las observaciones están a la derecha de la media y 50% a la izquierda de la media.
f (x)
0 5 10 15 20 x (minutos)
MediaMediana
Moda
f (x)
0 5 10 15 20 x (minutos)
f (x)
0 5 10 15 20 x (minutos)
MediaMediana
Moda
Desviación normal o Z : Es el número de desviaciones estándar a las que una observación está por encima o por debajo de la media. La distribución normal se CONVIERTE a una forma estándar utilizando la fórmula de conversión o Fórmula Z. para facilitar los cálculos Luego de aplicada la fórmula Z la media μ = 0 y la desviación estándar σ = 1
Z =Desviación normalX = Variable aleatoriaμ = Mediaσ= Desviación estándar
Cálculo de probabilidades con la desviación normal:Para hallar la probabilidad de que un evento X ocurra, se utiliza la fórmula Z y se obtiene el valor de Z (Este valor representa el área que se encuentra bajo la curva de la distribución, desde la media hasta el punto X ; equivale a la probabilidad). Como el 99.7% de los datos están a + 3 desviaciones estándar de la media, el valor máximo que puede tomar Z es 3.99. La tabla de la distribución normal muestra las distintas áreas (probabilidades) relacionadas con los valores de Z.
Si se conoce el área en porcentaje (probabilidad)1.- Se convierte a cifra decimal y se le resta 0,5: Si la cifra es negativa estará a la izquierda de la media y si es positiva a la derecha.2.- El porcentaje que resulte se ubica en el interior de la Tabla de Distribución normal para obtener a cual valor Z corresponde. 2.- Despejando X de la fórmula Z queda
3.- Se sustituyen los valores dados y resulta la variable buscada.
Aproximación normal a distribución binomial:Si en una distribución binomial la cantidad de ensayos (n) es muy grande la solución puede hallarse con un aproximado a la distribución normal. La aproximación es suficientemente precisa si n.π ≥ 5 y (1- π) ≥ 5.
Procedimiento:1.- Se calcula la media y la desviación estándar con las fórmulas:
2.- Se coloca el valor X como media de un intervalo de 1(ejem. Si n= 20 entonces el intervalo es 19,5 < 20 < 20,5 y se calcula la probabilidad como distribución normal.
Objetivo 8: Otras Distribuciones Continuas importantes
6
![Page 7: Resumen de Formulas 745[1]](https://reader036.vdocuments.co/reader036/viewer/2022082408/5571f7b249795991698bd115/html5/thumbnails/7.jpg)
Distribución Exponencial: Distribución de datos continuos (no discretos) que mide el paso del tiempo entre eventos con distribución de Poisson.
t = Lapso de tiempo μ = Tasa promedio de ocurrencia
e= Base de logaritmo natural: 2,71828
7