resumen de formulas 745[1]

9
ESTADÍSTICA GENERAL (CÓD 745) Objetivo de la materia: Aplicar métodos y Técnicas para Estadística descriptiva y Cálculo de Probabilidades. Evaluación: Ocho (8) Objetivos; 2 Integrales (objetivos 2 al 8) y 1 Trabajo Práctico (Objetivo 1). Mínimo para aprobación: 5 Objetivos. Material Instruccional: Estadística Aplicada a los negocios y a la economía (Webster); Estadística (Spiegel); Probabilidad (Meyer) Objetivo 1: Tratamiento de datos estadísticos Población: Recolección completa de todas las observaciones de interés para el investigador Parámetro: Medida descriptiva de la población total de todas las observaciones Muestra: Parte representativa de la población que se selecciona para ser estudiada Estadístico: Medida descriptiva de una muestra que sirve para estudiar el parámetro Variable: Característica de la población o la muestra que se está observando - Cuantitativa: Las que se pueden expresar de manera numérica - Cualitativa: Las que se expresan de manera no numérica - Contínua: Las que toman cualquier valor dentro de un rango dado (ej. mediciones) - Discreta: Las que están limitadas a ciertos valores (por lo general números enteros) Estadística Descriptiva: Proceso de recolectar, agrupar y presentar datos de manera que puedan describirse fácilmente dichos datos. Estadística Inferencial: Utiliza la muestra para sacar alguna inferencia o conclusión sobre la población de la cual hace parte la muestra. Error de muestreo: Diferencia entre el parámetro desconocido de la población y el estadístico de la muestra utilizado para calcular el parámetro. Sesgo muestral: Tendencia a favorecer la selección de ciertos elementos de la muestra en lugar de otros. Medición en Escalas Nominal: Nombre o clasificaciones que se utilizan para datos en categorías distintas y separadas. Ej.: Crecimiento Agresivo, Reembolso Total, Cambio. Medición en Escalas Ordinal: Las que clasifican las observaciones en categorías con un orden significativo. Ej.: Alto, Medio, Bajo. Medición en intervalos: Medidas en escala numérica en la que el valor de cero es arbitrario pero que la diferencia entre valores es importante. Ej.: la temperatura. Medición en escala de razón: Medida numérica en la que cero es un valor fijo en cualquier escala y la diferencia entre valores es importante. Distribución de Frecuencias: Forma de organizar datos dividiéndolos en clases y registrando el número de casos por cada clase. Reglas:: 1. Determinar el nº mayor y menor de los datos sueltos para calcular el rango (diferencia entre ambos); 2. Dividir el rango entre el nº de clases deseada; 3. Determinar el nº de observaciones por cada clases (frecuencia). Punto Medio o Marca de la clase (M): Promedio de los límites de cada clase. Intervalo de Clase (IC): Rango de valores dentro de una clase. Tamaño, Longitud o Amplitud de clase: Diferencia entre límites superior e inferior de cada clase. Frecuencia Acumulada “más que”: Se forma restando las frecuencias de las clases anteriores. Frecuencia Acumulada “menos que”: Se forma sumando las frecuencias de las clases anteriores. Frecuencia Relativa: Refleja la frecuencia de la clase en relación con el total de observaciones. Frecuencia Relativa Porcentual: Refleja la frecuencia de la clase como porcentaje en relación al total de observaciones Ojiva: Polígono de frecuencias acumuladas “menos que”. 1

Upload: pamela-balderrama-marquez

Post on 21-Jun-2015

517 views

Category:

Documents


1 download

TRANSCRIPT

Page 1: Resumen de Formulas 745[1]

ESTADÍSTICA GENERAL (CÓD 745)Objetivo de la materia: Aplicar métodos y Técnicas para Estadística descriptiva y Cálculo de Probabilidades.Evaluación: Ocho (8) Objetivos; 2 Integrales (objetivos 2 al 8) y 1 Trabajo Práctico (Objetivo 1). Mínimo para aprobación: 5 Objetivos.Material Instruccional: Estadística Aplicada a los negocios y a la economía (Webster); Estadística (Spiegel); Probabilidad (Meyer)

Objetivo 1: Tratamiento de datos estadísticosPoblación: Recolección completa de todas las observaciones de interés para el investigador Parámetro: Medida descriptiva de la población total de todas las observacionesMuestra: Parte representativa de la población que se selecciona para ser estudiadaEstadístico: Medida descriptiva de una muestra que sirve para estudiar el parámetroVariable: Característica de la población o la muestra que se está observando- Cuantitativa: Las que se pueden expresar de manera numérica - Cualitativa: Las que se expresan de manera no numérica- Contínua: Las que toman cualquier valor dentro de un rango dado (ej. mediciones)- Discreta: Las que están limitadas a ciertos valores (por lo general números enteros)Estadística Descriptiva: Proceso de recolectar, agrupar y presentar datos de manera que puedan describirse fácilmente dichos datos.Estadística Inferencial: Utiliza la muestra para sacar alguna inferencia o conclusión sobre la población de la cual hace parte la muestra.Error de muestreo: Diferencia entre el parámetro desconocido de la población y el estadístico de la muestra utilizado para calcular el parámetro. Sesgo muestral: Tendencia a favorecer la selección de ciertos elementos de la muestra en lugar de otros.Medición en Escalas Nominal: Nombre o clasificaciones que se utilizan para datos en categorías distintas y separadas. Ej.: Crecimiento Agresivo, Reembolso Total, Cambio.Medición en Escalas Ordinal: Las que clasifican las observaciones en categorías con un orden significativo. Ej.: Alto, Medio, Bajo. Medición en intervalos: Medidas en escala numérica en la que el valor de cero es arbitrario pero que la diferencia entre valores es importante. Ej.: la temperatura. Medición en escala de razón: Medida numérica en la que cero es un valor fijo en cualquier escala y la diferencia entre valores es importante. Distribución de Frecuencias: Forma de organizar datos dividiéndolos en clases y registrando el número de casos por cada clase. Reglas:: 1. Determinar el nº mayor y menor de los datos sueltos para calcular el rango (diferencia entre ambos); 2. Dividir el rango entre el nº de clases deseada; 3. Determinar el nº de observaciones por cada clases (frecuencia).Punto Medio o Marca de la clase (M): Promedio de los límites de cada clase.Intervalo de Clase (IC): Rango de valores dentro de una clase.Tamaño, Longitud o Amplitud de clase: Diferencia entre límites superior e inferior de cada clase.Frecuencia Acumulada “más que”: Se forma restando las frecuencias de las clases anteriores.Frecuencia Acumulada “menos que”: Se forma sumando las frecuencias de las clases anteriores.Frecuencia Relativa: Refleja la frecuencia de la clase en relación con el total de observaciones.Frecuencia Relativa Porcentual: Refleja la frecuencia de la clase como porcentaje en relación al total de observacionesOjiva: Polígono de frecuencias acumuladas “menos que”.Tabla de Contingencia: Sirve para examinar o comparar dos variables a la vezHistograma: Gráfico que muestra las clases en el eje horizontal y las frecuencias en el eje vertical a través de rectángulos unidos entre si .Diagrama de Barras: Muestra dos o más valores en el eje horizontalPolígono de Frecuencia: Es un gráfico de línea de las frecuencias dibujada respecto a la marca de clase.Diagrama Circular: Muestra las proporciones (porcentajes) relativos de una variableDiagrama de Máximos, Mínimos y cierres: Muestra valores a través de una línea vertical (mín y máx) u una pequeña marca horizontal (cierre)

Objetivo 2: Medidas de Tendencia Central, de Dispersión y de Sesgo

1

Page 2: Resumen de Formulas 745[1]

Para datos no agrupadosMedia: Medida de tendencia central que normalmente era considerada como promedio.

Media Poblacional (μ): Suma de todas las observaciones divididas entre la cantidad de observaciones.

Media Muestral ( ): Suma de todas las observaciones de la muestra entre la cantidad de observaciones de la muestra

Media Ponderada: ( ) Es el cálculo de la media que incluye la importancia de cada observación. Se calcula sumando todas las observaciones multiplicadas por su ponderación y dividas por la sumatoria de todas las ponderaciones.

Media geométrica (MG): Representa el cambio promedio con el tiempo y siempre será menor que la media aritmética salvo en caso de que todos los incrementos porcentuales sean iguales. Se calcula tomando la raíz enésima del producto de n números.

Media Armónica (H): Es el recíproco de la media aritmética de los recíprocos de los números. o mejor

Mediana o Media Posicional: Observación de la mitad después de que se han colocado los datos en una serie ordenada.

Posición de la mediana: Cantidad de observaciones más 1 divididas entre dos. Si el conjunto de datos contienen un número par de observaciones es necesario promediar los dos valores medios

Moda: Es la observación que más se repite

Medidas de dispersión: Miden que tanto se dispersan las medidas alrededor de su media

Rango: Diferencia entre la observación más alta y la más baja

Varianza o : Promedio de las observaciones respecto a su media elevadas al cuadrado

Poblacional

Muestral:

Desviación Estándar o : Es la raíz cuadrada de la varianza

Poblacional

Muestral:

2

Page 3: Resumen de Formulas 745[1]

3

Page 4: Resumen de Formulas 745[1]

Para datos agrupados.Media:

= Media de datos agrupados

= Frecuencia o número de observaciones en cada clase

= Punto medio de cada clase= Tamaño de la muestra = suma de todas las

frecuenciasClase mediana: Es la clase cuya frecuencia acumulada es ≥ n/2Mediana:. = Límite inferior de la clase que contiene la

mediana= Frecuencia acum. de la clase que antecede a la

clase de la mediana

= Frecuencia de la clase de la mediana

= Intervalo de clase de la clase de la mediana.Clase modal: La clase que tiene mayor frecuenciaModa: Observación más frecuente. Se calcula usando como base la clase Modal

= Límite inferior de la clase modal

= Diferencia entre la frecuencia de la clase modal y la clase anterior

= Diferencia entre la frecuencia de la clase modal y la clase sigiente

= Intervalo de clase de la clase modal.

Varianza:

Desviación estándar:

= Media de datos agrupados = Frecuencia o número de observaciones en

cada clase= Punto medio de cada clase

= Tamaño de la muestra = suma de todas las frecuencias

Cuartiles: Son las medidas que dividen un conjunto de datos en 4 partes iguales (son 3 en total Q1, Q2, Q3). Se calculan igualando los cuartiles al equivalente en percentiles

1er. Cuartil = Q1= percentil 25 = P25

2do. Cuartil = Q2 =percentil 50 = P50

3er. Cuartil = Q3 = percentil 75 = P75

Deciles: Son las medidas que dividen un conjunto de datos en 10 partes iguales(son 9 en total) Se calculan igualando los cuartiles al equivalente en percentiles

1er. Decil = percentil = 10 = P10

2do. Decil = percentil = 20 = P20

:9no. Decil = percentil = 90 = P90

Percentiles: Son las medidas que dividen un conjunto de datos en 100 partes iguales (son 99 en total)

= Sitio del percentil deseado en una serie ordenada

= Número de observaciones

= Percentil deseado

Cálculo del Percentil en datos agrupados Cálculo del Decil o cuartil

Se coloca el percentil equivalente al decil o al cuartil deseado.

Rango o recorrido: Diferencia entre la observación mayor y la menor de todas las observaciones.Rango de clase: Diferencia entre la observación mayor y la menor de la clase

Rango de todas las observaciones = Dato mayor – Dato menorRango de clase = Límite mayor – Límite menor

Rango o recorrido intercuartílico: Diferencia entre el primer cuartil y el tercer cuartil Rango intercuartílico = Q3 - Q1 = P75 – P25

4

Page 5: Resumen de Formulas 745[1]

Teorema de Chevyshev: Para todo conjunto de datos por lo menos

de las observaciones están dentro

de K desviaciones estándar de la media, en donde K es cualquier número mayor a 1.

Distribución Normal: Distribución de datos continuos (no discretos) que produce una curva simétrica en forma de campana. En ella la media la mediana y la moda son todas iguales

f (x)

0 5 10 15 20 x (minutos)

MediaMediana

Moda

f (x)

0 5 10 15 20 x (minutos)

f (x)

0 5 10 15 20 x (minutos)

MediaMediana

Moda

Regla empírica: Si se incluyen todas las observaciones que están a una desviación estándar de la media (por encima y por debajo), éstas serán el 68,3% de todas las observaciones, sin importar cual sea la media ni cual la desviación estándar.

Observaciones a + 1 desviación estándar de la media: 68.3%Observaciones a + 2 desviaciones estándar de la media: 95.5%Observaciones a + 3 desviaciones estándar de la media: 99.7%

Distribución Sesgada: Es una distribución que al tener una curva cuya moda está hacia la izquierda, produce un sesgo hacia la derecha y viceversa.

Coeficiente de Sesgo de Pearson:

Si P < 0 los datos están sesgados a la izquierda.Si P > 0 los datos están sesgados a la derecha

Sesgo a la Derecha

Sesgo a la Izquierda

Coeficiente de Variación: Medida que determina el grado de dispersión de un conjunto de datos relativo a su media, sobre todo cuando se consideran dos o más distribuciones que tienen medias significativamente diferentes o que están en medidas diferentes.

Fórmula:

Objetivo 3: Principios de Probabilidad

Objetivo 6: Distribuciones discretas importantes (Binomiales, Hipergeométricas, de Poisson)

Distribución de Poisson: Distribución discreta que mide el número de ocurrencias sobre algún intervalo de tiempo o espacio. Ej. Número de clientes que pueden llegar durante algún período de tiempo.

Objetivo 7: Distribución Normal

5

Moda

Mediana

Media

Moda

Mediana

Media

Moda

Mediana

Media

Moda

Mediana

Media

Page 6: Resumen de Formulas 745[1]

Distribución Normal: Distribución de datos continuos (no discretos) que produce una curva simétrica en forma de campana. En ella la media la mediana y la moda son todas iguales se utiliza para reflejar variables como estaturas, pesos, distancias y otras medidas que son divisibles infinitamente. La forma y posición están determinadas por la media μ y la desviación estándar σ. Más del 50% de las observaciones están por encima de la media y 50% están por debajo. Igualmente el 50% de las observaciones están a la derecha de la media y 50% a la izquierda de la media.

f (x)

0 5 10 15 20 x (minutos)

MediaMediana

Moda

f (x)

0 5 10 15 20 x (minutos)

f (x)

0 5 10 15 20 x (minutos)

MediaMediana

Moda

Desviación normal o Z : Es el número de desviaciones estándar a las que una observación está por encima o por debajo de la media. La distribución normal se CONVIERTE a una forma estándar utilizando la fórmula de conversión o Fórmula Z. para facilitar los cálculos Luego de aplicada la fórmula Z la media μ = 0 y la desviación estándar σ = 1

Z =Desviación normalX = Variable aleatoriaμ = Mediaσ= Desviación estándar

Cálculo de probabilidades con la desviación normal:Para hallar la probabilidad de que un evento X ocurra, se utiliza la fórmula Z y se obtiene el valor de Z (Este valor representa el área que se encuentra bajo la curva de la distribución, desde la media hasta el punto X ; equivale a la probabilidad). Como el 99.7% de los datos están a + 3 desviaciones estándar de la media, el valor máximo que puede tomar Z es 3.99. La tabla de la distribución normal muestra las distintas áreas (probabilidades) relacionadas con los valores de Z.

Si se conoce el área en porcentaje (probabilidad)1.- Se convierte a cifra decimal y se le resta 0,5: Si la cifra es negativa estará a la izquierda de la media y si es positiva a la derecha.2.- El porcentaje que resulte se ubica en el interior de la Tabla de Distribución normal para obtener a cual valor Z corresponde. 2.- Despejando X de la fórmula Z queda

3.- Se sustituyen los valores dados y resulta la variable buscada.

Aproximación normal a distribución binomial:Si en una distribución binomial la cantidad de ensayos (n) es muy grande la solución puede hallarse con un aproximado a la distribución normal. La aproximación es suficientemente precisa si n.π ≥ 5 y (1- π) ≥ 5.

Procedimiento:1.- Se calcula la media y la desviación estándar con las fórmulas:

2.- Se coloca el valor X como media de un intervalo de 1(ejem. Si n= 20 entonces el intervalo es 19,5 < 20 < 20,5 y se calcula la probabilidad como distribución normal.

Objetivo 8: Otras Distribuciones Continuas importantes

6

Page 7: Resumen de Formulas 745[1]

Distribución Exponencial: Distribución de datos continuos (no discretos) que mide el paso del tiempo entre eventos con distribución de Poisson.

t = Lapso de tiempo μ = Tasa promedio de ocurrencia

e= Base de logaritmo natural: 2,71828

7