conceptos basicos de la estadistica
TRANSCRIPT
Conceptos básicos.Variables estadísticas.
UNIVERSIDAD NACIONAL DANIEL ALCIDES CARRIÓNFACULTAD DE INGENIERÍA
ESCUELA DE FORMACIÓN PROFESIONAL DE INGENIERÍA AMBIENTAL
CLASE N° O2:
1
2
ALGUNAS OPINIONES INTERESANTES:
“El pensamiento estadístico será algún día tan necesario para el ciudadano competente como la habilidad de leer y escribir". (H.G. Wells)
“Para la mayoría de los estudiantes la estadística es un tema misterioso donde operamos con números por medio de fórmulas que no tienen sentido”. (Graham)
Estadisticas y Probabilidades. Ing. James Támara 3
Concepto de Estadística:
……la única herramienta que, hoy por hoy, permite dar luz y obtener resultados, y por tanto beneficios, en cualquier tipo de estudio, cuyos movimientos y relaciones, por su variabilidad intrínseca, no puedan ser abordadas desde la perspectiva de las leyes deterministas es la estadística.
La Estadística se ocupa de los métodos y procedimientos para recoger, clasificar, resumir, hallar regularidades y analizar los datos (Estadística Descriptiva), siempre y cuando la variabilidad e incertidumbre sea una causa intrínseca de los mismos; así como de realizar inferencias a partir de ellos, con la finalidad de ayudar a la toma de decisiones y en su caso formular predicciones (Estadística Inferencial).
Estadisticas y Probabilidades. Ing. James Támara 4
Pensamiento Estadístico:
Pensamiento “La estadística no solo es una colección de conceptos y técnicas. Sobre todo es una forma de razonar”.
Razonar en situaciones de variabilidad e incertidumbre para obtener información que guíe la toma de decisiones a partir de datos.
Nuestro conocimiento puede fallar, pero es actualmente la mejor herramienta para saber separar en situaciones aleatorias cotidianas, la variabilidad natural de los fenómenos causales.
Estadisticas y Probabilidades. Ing. James Támara 5
El pensamiento estadístico se caracteriza por:
Abordar la solución de problemas en base a datos no solo en intuiciones(Leer: Falacia del jugador https://es.wikipedia.org/wiki/Falacia_del_apostador) Importancia del proceso generador de datos (muestreo, experimentos, fuentes secundarias) Percibir de manera natural la omnipresencia de la variabilidad y la incertidumbre e incluirla en el proceso de modelización de la realidad Desarrollar la capacidad de abordar problemas faltos de estructura Valorar la utilidad de la estadística para estimar, para predecir, para valorar el impacto de un factor sobre la variabilidad de otros, para decidir entre diferentes opciones, etc. Uso del enfoque científico para resolver los problemas (inducción-deducción) Saber comunicar los resultados
Estadisticas y Probabilidades. Ing. James Támara 6
Relación entre Pensamiento Estadístico y Métodos Estadísticos
Estadisticas y Probabilidades. Ing. James Támara 7
Población o Universo:Es obvio que todo estudio estadístico ha de estar referido a un conjunto o colección de personas o cosas. Este conjunto de personas o cosas es lo que denominaremos población o universo. Aquí el término población o universo tiene un significado mucho más amplio que el usual, ya que puede referirse a personas, cosas u objetos, actos, áreas geográficas e incluso al tiempo.
Las personas u objetos que forman parte de la población se denominan elementos.
A su vez, cada elemento de la población tiene una serie de características que pueden ser objeto del estudio estadístico. Así por ejemplo si consideramos como elemento a una persona, podemos distinguir en ella los siguientes caracteres: Sexo, Edad, Nivel de estudios, Profesión, Peso, Altura, Color del Cabello, etc.
Luego por tanto de cada elemento de la población podremos estudiar uno o más aspectos cualidades o caracteres.
Conceptos Básicos
Estadisticas y Probabilidades. Ing. James Támara 8
La población puede ser según su tamaño de dos tipos:
Población finita: Cuando el número de elementos que la forman es finito, por ejemplo el número de alumnos de un centro de enseñanza, o de una sección.
Población infinita: Cuando el número de elementos que la forman es infinito, o tan grande que pudiesen considerarse infinitos.. Como por ejemplo si se realizase un estudio sobre concentración de un metal en el suelo. El suelo es tan extenso y los iones metálicos varían su concentración, que esta población podría considerarse infinita.
La población debe estar perfectamente definida en el tiempo y en el espacio, de modo que ante la presencia de un potencial integrante de la misma, se pueda decidir si forma parte o no de la población bajo estudio. Por lo tanto, al definir una población, se debe cuidar que el conjunto de elementos que la integran quede perfectamente delimitado.
Conceptos Básicos
Estadisticas y Probabilidades. Ing. James Támara 9
Ejemplos de Población Estadística:
Conjunto de estudiantes de la UNDAC/FI/EFPIA inscritos para el periodo 2016-A. Conjunto formado por las notas finales que obtuvieron los alumnos de la UNDAC/FI/EFPIA durante el periodo 2016-A de todas las materias que cursaron.Las ventas mensuales en soles de la empresa “x”, desde su fundación hasta el mes pasado.
El tamaño de la población, que es el número de elementos que la conforman, se denota con la letra N (ene mayúscula)
Conceptos Básicos
Estadisticas y Probabilidades. Ing. James Támara 10
Muestra:Una muestra es un subconjunto de la población o universo. Una muestra, en un sentido amplio, no es más que eso, una parte del todo que se llama población o universo y que sirve para representarlo.
Toda aplicación de las estadísticas pasa por la decisión si usar la población o una muestra para llevar a cabo el estudio.
Algunos factores que determinan el uso de muestras: Costos (Presupuestos limitados) Población infinita o demasiado grande Población fuera de alcance (imposible) Medir la característica de interés implica la destrucción del elemento medido. Población suficientemente homogénea respecto a la característica estudiada. Las exigencias (objetivos) del estudio así lo requieren.
Conceptos Básicos
Estadisticas y Probabilidades. Ing. James Támara 11
La Teoría del Muestreo o Técnicas de Muestreo es un poderosa herramienta estadística que nos permite seleccionar muestras representativas de una población.
Conceptos Básicos
Tipo de
Muestra
Muestra Subjetiv
a
Muestras Probabilístic
aso
Aleatorias
Muestras No
Probabilísticas
Muestra por
Cuotas
Muestra por
Grupos Naturale
s
Muestra Aleatoria Simple
Muestra Sistemátic
a
Muestra Estratificad
a
Muestra Por Conglomerad
o
Estadisticas y Probabilidades. Ing. James Támara 12
Conceptos BásicosEjemplos de Población y Muestra:
Población: Conjunto de estudiantes de la UNDAC/FI inscritos para el periodo 2016-A.
Muestra (1): Estudiantes de Ingeniería Ambiental Muestra (2): Estudiantes de Geología.
Población: Conjunto formado por las notas finales que obtuvieron los alumnos de la UNDAC/FI/EFPIA durante el periodo 2015-B de todas las materias que cursaron
Muestra (1): Notas mayores o iguales a 10 puntos. Muestra (2): Notas de Estadísticas.
Población: Las ventas mensuales en soles de la empresa “X” desde su fundación hasta el mes pasado.
Muestra (1): Ventas de los últimos 12 meses.
Al tamaño de la muestra la denotamos con n (ene minúscula)
Estadisticas y Probabilidades. Ing. James Támara 13
Conceptos BásicosVariables:Son aspectos o características medibles de los elementos de la población o muestra. Pueden ser de muy diversos tipos, por lo que los podemos clasificar en dos grandes clases:
CuantitativasVariables
Cualitativas o Atributos
Las variables cuantitativas son las que se describen por medio de números, como por ejemplo el Peso, Altura, Edad, Número de Suspensos…
A su vez este tipo de variables se puede dividir en dos subclases:
Variables Cuantitativas Discretas o Variables Discretas
Variables Cuantitativas Continuas o Variables Continuas
Estadisticas y Probabilidades. Ing. James Támara 14
Conceptos BásicosVariables DiscretasAquellas a las que se les puede asociar un número entero, es decir, aquellas que por su naturaleza no admiten un fraccionamiento de la unidad, por ejemplo número de hermanos, páginas de un libro, número de defectos en un producto, etc.
Variables ContinuasAquellas que por su naturaleza admiten que entre dos valores cualesquiera la variable pueda tomar cualquier valor intermedio, por ejemplo peso, tiempo, costo, etc.
Los Atributos o Variables Cualitativas son aquellos caracteres que para su definición precisan de palabras, es decir, no le podemos asignar un número. Por ejemplo Sexo Profesión, Estado Civil, etc.
Estadisticas y Probabilidades. Ing. James Támara 15
Conceptos BásicosLos Atributos o Variables Cualitativas a su vez las podemos clasificar en:
Ordenables: Aquellas que sugieren una ordenación, por ejemplo la graduación militar, el nivel de estudios, etc.
No Ordenables: Aquellas que sólo admiten una mera ordenación alfabética, pero no establece orden por su naturaleza, por ejemplo el color de pelo, sexo, estado civil, etc.
A las variables las denotamos con letras x, y, z,…. y a los distintos valores que toma una variable con su letra y subíndices x1, x2, x3,……., xk
Convenio: Las variables cuantitativas se mostrarán ordenadas de menor a mayor, es decir, si x denota una variable cuantitativa (discreta o continua) entonces siempre:x1 < x2 < x3 <…….< xk
Estadisticas y Probabilidades. Ing. James Támara 16
Conceptos BásicosPor ejemplo:
Población: Conjunto de estudiantes de la UNDAC/FI/EFPIA inscritos para el periodo 2016-A Muestra: Estudiantes matriculados en Estadística Sección A. B o C. Tipo de Muestreo: Aleatorio Simple Tamaño de la muestra (n): 12 Variables de Estudio: x = Edad
Definición: Edad cronológica del estudiante Tipo: Cuantitativa, continua Unidad de Medida: Años cumplidos Rango: 0,1, 2, 3,……..
y = Nota Aprobatoria de Calculo I. Definición: Nota con la cual aprobó Cal.I.Tipo: Cuantitativa, Discreta Unidad de Medida: Puntos Rango: 0,1,2,3,……20
z = Repitencia en Estadísticas y Probabilidades. Definición: Cantidad de veces que ha cursado Tipo = Cuantitativa Unidad de Medida: Cantidad Rango: 0,1,2,3,…..
w = Estado Civil Definición: Situación civil respecto al matrimonioTipo: Cualitativa/Atributo, No Ordenable Unidad de Medida: Ninguna Rango: Soltero (S), Casado (C), Divorciado (D), Viudo (V), Otro (O)
Estadisticas y Probabilidades. Ing. James Támara 17
Conceptos BásicosProceso de Recolección de datos:
Estudianteen la Muestra
Número Aleatori
oX
(Edad)
Y (Nota Ap. Cal.
I.)
Z (Repitencia)
W (Edo. Civil)
1er 4 20 10 0 S2do 12 21 10 0 S3er 1 19 11 0 S4to 16 22 14 0 S5to 33 25 13 1 S6to 21 26 15 1 S7mo 7 20 10 0 S8vo 2 22 10 2 S9no 40 25 11 1 S
10mo 37 18 12 2 S
Estadisticas y Probabilidades. Ing. James Támara 18
Conceptos BásicosEn esta muestra las variables toman los siguientes valores:x (Edad - Años):x1 = 18; x2 = 19; x3 = 20; x4= 21; x5 = 22; x6 = 25; x7 = 26; x8 = 27** Se cumple el orden ascendente de la variable por ser cuantitativa
y (Nota aprobatoria de Cal.I.- ptos):y1 = 10; y2 = 11; y3 = 12; y4= 13; y5 = 14; y6 = 15z (Repitencia de Est.):z1 = 0; z2 = 1; z3 = 2w (Estado Civil):w1 = S; w2 = C
Frecuencia Absoluto o FrecuenciaEl número de veces que se repite un determinado valor de una variable en una muestra o población de la misma es su frecuencia absoluta ó frecuencia (f):x1 = 18 años ; f1 = 1 alumno, por otra parte y1 = 10 ptos; f1 = 5 alumnos
Estadisticas y Probabilidades. Ing. James Támara 19
Conceptos Básicos
Se cumple que para una determinada variable que toma k distintos valores en la población o muestra:
nNffffK
iik ó .......
121
En nuestro ejemplo para la variable edad (x):1211221221.......
8
1821
iiffff
para la variable estado civil (w):1211121 ff
Estadisticas y Probabilidades. Ing. James Támara 20
Conceptos BásicosFrecuencia Relativa:
Es la proporción que ocupa un valor especifico de una variable en la población o muestra, es decir, es el cociente que resulta de dividir la frecuencia (fi) entre el tamaño de la muestra o población según sea el caso:
Nfhó
nfh i
ii
i
P.ej: si x1 = 18 años ; f1 = 1 alumno entonces la proporción de alumnos de 18 años en la muestra será:
0833,01211
1 nfh
Si multiplicamos por 100 a hi obtenemos la frecuencia relativa porcentual,100100%
nfhh i
ii en el ejemplo %hi = 8,33%
Estadisticas y Probabilidades. Ing. James Támara 21
Conceptos BásicosSe cumple que para una determinada muestra o población de una variable:
Frecuencia Absoluta Acumulada
Para un determinado valor de una variable cuantitativa (continua o discreta), su frecuencia absoluta acumulada o simplemente frecuencia acumulada (F) se define como la cantidad de valores de la variable que son menores o iguales al valor dado:
100%.....%%%%
y ;1.....
3211
3211
k
k
ii
k
k
ii
hhhhh
hhhhh
ii
i
jjii fFffffF
1
121 ......
Estadisticas y Probabilidades. Ing. James Támara 22
Conceptos BásicosP.ej:Para la variable x (edad):F1= 1 (cantidad de alumnos en la muestra con edad menor o igual a 18 años)
F2= 3 (cantidad de alumnos en la muestra con edad menor o igual a 19 años)
F3= 5 (cantidad de alumnos en la muestra con edad menor o igual a 20 años)Nótese que:F1= f1 = 1 F2= f1+ f2 = 1 + 2 = F1 + f2 = 3F3= f1+ f2 + f3 = 1 + 2 + 2= F2 + f3 = 5 ……………………F7=11F8= f1+ f2 + f3 +…….+ f8 = 1+2+2+1+2+2+1+1= 12=F7 + f8 = 11+ 1= 12 Si una variable toma k-distintos valores en una población o muestra, entonces se cumple que: F1= f1 y Fk= N ó Fk= n
Estadisticas y Probabilidades. Ing. James Támara 23
Conceptos BásicosFrecuencia Relativa Acumulada
Para un determinado valor de una variable cuantitativa (continua o discreta), su frecuencia relativa acumulada (H) se define como la proporción de valores de la variable que son menores o iguales al valor dado:
ii
i
jjii hHhhhhH
1
121 ......
Igualmente se puede determinar la frecuencia relativa acumulada porcentual (%H) que se define como el porcentaje de valores de la variable que son menores o iguales al valor dado:
ii
i
jjii hHhhhhH %%%%......%%% 1
121
Estadisticas y Probabilidades. Ing. James Támara 24
Conceptos BásicosSe cumple que:
100%
ó
ii
ii
ii
HHNFH
nFH
Igualmente , si una variable toma k-distintos valores en una población o muestra entonces:
H1= h1 y Hk= 1 y %H1= %h1 y %Hk= 100En nuestro ejemplo para la variable edad:H1= h1 = 0,0833H2= h1+ h2 = 0,0833 + 0,1667 = H1 + h2 = 0.25 entonces %H2 = 25%Lo que significa que el 25% de los alumnos en la muestra tienen una edad menor o igual a 19 años
Estadisticas y Probabilidades. Ing. James Támara 25
Conceptos Básicos
Parámetro PoblacionalLos parámetros poblacionales caracterizan y describen estadísticamente a las poblaciones. Por ejemplo, si después de un estudio poblacional (Censo) de los estudiantes de la EAC inscritos en el 2do periodo del 2008 se obtiene que la edad promedio es 23 años, entonces este promedio será un parámetro de dicha población.
Una vez definida la población sus parámetros estadísticos no varían.
Ejemplos de parámetros poblacionales:-Ingreso promedio de la población trabajadora de un país-Porcentajes de errores de facturación en que incurre CANTV
Por lo general los parámetros poblacionales se desconocen y para su determinación se requiere o bien efectuar un estudio poblacional (Censo) con el cual se logra se valor “real” o en todo caso realizar un estudio por muestras con lo cual se logra una “estimación” del valor real.
Estadisticas y Probabilidades. Ing. James Támara 26
Conceptos BásicosEstadístico MuestralSon resúmenes de la información contenida en la muestra, o sea son funciones de la información muestral, esto es, depende sola y exclusivamente de la muestra seleccionada. Caracterizan y describen estadísticamente a las muestras.Por ejemplo, la edad promedio de los 12 estudiantes seleccionados aleatoriamente fue de 22 años
Teóricamente de una población se pueden extraer infinitas o un numero muy grande de muestras del mismo tamaño, por lo tanto, un Estadístico Muestral es una variable ya que su valor depende de los elemento que componen la muestra.Una vez seleccionada la muestra de población los estadísticos muéstrales no varían son constantes
Estadisticas y Probabilidades. Ing. James Támara 27
Conceptos BásicosProceso de la Inferencia Estadística
Población de
Parámetros Desconocidos
Se selecciona, en la población, una muestra aleatoria
de n elementos
Con los datos de la muestra se calculan los estadísticos
muéstrales
Se usa el valor del estadístico muestral para estimar o hacer
Inferencia acerca delparámetro poblacional
Estadisticas y Probabilidades. Ing. James Támara 29
Estadistica y Ética
“Hay tres clases de mentiras: la mentira, la maldita mentira y las estadísticas” (Mark Twain)"Las cifras no mienten, pero los mentirosos también usan cifras” (Anónimo)
Recomendación general para el manejo de cifras:• Dude de cualquier resultado numérico, provenga de donde provenga, y beneficie de la duda haciendo cuestionamientos:
Como se obtuvieron los resultado? Donde se obtuvieron? Cuando se obtuvieron? Quien o quienes lo obtuvieron? Bajo que condiciones se obtuvieron los resultados Etc, etc, …….