notas de clase
DESCRIPTION
estadisicaTRANSCRIPT
-
Dra
. Eli
zab
eth
Me
nd
oza
C
rde
na
s
Ap
lica
nd
o l
a e
sta
ds
tica
en
la
s ci
en
cia
s so
cia
les
Libro desarrollado para facilitar el aprendizaje de la estadstica aplicada en las ciencias sociales
Universidad Autnoma de Nuevo Len Facultad de Trabajo Social y Desarrollo Humano
-
La medicin es el ama de llaves de la enseanza. Sin medicin no puede haber evaluacin. Sin evaluacin, es imposible la
retroalimentacin. Sin retroalimentacin, no puede tenerse una idea precisa de los resultados alcanzados. Sin conocer estos
resultados, tampoco es posible una mejora sistemtica en el aprendizaje.
Parnell, citado en Mehrens y Lehmann, 1982, p19.
Propsito
La estadstica ha llegado a ocupar un amplio escenario en el desarrollo de la ciencia y la
tecnologa, pero tambin en las ms diversas esferas de la vida cotidiana, incluidas la cultura y el
deporte. En esta perspectiva podemos decir que es una disciplina que lleg para expandirse y para
incorporarse a la cultura en la sociedad del conocimiento y la informacin. Un aspecto importante en
la prctica de los profesionales en T.S. y D.S. la constituye el proceso de investigacin, donde juegan un
importante papel los procedimientos Estadsticos, ya que proporcionan al egresado, instrumentos para
tomar decisiones cuando prevalecen condiciones de incertidumbre
La metodologa estadstica nos dota de una serie de principios, procedimientos, tcnicas y
mtodos para realizar cuatro tareas fundamentales en la investigacin:
1. Obtener datos pertinentes de manera rpida y a costos bajos;
2. Una vez obtenidos los datos, proporciona los mtodos para su organizacin y
procesamiento, a fin de obtener de ellos la informacin requerida;
3. Proporciona los principios y mtodos para que las conclusiones emanadas o acciones a
seguir sean el producto de procesos de induccin vlidos, que se obtengan de interpretaciones
adecuadas de los resultados; y
4. Proporciona los principios y lineamientos para comunicar apropiadamente los resultados,
conclusiones y recomendaciones, ya sea en el marco de un reporte, una presentacin oral o un artculo
cientfico.
As, los mtodos y tcnicas de la estadstica ayudan a la realizacin de mltiples tareas en las
organizaciones productivas y sociales, tanto en las instituciones pblicas como en las privadas; son la
base para la realizacin de investigaciones que permiten el sustento de la toma de decisiones en las
instituciones u organizaciones de los ms diversos giros.
Pretendemos, por tanto, que el estudiante de la Licenciatura en T. S. y D.H., se familiarice con
las nociones de Estadstica de mayor aplicacin en el Trabajo Social, con un doble objetivo: que sepa
analizar e interpretar la informacin estadstica, los argumentos relacionados con los datos o los
fenmenos estocsticos que pueden encontrar en diversos contextos, y que desarrolle su capacidad de
crtica hacia las informaciones de tipo estadstico procedentes de cualquier fuente.
-
Elementos de Competencia
1. Elaborar un reporte de Anlisis Descriptivo que facilite la adecuada
interpretacin de los resultados obtenidos de algn caso prctico (real o
hipottico) presentado en el aula, utilizando los procedimientos, tcnicas
y mtodos de estadstica descriptiva
2. Estimar parmetros poblacionales de las variables analizadas en el reporte
de Anlisis Descriptivo del caso prctico (real o hipottico) presentado en
el aula, para que las conclusiones emanadas o acciones a seguir sean el
producto de procesos de induccin vlidos, basados en adecuadas
interpretaciones de los resultados
3. Determinar el tamao de una muestra que represente a una determinada
poblacin, con la exactitud y confianza que el estudiante en el papel de
investigador determine.
Metodologa del curso
Esta asignatura ha de entenderse como una herramienta para el trabajador social, y por tanto
debe sustentarse, fundamentalmente, en la resolucin de casos prcticos. Por tanto, plantearemos una
metodologa que procure la participacin del alumnado en la resolucin de esos casos, ya sea
individualmente o de forma colectiva.
Sesiones de Clase
Los estudiantes tienen la obligacin de asistir a todas las sesiones de clase presencial. En este
programa no se permiten las ausencias. En el caso excepcional de que no pueda evitarse la ausencia,
se exigir que el estudiante realice un trabajo/experiencia de compensacin igual y pertinente que
ser definido por el profesor As tambin, el estudiante que no pueda asistir a una sesin de clase, es
el o la responsable de negociar con el instructor la realizacin de un trabajo escrito extraordinario
dedicado a recuperar la instruccin perdida. El instructor disear este trabajo asignado de forma que
cumpla con los objetivos y el contenido de la sesin de clase perdida. En correspondencia con ello, se
fijar una fecha lmite para la entrega del trabajo terminado.
Competencia No 1
Al finalizar esta unidad de aprendizaje el estudiante debe ser capaz de elaborar un reporte de
Anlisis Descriptivo que facilite la adecuada interpretacin de los resultados obtenidos de algn caso
prctico (real o hipottico) presentado en el aula, utilizando los procedimientos, tcnicas y
mtodos de estadstica descriptiva
Contenidos
1.1 Introduccin al curso de estadstica y conceptos bsicos
1.2 Distribucin de frecuencias y tcnicas de representacin grfica
1.3 Medidas de tendencia central
-
1.4 Medidas de dispersin
1.5 La curva normal y la desviacin estndar
Las Actividades de aprendizaje que deben ser cubiertas por el alumno son:
Presentaciones por parte del profesor en el aula
Resolucin de problemas de forma individual y por equipo
Elaboracin de Tablas de Distribucin de Frecuencias y Porcentajes en el cuaderno o
pizarrn y usando SPSS
Elaborar reportes grficos utilizando Tablas de Distribucin de Frecuencias y
Porcentajes en el cuaderno o pizarrn y usando SPSS
Uso de sistemas electrnicos de informacin
Consulta y anlisis de libros, artculos y publicaciones en lnea
Uso del paquete SPSS como apoyo tecnolgico
-
Propsito del curso ........................................................................................................................................ Introduccin ....................................................................................................................................................
Importancia de la Estadstica para el profesional en Trabajo Social y Desarrollo Humano ....................... Definicin de Estadstica. ........................................................................................................................ Fases de la Estadstica ............................................................................................................................. Funciones de la estadstica ..................................................................................................................... Conceptos bsicos ...................................................................................................................................
Niveles de Medicin .................................................................................................................................... Trminos para recordar ..............................................................................................................................
Distribucin de frecuencias y tcnicas de representacin grfica.................................................................. Ordenamiento y Clasificacin de datos ......................................................................................................
Qu es Distribucin de Frecuencias? .................................................................................................... Partes de una Tabla .................................................................................................................................
Estado civil de los afiliados al INSEN ............................................................................................................. Reglas para formar una tabla de Distribucin de Frecuencias ...............................................................
Tcnicas de Representacin Grfica de Datos ................................................................................................ Partes de una Grfica ..................................................................................................................................
Regla de los 3/4 ....................................................................................................................................... Regla de los .............................................................................................................................................. Diagrama de barras compuestas ................................................................................................................ Grafica Circular ............................................................................................................................................ Histograma y Polgono de Frecuencias ....................................................................................................... Trminos para recordar ..............................................................................................................................
Medidas de tendencia central ....................................................................................................................... Que es un promedio? ............................................................................................................................ La Moda (Mo) .......................................................................................................................................... Propiedades de la moda ......................................................................................................................... Desventajas de la moda .......................................................................................................................... Determinar la Moda de una lista de datos ............................................................................................ Cmo determinar la Moda en distribuciones de frecuencias de datos agrupados ............................... Representacin Grfica ........................................................................................................................... La Mediana (Mdn) ................................................................................................................................... Propiedades de la mediana .....................................................................................................................
La Media aritmtica ( ) .......................................................................................................................
Propiedades de la media aritmtica ....................................................................................................... Desventajas de la media aritmtica ........................................................................................................ Obtencin de la media para una lista de datos ...................................................................................... Obtencin de la media para distribuciones de frecuencia ..................................................................... Medidas de dispersin ........................................................................................................................... Cundo nos pueden ayudar estos estadgrafos, para qu sirven? ....................................................... Clculo del Rango .................................................................................................................................... Clculo de Rango, Varianza y Desviacin estndar para Listas de datos ................................................ Curva Normal y Desviacin estndar ......................................................................................................
Trabajos citados .............................................................................................................................................
-
Introduccin
Importancia de la Estadstica para el profesional en Trabajo Social y Desarrollo Humano
En la actualidad se ha incorporado la estadstica, en forma generalizada, al currculo de
matemticas de la enseanza primaria y secundaria y de las diferentes especialidades universitarias en
la mayora de pases desarrollados. En Mxico algunos conceptos estadsticos se estudian desde
el nivel secundario, pero falta mucho por hacer en este rubro. Las razones de este inters hacia la
enseanza de la estadstica han sido repetidamente sealadas por diversos autores, desde
comienzos de la dcada de los ochenta. Por ejemplo en Holmes (1980) encontramos las
siguientes:
La estadstica es una parte de la educacin general deseable para los futuros ciudadanos
adultos, quienes precisan adquirir la capacidad de lectura e interpretacin de tablas y grficos
estadsticos que con frecuencia aparecen en los medios informativos. Para orientarse en el mundo
actual, ligado por las telecomunicaciones e interdependiente social, econmica y polticamente, es
preciso interpretar una amplia gama de informacin sobre los temas ms variados.
Es til para la vida posterior, ya que en muchas profesiones se precisan unos conocimientos
bsicos del tema. La estadstica es indispensable en el estudio los fenmenos complejos,
en los que hay que comenzar por definir el objeto de estudio, y las variables
relevantes, tomar datos de las mismas, interpretarlos y analizarlos.
Su estudio ayuda al desarrollo personal, fomentando un
razonamiento crtico, basado en la valoracin de la evidencia
objetiva; hemos de ser capaces de usar los datos cuantitativos para
controlar nuestros juicios e interpretar los de los dems; es importante adquirir
un sentido de los mtodos y razonamientos que permiten transformar estos
datos para resolver problemas de decisin y efectuar predicciones (Ottaviani,
1998).
Ayuda a comprender otros temas del currculum, donde con frecuencia aparecen grficos,
resmenes o conceptos estadsticos.
El trabajo social y las ciencias de la educacin utilizan la base metodolgica de la estadstica
para los procesos de investigacin aplicada, no slo para monitorear programas en sistemas educativos
sino para cualquier asunto relacionado con la evaluacin y toma de decisiones. Las ciencias biolgicas y
las disciplinas emergentes, como el desarrollo sustentable, o agroecosistemas, medio ambiente,
cambio global y ecologa, consideran a la metodologa estadstica como fundamental para la
generacin del conocimiento y para el diseo e implantacin de estrategias de intervencin. Hay una
gran cantidad de estudios e investigaciones en estas disciplinas que sin la metodologa estadstica
seran impensables.
Definicin de Estadstica
"Ciencia que se ocupa del estudio de fenmenos de tipo genrico, normalmente complejos y
enmarcados en un universo variable, mediante el empleo de modelos de reduccin de la informacin y
-
Recopilacin de informacin
(numrica o alfabtica)
Organizacin de la
informacin recabada
Anlisis e interpretacin
de los resultados
Presentacin de los
resultados
de anlisis de validacin de los resultados en trminos de representatividad".
Fases de la Estadstica
La recopilacin de informacin. La informacin puede ser numrica, alfabtica o simblica
Organizacin de la informacin recabada
Anlisis e interpretacin de los resultados
Presentacin de los resultados
Funciones de la estadstica
Se puede hacer una distincin entre las dos funciones del mtodo
estadstico: las tcnicas de estadsticas descriptivas y las tcnicas
estadsticas inferenciales. El propsito principal de la estadstica
descriptiva es presentar la informacin en forma cmoda, utilizable y
comprensible. Por otra parte, la estadstica inferencial se ocupa de hacer deducciones acerca de la
poblacin de estudio basndose en la o las muestras tomadas de ella.
Conceptos bsicos
Variable. Es cualquier caracterstica de una persona, medio ambiente o situacin experimental
que pueda cambiar de persona a persona, de un medio ambiente a otro medio ambiente o de una
situacin experimental a otra.
Ejemplos: sexo del entrevistado, estado civil actual del entrevistado, edad del entrevistado,
etctera, etctera.
Variable Independiente en un experimento. Es una variable controlada sistemticamente por
el investigador. Por lo general, en una investigacin el cientfico se interesa por el efecto que tiene una
variable A sobre alguna o ms variables. Ejemplo: El investigador desea saber cmo el alcohol afecta la
memoria. Para averiguarlo, es posible que el investigador vare los niveles de alcohol para
posteriormente medir la cantidad de recuerdos que maneja el sujeto de estudio.
La variable que controla el investigador es el nivel de alcohol y es a la que llamaremos la
variable independiente
Variable Dependiente en un experimento. Es la variable que mide el investigador para
determinar el efecto de la variable independiente
Ejemplos: Del ejemplo anterior, la cantidad de recuerdos que maneja el sujeto de estudio, es
-
la que llamaremos la variable dependiente
Datos. Son todos aquellos nmeros o medidas obtenidos como resultado de observaciones. Si
bien pueden ser recuentos (datos de frecuencias) tales como el nmero de personas que se dice que
votaron por Felipe Caldern, son considerados tambin como datos cada una de las respuestas
obtenidas a las preguntas de un cuestionario, cdula de entrevista o cualquier instrumento de
recopilacin de la informacin (datos).
Ejemplos : una tcnica utilizada cotidianamente para obtener datos es la que empleamos
cuando estamos socializando, imaginemos que hoy es el gran da en que estamos en posicin de
convivir con aquella persona que nos interesa, aunque sta ni idea tenga de que existimos, qu cosas
nos interesara saber de esa persona?, Pues bien cada pregunta que nos hagamos es una variable
porque de un individuo a otro puede cambiar la respuesta, pero cada respuesta que nos d la persona a
la que cuestionamos es un dato.
Entonces hagamos la distincin entre variable y dato:
VARIABLE DATO
Cmo te llamas? Pancho Lpez
A que te dedicas? Administro mi cyber caf
Cul es tu platillo preferido? Garza asada
Estas casado? Pero para nada!
Qu marca es tu auto? Transam
Cmo es la pareja de tus sueos? Como t
Poblacin o Universo. Es el conjunto completo de individuos objetos o medidas que poseen
por lo menos una caracterstica comn observable
Ejemplos:
Todos los estudiantes inscritos en el cuarto semestre de la Fac. de Trabajo Social y Desarrollo
Humano de la U.A.N.L.
Los grupos de pandillas de Fomerrey 872
Parmetro. Es el nmero resultante de la manipulacin de los datos de una poblacin, que de
acuerdo con ciertos procedimientos especficos se cuantifica una caracterstica de la poblacin.
Ejemplo: Si pudiramos medir la altura de todos los mexicanos adultos y con esos datos
calculamos la estatura media, estaramos calculando un parmetro
Muestra. Es un subconjunto de la poblacin o universo.
Muestra aleatoria. Es un subconjunto de la poblacin o universo seleccionado en forma tal que
cada miembro de la poblacin tenga la misma oportunidad de ser elegido para formar parte de la
muestra.
Estadgrafo o Estadstica. Es el nmero resultante de la manipulacin de los datos de una
muestra de acuerdo con ciertos procedimientos especficos. Para estimar el parmetro referente a una
poblacin usamos generalmente un estadgrafo que se calcula a partir de una muestra.
Indicador Social. Es una medida de resumen, de preferencia estadstica, referida a la cantidad
-
o magnitud de un conjunto de parmetros o atributos de una sociedad. Permite ubicar o clasificar las
unidades de anlisis (personas, naciones, sociedades, bienes, etc.) con respecto al concepto o conjunto
de variables o atributos que se estn analizando.
Por ejemplo, la tasa de analfabetismo y el acceso al agua potable son indicadores sociales
simples, ya que se refieren a atributos que se puede constatar su presencia o nivel calidad en forma
simple y emprica. Diferente es el caso de un indicador como clase social o prestigio que requieren un
marco conceptual ms complejo al ser un constructo terico ambos y no tiene una equivalencia
emprica concreta. En la composicin de indicadores se debe tener conceptualmente claro lo que
buscamos y no requieren un gran desarrollo matemtico o estadstico.
Por ejemplo: viviendas de un pueblo que no tienen agua potable y expresado en porcentajes.
Argumento: El 59% de las casas del pueblo X no tienen agua potable instalada y hay que traerla
manualmente. Otro ndice seria que no tienen electricidad. Reuniendo varios ndices tenemos un
indicador, por ejemplo de pobreza. Ordenando varios indicadores como uno de pobreza, otro de
analfabetismo, otro de esperanza de vida, tenemos una escala de prioridades a resolver o simplemente
describir. Podemos tomar acciones sobre el analfabetismo enseando a leer y sobre la pobreza
instalando el agua y la electricidad, pero no podemos tomar acciones sobre la esperanza de vida, que
es un valor nominal o ms bien un objetivo a mejorar, por esto los ndices deben ser homogneos con
relacin al propsito de la accin.
La secuencia o la vida de un indicador comienza seleccionando uno o varios que representen a
nuestro entender lo que se quiere investigar. Se ha seleccionado Esperanza de vida al nacer,
Analfabetismo y Nivel de vida (Producto Interno Bruto) y con estos tres indicadores tenemos uno de
Desarrollo Humano para comparar naciones.
Proceso para introducir un indicador: Metodologa en las ciencias sociales.
Seleccionando un tpico.
Definiendo el problema.
Revisando la literatura.
Formulando una hiptesis.
Seleccionando un mtodo de investigacin.
-Seleccionando un programa estadstico.
-Seleccionando los indicadores e ndices.
-Recopilando datos secundarios (censales)
Analizando los resultados.
Presentando los resultados.
Normalmente en los trabajos de proyectos de desarrollo se utilizan hasta 100 ndices, que ya
estn en las estadsticas del censo y con los cuales se construyen 10 o 20 indicadores, que han de ser
ordenados finalmente por Prioridades sociales, precisando de una encuesta para este fin.
Los ndices de desarrollo humano y las escalas de prioridades de la calidad de vida, se han
-
elaborado a nivel mundial por las Naciones Unidas: ndice de Desarrollo Humano, comprenden la
Esperanza de Vida, Tasa de Alfabetizacin, Tasa de Enseanza y Producto Interno Bruto. Los
indicadores de objetivos de desarrollo han catalogado 12 prioridades con sus estadsticas para todos
los pases. El primero es la pobreza y, consecuentemente, el hambre.
El tema de las prioridades sociales como una aplicacin de la metodologa para la poltica
social, establece qu acciones se ejecutarn primero y cuales siguen despus; de acuerdo con un orden
que se preestablece, preguntando a los usuarios o clientes de un plan de desarrollo sobre qu temas
deben ser los primeros en atenderse o asignar ayudas.
Estas prioridades se establecen con los indicadores sociales de desarrollo, tales como: el ndice
de pobreza, medido, por ejemplo, con el coeficiente de Engel o el coste de la canasta bsica o el nivel
de economa autosuficiente. Una vez seleccionada una lista de indicadores necesaria para establecer
los ndices que definen cada indicador. En el ejemplo anterior, el ndice de pobreza pudiera ser
definido por el costo de la alimentacin dividido por los ingresos familiares, esto es, el coeficiente de
Engel. Tambin el porcentaje de hogares sin electricidad o agua permiten medir la pobreza. En este
proceso, se puede proceder con otro indicador, como el nivel de educacin o las facilidades de
asistencia mdica. As terminamos la escala de indicadores que han sido definidos y compuestos con
ndices o porcentajes o promedios, o cualquier medidor. Son sumamente tiles para planificar
objetivos a corto y medio plazo sobre la calidad de vida de la poblacin.
Prioridades sociales cualitativas para reas (indicadores) que se consideran interconectadas y
que vienen estudindose en la ltima dcada.
Costo de/y acceso al cuidado de la salud.
Viviendas y personas sin hogar.
Economa autosuficiente.
Violencia.
Abusos de sustancias y otras adicciones.
Discriminacin.
Mayores.
Jvenes.
Estrs, ansiedad y depresin.
Falta de tiempo para s mismo y para los otros.
El ms sealado es el tema de la salud, le sigue vivienda y as sucesivamente. Adems, puede
hacerse algn comentario sobre la evolucin del desarrollo en la poblacin ya que existen otras
encuestas durante la ltima dcada. Tambin se pueden tener observaciones de tipo sociolgico sobre
los cambios en la cultura de la poblacin dado que sta y las necesidades definen las prioridades,
opinin cierta en un anlisis funcionalista.
Las viviendas y las personas sin hogar son prioritarias, sin embargo aparecen de manera distinta
en 1995. En ese momento, por ejemplo, no se meda el nmero de personas sin hogar. Los temas
-
relacionados con salud han sido redefinidos y elevaron su prioridad al primer lugar en 2004. Los dos
ltimos Estrs... y Falta de tiempo... aparecen por primera vez y son indicadores cualitativos. El
indicador Economa... ha sido tambin redefinido. Mayores y Jvenes son fluctuantes, en tanto
Transporte y Desempleo no figuran. Aparecen nuevos indicadores y dejan de usarse otros.
Otras encuestas no gubernamentales, del peridico local y fundaciones, coinciden en
prioridades dentro del rango de las diez posiciones, pero con diferencias. Esta cuestin es interesante.
Niveles de Medicin
Es de suma importancia conocer el nivel de medicin de cada una de las variables con las
cuales estamos trabajando, pues de acuerdo a su forma o nivel de medicin son los procedimientos
estadsticos que podemos emplear. Antes de conocer los tres niveles de medicin es importante tener
claro el significado de la palabra medir, pues generalmente pensamos que una medicin nos va a
significar un valor numrico y no es cierto en todos los casos. Cuando preguntamos a alguien cmo es
el lugar que visit, toda la informacin que nos proporciona para describir el paisaje son medidas que
tomo a travs de las observaciones que realizo utilizando sus cinco sentidos o bien algn instrumento
de medicin. Pues bien podemos entonces definir:
Medir: Es asignar un valor a un fenmeno observado. Los tres Niveles de Medicin son
NOMINAL, ORDINAL Y CARDINAL los cuales vamos a definir y ejemplificar a continuacin.
Nominal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que no
indican por si mismas ningn orden jerrquico o distancia entre la posible gama de respuestas.
Algunos ejemplos son: sexo, estado civil, nombre, lugar de origen,...
Ordinal. Es asignar un valor a un fenmeno observado utilizando para ello etiquetas que nos
indican un orden jerrquico pero no distancia.
Algunos ejemplos son: escolaridad, frecuencia con que asistes a los conciertos del auditorio
coca cola, puesto, que tanto te gusta estudiar estadstica,...
Cardinal Es asignar un valor a un fenmeno observado utilizando para ello cantidades
numricas que indican por si mismas un orden jerrquico y distancia.
Algunos ejemplos son: edad, nmero de hijos, ingresos, temperatura,...
Este nivel de medicin se divide en dos categoras, intervalar y de razn, aunque para fines
estadsticos ambos se trataran de igual forma
Intervalar En este caso, el cero es un valor arbitrario, por ejemplo, cuando observamos que la
temperatura ambiental esta en cero grados sabemos que esto nos indica que hace fro y no que haya
ausencia de temperatura. Es un valor arbitrario porque a alguien se le ocurri que cuando se congela el
agua era cero grados centgrados
Razn En este caso, el cero indica ausencia, por ejemplo, cuando alguien nos dice que tiene
cero hermanos, significa que carece de ellos.
-
Trminos para recordar
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Distribucin de frecuencias y tcnicas de representacin grfica
Ordenamiento y Clasificacin de Datos
Qu es Distribucin de Frecuencias? A la ordenacin sistemtica de los datos y colocar frente
a l el nmero de veces que apareci como respuesta a la variable es lo que conocemos como
distribucin de frecuencias.
Becas a estudiantes de la UANL
rea acadmica f
Admn. de empresas
400
Educacin 50
Humanidades 150
Ciencias Soc. 250
Ciencias 200
Total = n = 1050
Tcnicas de seduccin empleada por los
universitarios Tcnicas f
Embriagar a la chica
76
Falsa promesa de matrimonio
26
Amor fingido 76
Amenaza de terminar
17
Total = n = 195
Respuestas de los adolescentes entrevistados
Frecuencia con que eres impuntual
f
Frecuentemente 55
Ocasionalmente 87
Nunca 23
n 165
Partes de una Tabla
TITULO DE LA TABLA: Es una breve descripcin
del tema que se est tratando, el cual tiene como
propsito ubicar al pblico sobre el asunto que se desea
abordar.
NOMBRE DE LA VARIABLE: Es la caracterstica que
ocupa nuestra atencin en el presente anlisis.
TIPO DE OCURRENCIA: Se debe informar al lector que tipo de cantidad se est manejando, por ejemplo si estamos hablando de la asistencia a un concierto en el auditorio coca cola de
Monterrey, podemos manejarlo de alguna de las siguientes formas:
Frecuencia de asistentes Porcentaje de asistentes Proporcin de asistentes
VALORES: Es toda la gama de datos que se obtuvieron como respuesta a la variable
FRECUENCIA, PORCENTAJE O PROPORCION: La frecuencia se denota con f e indica la
cantidad de veces que apareci cada uno de los datos de la variable
Las proporciones las denotamos con el smbolo P e indican la porcin con que aparece cada
uno de los datos de la variable cuando la poblacin o muestra de estudio se estandariza a 1
Por frmula: P = f/N
f indica frecuencia N indica el tamao de la poblacin.
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
El porcentaje se denota con el smbolo % e indica la cantidad de veces que aparece cada uno de los
datos de la variable cuando la poblacin o muestra de estudio se estandariza a 100
Por frmula: % = f/N x 100 %=P x 100
f indica frecuencia N indica el tamao de la poblacin P es la proporcin.
Ejemplo de una Tabla de Distribucin de Frecuencias (f) y Porcentaje (%)
Reglas para formar una tabla de Distribucin de Frecuencias
Imaginemos que acaba de aceptar el puesto de director de una escuela su responsabilidad es
preparar un nuevo plan de estudios que estimule sus capacidades intelectuales y para ello empieza por
evaluar las capacidades de su cuerpo estudiantil utilizando una muestra de 110 estudiantes, y del test
que aplica encuentra los siguientes valores de coeficiente intelectual:
CI CI CI CI CI CI CI CI CI CI
154 131 122 100 113 119 121 128 112 93
133 119 115 117 110 104 125 85 120 135
116 103 103 121 109 147 103 113 107 98
128 93 90 105 118 134 89 143 108 142
85 108 108 136 115 117 110 80 111 127
100 100 114 123 126 119 122 102 100 106
105 111 127 108 106 91 123 132 97 110
150 130 87 89 108 137 124 96 111 101
118 104 127 94 115 101 125 129 131 110
97 135 108 139 133 107 115 83 109 116
110 113 112 82 114 112 113 142 145 123
Podemos observar que esta informacin no tiene ni pies ni cabeza, por ello organizarla es
importante a fin de que adquiera algn sentido, al realizar esta tarea estamos generando una
distribucin de frecuencias de los CI de los 110 estudiantes elegidos al azar. Primero tememos que
encontrar el CI ms alto a fin de saber dnde vamos a empezar y el ms bajo para conocer el punto
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
final de nuestro trabajo. En este ejemplo el CI ms alto es 154 y el ms bajo es 80, entonces la
distribucin de frecuencias de los CI de los 110 estudiantes elegidos al azar queda como sigue:
Distribucin de frecuencias de los CI
CI f CI f CI f CI f
154 1 129 1 114 2 98 1
150 1 128 2 113 4 97 2
147 1 127 3 112 3 96 1
145 1 126 1 111 3 94 1
143 1 125 2 110 5 93 2
142 2 124 1 109 2 91 1
139 1 123 3 108 6 90 1
137 1 122 2 107 2 89 2
136 1 121 2 106 2 87 1
135 2 120 1 105 2 85 2
134 1 119 3 104 2 83 1
133 2 118 2 103 3 82 1
132 1 117 2 102 1 80 1
131 2 116 2 101 2
130 1 115 4 100 4
Como podr observar los datos estn muy dispersos y no existe una tendencia visual clara del
comportamiento de los mismos. En estas condiciones se acostumbra agrupar los datos en intervalos de
clase, para obtener una distribucin de frecuencias de datos agrupados.
Regla para formar una tabla de Distribucin de Frecuencias de Datos Agrupados
Los intervalos de clase (IC) no deben ser tan amplios que se pierda la discriminacin
proporcionada por nuestra medida original, ni tan pequeos que se desvirte el objetivo que se busca
con la agrupacin. En las ciencias sociales es aceptado agrupar los datos utilizando entre 5 y 20
intervalos de clase
Procedimiento:
Paso 1. Decidir el nmero de IC con que se quiere
trabajar (para este ejemplo manejaremos 15 IC)
Paso 2. Calcular la diferencia entre el valor ms alto y el
ms bajo de los datos originales y sumar 1 para obtener la
cantidad de datos o datos potenciales. Para el ejemplo: 154
80 + 1 =75
Paso 3. Dividir este nmero entre 15(para este ejemplo
manejaremos 15 IC) para obtener el nmero de datos o
datos potenciales en cada IC. . Para el ejemplo: 75/5=5. A la
amplitud de cada IC la designaremos con el smbolo i. En
este ejemplo i=5
Paso 4. Se considera el valor ms bajo de los datos
originales como el lmite inferior del primer IC. Sumar i-1
para obtener el lmite superior del primer IC. En nuestro caso
el primer IC es 80-84
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Paso 5. El siguiente intervalo de clase comienza en el entero siguiente al extremo superior del
primer intervalo de clase. En este ejemplo es 85. Se reproducen las mismas etapas indicadas
en el paso 4 para obtener el lmite superior del segundo intervalo de clase. Repita este
procedimiento para formar cada uno de los siguientes intervalos de clase, hasta que todos
los datos queden incluidos en sus apropiados intervalos de clase
Paso 6. Asigne cada uno de los datos obtenidos a sus apropiados intervalos de clase.
Paso 7. La distribucin de frecuencias de datos agrupados se muestra en la siguiente tabla
Lmites reales de un intervalo de clase: Los verdaderos lmites se encuentran a la mitad
del camino entre el lmite superior de un IC y el lmite inferior del IC contiguo superior. Por
frmula tenemos:
Lmite real inferior (LRI)= (Lmite inferior + Lmite superior del IC contiguo inferior)/2
2
LSLILRI
Lmite real superior (LRS)= (Lmite inferior del IC contiguo superior + Lmite superior)/2
2
LSLILRS
Frecuencia acumulada: Para poder
calcular este tipo de frecuencias hay que
tener en cuenta que la variable estadstica ha
de ser cardinal u ordinal. En otro caso no
tiene mucho sentido el clculo de esta
frecuencia. La frecuencia acumulada de un
valor de la variable, es el nmero de veces
que ha aparecido en la muestra un valor
menor o igual que el de la variable y lo
representaremos por fa. Anlogamente se
define el Porcentaje Acumulado y lo vamos a
denotar por c% como la frecuencia
acumulada dividida entre n por 100
Punto Medio
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Los Puntos Medios, como su nombre lo dice se encuentran a la mitad del camino entre el lmite
superior y el lmite inferior de un IC, sin importar si utilizamos los lmites aparentes o los verdaderos.
Por frmula tenemos:
Punto Medio (x) = (Lmite inferior + Lmite superior)/2
Punto Medio (x) = (Lmite real inferior + Lmite real superior)/2
Tcnicas de Representacin Grfica de Datos
Partes de una Grfica
T t u l o d e l a g r f i c a
0102030405060708090
1er conc. 2do conc. 3er conc. 4to conc.
Parejas
Solteros
Solteras
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
1. TITULO DE LA GRAFICA
Es una breve descripcin del tema que se esta tratando, el cual tiene como propsito ubicar al
publico sobre el asunto que se desea abordar.
2. TIPO DE OCURRENCIA
Se debe informar al lector que tipo de cantidad se est manejando, por ejemplo si estamos
hablando de la asistencia a un concierto en el auditorio coca cola de Monterrey, podemos manejarlo
de alguna de las siguientes formas:
Frecuencia de asistentes
Porcentaje de asistentes
Proporcin de asistentes
3. ESCALA
4. SIMBOLOGIA
Representa los grupos que nos interesan comparar respecto a una caracterstica en particular
estas son las variables independientes
5. CARACTERSTICA QUE ESTAMOS MIDIENDO
A la caracterstica que se esta midiendo, se le conoce como variable dependiente
6. MARCO
De preferencia debe enmarcarse la grfica a fin de dar una mejor presentacin, sin embargo
esto es opcional.
Regla de los 3/4
Como es bien sabido las grficas pueden ser empleadas para confundir al lector cuando se
manipulan intencionalmente los ejes o cuando se omite en el eje Y la frecuencia cero, es por ello que
para evitar una anarqua en la tcnica de representacin grfica, es necesario adoptar un convenio
para minimizar la posibilidad de interpretaciones errneas. La mayora de los estadsticos en que la
altura del eje Y debe ser aproximadamente 0.75 de la longitud del eje X, siendo aceptable que esta
proporcin oscile entre 0.7 y 0.8.
Siempre que un grfico lleve ejes coordenados debemos emplear la regla de los . A
continuacin veremos algunos ejemplos de representaciones grficas.
Las grficas que a continuacin vamos a manejar, son empleadas para representar variables
cuyo nivel de medicin es NOMINAL u ORDINAL.
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Diagrama de barras
Estado civil de los afiliados al INSEN
Estado Civil
Regla de los
Se elige en forma arbitraria un valor para el eje X, tomando en cuenta la cantidad de divisiones en que debe seccionarse ste con el fin de colocar las barras.
Si X= a 10 cm., el valor de Y se obtiene de la siguiente operacin:
Ymin=.7X Ymin=.7 (10 cm)=7 cm.
Yideal=.75 Yideal=.75(10 cm) =7.5 cm.
Ymax=.8X Ymax=.8(10 cm)=8 cm.
Esto significa que el valor del eje Y puede tener cualquier longitud entre 7 y 8 cm. inclusive.
o El eje X debe ser dividido en partes iguales, cada seccin es utilizada por una barra
o Todas las barras deben tener el mismo ancho
o Las barras van separadas entre s, ya que los valores que toman (soltero, casado,...) no indican
continuidad y la separacin entre ellas debe ser de igual tamao
o Ninguna de las barras debe recargarse sobre el eje Y
Diagrama de barras compuestas
Distribucin de asistentes al Auditorio Coca Cola
o El eje X debe ser dividido en partes iguales, cada seccin es utilizada por el grupo de
comparacin
o Todas las barras deben tener el mismo ancho
o Las barras de cada grupo de comparacin van unidas entre s.
o Los grupos de comparacin son separados entre s y la separacin entre ellas debe ser de igual
tamao
0102030405060
0
10
20
30
40
50
60
70
80
90
1er conc. 2do conc. 3er conc. 4to conc.
Parejas
Solteros
Solteras
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
o Ninguna de las barras debe recargarse sobre el eje Y
En los dos ejemplos anteriores debe aplicarse la regla de los
Regla de los
Se elige en forma arbitraria un valor para el eje X, tomando en cuenta la cantidad de divisiones
en que debe seccionarse ste con el fin de colocar las barras.
Si X= a 20 cm., el valor de Y se obtiene de la siguiente operacin:
Ymin=.7X Ymin=.7 (20 cm)=14 cm.
Yideal=.75 Yideal=.75 (20 cm)=15 cm.
Ymax=.8X Ymax=.8(20 cm) =16 cm
Esto significa que el valor del eje Y puede tener cualquier longitud entre 14 cm. y 16 cm.
inclusive.
Grafica Circular
La grfica que a continuacin vamos a manejar, es empleada para representar variables cuyo
nivel de medicin es NOMINAL u ORDINAL preferentemente, sin embargo con variables CARDINALES
tambin pueden emplearse.
0
10
20
30
40
50
60
70
80
90
100
1er conc. 2do conc. 3er conc. 4to conc.
Frec.
Asistentes al auditorio Coca Cola
Parejas
Solteros
Solteras
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Recordemos que la operacin que nos permite encontrar la abertura de los ngulos que
deseamos manejar esta dada por la siguiente frmula:
Angulo= P x 360=f/N x 360
Estado civil de los afiliados al INSEN
Estado civil f P % ngulo
Soltero 22 .11 11 40
Casado 50 .25 25 90
Viudo 112 .56 56 20|
Divorciado 16 .08 8 29
Total (N) f =200
Soltero 11%
Casado 25%
Viudo 56%
Divorciado 8%
Estado civil de los integrantes del INSEN
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Histograma y Polgono de Frecuencias
Distribucin de porcentajes, su Histograma y Polgono
Intervalo de clase Intervalo de clase
Lmite
inferior
Lmite
superior
f
Lmite
real
inferior
Lmite
real
superior
Punto
Medio
X
fa c% Porcentaje
%
150 154 2 149.5 154.5 152 110 100 2
145 149 2 144.5 149.5 147 108 98 2
140 144 3 139.5 144.5 142 106 96 2
135 139 5 134.5 139.5 137 103 94 5
130 134 7 129.5 134.5 132 98 89 6
125 129 9 124.5 129.5 127 91 83 8
120 124 9 119.5 124.5 122 82 75 8
115 119 13 114.5 119.5 117 73 66 12
110 114 17 109.5 114.5 112 60 55 15
105 109 14 104.5 109.5 107 43 39 13
100 104 12 99.5 104.5 102 29 26 11
95 99 4 94.5 99.5 97 17 15 4
90 94 5 89.5 94.5 92 13 12 5
85 89 5 84.5 89.5 87 8 7 5
80 84 3 79.5 84.5 82 3 3 3
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Histograma
Polgono de Porcentajes
0
5
10
15
20
Frec.
1
Calificacin de CI
Coeficiente Intelectual de los
estudiantes
0
2
4
6
8
10
12
14
16
18
82 92 102
112
122
132
142
152
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Distribucin de Frecuencias de datos agrupados y su Ojiva
Lmite
inferior
Lmite
superior
f
Lmite
real
inferior
Lmite
real
superior
Punto
Medio
X
fa
150 154 2 149.5 154.5 152 110
145 149 2 144.5 149.5 147 108
140 144 3 139.5 144.5 142 106
135 139 5 134.5 139.5 137 103
130 134 7 129.5 134.5 132 98
125 129 9 124.5 129.5 127 91
120 124 9 119.5 124.5 122 82
115 119 13 114.5 119.5 117 73
110 114 17 109.5 114.5 112 60
105 109 14 104.5 109.5 107 43
100 104 12 99.5 104.5 102 29
95 99 4 94.5 99.5 97 17
90 94 5 89.5 94.5 92 13
85 89 5 84.5 89.5 87 8
80 84 3 79.5 84.5 82 3
La caracterstica de las ojivas es que son curvas que nunca bajan, siempre van en ascenso o por
lo menos permanecen constantes.
Grfica de la Ojiva de la distribucin de frecuencias del ejemplo
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Trminos para recordar
Diagrama de barras
Histograma Proporcin
Diagrama de barras compuestas
Intervalo de Clase
Ojiva
Punto Medio
Distribucin de Frecuencias
Polgono
Regla de los
Tabla Frecuencia Porcentaje
Grafica Circular
Porcentaje acumulado
Tcnicas de Representacin grfica
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Medidas de tendencia central
Son otra forma de describir datos numricos, las medidas de tendencia central,
comnmente conocidas como promedios. Estos promedios son la media aritmtica, la mediana, y la
moda
Qu es un promedio?
A menudo necesitamos un solo nmero para representar una serie de datos. Este nico
nmero puede ser considerado como tpico de todos los datos.
La palabra promedio es usada frecuentemente en nuestro lenguaje diario, normalmente
nos referimos a la media aritmtica, pero podra referirse a cualquiera de los promedios. Un
trmino ms preciso que promedio es una medida de tendencia central.
La Moda (Mo)
La moda es la medida de tendencia central especialmente til para describir mediciones
de tipo ordinal y nominal.
Definicin:
Es el valor (dato o respuesta) que aparece con mayor frecuencia en una lista de datos o
distribucin de frecuencias
Propiedades de la moda
La moda se puede determinar en todos los tipos de mediciones (nominal, ordinal y cardinal).
La moda tiene la ventaja de no ser afectada por valores extremos.
Puede ser calculada en distribuciones con intervalos abiertos.
Desventajas de la moda
En muchas series de datos no hay moda porque ningn valor aparece ms de una vez.
En algunas series de datos hay ms de una moda, en este caso uno podra preguntarse cual
es el valor representativo de la serie de datos?
Determinar la Moda de una lista de datos
Ejemplos:
Obtenga la moda para cada uno de los siguientes conjuntos de medidas
a). 20, 18, 15, 20, 18, 13, 15, 15, 15, 20
b). 12, 18, 15, 14, 17, 18, 11, 18, 14, 12, 18
c). 129, 15, 15, 15,14, 13,13, 11
El nivel de medicin de
estos datos es Cardinal
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
El nivel de medicin de
estos datos es:
Nominal y Ordinal
Solucin:
Para el inciso (a) el dato que aparece ms frecuentemente es el nmero 15, por lo
tanto el promedio segn la Mo es 15
Para el inciso (b) el dato que aparece ms frecuentemente es el nmero 18, por lo
tanto el promedio segn la Mo es 18
Para el inciso (c) el dato que aparece ms frecuentemente es el nmero 15, por lo
tanto el promedio segn la Mo es 15
Obtenga la moda para cada una de las siguientes tablas de distribuciones de frecuencias
( d) ( e ) ( f ) ( g )
rea
acadmica
f
Tcnicas de
seduccin
f
Frecuencia con
que eres
impuntual
f Clase Social
f
Admn. de empresas
400 Embriagar a la chica
76 Frecuentemente 55 Alta 5
Educacin
50 Falsa promesa de matrimonio
26 Ocasionalmente 87 Media 49
Humanidades
150 Amor fingido 76 Nunca 23 Baja 46
Ciencias Soc.
250 Amenaza de terminar
17 Marginal 12
Ciencias 200
Solucin:
Para el inciso (d) el rea acadmica (dato) que aparece ms frecuentemente es
Admn. de empresas, por lo tanto el rea acadmica promedio segn la Mo es
Admn. de empresas
Para el inciso (e) los datos que aparecen ms frecuentemente son
Embriagar a la chica y Amor fingido, por lo tanto las Tcnicas de seduccin
promedio segn la Mo son Embriagar a la chica y Fingir amor en este ejemplo
hay dos modas y ambas deben ser consideradas como promedio.
Para el inciso (f) el dato que aparece ms frecuentemente es Ocasionalmente, por lo tanto
en promedio segn la Mo los entrevistados son ocasionalmente impuntuales
Para el inciso (g) el dato que aparece ms frecuentemente es la clase social Media, por lo
tanto la Clase Social promedio segn la Mo es la Clase Media
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
8 -
Cmo determinar la Moda en distribuciones de frecuencias de datos agrupados
Para datos agrupados en una distribucin de frecuencia, la moda puede ser estimada por el
punto medio del intervalo que contenga la frecuencia de clase ms grande. Si hay dos intervalos
contiguos con frecuencia mxima la moda ser la media aritmtica de los dos puntos medios. Si hay
dos o ms intervalos no contiguos con frecuencia de clase mxima habr dos o ms modas que sern
los puntos medios de dichos intervalos.
Obtenga la moda de las siguiente tablas de distribucin de frecuencias
(h)
I. C. f x
95 - 99 5 97
90 - 94 9 92
85 - 89 12 87
80 - 84 15 82
75 -79 12 77
70 -74 9 72
65 - 69 4 67
60 - 64 3 62
Solucin:
Para el inciso (h) el intervalo de clase que aparece ms frecuentemente es (80 84), el punto medio
(x) de ese intervalo es (80+84)/2=82, por lo tanto el promedio segn la Mo es 82
Ejemplo: Calcular las modas de las siguientes distribuciones de frecuencia
I. C. f x hay dos modas I. C. f
95 - 99 5 97 (Bimodal) 95 - 99 7
90 - 94 6 92 90 - 94 7
85 - 89 8 87 Moda= 87 85 - 89 7 No hay moda
80 - 84 3 82 80 - 84 7
75 -79 2 77 75 -79 7
70 -74 7 72 70 -74 7
65 - 69 8 67 Moda=(67+62)/2 65 - 69 7
60 - 64 8 62 Moda = 65 60 - 64 7
Representacin Grfica
Polgono de Frecuencias Distribucin Bimodal
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
l
l
La Mediana (Mdn)
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeos, el
valor central que puede dar una mejor descripcin de los datos, es el obtenido mediante la
medida de tendencia central llamada mediana.
Definicin:
Es el dato que aparece al centro de una lista de datos o distribucin de frecuencias siempre y
cuando stos (los datos) estn ordenados en forma ascendente o descendente
Propiedades de la mediana
Hay slo una mediana en una serie de datos.
No es afectada por los valores extremos ( altos o bajos )
Puede ser calculada en distribuciones de frecuencia con intervalos abiertos, si no se
encuentra en el intervalo abierto.
Puede ser calculada en distribuciones con escala cardinal, y ordinal.
Ejemplo:
Obtenga la mediana para cada uno de los siguientes conjuntos de medidas
a. 20, 18, 15, 18, 13, 15, 15, 15, 20
b. 12, 18, 15, 14, 17, 18, 11, 18, 14, 12
c. 129, 15, 15, 15,14, 13, 13, 12, 11
Solucin: Debido a que los datos se encuentran desordenados en los incisos a y b, lo
primero por hacer es ordenar los datos como sigue:
a. 13, 15, 15, 15, 15, 18, 18, 20, 20
b. 11, 12, 12, 14, 14, 15, 17, 18, 18, 18
Una vez ordenados los datos debemos localizar la posicin del centro de la distribucin de
frecuencias o lista de datos, para ello contamos con las siguientes frmulas:
Cuando N es impar
El centro de la distribucin se localiza en:
2
1N
Cuando N es par
La Distribucin de f cuenta con dos lugares al
centro y se localizan en:
Centro 1
2
N
Centro 2
12
N
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
En el inciso (a), cuyos datos aparecen en los cuadros de abajo, N=9, el dato que aparece al
centro de la lista, en la 5 posicin es el nmero 15, por lo tanto el promedio segn la Mdn es 15
En el inciso (b) N=10, aparecen al centro de la lista los nmeros 14 y 15, ocupando los
lugares 5 y 6 en estos casos el valor de la mediana es el punto medio entre ambos valores, por lo
tanto el promedio segn la Mdn es (14+15)/2, o sea, Mdn=14.5
En el inciso (c) N=9, el dato que aparece al centro de la lista es el nmero 15, por lo tanto el
promedio segn la Mdn es 15
a). x b). x c). x
20 Mdn = 15 18 129
20 18 Mdn = (14+15)/2 15
18 18 Mdn =14.5 15
18 17 15 Mdn = 14
15 5 posicin 15 5 posicin 14 5 posicin
15 14 6 posicin 13
15 14 13
15 12 12
13 12 11
11
Obtenga la mediana para cada una de las siguientes distribuciones de frecuencias
( d ) ( e ) ( f )
rea acadmica
f
Tcnicas de seduccin
f
Frecuencia con
que eres impuntual
f
Admn. de empresas
400 Embriagar a la
chica 76 Frecuentemente 55
Educacin 50 Falsa promesa de matrimonio
26 Ocasionalmente 87
Humanidades 150 Amor fingido 76 Nunca 23
Ciencias Sociales
250 Amenaza de
terminar 17 Total N=165
Ciencias 200
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Solucin: Debido a que los datos en los incisos d y e, no se pueden ordenar debido a que se
trata de valores NOMINALES el promedio Mediana es imposible de obtener.
En el inciso (f) el valor de N es 165, como es un valor impar solo existe un lugar al centro y se
localiza utilizando la formula 2
1165
2
1
N= 83, utilizando la fa podemos localizar ese punto como
se ve a continuacin
Frecuencia con que eres impuntual
f
fa
Frecuentemente 55 165
Ocasionalmente 87 110
Hasta aqu ya se han ocupado
110 lugares, por lo tanto ya se ocupo
el lugar 83. El dato que ocupa la
posicin del centro es Ocasional-
mente
La Mdn sabemos que la
localizamos cuando al utilizar la
fa llegamos al lugar indicado en
la formula en forma exacta o
cuando nos pasamos por
primera vez.
Nunca 23 23
Hasta aqu solo se han ocupado
23 lugares, todava no se ha ocupado
el lugar 83
Total N=165
En el inciso (f) N=165, el dato que aparece al centro de la distribucin de frecuencias, en la 83
posicin es Ocasionalmente, por lo tanto se puede decir que en promedio segn la Mdn la poblacin
entrevistada es impuntual en forma ocasional
Obtenga la mediana para cada una de las siguientes distribuciones de frecuencias
( g ) ( h )
I. C. f I. C. f
95 - 99 5 95 - 99 38
90 - 94 9 90 - 94 52
85 - 89 12 85 - 89 43
80 - 84 15 80 - 84 7
75 -79 12 75 -79 10
70 -74 9 70 -74 15
65 - 69 4 65 - 69 8
60 - 64 3 60 - 64 7
Total N=69 Total N=180
Solucin (g)
En el inciso (g) el valor de N es 69, como es un valor impar solo existe un lugar al centro y se
localiza utilizando la frmula
2
169
2
1N 35, utilizando la fa podemos localizar ese punto como se
ve a continuacin
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
I. C. f fa
Aqu nos pasamos por primera vez de 35, por lo
95 - 99 5 tanto la Mdn es un valor que oscila entre 79.5 y
90 - 94 9 84.5 que son los lmites reales del intervalo de
85 - 89 12 clase que se encuentra al centro de la distribucin
80 - 84 15 43 de frecuencias
75 -79 12 28 28 es la fa dentro de la frmula
70 -74 9 16
65 - 69 4 7
60 - 64 3 3
Total N=69
Para obtener la mediana de las distribuciones de frecuencia de datos agrupados en intervalos
de clase, se debe utilizar la siguiente formula:
f
) i( f a
LRIMdn2
Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=79.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=69
fa es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa
= 28
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=15
El procedimiento queda como sigue:
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Paso 1. N/2 = 69/2 =34.5
Paso 2. N/2- fa = 34.5-28= 6.5
Paso 3. i(N/2- fa) = 5 (6.5) = 32.5
Paso 4. f
) i( f a2
= 32.5/15 = 2.167
Paso 5. f
) i( f a
LRIMdn2
= 79.5 + 2.167 = 81.67
Mdn = 81.67
Solucin (h)
En el inciso (h) el valor de N es 180, como es un valor par existen dos lugares al centro y se
localizan utilizando las formulas:
Centro 1=2
N = 2
180= 90
Centro 2= 12
N = 90 + 1= 91
Con la ayuda de la fa podemos localizar esos puntos como se ve a continuacin
I. C. f fa
95 - 99 38
90 - 94
52
142
Aqu nos pasamos por primera vez de 91, el centro que nos faltaba encontrar, por lo tanto la Mdn
es un valor que oscila entre 89.5 y 94.5 que son los lmites reales del intervalo de clase que se
encuentra en uno de los centros de la distribucin de frecuencias
85 - 89
43
90
Aqu llegamos a uno de los centros, la posicin 90, por lo tanto la Mdn es un valor que oscila entre
84.5 y 89.5 que son los lmites reales del intervalo de clase que se encuentra en uno de los
centros de la distribucin de frecuencias
fa
80 - 84 7 47 fa
75 -79 10 40
70 -74 15 30
65 - 69 8 15
60 - 64 7 7
Total N=180
Para obtener la mediana de las distribuciones de frecuencia de datos agrupados en intervalos
de clase, se debe utilizar la siguiente formula:
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
f
) i( f a
LRIMdn2
Nota:
La frmula se aplica utilizando el intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados, en este caso como los centros caen en diferentes intervalos de clase
se elige uno de ellos, cualesquiera, el resultado de la Mdn es el mismo, y si observamos con
detenimiento el nico valor que puede tener la Mdn en esta situacin es el valor del LMITE REAL
que es comn a ambos intervalos de clase.
A fin de demostrarlo calcularemos la Mdn en ambos intervalos
Clculo de la Mediana utilizando el intervalo de clase ( 85 89 )
Donde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=84.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=180
fa Es la frecuencia acumulada del intervalo de clase contiguo inferior.
Para ste ejemplo fa = 47
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=43
El procedimiento queda como sigue:
Paso 1. N/2 = 180/2 =90
Paso 2. N/2- fa = 90-47= 43
Paso 3. i(N/2- fa) = 5 (43) = 215
Paso 4. f
) i( f a2
= 215/43 = 5
Paso 5. f
) i( f a
LRIMdn2
= 84.5 + 5 = 89.5
Mdn = 89.5
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Clculo de la Mediana utilizando el intervalo de clase (90 94)
Dnde:
LRI es el lmite real superior del intervalo de clase que quedo al centro de la distribucin de
frecuencia de datos agrupados. Para ste ejemplo LRI=89.5
i es la amplitud del intervalo de clase. Para ste ejemplo i=5
N es la suma de las frecuencias. Para ste ejemplo N=180
fa es la frecuencia acumulada del intervalo de clase contiguo inferior. Para ste ejemplo fa
= 90
f es la frecuencia del intervalo de clase que quedo al centro de la distribucin de frecuencia de
datos agrupados. Para ste ejemplo f=52
El procedimiento queda como sigue:
Paso 1. N/2 = 180/2 =90
Paso 2. N/2- fa = 90-90= 0
Paso 3. i(N/2- fa) = 5 (0) = 0
Paso 4. f
) i( f a2
= 0/52 = 0
Paso 5. f
) i( f a
LRIMdn2
= 89.5 + 0 = 89.5
Mdn = 89.5
La Media aritmtica ( )
La medida de tendencia central ms ampliamente usada es la media aritmtica, usualmente
abreviada como media
Definicin
Es el punto de equilibrio de una lista de datos o distribucin de frecuencias.
Propiedades de la media aritmtica
Puede ser calculada en distribuciones con escala cardinal
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Todos los valores son incluidos en el cmputo de la media.
Una serie de datos solo tiene una media
Es una medida muy til para comparar dos o ms poblaciones
Es la nica medida de tendencia central donde la suma de las desviaciones de cada valor
respecto a la media es igual a cero. Por lo tanto podemos considerar a la media como el
punto de balance de una serie de datos
Desventajas de la media aritmtica
Si alguno de los valores es extremadamente grande o extremadamente pequeo, la media
no es el promedio apropiado para representar la serie de datos.
No se puede determinar si en una distribucin de frecuencias hay intervalos de clase
abiertos.
Obtencin de la media para una lista de datos
La media aritmtica de una lista de datos se calcula de la siguiente manera:
= n
x
Donde
Simboliza la media de la muestra
x Es la suma de todos los valores de la muestra
n es el nmero de valores que tiene la muestra
Ejemplo:
OBTENGA LA MEDIA PARA CADA UNO DE LOS SIGUIENTES CONJUNTOS DE MEDIDAS
a. 10, 8, 6, 0, 8, 3, 2, 5, 8, 0
b. 15, 19, 13, 15, 13, 17, 15, 17,11
c. 119, 5, 5, 5, 4, 3, 3, 1
Solucin:
Los incisos a, b y c son listas de datos por lo que se aplica la frmula n
xX
x se refiere al dato y n a la cantidad de datos
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
n
xX
= (10+ 8+ 6+ 0+ 8+ 3+ 2+ 5+ 8+ 0)/10 = 50/10 = 5
n
xX
= (15+ 19+ 13+ 15+ 13+ 17+ 15+ 17+11) / 9 = 135 / 9 = 15
n
xX
= (119+ 5+ 5+ 5+ 4+ 3+ 3+ 1) / 8 = 145 / 8 = 18.125
La media de la muestra, o cualquier otra medida basada en los datos de la muestra se le
denomina: estadstico o estadgrafo.
La media de la muestra y la media de la poblacin se calculan de la misma manera pero
tienen diferente notacin:
Donde:
simboliza la media de la poblacin
N simboliza el tamao de la poblacin, es decir, el nmero total de observaciones en la
poblacin.
La media de la poblacin, o cualquier otra medida basada en los datos de la poblacin se le
denomina: parmetro.
Obtencin de la media para distribuciones de frecuencia
Frecuentemente los datos estn agrupados y presentados en forma de distribucin de
frecuencias. Si esto sucede es normalmente imposible recuperar los datos crudos originales.
Por consiguiente si queremos calcular la media u otro estadstico es necesario estimarlo en
base al punto medio de la distribucin de frecuencias.
La media aritmtica de una muestra de datos organizados en una distribucin de
frecuencias se calcula de la siguiente manera:
Dnde:
Simboliza la media de la muestra
N
x
n
fxX
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
x Es la marca de clase punto medio
f Es la frecuencia de clase la frecuencia del intervalo de clase
fx Es la suma de los productos de f por x
n Es la suma de las frecuencias
Ejemplos:
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias ( d ) ( e ) ( f )
rea acadmica f
Tcnicas de seduccin
f
Frecuencia con que eres impuntual
f
Admn. de empresas
400
Embriagar a la chica
76 Frecuentemente 55
Educacin
50
Falsa promesa de matrimonio
26 Ocasionalmente 87
Humanidades
150
Amor fingido 76 Nunca 23
Ciencias Soc.
250
Amenaza de terminar
17
Ciencias
200
Solucin:
En los incisos d y e se trata de valores NOMINALES y el inciso f maneja valores ORDINALES,
como puede observarse, ste tipo de valores no se pueden sumar por lo cual el promedio Media es
imposible de obtener.
Obtenga la media para cada una de las siguientes tablas de distribuciones de frecuencias
( g ) ( h )
Cuntos hermanos tienes?
f I. C. f
6 5 95 - 99 5
5 9 90 - 94 9
4 12 85 - 89 12
3 15 80 - 84 15
2 12 75 -79 12
1 9 70 -74 9
0 4 65 - 69 4
60 - 64 3
Solucin: Los incisos g y h son distribuciones de frecuencias por lo que se aplica la frmula
n
fxX
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Cuantos hnos. tienes?
f fx
6 5 30
5 9 45
4 12 48
3 15 45
2 12 24
1 9 9
0 4 0
Totales N= 66 fx=201 = N
fx = 201/66 = 3.05
Basndonos en este resultado podemos concluir entonces que en promedio segn lo indica la
media, la poblacin entrevistada cuenta con 3 hermanos.
Calificaciones I. C.
f PM
x fx
95 - 99 5 97 485 90 - 94 9 92 828 85 - 89 12 87 1044 80 - 84 15 82 1230 75 -79 12 77 924 70 -74 9 72 648 65 - 69 4 67 268 60 - 64 3 62 186 Totales N= 69 fx=5613 =
N
fx = 5613 / 69 = 81.35
Basndonos en este resultado podemos concluir entonces que la poblacin entrevistada segn
lo indica la media obtuvo en promedio una calificacin de 81.35.
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Tipo de curvas y Posicin de la Moda, Mediana y Media
Curva Normal
Leptocrtica Mesocrtica Platicrtica
Mo
Mdn
Mo Mdn
Mo
Mdn
Curva Bimodal
Silla de montar Curva U
Mo Mdn Mo
Mo Mdn Mo
Curva Sesgada Sesgo Positivo Sesgo Negativo
Mdn
Mdn
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Cuando seleccionar la Moda, la Mediana o la Media como el promedio ms adecuado
NIVEL DE MEDICION MEDIDA DE TENDENCIA CENTRAL
N O M I N A L O R D I N A L C A R D I N A L
MODA Mo
Siempre
Cuando la distribucin de frecuencias o lista de datos sea
bimodal
Cuando la distribucin de frecuencias o
lista de datos sea bimodal
MEDIANA Mdn
Debido a que los datos nominales no se pueden ordenar el promedio Mediana no se puede obtener
Cuando la distribucin de frecuencias o lista de datos sea
unimodal
Cuando la distribucin de frecuencias o
lista de datos sea unimodal y sesgada <
Mdn >
MEDIA
Debido a que los datos nominales no se pueden sumar el promedio Media no se puede obtener
Debido a que los datos no se pueden sumar el promedio Media no se puede obtener
Cuando la distribucin de frecuencias o
lista de datos sea unimodal y normal <
Mdn >
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Medidas de dispersin
Las medidas de dispersin en conjunto con las medidas de tendencia central son de
gran ayuda para entender mejor cmo se comporta una variable dentro de una poblacin, y
es de mayor envergadura cuando las utilizamos para comparar una variable en dos o ms
poblaciones distintas.
Cundo nos pueden ayudar estos estadgrafos, para qu sirven?
Pues bien, imagine que usted es un millonario y despilfarrador extranjero que visita
por primera vez nuestro pas, llega a la ciudad de Acapulco. Y aunque todo lo que
experimenta en este viaje le gusta, su clima es lo que ms le cautiv. Ahora imagine que
alguien le comenta que el desierto de Sonora tiene en promedio los mismos grados de
temperatura que la ciudad de Acapulco. Si usted no tuviera conocimientos de estadstica y
siendo extranjero, podra pensar que ambas regiones tienen el mismo clima y como tiene
mucho $$$, lo ms probable es que con el equipaje con que lleg a Acapulco, (que es el
adecuado para esa ciudad) se dirija al desierto de Sonora.
Si esto ocurriera, Qu pasara?, Lo ms seguro es que se afectara su salud al
experimentar tantos cambios tan bruscos de temperatura y sin la proteccin adecuada.
Como puede verse en las grficas de abajo, en Acapulco las temperaturas oscilan entre 28C
y 32C, mientras que en el desierto de Sonora la fluctuacin va de los 0C a los 60C
Acapulco
28C 32C
=30C
Desierto de Sonora
0C 60C
= 30C
Las medidas de dispersin indican precisamente, como su nombre lo dice, que tan
dispersos, valga la redundancia, o que tan compactos son los valores que se manejan. Esto
significa que entre mayor sea el resultado obtenido mayor es tambin la dispersin de los
datos
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Rango
El Rango es el estadgrafo ms sencillo de obtener y de entender, lo que hace es medir la distancia que
existe entre el valor ms alto y el ms bajo de un conjunto de datos
Clculo del Rango
R =Max-Min
Considerando las grficas de temperatura, podemos observar que para Acapulco el rango de
temperatura es:
R =Max-Min = 32-28 = 4C
Mientras que para el desierto de Sonora el rango es:
R =Max-Min = 60-0 = 60C
Como se puede observar, el rango es mayor cuando los datos estn ms dispersos. Esta es la
idea central en la interpretacin de cualquiera de las medidas de dispersin que se calcule.
Existen muchos diferentes estadgrafos utilizados para medir la dispersin de los datos, pero en
este curso solo vamos a manejar el clculo de Rango, Varianza y Desviacin estndar.
Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos simples
La desviacin estndar es un ndice numrico de la dispersin de un conjunto de datos (o
poblacin). Mientras mayor es la desviacin estndar, mayor es la dispersin de la poblacin La
desviacin estndar nos dice cunto tienden a alejarse los puntajes del promedio. De hecho
especficamente la desviacin estndar es "el promedio de lejana de los puntajes respecto del
promedio".
Al igual que la desviacin estndar, la varianza es un ndice numrico de la dispersin de una
distribucin o poblacin. Mientras mayor es la varianza, mayor es la dispersin. La varianza es un
promedio elevado al cuadrado de las desviaciones individuales de cada observacin con respecto a
la media de una distribucin. Como promedio al cuadrado, la varianza en realidad slo es una
variacin de la desviacin estndar. Por lo tanto, se representa con el smbolo 2 , lo que
representa la desviacin estndar, pero elevada al cuadrado.
La desviacin estndar, y no la varianza, es la medida de dispersin de uso ms generalizado en
estadstica. No slo porque el valor de la desviacin estndar, para cualquier distribucin
determinada, siempre es mucho menor que para la varianza, sino por encima de todo porque es ms
conveniente para llevar a cabo operaciones matemticas.
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
La desviacin estndar es entre las medidas de dispersin lo que la media es entre las medidas
de tendencia central: ambas tienden a reinar en sus dominios. En conjunto, ambos indicadores
suelen proporcionar una buena descripcin de distribuciones de datos cuando estas distribuciones
son simtricas, como por ejemplo, las distribuciones normales.
Clculo de Rango, Varianza y Desviacin estndar para Listas de datos
Varianza =2
22
N
xs
Desviacin estndar =2
2
N
xs
Ejemplo:
x x2
20 400
20 400
18 324
18 324
15 225
15 225
15 225
15 225
13 169
x=149 x2=2517
N=9
= N
x = 149 / 9 =
16.56
En este ejemplo para obtener el Rango se resta
a 20 (Max) el nmero 13 (Min)
R = 20-13=7 R = 7
Clculo de la varianza y la desviacin estndar
22
2
N
xs
s2= 44.523.27467.27956.16
9
2517 2
s2
= 5.44
22
N
xs = 44.5 = 2.33
s = 2.33
Clculo de Rango, Varianza y Desviacin estndar para Distribuciones de Frecuencias
Varianza =2
22
f
N
xs
Desviacin estndar =2
2
f
N
xs
Cuantos hermanos tienes ?
f fx (fx)(x)
fx
2
6 5 30 180
5 9 45 225
4 12 48 192
3 15 45 135
2 12 24 24
1 9 9 9
0 4 0 0
Totales N=66 fx=201 fx2=765
= N
fx = 201/66 = 3.05
Rango = R = 6-0 = 6
22
2 f
N
xs = (765 / 66) 3.05 2 = 11.6 9.3 = 2.3
s2 = 2.3
22
f
N
xs = 3.2 = 1.51
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos agrupados
Clculo de Rango, Varianza y Desviacin estndar para Distribuciones de Frecuencias de datos
agrupados
Calificaciones I. C.
f PM
x fx
(fx)(x)
fx2
95 - 99 5 97 485 47045
90 - 94 9 92 828 76176
85 - 89 12 87 1044 90828
80 - 84 15 82 1230 100860
75 -79 12 77 924 71148
70 -74 9 72 648 46656
65 - 69 4 67 268 17956
60 - 64 3 62 186 11532
Totales N= 69 fx=5613 fx2
= 462201
= N
fx = 5613 / 69 = 81.35
Rango = R = LRSmax- LRImin=99.5 59.5 = 40 Tambin puede obtenerse as : Rango = R = LSmax- LImin=99 60+1 = 40
22
2 f
N
xs = (462201 / 69) 81.35 2 =
6698.6 6617.8= 80.7 s2 = 80.7
22
f
N
xs = 7.80 = 8.99
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Curva Normal y Desviacin estndar
Como dijimos anteriormente, una calificacin carece de significado por s misma. A fin de que lo
adquieran, es necesario compararlas con la distribucin de calificaciones de algn grupo de
referencia. Ciertamente, las calificaciones obtenidas a partir de cualquier escala, llegan a tener
mayor significado cuando se las compara con un grupo de referencia de personas u objetos.
As, si nos dijeran que un escalador poblano a la edad de 8 aos escal sin ayuda de un adulto el
volcn Cuexcomate, quedaramos sorprendidos o no, segn sean nuestros conocimientos acerca del
volcn Cuexcomate. Todos tenemos la idea de cmo es un volcn, tal vez ya hayan visitado alguno y
a sabiendas de que la mayora de los volcanes tienen alturas superiores a 1000 metros, que tan
extraordinario puede considerarse el logro de nuestro annimo escalador poblano, cuando nos
enteremos que el volcn Cuexcomate ubicado en la ciudad de Puebla es considerado el ms
pequeo del mundo ya que su altura es de13 m
En esta unidad veremos que la transformacin a valores z proporciona un medio preciso para
interpretar cualquier valor de una variable cuando se trata de valores normalmente distribuidos.
La desviacin estndar es un indicador en extremo valioso con muchas aplicaciones. Por
ejemplo, los estadsticos saben que cuando un conjunto de datos se distribuye de manera normal,
el 68% de las observaciones de la distribucin tiene un valor que se encuentra a menos de una
desviacin estndar de la media. Tambin saben que el 96% de todas las observaciones tiene un
valor no es mayor a la media ms o menos dos desviaciones estndar (la Figura siguiente ilustra esta
informacin).
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
Entre las distribuciones continuas la ms importante es la llamada distribucin normal.
Fue introducida por Carl Friedrich Gauss a principios del siglo XIX en su estudio de los errores de
medida. Desde entonces se ha utilizado como modelo en multitud de variables (peso, altura,
calificaciones...), en cuya distribucin los valores ms usuales se agrupan en torno a uno central y los
valores extremos son escasos.
Interpretacin de la calificacin obtenida en un examen de estadstica
Imagine que en el examen de estadstica usted obtuvo una calificacin de 97. Tal vez quiera
presumir a alguien lo brillante que usted es. Pero resulta
que se alguien dice:, Seguramente tu profesor es barco y
cualquiera saca buen promedio.
Para mostrar su superioridad con respecto al grupo,
pudiera desear hacerle saber a esa amiga el porcentaje de compaeros
con calificaciones inferiores.
A continuacin se indica, paso a paso, el procedimiento requerido para eliminar toda dificultad
acerca de la interpretacin de las calificaciones de estadstica.
-
Aplicando la estadstica en las ciencias sociales Competencia 1 Unidad2
1. Determnese la media y la desviacin estndar correspondiente a la prueba.
Calificaciones I. C.
f PM
x fx
(fx)(x)
fx2
95 - 99 5 97 485 47045
90 - 94 9 92 828 76176
85 - 89 12 87 1044 90828
80 - 84 15 82 1230 100860
75 -79 12 77 924 71148
70 -74 9 72 648 46656
65 - 69 4 67 268 17956
60 - 64 3 62 186 11532
Totales N= 69 fx=5613 fx2
= 462201
= N
fx = 5613 / 69 = 81.35
Rango = R = 99 - 60 = 39
22
2 f
N
xs = (462201 / 69) 81.35 2 =
6698.6 6617.8= 80.7 s2 = 80.7
22
f
N
xs = 7.80 = 8.99
2. Transfrmese la calificacin que se desea interpretar en un dato z, usando la siguiente
frmula: MUESTRA
POBLACIN
stddesviacin
mediancalificaciz
_
s
xxz
xz
Si interesa interpretar una calificacin de 97, y se sabe que la media y la desviacin estndar
son 81 y 9, respectivamente, se obtendr que
7819
8197.
z
3. Bsquese en la columna C de la tabla de la calificacin z, el valor correspondiente a 1.78 y se
encontrar el nmero .0375. Esto significa que solamente el 3.75 % de las personas en el grupo de
comparacin tendrn calificaciones superiores que 97. La columna B indica la probabilidad de
encontrarnos calificaciones entre la media (81) y 97 o sea 42.25%.
El mtodo resulta fcil.
9990817263 99908172631.78 SD
3.75%
-
Aplicando la estadstica en las ciencias sociales Competencia 2
45
Competencia No 2
Al finalizar esta unidad de aprendizaje el estudiante debe ser capaz de Estimar
parmetros poblacionales de las variables analizadas en el reporte de Anlisis Descriptivo
del caso prctico (real o hipottico) presentado en el aula, para que las conclusiones
emanadas o acciones a seguir sean el producto de procesos de induccin vlidos, basados
en adecuadas interpretaciones de los resultados
Contenidos
2.1 Introduccin a la estadstica inferencial
2.1.1 Por qu usar muestras
2.1.2 Mtodos de muestreo
2.1.2.1 Muestreo aleatorio
2.1.2.2 Muestreo no aleatorio
2.1.3 Error de muestreo
2.2 Estimacin de parmetros poblacionales
2.2.1 Concepto de Distribucin muestral de Medias
2.2.2 Error estndar de la media
2.2.3 Intervalos de confianza
2.2.4 Estimacin de proporciones
Las Actividades de aprendizaje que deben ser cubiertas por el alumno son:
Presentaciones por parte del profesor en el aula
Resolucin de problemas de forma individual y por equipo
Realizar bsquedas en Internet para localizar algunos reportes en lnea de
investigaciones sociales que utilizaron Muestreo aleatorio y no aleatorio
Consulta y anlisis de libros y publicaciones
Uso del paquete SPSS como apoyo tecnolgico
-
Aplicando la estadstica en las ciencias sociales Competencia 2
46
Por qu se toman las muestras?
Hasta ahora, todos los procedimientos y tcnicas que hemos
estudiado se refieren a la rama de la estadstica descriptiva, la cual nos ha
permitido tener un conocimiento claro de las caractersticas bsicas de una
poblacin y as estar en capacidad de presentar un informe cmodo, til y
comprensible.
Debido a que generalmente no es posible estudiar las poblaciones
completamente, ya sea porque sta es muy grande, por causas econmicas, falta de
personal, o para una mayor rapidez en el acopio y presentacin de los datos, lo que se
suele hacer es obtener los datos, de tan slo una muestra de la poblacin.
No podemos estudiar todos los coches que salen de una cadena de produccin para
determinar su calidad, ni es posible probar un medicamento en todas las personas, ni
podemos costearnos preguntar a todos los mexicanos sobre una cuestin cualquiera (salvo
en votaciones, o en el censo, siendo estos los pocos casos en que un estudio comprende a
toda la poblacin).
Como repercusin, deberemos resignarnos a utilizar muestras, que sean capaces de
revelarnos algo acerca de la poblacin de las que han sido extradas. En esta unidad
hablaremos de la forma de elegirlas, y las condiciones que han de verificar.
Idea bsica (descripcin cualitativa)
Si conocemos una fraccin de algo podremos conocer con determinada
exactitud ese algo?
La respuesta es: No.
o Una parte de algo es una fraccin que ha sido tomada de acuerdo con una cierta
regla o criterio, que no siendo un criterio cientfico no necesariamente representa la
totalidad de ese algo.
o La nica forma de evitar que al seleccionar una parte de algo se caiga en una
eleccin no representativa, es hacindolo de forma cientfica. Siendo el algo
desconocido, esta eleccin debe hacerse de manera aleatoria. Una muestra es
una parte de algo, tomada aleatoriamente, con lo que se garantiza que es
representativa de ese algo. Esto no slo se acepta en la ciencia, sino que provee
de una teora que permite cuantificar la representatividad.
Tomemos como ejemplo una imagen, la cual slo se deja ver a travs un rea
pequea (la cantidad de rea descubierta es la misma en las dos primeras imgenes)
-
Aplicando la estadstica en las ciencias sociales Competencia 2
47
Si la lgica que utilizaras para descubrir el tema de la
imagen es la de observar el centro de la misma, podras
observar que parece ser un ave, pero igual puede ser un gallo,
un guila o un pajarito de los que vemos todos los das en las
calles por donde pasamos. Esta es una seleccin no aleatoria
(una parte) de la poblacin a observar.
En esta segunda imagen
el rea descubierta es al azar (a
la suerte) y podrs notar que la seleccin nos brinda una
idea bastante ms clara de la imagen a observar
En ambos casos conforme crece el rea visible la
informacin nos va dando una mejor idea de la imagen
completa, pero slo en el segundo caso la imagen es
representativa al haberse elegido reas en forma aleatoria.
Este ejemplo es en extremo simple y enfatiza la
diferencia entre una parte y una muestra, con la intencin
deliberada de dar una mejor idea de lo que tratamos de explicar.
Afirmacin
De las observaciones anteriores podemos afirmar lo
siguiente: "Una parte de algo no significa que sea una
muestra que represente vlidamente a ese algo"
La Estadstica inferencial se ocupa de de hacer
deducciones acerca de la poblacin de estudio basndose en la informacin obtenida de la
(o las) muestra(s) tomada(s) de ella, as como de la toma de decisiones.
Por ejemplo, cuando se pretende conocer de antemano los resultados de unas
elecciones, se suelen hacer encuestas sobre in