estadistica aplicada a las ciencias sociales-12!10!2013

Upload: edgar-garcia

Post on 04-Mar-2016

23 views

Category:

Documents


1 download

DESCRIPTION

trabajador social

TRANSCRIPT

  • estadistica aplicada a las ciencias sociales

    por marubas23amas | buenastareas.com

    CAPITULO I

    1. INTRODUCIN.

    Matemticas Bsicas.

    Por qu estudiar estadstica?

    2. ESTADSTICA.

    La estadstica y su empleo.

    Qu es la estadstica?

    Estadstica descriptiva.

    Estadstica inferencial.

    3. POBLACIN Y MUESTRA.

    La poblacin y su clasificacin.

    La muestra.

    Ejercicios prcticos tema 3

    4. MUESTREO.

    El muestreo aleatorio.

    El muestreo sistemtico.

    El muestreo estratificado.

    El muestreo por conglomerados.

    5. VARIABLES.

    Variable.

    Variable aleatoria.

    Variable continua.

  • Variable discreta.

    Variable Cuantitativa.

    Variable Cualitativa.

    1. INTRODUCCIN.

    Por qu estudiar estadstica?

    La estadstica es la ciencia que trata sobre la obtencin de informacin a partir de datos

    numricos. Estudiamos estadstica porque la utilizacin de datos se ha convertido en algo

    cada vez ms comn en un nmero creciente de profesiones, en poltica y en la vida

    cotidiana.

    Para la gente comn y corriente la estadstica significa nmeros. En el peridico de la

    maana se pueden encontrar las estadsticas ms recientes sobre los delitos de la ciudad,

    nmero de asesinatos, de robos de automviles, de asaltos y dems delitos que hayan

    sido denunciados en determinado periodo de tiempo. Aunque estos ejemplos forman

    parte del concepto total estadstica, la palabra tiene un sentido ms amplio para aquellas

    personas cuyo trabajo requiere un conocimiento (si bien a veces mnimo) de los aspectos

    ms tcnicos de la estadstica. Para estas personas, la palabra estadstica tiene una

    relacin con aquellos conceptos y tcnicas que se emplean en la

    recopilacin,organizacin, resumen, anlisis, interpretacin y comunicacin de la

    informacin numrica. Naturalmente, dichos conceptos y tcnicas juegan un papel

    importante en las actividades que cumplen los profesionales de ciertas ciencias.

    La mayora de los lectores del presente texto no van a ser expertos en estadstica, cabe

    preguntar entonces para qu hay que estudiarla. La razn estriba, en pocas palabras, en

    que los conceptos y las tcnicas de la estadstica se utilizan actualmente en un gran

    nmero de ocupaciones. Las ideas estadsticas constituyen una parte integral de las

    actividades investigativas, de las encuestas para recopilar datos y del anlisis de los datos

    que se originan en las instituciones y en las organizaciones.

    Es posible que un trabajador no necesite conocer de la estadstica sino aquello que lo

    faculte para saber cundo se requieren los servicios de un experto y para poder

    comunicarse eficazmente con l cuando trabajen juntos en la planeacin, direccin e

  • interpretacin de los resultados de una actividad que requiere la metodologa de esta

    ciencia.

    La persona que comprenda los conceptos estadsticos y su metodologa sacar mejor

    provecho de ellos. Esta persona estar ms preparada para evaluar los resultados de una

    investigacin y dems informaciones que se obtengan. El profesional que entienda de

    estadstica podr leer con mayor inteligencia la lectura que, sobre su campo de accin, va

    da a da apareciendo.

    Finalmente vamos a descubrir que los conocimientos de la estadstica son de gran ayuda

    para las dems asignaturas. Muchos textos correspondientes a otras asignaturas se

    hanescrito sobre la base de que el estudiante tiene por lo menos un conocimiento

    elemental de las ideas y tcnicas de la estadstica y, adems, muchos cursos superiores

    tienen esta materia como requisito previo.

    Algunas reas de aplicacin de la metodologa estadstica son la agricultura, biologa,

    negocios, salud, medicina, industria, sociologa y psicologa, ya que la mayora de los

    psiclogos se valen de los conceptos y tcnicas de la estadstica para medir y comparar la

    conducta, las actitudes, la inteligencia y las aptitudes del hombre.

    2. ESTADSTICA.

    La estadstica y su empleo?

    La estadstica es una de las herramientas ms ampliamente utilizadas en la investigacin

    cientfica. Se emplea en las instituciones gubernamentales y educativas, en los negocios

    en la industria y en otras organizaciones. El empleo juicioso de las tcnicas estadsticas

    permite obtener conclusiones tiles a partir de un conjunto de datos numricos.

    Sin embargo el trmino estadstica tiene distintos significados para diferentes personas.

    Para algunos no es ms que informacin numrica, para otros es un mtodo para

    obtener, presentar y describir grandes cantidades de datos y para otros es un mtodo

    para tomar decisiones en situaciones de incertidumbre. Los objetivos principales de este

    captulo son aclarar los significados de estadstica, definir sus conceptos bsicos

    utilizados con mayor frecuencia.

    Nos enfocaremos en la divisin de la estadstica en dos reas principales, la estadstica

  • descriptiva la cual incluye la obtencin, presentacin y descripcin de datos numricos y

    la estadstica inferencialque se ocupa de las tcnicas para tomar decisiones con base en

    el anlisis de los datos obtenidos.

    Qu es la estadstica?

    La mayor parte de las palabras tienen varios significados; la palabra estadstica no es

    una excepcin. En el lenguaje comn, la palabra se emplea para detonar un conjunto de

    calificaciones o nmeros. Por ejemplo el cronista deportivo puede decir, estas son las

    estadsticas para la primera mitad. Una persona cualquiera puede preguntar has v isto

    las ltimas estadsticas acerca del desempleo?. En los diarios o peridicos locales se

    presentan nacimientos y muertes como estadsticas vitales.

    El trmino estadstica tambin se emplea para designar un rea de estudio: una disciplina.

    Es la ciencia que se encarga del estudio de los mtodos y procedimientos para recolectar,

    clasificar, resumir, presentar, analizar e interpretar informacin. La aplicacin de la

    estadstica se da en varios niveles de complejidad, desde los que requieren tcnicas muy

    elevadas hasta los que solo necesitan, por ejemplo, la organizacin de un conjunto de

    datos en tablas, la construccin de algunas grficas y el clculo de ciertos promedios.

    Como se menciono anteriormente la estadstica comnmente se clasifica en dos ramas o

    procedimientos:

    Estadstica descriptiva.

    La estadstica descriptiva se refiere a aquella parte del estudio que incluye la obtencin,

    organizacin, presentacin y descripcin de informacin numrica.

    Comprende aquellos mtodos usados para recolectar, organizar y describir la informacin

    recabada, nos ayuda a describir el mundo en torno nuestro.

    Despusde obtener datos, estos deben transformarse en formas ms tiles y

    significativas:

    En forma tabular.

    En forma de grficas.

    En forma aritmtica.

    La parte de la estadstica que da los procedimientos para transformar los datos se llama

    estadstica descriptiva.

  • Ejemplo: Un gerente de personal desea conocer las aptitudes de cinco oficinistas que

    trabajan en una compaa. Se aplica una prueba de aptitudes a los cinco empleados y las

    calificaciones son 82, 85, 95, 92 y 91. La medida estadstica que emplea el gerente de

    personal es la aptitud promedio o media aritmtica, la cul es la suma de los valores

    obtenidos dividida entre el nmero de observaciones.

    82 + 85 + 95 + 92 + 91 = 445 = 89

    5 5

    El resultado se limita a los datos obtenidos en este caso particular y no aplica ninguna

    inferencia o generalizacin acerca de las aptitudes de otros oficinistas. Este mtodo es de

    naturaleza descriptiva, debido a que el promedio condensa y describe la informacin

    obtenida.

    Adems los datos pueden representarse en numerosas formas visuales. Una de ellas

    utilizadas con mayor frecuencia es la grfica de barras.

    Estadstica Inferencial.

    Parte de la estadstica que se refiere a la formulacin de inferencias o deducciones de los

    valores resultantes, obtener conclusiones para la toma de decisiones sobre poblaciones a

    partir de una muestra.

    La estadstica inferencial es la parte de los mtodos estadsticos que ayudan a conocer

    algn aspecto de la poblacin mediante el conocimiento de ciertos aspectos de la

    muestra.

    La inferencia estadstica es unatcnica mediante la cual se obtiene generalizaciones o se

    toman decisiones en base a una informacin parcial o incompleta obtenida mediante

    tcnicas descriptivas. A continuacin se presenta un caso tpico que se resuelven

    mediante estadstica inferencial, donde la decisin o eleccin se da en base a informacin

    numrica.

    Ejemplo: Un fabricante de medicinas afirma que una nueva vacuna contra el catarro

    desarrollado por su compaa tiene una efectividad del 90%; esto es, en promedio 90 de

    cada 100 personas que emplean la vacuna pasarn el invierno sin contagiarse de catarro.

    Resulta prcticamente imposible probar la vacuna en todas las personas, as que

    consideraremos que 30 personas han recibido la vacuna, y que de las 30, 25 no se

  • contagiaron de catarro. Si la afirmacin del fabricante es correcta, se esperara que 27

    personas (30 x .90 = 27) pasarn el invierno sin catarro. Ya que el nmero observado es

    25, lo cual es inferior al nmero esperado 27, Debera rechazarse la afirmacin del

    fabricante en base a la evidencia?

    Tanto la estadstica descriptiva e inferencia son dos reas que conforman a la disciplina

    de la estadstica moderna. De las dos la segunda se ha vuelto cada vez ms importante.

    Sin embargo, son esenciales tanto en la investigacin como en la toma de de decisiones.

    3. POBLACIN Y MUESTRA.

    La poblacin y su clasificacin.

    La poblacin es uno de los conceptos bsicos que existe en la estadstica, llamamos

    poblacin a la totalidad de todas las posibles observaciones y mediciones bajo

    consideracin es una situacin dada un problema.

    Es un conjunto de individuos uobjetos acerca del cual se quiere saber algo o tambin, es

    el total de la informacin, o de los objetos con una caracterstica en comn de inters para

    un estadstico o una investigacin particular.

    Cada situacin diferente implica una poblacin diferente. Si el problema consiste en

    evaluar el coeficiente intelectual promedio de todos los nios de las primarias del Estado

    de Michoacn, entonces los C.I. de todos los nios constituyen la poblacin. Si la finalidad

    de una investigacin es determinar qu proporcin de todas las unidades producidas en

    cierto proceso de manufactura es defectuosa, entonces la poblacin consiste en las

    mediciones de calidad de todas las unidades producidas mediante ese proceso.

    A la poblacin generalmente se le clasifica en dos categoras finitas e infinitas. Una

    poblacin finita es aquella que incluye un nmero limitado de medidas y observaciones.

    Por ejemplo son poblaciones finitas el conjunto de las alturas de todos los estudiantes que

    actualmente estn presentes en el aula, o el conjunto de calificaciones del presente ciclo

    escolar en la Licenciatura en Psicologa Educativa. Se dice que una poblacin es infinita si

    incluye un gran conjunto de medidas u observaciones que no pueden alcanzarse por

    conteo, por ejemplo la poblacin formada por los nacimientos de personas del presente y

    futuro, o el conjunto de estrellas que forman el universo.

    Muestra.

  • Una muestra es un conjunto de medidas u observaciones tomadas a partir de una

    poblacin dada, es un subconjunto de una poblacin. Desde luego, el nmero de

    observaciones en una muestra es menor que el nmero posiblede observaciones en la

    poblacin; de otra forma, la muestra sera la poblacin misma. Las muestras se toman

    debido a que no es factible desde el punto de vista econmico, aunque en algunos casos

    sea probable (como sucede con los censos nacionales) recolectar todas las posibles

    observaciones en la poblacin. Por ejemplo se desea conocer la opinin que los alumnos

    de una universidad tienen sobre los alimentos de la cafetera, por lo que se decide aplicar

    encuestas. Podra resultar muy difcil aplicar la encuesta a cada uno de los alumnos que

    conforman esa universidad suponiendo que la matricula sea de 20,000 alumnos, por lo

    que sera recomendable tomar una muestra de esa poblacin para aplicar dichas

    encuestas.

    4. MUESTREO.

    Muestreo aleatorio simple.

    Muestreo es el proceso de tomar una o varias muestras de una poblacin. Existen al

    menos cuatros diseas de muestra comnmente utilizados, uno de ellos es el muestreo

    aleatorio simple.

    La muestra se elige de forma tal que todas las muestras del mismo tamao tengan la

    misma probabilidad de ser elegidas.

    El muestreo aleatorio simple se usa cuando las unidades son homogneas con respecto a

    la caracterstica poblacional en estudio.

    Existen varias tcnicas comnmente utilizadas para llevar a cabo este muestreo, como lo

    son la tabla de nmeros aleatorios, la tcnica de la urna, otra tcnica es someter nmeros

    a una rifa, incluso las calculadoras cientficas tienen la opcin de darnos nmeros

    aleatorios.

    Muestreo sistemtico.

    Con este procedimiento, se selecciona una muestra tomada cada k-sima unidad de la

    poblacin una vez que las unidadesde muestreo estn numeradas o arregladas de alguna

    forma. La letra k es la razn del muestreo, esto es, la razn del tamao de la poblacin al

    tamao de la muestra. Entonces si se va a seleccionar una muestra de 40 unidades a

    partir de una poblacin de 1000 unidades, entonces k= 1000/40 =25, y la muestra se

    obtiene tomando cada 25-sima unidad de la poblacin.

    Puede utilizarse el procedimiento de la urna para determinar con cul de las primeras 25

  • unidades empezar. Si se selecciona la 10-sima como inicial aleatorio, entonces la

    muestra incluir las unidades 10, 35, 60,...., 960-simas. Entonces, aquellas unidades

    cercanas nunca estarn representadas ni de ms ni de menos en la muestra.

    Muestreo Estratificado.

    Este es otro diseo de muestreo frecuentemente utilizado. Este procedimiento implica

    dividir a la poblacin en clases o grupos denominados estratos. Se supone que las

    unidades incluidas en cada estrato son relativamente homogneas con respecto a las

    caractersticas que vayan a estudiarse. Se toma una submuestra a partir de cada estrato

    mediante un procedimiento aleatorio simple. Entonces para obtener la muestra general se

    combinan las submuestras correspondientes a todos los estratos.

    El muestreo estratificado se emplea con ms frecuencia en el manejo de poblaciones

    heterogneas tales como los datos acerca del ingreso familiar en una sola rea

    metropolitana. Mediante estratificacin, se forman estratos de manera que las unidades

    dentro de cada uno sean casi homogneas y los estratos sean diferentes unos a otros. A

    menudo se toma una razn de muestreo igual para todos los estratos.Esto es, las

    unidades en la muestra se asignan entre los estratos en proporcin al nmero relativo de

    unidades en cada estrato de la poblacin. A una muestra seleccionada de esta forma se

    le denomina muestra estratificada proporcional.

    Algunas veces la razn de muestreo en cada estrato ser inversamente relacionada con

    la homogeneidad de las unidades en el estrato; mientras ms homogneo sea el estrato,

    menor ser su proporcin incluida en la muestra. A una muestra obtenida de esta forma

    se le denomina muestra estratificada desproporcionada. La razn de este proceder, es

    que cuando las unidades de un estrato son ms homogneas, resulta necesaria una

    submuestras pequea para asegurar la representatividad. En consecuencia, el costo del

    muestreo se reduce.

    Muestreo por conglomerados.

    En primer lugar, este procedimiento implica la seleccin aleatoria de grupos o

    conglomerados, a partir de la poblacin; la muestra general est formada por todas o por

    una submuestra de las unidades en cada conglomerado. El muestreo por conglomerados

    es diferente del muestreo estratificado en que las diferencias entre los conglomerados son

    generalmente pequeas y las unidades dentro de cada uno en general son ms

    heterogneas. Cada conglomerado debera ser una miniatura de la poblacin. Aun

    cuando un solo conglomerado podra ser una muestra satisfactoria, ste rara vez es el

    caso.

  • Generalmente los conglomerados se les conocen como unidades primarias de muestreo.

    Si todas las unidades de los conglomerados elegidos se incluyen en la muestra general, al

    procedimiento se le denomina muestreo de una sola etapa(unietpico). Si se toma

    aleatoriamente una submuestra a partir de cada conglomerado seleccionado y todas las

    unidades de la submuestra se incluyen en la muestra general, al procedimiento se le

    denomina muestreo bietpico (dos etapas)

    Sin un proceso de muestreo implica tres o ms etapas, se le denomina muestreo

    polietpico (varias etapas). Por ejemplo, en una investigacin acerca de los profesores en

    las universidades estatales de Mxico, se seleccion aleatoriamente cierto nmero de

    universidades estatales como conglomerados en la primera etapa. Si en la muestra se

    incluyen todos los profesores de las universidades seleccionadas, se trata de un muestreo

    de una sola etapa. Si dentro de cada una de las universidades elegidas se selecciona

    aleatoriamente cierto nmero de departamentos o licenciaturas, y la muestra incluye a

    todos los profesores de los departamentos o licenciaturas elegidas se trata de un muestre

    bietpico. La tercera etapa podra implicar la seleccin de una muestra de profesores de

    cada departamento o licenciatura; entonces, la muestra incluira a todos los profesores

    muestreados en los departamentos seleccionados de los conglomerados elegidos. A

    menudo se prefiere el muestreo por conglomerados debido a su costo relativamente bajo.

    VARIABLES.

    Variable.

    Es el conjunto de caractersticas de las entidades que interesan en una investigacin

    cientfica. El bilogo puede tener un inters especial es el tamao del foramen magno de

    las ardillas. El mdico puede querer investigar el nivel de colesterol de ciertos pacientes.

    Al educador le puede llamar la atencin el rendimiento en la lecturade los estudiantes que

    han aprendido a leer con un mtodo determinado. El investigador agrcola puede estar

    interesado en conocer la resistencia de una variedad de trigo a cierta enfermedad. Al

    meteorlogo le puede llamar la atencin la nieve como una proporcin de la precipitacin

    total. En virtud de que cualquiera de estas caractersticas, por regla general, presenta un

    valor diferente cuando se observa en diferentes entidades, ella recibe el nombre de

    variable. Adems de las variables ya mencionadas, inmediatamente vienen a la mente

    otras, tales como la estatura de los hombres, la vida de las llantas de un automvil, el

    color de la piel de los perros y el nmero de zurdos en una escuela.

    Variable aleatoria.

  • Si los valores numricos que provienen de una variable provienen de factores fortuitos y si

    un determinado valor no se puede predecir exactamente con anticipacin, esa variable se

    denomina variable aleatoria.

    Para representar las variables aleatorias utilizaremos letras maysculas como X, Y y Z.

    De esta manera podremos referirnos a la variable aleatoria edad como X o a la variable

    aleatoria estatura como Y. Los valores individuales de una variable aleatoria se

    representarn con letras minsculas tales como x, y, y z. Si por ejemplo, la variable

    aleatoria X tiene 6 valores, nos referimos a esos valores como x1, x2, x3, x4, x5, x6. Los

    subndices servirn para distinguir un valor de la variable aleatoria de otro.

    Variable continua.

    Una variable continua es aquella que tericamente puede tomar cualquier valor dentro de

    un intervalo de valores. Es decir, una variable continua semide uniformemente. Otra

    manera de explicar lo que es una variable continua consiste en decir que, sin importar que

    tan cerca puedan estar dos valores de una variable, es posible tericamente hallar otra

    variable cuyo valor se pueda colocar entre ellos. Un ejemplo de variables continua es la

    estatura humana. Sin tener en cuenta que tan prxima sea la estatura de dos personas,

    es posible tericamente encontrar otra persona que sea ms alta que la ms baja y a la

    vez ms baja que la ms alta de las dos.

    Nuestra posibilidad de identificar a tal persona en la prctica puede dificultarse por las

    limitaciones de los instrumentos de medida disponibles. Otras variables continuas pueden

    ser aquellas que se miden con una escala de peso o de temperatura.

    Variable discreta.

    Cuando los valores que puede tomar una variable estn separados entre s por una

    determinada cantidad, la variable se denomina discreta. Una caracterstica de la variable

    discreta es la presencia de vacios o interrupciones entre los valores que se pueden

    tomar. Como ejemplos de la variable discreta puede citarse, el nmero de admisiones en

    un hospital durante un da determinado, el nmero de accidentes automovilsticos que se

    producen dentro de los lmites de una ciudad durante un mes, el nmero de colonias de

    bacterias en una placa de agar y el nmero de estudiantes de primer ao en un sistema

    escolar determinado.

    Variable cuantitativa.

    Se dice que una variable, es una variable cuantitativa siempre que los valores que puede

    asumir sean los resultados de medidas numricas. Ejemplos de variable cuantitativa son

  • la estatura, elpeso, la temperatura, el coeficiente intelectual, la presin sangunea, el

    nmero de estudiantes de primer ao y el nmero de accidentes que se producen en

    alguna regin geogrfica en un perodo de tiempo dado.

    Variable cualitativa.

    Hay muchos casos en que no es posible hacer medidas numricas. Muchas variables son

    susceptibles nicamente de clasificacin. Por ejemplo la variable estado civil puede

    recibir valores cualitativos de soltero, casado, divorciado, viudo etc. Si las entidades de

    inters son estudiantes universitarios y si la variable de inters es curso la variable

    puede asumir los valores cualitativos de primero, segundo, tercero, etc. Una variable

    cuyos valores consisten en categoras de clasificacin se denomina variable cuantitativa.

    Como la determinacin del valor de una variable cuantitativa se lleva a cabo por medio de

    algn procedimiento de medicin, el resultado se denomina medida. Un grupo de tales

    medidas recibe el nombre de datos de medida. Cuando las entidades se clasifican

    teniendo en cuenta una variable cuantitativa, generalmente es necesario contar el nmero

    de entidades que se pueden clasificar en cada una de las categoras. La informacin de

    este tipo se denomina datos de conteo. Frecuentemente se utiliza la palabra observacin

    para hacer referencia a un dato o medida de conteo.

    CAPITULO II

    6. NIVELES DE MEDICIN.

    Nominal

    Ordinal

    De intervalo

    De razn.

    7. MEDIDAS DE TENDENCIA CENTRAL.

    Media aritmtica.

    Mediana.

    Moda.

    Ejercicios prcticos del tema 7

    8. MEDIDAS DE DISPERCIN

  • Desviacin tpica.

    Datos agrupados.

    La varianza.Ejercicios prcticos tema 8

    9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.

    Distribucin de frecuencias.

    Representacin grfica.

    Ejercicios prcticos tema 9

    6. NIVELES DE MEDICIN.

    La medicin puede definirse como la asignacin de nmeros a objetos y eventos de

    acuerdo con ciertas reglas; la manera como se asignan esos nmeros determina el tipo

    de escala de medicin (Stevens, 1946; Cohen y Cohen, 1975;Saris y Stronkhorst, 1984).

    Esto conduce a la existencia de diferentes tipos de escalas, por lo que el problema se

    transforma en explicitar a)las reglas para asignar nmeros, b)las propiedades

    matemticas de las escalas resultantes, y c)las operaciones estadsticas aplicables a las

    medidas hechas con cada tipo de escala.

    Las propiedades del sistema numrico asociadas con las escalas de medicin son la

    identidad, magnitud, igual intervalo y cero absoluto (Stevens, 1957): 1-Identidad: cada

    nmero tiene un significado particular. 2-Magnitud: los nmeros tienen un orden inherente

    ascendente o descendente. 3-Intervalos iguales: las diferencias entre nmeros en

    cualquier punto de la escala son las mismas (la diferencia entre 10 y 20 es la misma que

    entre 100 y 110). 4-Cero absoluto: el punto cero en la escala de medicin representa la

    ausencia de la propiedad que se estudia.

    A continuacin se presenta un resumen de las caractersticas, propiedades y aplicaciones

    de cada una de las escalas mencionadas (Stevens, 1957; Cohen y Cohen, 1975; Saris,

    1984)

    Escala nominal. En esta escala las unidades observacionales (UO) se agrupan en clases

    excluyentes segn determinada propiedad, con lo que sedefine una particin sobre el

    conjunto de tales unidades. Los nmeros se usan como identificadores o nombres.

    Cuando se estudia el desempleo de un pas y se incluye la variable sexo, se codifica

    masculino como 1 y femenino como 2, por ejemplo; los nmeros 1 y 2 representan

    categoras de datos: son simples identificadores y son completamente arbitrarios. La

    operacin matemtica permitida es el conteo.

    Escala ordinal: Surge a partir de la operacin de ordenamiento; en esta escala se habla

    de primero, segundo, tercero. No se sabe si quien obtiene el primer puesto est cerca o

  • lejos del segundo puesto. Los valores de la escala representan categoras o grupos de

    pertenencia, con cierto orden asociado, pero no una cantidad mensurable. La escala

    ordinal tiene las propiedades de identidad y magnitud. Los nmeros representan una

    cualidad que se est midiendo, y expresan si una observacin tiene ms de la cualidad

    medida que otra UO. La distancia entre puntos de la escala no es constante: no se puede

    determinar la distancia entre las categoras, slo es interpretable el orden entre sus

    valores. Ejemplos: situacin socioeconmica, nivel educativo.

    Escala de intervalos. Esta escala representa magnitudes, con la propiedad de igualdad de

    la distancia entre puntos de escala de la misma amplitud. Aqu puede establecerse orden

    entre sus valores, hacerse comparaciones de igualdad, y medir la distancia existente

    entre cada valor de la escala. El valor cero de la escala no es absoluto, sino un cero

    arbitrario: no refleja ausencia de la magnitud medida, por lo que las operaciones

    aritmticas de multiplicacin y divisinno son apropiadas. Cumple con las propiedades de

    identidad, magnitud e igual distancia. La igual distancia entre puntos de la escala significa

    que puede saberse cuntas unidades de ms tiene una UO comparada con otra, con

    relacin a cierta caracterstica analizada.

    Escala de razn. Corresponde al nivel de medicin ms completo. Tiene las mismas

    propiedades que la escala intervalos, y adems posee el cero absoluto. Aqu el valor cero

    no es arbitrario, pues representa la ausencia total de la magnitud que se est midiendo.

    Con esta escala se puede realizar cualquier operacin lgica (ordenamiento,

    comparacin) y aritmtica. A iguales diferencias entre los nmeros asignados

    corresponden iguales diferencias en el grado de atributo presente en el objeto de estudio.

    Ejemplos: longitud, peso, distancia, ingresos, precios.

    A manera de conclusin es importante tener siempre presente la escala de medicin que

    se est usando, pues no todos los procedimientos estadsticos son apropiados para

    cualquier anlisis. En general, las variables estadsticas se clasifican en variables

    continuas o cuantitativas y variables discretas o cualitativas, segn el nivel de escala en

    que estn medidas. Las variables continuas se refieren a magnitudes medidas en escala

    de intervalos o de razn, mientras que las variables discretas comprenden magnitudes

    medidas en escalas de nivel nominal y ordinal.

    7. MEDIDAS DE TENDENCIA CENTRAL.

    Supngase que un determinado alumno obtiene 35 puntos en una prueba de matemtica.

    Este puntaje, por s mismo tiene muy poco significado a menos que podamos conocer el

  • total de puntos queobtiene una persona promedio al participar en esa prueba, saber cul

    es la calificacin menor y mayor que se obtiene, y cun variadas son esas calificaciones.

    En otras palabras, para que una calificacin tenga significado hay que contar con

    elementos de referencia generalmente relacionados con ciertos criterios estadsticos.

    Las medidas de tendencia central (media, mediana y moda) sirven como puntos de

    referencia para interpretar las calificaciones que se obtienen en una prueba.

    Volviendo a nuestro ejemplo, digamos que la calificacin promedio en la prueba que hizo

    el alumno fue de 20 puntos. Con este dato podemos decir que la calificacin del alumno

    se ubica notablemente sobre el promedio. Pero si la calificacin promedio fue de 65

    puntos, entonces la conclusin sera muy diferente, debido a que se ubicara muy por

    debajo del promedio de la clase.

    En resumen, el propsito de las medidas de tendencia central es:

    Mostrar en qu lugar se ubica la persona promedio o tpica del grupo.

    Sirve como un mtodo para comparar o interpretar cualquier puntaje en relacin con el

    puntaje central o tpico.

    Sirve como un mtodo para comparar el puntaje obtenido por una misma persona en dos

    diferentes ocasiones.

    Sirve como un mtodo para comparar los resultados medios obtenidos por dos o ms

    grupos.

    La media aritmtica: comnmente conocida como media o promedio. Se representa por

    medio de una letra M o por una X con una lnea en la parte superior.

    La mediana: la cual es el puntaje que se ubica en el centro de una distribucin. Se

    representa como Md.

    La moda: que es el puntaje que se presenta con mayorfrecuencia en una distribucin. Se

    representa Mo.

    De estas tres medidas de tendencia central, la media es reconocida como la mejor y ms

    til. Sin embargo, cuando en una distribucin se presentan casos cuyos puntajes son muy

    bajos o muy altos respecto al resto del grupo, es recomendable utilizar la mediana o la

    moda. (Porque dadas las caractersticas de la media, esta es afectada por los valores

    extremos).

    La media es considerada como la mejor medida de tendencia central, por las siguientes

    razones:

    Los puntajes contribuyen de manera proporcional al hacer el cmputo de la media.

    Es la medida de tendencia central ms conocida y utilizada.

  • Las medias de dos o ms distribuciones pueden ser fcilmente promediadas mientras que

    las medianas y las modas de las distribuciones no se promedian.

    La media se utiliza en procesos y tcnicas estadsticas ms complejas mientras que la

    mediana y la moda en muy pocos casos.

    Cmo calcular, la media, la moda y la mediana

    Media aritmtica o promedio

    Es aquella medida que se obtiene al dividir la suma de todos los valores de una variable

    por la frecuencia total. En palabras ms simples, corresponde a la suma de un conjunto

    de datos dividida por el nmero total de dichos datos.

    Ejemplo 1:

    En matemticas, un alumno tiene las siguientes notas: 4, 7, 7, 2, 5, 3

    n = 6 (nmero total de datos)

    La media aritmtica de las notas de esa asignatura es 4,8. Este nmero representa

    el promedio.

    Ejemplo 2:

    Cuando se tienen muchos datos es ms conveniente agruparlos en una tabla de

    frecuencias y luego calcular la media aritmtica. El siguiente cuadro con lasmedidas de 63

    varas de pino lo ilustra.

    Largo (en m)

    Frecuencia absoluta

    Largo por Frecuencia absoluta

    5

    10

    5 . 10 = 50

    6

    15

    6 . 15 = 90

    7

    20

    7 . 20 = 140

    8

    12

    8 . 12 = 96

    9

    6

  • 9 . 6 = 54

    Frecuencia total = 63

    430

    Se debe recordar que la frecuencia absoluta indica cuntas veces se repite cada valor,

    por lo tanto, la tabla es una manera ms corta de anotar los datos (si la frecuencia

    absoluta es 10, significa que el valor a que corresponde se repite 10 veces).

    Moda (Mo)

    Es la medida que indica cual dato tiene la mayor frecuencia en un conjunto de datos; o

    sea, cual se repite ms.

    Ejemplo 1:

    Determinar la moda en el siguiente conjunto de datos que corresponden a las edades de

    nias de un Jardn Infantil.

    5, 7, 3, 3, 7, 8, 3, 5, 9, 5, 3, 4, 3

    La edad que ms se repite es 3, por lo tanto, la Moda es 3 (Mo = 3)

    Ejemplo 2:

    20, 12, 14, 23, 78, 56, 96

    En este conjunto de datos no existe ningn valor que se repita, por lo tanto, este conjunto

    de valores no tiene moda.

    Mediana (Med)

    Para reconocer la mediana, es necesario tener ordenados los valores sea de mayor a

    menor o lo contrario. Usted divide el total de casos (N) entre dos, y el valor resultante

    corresponde al nmero del caso que representa la mediana de la distribucin.

    Es el valor central de un conjunto de valores ordenados en forma creciente o decreciente.

    Dicho en otras palabras, la Mediana corresponde al valor que deja igual nmero de

    valores antes y despus de l en un conjunto dedatos agrupados.

    Segn el nmero de valores que se tengan se pueden presentar dos casos:

    Si el nmero de valores es impar, la Mediana corresponder al valor central de dicho

    conjunto de datos.

    Si el nmero de valores es par, la Mediana corresponder al promedio de los dos valores

    centrales (los valores centrales se suman y se dividen por 2).

    Ejemplo 1:

    Se tienen los siguientes datos: 5, 4, 8, 10, 9, 1, 2

    Al ordenarlos en forma creciente, es decir de menor a mayor, se tiene: 1, 2, 4, 5, 8, 9, 10

  • El 5 corresponde a la Med, porque es el valor central en este conjunto de datos impares.

    Ejemplo 2:

    El siguiente conjunto de datos est ordenado en forma decreciente, de mayor a menor, y

    corresponde a un conjunto de valores pares, por lo tanto, la Med ser el promedio de los

    valores centrales.

    21, 19, 18, 15, 13, 11, 10, 9, 5, 3

    Ejemplo 3:

    En el grfico de barras (que tiene un nmero par de columnas) los valores centrales son

    72 y 77, por lo tanto, la

    8. MEDIDAS DE DISPERCIN

    A pesar de la gran importancia de las medidas de tendencia central y de la cantidad de

    informacin que aportan individualmente, no hay que dejar de sealar que en muchas

    ocasiones esa informacin, no slo no es completa, sino que puede inducir a errores en

    su interpretacin. Veamos algunos ejemplos.

    Consideremos dos grupos de personas extrados como muestras respectivas de dos

    poblaciones distintas: el primero est compuesto por 100 personas que asisten a la

    proyeccin de una pelcula para nios, y el segundo por 100 personas elegidas entre los

    asistentes a una discoteca juvenil.Pudiera ocurrir que, aun siendo las distribuciones de las

    edades de ambos grupos muy distinta, la media y la mediana coincidieran para ambas.

    (Da un ejemplo concreto en que esto ocurra).

    Igualmente ocurre en este otro ejemplo. La caja de un kiosco registra las siguientes

    entradas en miles de pesos, a lo largo de dos semanas correspondientes a pocas

    distintas del ao.

    1 semana

    2 semana

    10

    30

    20

    40

    30

    50

    50

    50

  • 60

    60

    80

    60

    100

    60

    350

    350

    La media y la mediana de ambas distribuciones coinciden (el valor de ambas es 50 en los

    dos casos) y, sin embargo, las consecuencias que se podran derivar de una y otra tabla

    son bien distintas.

    Comprendemos pues, a la vista de estos ejemplos, la necesidad de conocer otras

    medidas, aparte de los valores de centralizacin, que nos indiquen la mayor o menor

    desviacin de cada observacin respecto de aquellos valores.

    Las medidas de desviacin, variacin o dispersin que estudiaremos a continuacin son:

    Rango o amplitud, desviacin media y desviacin tpica.

    RANGO, AMPLITUD TOTAL O RECORRIDO

    El rango se suele definir como la diferencia entre los dos valores extremos que toma la

    variable. Es la medida de dispersin ms sencilla y tambin, por tanto, la que proporciona

    menos informacin. Adems, esta informacin puede ser errnea, pues el hecho de que

    no influyan ms de dos valores del total de la serie puede provocar una deformacin de la

    realidad.

    Comparemos, por ejemplo, estas dos series:

    Serie 1: 1 5 7 7 8 9 9 10 17

    Serie 2: 2 4 6 8 10 12 14 16 18

    Ambas series tienen rango 16, pero estn desigualmenteagrupadas, pues mientras la

    primera tiene una mayor concentracin en el centro, la segunda se distribuye

    uniformemente a lo largo de todo el recorrido.

    El uso de esta medida de dispersin, ser pues, bastante restringido.

    DESVIACIN MEDIA

    En teora, la desviacin puede referirse a cada una de las medidas de tendencia central:

  • media, mediana o moda; pero el inters se suele centrar en la medida de la desviacin

    con respecto a la media, que llamaremos desviacin media.

    Puede definirse como la media aritmtica de las desviaciones de cada uno de los valores

    con respecto a la media aritmtica de la distribucin, y de indica as:

    Ntese que se toman las desviaciones en valor absoluto, es decir, que la frmula no

    distingue si la diferencia de cada valor de la variable con la media es en ms o en menos.

    Ya se habr advertido que esta expresin sirve para calcular la desviacin media en el

    caso de datos sin agrupar. Veamos un ejemplo:

    Se tiene los valores 2, 2, 4, 4, 5, 6, 7, 8, 8. Averiguar la desviacin media de estos

    valores.

    X

    2

    -3

    3

    2

    3

    3

    4

    -1

    1

    4

    -1

    1

    4

    -1

    1

    5

    0

    0

    6

    1

    1

  • 7

    2

    2

    8

    3

    3

    8

    3

    3

    DM = 1,8

    Veamos ahora cmo se calcula la desviacin media en el caso de datos agrupados en

    intervalos.

    donde observamos que ahora las desviaciones van multiplicadas por las frecuencias de

    los intervalos correspondientes.

    Adems, las desviaciones son de cada centro, o marca de clase, a la media aritmtica. Es

    decir,

    Ejemplo: Para hallar la desviacin media de la siguiente tabla referida a las edades de los

    100 empleados de una cierta empresa:

    Clase

    ni16-20

    2

    20-24

    8

    24-28

    8

    28-32

    18

    32-36

    20

    36-40

    18

    40-44

    15

  • 44-48

    8

    48-52

    3

    veamos cmo se procede:

    Clase

    ni

    xm

    ni xm

    ni

    16-20

    2

    18

    36

    16,72

    33,44

    20-24

    8

    22

    176

    24-28

    8

    28-32

    18

    32-36

    20

  • 36-40

    18

    40-44

    18

    44-48

    8

    48-52

    3

    100

    DM = 6,09

    La desviacin media viene a indicar el grado de concentracin o de dispersin de los

    valores de la variable. Si es muy alta, indica gran dispersin; si es muy baja refleja un

    buen agrupamiento y que los valores son parecidos entre s.

    La desviacin media se puede utilizar como medida de dispersin en todas aquellas

  • distribuciones en las que la medida de tendencia central ms significativas haya sido la

    media. Sin embargo, para las mismas distribuciones es mucho ms significativa la

    desviacin tpica, que estudiaremos a continuacin, y eso hace que el uso de la

    desviacin media sea cada vez ms restringido.

    DESVIACIN TPICA

    Es sin duda la medida de dispersin ms importante, ya que adems sirve como medida

    previa al clculo de otros valores estadsticos.

    La desviacin tpica se define como la raz cuadrada de la media de los cuadrados de las

    desviaciones con respecto a la media de la distribucin. Es decir,

    para datos sin agrupar, o bien:

    Clculo de la desviacin tpica para datos no agrupados en clases

    Veamos la frmula anterior aplicada a un caso concreto.

    Hallar la desviacin tpica de la serie: 5, 8, 10, 12, 16.

    X

    2

    5

    -5,2

    27,04

    8

    -2,2

    4,84

    10

    -0,2

    0,04

    12

    1,8

  • 3,24

    16

    5,8

    33,64Primero hallamos = 10,2

    luego S =

    Clculo de la desviacin tpica para datos agrupados en clases y agrupados por

    frecuencias

    Mtodo largo: Se aplica la siguiente frmula

    donde y f es la frecuencia absoluta de cada intervalo.

    Mtodo abreviado o corto: La frmula a utilizar es:

    donde:

    I: amplitud de la clase

    D: distancia en clases desde cada una en concreto a la clase que contiene a la media

    supuesta A.

    Ejemplo: Las alturas en cm de un grupo de 103 personas se distribuyen as:

    Clases

    F

    150 155

    155 160

    160 165

    165 170

    170 175

    175 180

    180 185

    185 190

    190 195

    195 200

    3

    6

    12

  • 18

    25

    17

    10

    7

    4

    1

    103

    Resp: S = 9,56

    9. DISTRIBUCIN DE FRECUENCIAS Y REPRESENTACIN GRFICA.

    Cuando se rene gran cantidad de datos primarios es til distribuirlos en clases y

    categoras y determinar las frecuencias de las clases, o sea, el nmero de elementos que

    pertenecen a una clase. El ordenamiento tabular de los datos por clases conjuntamente

    con las frecuencias de clases se denomina distribucin de frecuencias

    El caso que se describe a continuacin, variables discretas se denomina distribucin por

    conteo de valores individuales. Supongamos que un determinado colectivo, representado

    por la variable estadstica Xi, que para mayor sencillez consideraremos como

    unidimensional; sean los datos de esta variable (representativo cada uno de ellos de un

    suceso) X1, X2, , Xn (supuesto que sean n los valores de la variable considerada.)

    Definiremos como frecuencia de un dato el nmero de veces que este aparece en el

    colectivo; consecuentemente, si unavariable estadstica toma r valores, cada uno de los

    cuales puede repetirse un cierto nmero de veces, podramos decir que el nmero de

    datos representado por la variable seran N, siendo N la suma de las respectivas

    frecuencias de cada dato (N=Xi).

    Este valor N ser denominado como frecuencia total, mientras que la frecuencia de cada

    dato recibir el nombre de frecuencia absoluta o simplemente frecuencia (fi). La

    frecuencia absoluta nos habla del nmero de veces que un dato aparece en un

    colectivo, ms ello no nos dice demasiado en orden al establecimiento de comparaciones

    sobre la importancia de este dato. Para obtener una idea de la importancia que un dato

    posee en el seno de un colectivo, puesto que no es suficiente concepto de frecuencia, se

    utiliza el concepto frecuencia relativa, que se definir como: el coeficiente entre la

    frecuencia absoluta del dato considerado y la frecuencia total (fr=fi/Xi).

    Para efectos prcticos, asumiremos las siguientes definiciones de frecuencias:

  • Frecuencia absoluta: es el nmero de veces que aparece en la muestra dicho valor de la

    variable y se representa por fi.

    Frecuencias relativas: es el cociente entre la frecuencia absoluta y el tamao de la

    muestra. La denotaremos por fri

    Frecuencias absoluta acumulada: para poder calcular este tipo de frecuencias hay que

    tener en cuenta que la variable estadstica ha de ser cuantitativa o cualitativa ordenable.

    En otro caso no tiene mucho sentido el clculo de esta frecuencia. La frecuencia absoluta

    acumulada de un valor de la variable, es el nmero de veces que ha aparecido en la

    muestra un valor menor o igual queel de la variable y lo representaremos por fa, se puede

    acumular, en la tabla estadstica) en orden ascendente (fa) o descendente (fa).

    Frecuencia relativa acumulada: al igual que en el caso anterior se calcula como el

    cociente entre la frecuencia absoluta acumulada dividido por el tamao de la muestra (N)

    y la denotaremos por fra.

    Resumiendo lo expuesto, si Xi es un valor de la variable, podemos representar por fi a su

    frecuencia y por fi/Xi a su frecuencia relativa (siendo Xi=N o la frecuencia total). Para el

    conjunto de los valores de la variable Xi tendramos, as la tabla #1, compresiva de

    la informacin sobre dicha variable, a travs de las respectivas frecuencias:

    Tabla #1: Variables Discretas

    Valores de la variable Xi

    (datos)

    frecuencias absolutas

    fi

    frecuencias relativas

    fi/N

    X1

    f1

    f1/N

    X2

    f2

    f2/N

    Xn

  • Fn

    fn/N

    Donde:

    N=fi y fi/N=1

    Otro es el caso de las clases representadas en forma de intervalos, variables continuas,

    llamados intervalos de clases que poseen extremos llamados lmite inferior y lmite

    superior, Un intervalo se dice que es abierto o no cerrado, por un extremo si no contiene

    el lmite correspondiente.

    La longitud, tamao o amplitud de un intervalo de clases (C) es la diferencia entre los

    limites superior e inferior (C=lim sup lim inf). El Recorrido (R) es la diferencia entre el

    dato mayor y el menor del conjunto da datos en estudio (R=Xn X1)

    En el caso de variables continuas ser necesario fijar intervalos de frecuencias para llegar

    a un resumen efectivo de la informacin original. A menudo es necesariorepresentar una

    clase, o ms particularmente, un intervalo por un nico valor, este representar a todo el

    intervalo y se denominar marca de clases. Matemticamente el punto medio de cada

    intervalo corresponde a lo que denominamos marca de clase, se denotar por Xi, y

    constituir el valor representativo de cada intervalo. El nmero de observaciones que

    correspondan a cada intervalo se denominar frecuencias absolutas.

    Tabla #2: Variables Continuas

    Intervalos

    (C)

    Marcas de Clases

    Xi

    Frecuencias Absolutas

    fi

    X1-X2

    X1

    f1

    X2-X3

    X2

    f2

  • Xn-1-Xn

    Xn

    Fn

    Donde

    N = fi = Nmero de observaciones

    C = X X" = Amplitud del intervalo

    Por ltimo, en el caso de variables no mensurables, dicha tabla adoptar una forma como

    la siguiente:

    Tabla #3: Variable Ordinales

    Variable

    Frecuencias

    Caracterstica A

    Fa

    Caracterstica B

    Fb

    Caracterstica Z

    Fz

    Reglas Generales para construir las distribuciones de frecuencias por intervalos

    A = ( X1, X2, , Xn )

    1. Efectuar el arreglo ordenado (Ascendente o Descendente) de la poblacin o muestra

    2. Obtener la frecuencia absoluta mediante la tabulacin o conteo de los datos

    (homogenizar los datos)

    R = (valor mayor valor menor) = Xn X1

    3. Encontrar el rango o recorrido (R) de los datos:

    4. Encontrar el nmero de clases o intervalos de clases (K). El nmero de clases debe ser

    tal que se evite el detalle innecesario, pero que no conduzca a la prdida de ms

    informacin de la que puede ser convenientemente ignorada. Para este clculo se utiliza

    la formula de Sturges

    K = 1 + 3.322(log. N)

    5- Determinar la amplitud dela clase ( C ):

    R

    C = --------

    K

    Nota: el resultado siempre se aproxima al siguiente entero si excede al nmero entero

  • obtenido, no importa el monto de la fraccin excedida al entero

    C = se lee "se aproxima a"

    6. El dato menor (X1) ser el lmite inferior de la primera clase. A l se le suma C y se

    obtiene el lmite superior de la primera clase que tambin ser el lmite inferior de la

    segunda clase. Luego se suma nuevamente C y se obtiene el lmite superior del segundo

    intervalo e inferior del tercero. Y as sucesivamente hasta que el lmite superior

    corresponda o supere ligeramente el valor mayor ( Xn ), la cantidad de clases obtenidas

    deber corresponder con el nmero K calculado mediante la frmula de Sturges.

    7. Una vez construidos los intervalos se calculan, mediante tabulacin de acuerdo a los

    lmites inferiores y superiores de las clases, las frecuencias absolutas, relativas,

    porcentuales y acumuladas correspondientes.

    8. Con los datos obtenidos se procede a construir la tabla de distribucin de frecuencia.

    Tabla de distribucin de frecuencias.

    Una de los primeros pasos que se realizan en cualquier estudio estadstico es la

    tabulacin de resultados, es decir, recoger la informacin de la muestra resumida en una

    tabla, que denominaremos distribucin de frecuencias, en la que cada valor de la variable

    se le asocian determinados nmeros que representan el nmero de veces que ha

    aparecido, su proporcin con respecto a otros valores de la variable, etc.

    Por tanto, llamaremos distribucin de frecuencias a un agrupamiento de datos

    en clases acompaada de susfrecuencias: frecuencias absolutas, frecuencias relativa o

    frecuencia porcentuales. En caso de que las variables estn al menos en escala ordinal

    aparecen opcionalmente las frecuencias acumuladas absolutas, y frecuencias

    acumuladas porcentuales. Las distribuciones de frecuencias varan en dependencia si

    corresponden a una variable discreta o a una variable continua.

    Ejemplo #1: Variable Continua:

    La tienda CABRERAS Y ASOCIADOS estaba interesada en efectuar un anlisis de

    sus cuentas por comprar. Uno de los factores que ms interesaba a la administracin de

    la tienda era el de los saldos de las cuentas de crdito. Se escogi al azar una muestra

    aleatoria de 30 cuentas y se anot el saldo de cada cuenta (en unidades monetarias)

    como sigue:

    77.97 13.02 17.97 89.19 12.18 8.15 34.40 43.13 79.61 90.99

    43.66 29.75 7.42 93.91 20.64 21.10 17.64 81.59 60.94 43.97

    32.67 43.66 51.69 53.40 68.13 11.10 12.98 38.74 70.15 25.68

  • Solucin:

    1. A= ( 7.42, 8.15, , , , 90.99, 93.91 )

    donde: X1 = valor mnimo = 7.42

    Xn= valor mximo = 93.91

    2. Efectuar el arreglo ordenado de la poblacin o muestra:

    R = valor mayor valor menor = Xn X1 = 93.91 7.42 = 86.49

    3. Encontrar el rengo o recorrido de los datos: "R"

    K=1+3.322(log N)

    Nota: en el ejemplo en estudio N=30 por cuanto que son 30 clientes en la muestra:

    K = 1 + 3.322 (log 30)

    = 1 + 3.322 (1.477) el log fue obtenido segn calculadora

    = 1+ 4.9069

    = 5.9069 ~6 aproximado al siguiente entero

    4. Encontrar en nmero de clases "K" , segn la frmula de Sturges:

    5. Determinar la amplitud de la clase: "C"

    Nota: obsrvese que se va a trabajar con una cifra significativa mscmoda, o sea como

    los datos estn dados en centsimos, se calculo C hasta los milsimos para evitar que

    algn dato coincida con el lmite de clases

    Clases

    P.M.

    Xi

    fi

    fr

    fa

    fa

    fra

    fra

    7.420 21.835

    14.628

    10

    0.33

    10

    30

    0.33

    1.00

    21.835 36.250

    29.043

    4

    0.13

  • 14

    20

    0.46

    0.67

    36.250 50.665

    43.458

    5

    0.17

    19

    16

    0.63

    0.54

    50.665 65.080

    57.873

    3

    0.10

    22

    11

    0.73

    0.37

    65.080 79.495

    72.288

    3

    0.10

    25

    8

    0.83

    0.27

    79.495 93.910

    86.703

    5

    0.17

    30

    5

    1.00

    0.17

    Total

    XXX

    30

    1.00

  • XXX

    XXX

    XXX

    XXX

    Simbologa utilizada:

    XI = Punto medio o marca de clases

    fi = frecuencia absoluta

    fr = frecuencia relativa

    fa = frecuencia absoluta acumulada descendente

    fa = frecuencia absoluta acumulada ascendente

    fra = frecuencia relativa acumulada descendente

    fra = frecuencia relativa acumulada ascendente

    Nota:

    i. Obsrvese que el lmite inferior de la primera clase es el valor mnimo ( X1=7.42 ) y el

    lmite superior es el resultado de X1+C = 7.42+14.415 = 21.835.

    ii. El lmite inferior de la siguiente clase es igual al lmite superior de la clase anterior y el

    lmite superior es el resultado de adicionarle nuevamente la amplitud de la clase ( C ).

    iii. Obsrvese que el lmite superior de la ltima clase es igual al valor mayor ( Xn=93.91 )

    Representaciones Grficas de la Distribucin de Frecuencias

    a. Los Cuadros estadsticos:

    La estadstica es una disciplina que nos ensea a organizar los datos recogidos para

    poder analizar sus caractersticas y posteriormente inferir, a partir de las muestras

    tomadas, las caractersticas de la poblacininvestigada. Los cuadros o tablas

    corresponden a arreglos sistemticos de los datos por filas y columnas y son un buen

    complemento del texto en los informes

    El primer procedimiento estadstico consiste en tabular los datos segn el tipo de escala

    de medicin utilizada. La tabulacin de los datos conlleva a representar la informacin a

    travs de tablas que de forma general contiene las siguientes partes fundamentales:

    1. Numeracin (siempre que se presenten dos o ms cuadros)

    2. Ttulo: es la descripcin que precede al cuadro, la cul deber estar redactada en forma

    breve y clara, de tal manera que exprese su contenido, siguiendo el ordenamiento del

    mismo. Es necesario abarcar las caractersticas: Qu, Dnde, Cmo y Cundo

    3. Encabezamiento: se refiere al nmero de atributos o variables que se quieren

    representar en el cuadro y se anotan como denominaciones de las columnas y

  • subcolumnas; puede ser unidimensional, bidimensonial o multidimensional. Los ttulos de

    las columnas van en maysculas y los subttulos en minsculas

    4. Cuerpo: es el conjunto de columnas y lneas que contiene el cuadro en orden vertical y

    horizontal, donde se colocan los datos sobre los hechos observados

    5. Pie: se refiere a la informacin adicional necesaria a saber: notas, llamadas, fuentes de

    informacin y otras. Se anotan en el espacio debajo de la lnea inferior que limita el

    cuerpo del cuadro.

    Los Grficos Estadsticos:

    El grfico es quizs el auxiliar ms valioso y utilizado para expresar datos estadsticos,

    este elemento no le aade novedad a las tablas o cuadros estadsticos, es de fcil

    comprensin yaccesible a un nmero mayor de usuarios. El grfico adems de expresar

    visualmente los hechos ms importantes de la informacin numrica, permite una mejor y

    ms fcil comprensin y ahorra tiempo y esfuerzo en el anlisis de datos estadsticos al

    facilitar su apreciacin visual en forma conjunta:

    Histogramas de frecuencias:

    Un histograma es un grfico que sirve para representar una distribucin de frecuencias.

    Este grfico est formado por un conjunto de rectngulos (caso de variables continuas)

    que tienen como base un eje horizontal (generalmente el eje de las abscisas o de las X), y

    como centro los puntos medios de las clases. Los anchos de las clases y las reas de los

    rectngulos son proporcionales a las frecuencias de las clases. En el caso de las

    variables discretas el grfico consiste de un conjunto de barras verticales en lugar de

    rectngulos, hallndose cada barra sobre la observacin respectiva y con una altura

    proporcional a la frecuencia de la observacin

    Polgono de frecuencias:

    El polgono de frecuencias es un grfico formado por lneas quebradas, que tiene los

    centros de las clases representadas en un eje horizontal (eje de las X) y las frecuencias

    de las clases en un eje vertical (eje de las Y). La frecuencia correspondiente a cada centro

    de clase se seala mediante un punto y luego los puntos consecutivos se unen por lneas

    rectas. Del correspondiente histograma se puede lograr el polgono de frecuencia uniendo

    los puntos medios de las bases superiores de cada rectngulos mediante lneas rectas.

    Ojivas:

    Las ojivas se refieren a los grficos que se construyen utilizando unadistribucin

    acumulativa de frecuencias, el orden de acumulacin se aplica al cuadro de distribucin

    de frecuencia y puede ser descendente (fa, fra) o ascendente (fa, fra). La figura que

    se forma al unir los puntos del polgono de frecuencias acumulativas es lo contrario del

  • orden anunciado (por ejemplo si se utiliz el orden descendente en la acumulacin de los

    datos en el cuadro, la ojiva resulta ser ascendente).

    CAPITULO III

  • 10. INTRODUCCIN A LA PROBABILIDAD

    Concepto de probabilidad.

    Enfoques de la probabilidad.

    Experimentos aleatorios.

    Ejercicios prcticos tema 10

    10. INTRODUCCIN A LA PROBABILIDAD

    Muchos de los eventos que ocurren en la vida diaria no pueden ser predichos con

    exactitud desde antes por diversas razones, pues la mayora de los hechos estn influidos

    por factores externos. Adems, existen aquellos sucesos que estn directamente influidos

    por el azar, es decir, por procesos que no se est seguro de lo que va a ocurrir. Sin

    embargo, la probabilidad nos permite acercarnos a esos sucesos y estudiarlos,

    ponderando las posibilidades de su ocurrencia y proporcionando mtodos para tales

    ponderaciones.

    Precisamente, algunos de esos mtodos proporcionados por la probabilidad nos llevan a

    descubrir que algunos sucesos tienen una mayor o menor probabilidad de ocurrir que la

    ponderacin asignada a travs del sentido comn. Nuestros sentidos, la informacin

    previa que poseemos, nuestras creencias o posturas, nuestras inclinaciones, son algunos

    de los factores que intervienen para no permitirnos hacerponderaciones reales y

    sistemticas. La probabilidad nos permitir estudiar los eventos de una manera

    sistemtica y ms cercana a la realidad, retribuyndonos con informacin ms precisa y

    confiable y, por tanto, ms til para las disciplinas humanas.

    Anlisis combinatorio

    En ocasiones el trabajo de enumerar los posibles sucesos que ocurren en una situacin

    dada se convierte en algo difcil de lograr o, simplemente, tedioso. El anlisis

    combinatorio, o clculo combinatorio, permite enumerar tales casos o sucesos y as

    obtener la probabilidad de eventos ms complejos.

    En el caso de que existan ms de un suceso a observar, habra que contar el nmero de

    veces que pueden ocurrir todos los sucesos que se desean observar, para ello se utiliza el

    principio fundamental de conteo:

  • Si un suceso se puede presentar de n1 formas, y otro se puede presentar de n2 formas,

    entonces el nmero de formas en que ambos sucesos pueden presentarse en ese orden

    es de n1n2.

    En otras palabras, basta multiplicar el nmero de formas en que se pueden presentar

    cada uno de los sucesos a observar.

    Este principio nos remite automticamente al factorial de un nmero natural, que se puede

    pensar como una funcin con dominio los nmeros naturales junto con el cero

    y codominio los nmeros naturales. El factorial de un nmero n, denotado n!, se define

    como:

    En el anlisis combinatorio se definen las permutaciones, con o sin repeticin, y las

    combinaciones.

    Permutaciones (u ordenaciones) con repeticin

    Las permutaciones son tambin conocidas como ordenaciones, y de hecho toman este

    nombre porque son ordenacionesde r objetos de n dados. En este curso las

    representaremos como ORnr nORr.

    Por ejemplo:

    Sea A={a,b,c,d}, cuntas "palabras" de dos letras se pueden obtener?

    Se pide formar permutaciones u ordenaciones de 2 letras, cuando el total de letras es 4.

    En este caso r=2 y n=4.

    Las "palabras" formadas son: aa, ab, ac, ad, ba, bb, bc, bd, ca, cb, cc, cd, da, db, dc, dd.

    En total son 16.

    En general, si se toman r objetos de n, la cantidad de permutaciones u ordenaciones con

    repeticin obtenidas son:

    ORnPr = nORr = n r

    Permutaciones (u ordenaciones) sin repeticin

    En este caso, a diferencia del anterior, se realizan ordenaciones de r objetos

    de n dados atendiendo a la situacin de cada objeto en la ordenacin. Su representacin

    ser Pnr nPr.

  • Por ejemplo:

    Sea el mismo conjunto A={a,b,c,d}, cuntas ordenaciones sin repeticin se pueden

    obtener?

    Lo que resulta es: ab, ac, ad, ba, bc, bd, ca, cb, cd, da, db, dc. Son 12 en total.

    En general, si se toman r objetos de un total de n, la cantidad de permutaciones

    Pnr = nPr =

    Combinaciones

    Es una seleccin de r objetos de n dados sin atender a la ordenacin de los mismos. Es

    decir, es la obtencin de subcojuntos, de r elementos cada uno, a partir de un conjunto

    inicial de nelementos. La denotaremos con Cnr, nCr .

    Por ejemplo:

    Si tomamos el mismo conjunto A={a,b,c,d}, cuntos subconjuntos de 2 elementos cada

    uno se pueden obtener?

    Hacindolos se obtienen: {a,b}, {a,c}, {a,d}, {b,c}, {b,d}, {c,d}. Son seis los subconjuntos.

    En general, si de n objetos dados se hacen combinaciones de r objetos cada una, el

    nmero decombinaciones obtenidas son:

    Cnr = nCr =

    o, que es lo mismo,

    Cnr = nCr =

    Eventos

    Cuando se realiza un experimento, que es cualquier proceso que produce un resultado o

    una observacin, se van a obtener un conjunto de valores. A este conjunto de valores que

    puede tomar una variable se le denomina espacio muestral.

    Por ejemplo:

    Si se tiene un dado cualquiera, el espacio muestral (EM) es EM={1,2,3,4,5,6}.

    Si existen ms de una variable, el espacio muestral est formado por las combinaciones

    de valores de cada una de las variables.

    Si tomamos un subconjunto cualquiera del espacio muestral tenemos lo que se denomina

    un evento, y si ste consta de un solo elemento entonces es un evento elemental.

    Como se puede uno imaginar, existen eventos que siempre, no importa el nmero de

    experimentos o su situacin, ocurren, y en cambio existen otros que nunca ocurren. Los

  • que siempre ocurren son los eventos seguros, y los que nunca son los eventos

    imposibles.

    Sin embargo, no todos los resultados son al azar, pues si un experimento es cualquier

    proceso entonces los resultados pueden tomar cualquier tipo de valor. Por esta razn, se

    define como experimento aleatorio al proceso en el que se pueden predecir con certeza la

    ocurrencia de sus eventos, con excepcin del seguro o del imposible. Hay que hacer la

    observacin que esta definicin habla en trminos generales y no especficamente sobre

    algn experimento en particular.

    A aqulla variable que est asociada a un experimento de este tipo se le

    denomina variable aleatoria.

    En cambio, a un experimento no aleatorio se le denomina experimento

    determinstico.Cuando hablamos de varios eventos dentro del mismo experimento se

    pueden dar varios casos.

    Si dos o ms eventos no pueden ocurrir simultneamente, se llaman eventos mutuamente

    excluyentes, es decir, que la interseccin de ambos eventos es vaca.

    Por otro lado, en ocasiones un evento o ms eventos dependen de otro evento previo, es

    decir, un evento A ocurre dado que ocurri un evento B. Si existe este tipo de relacin

    entre eventos se dice que son eventos dependientes o condicionados (el

    evento A depende del evento B, o el resultado del evento A est condicionado al resultado

    del evento B). Por otro lado, si no existe tal relacin entre eventos se dice que

    son eventos independientes. Los criterios de dependencia o de independencia se

    definirn ms adelante, en trminos de probabilidad condicional.

    Probabilidad de eventos

    Para calcular la probabilidad de eventos es necesario que stos se comporten de una

    manera ms o menos estable. Precisamente, se echa mano de la regularidad estadstica,

    que es la propiedad de los fenmenos aleatorios, y que consiste en que al aumentar el

    nmero de repeticiones de un experimento en condiciones prcticamente constantes,

    la frecuencia relativa de ocurrencia para cada evento tiende a un valor fijo.

    Sin embargo, al momento de definir la probabilidad de un evento podemos tomar en

    cuenta los siguientes criterios:

    1. La probabilidad subjetiva de un evento se la asigna la persona que hace el estudio, y

    depende del conocimiento que esta persona tenga sobre el tema. Precisamente por su

  • carcter de subjetividad no se considera con validez cientfica, aunque en lavida diaria es

    de las ms comunes que se utilizan al no apoyarse ms que en el sentido comn y los

    conocimientos previos, y no en resultados estadsticos.

    2. La probabilidad frecuencial de un evento es el valor fijo al que tienden las frecuencias

    relativas de ocurrencia del evento de acuerdo a la regularidad estadstica. Esta definicin

    sera la ms real, pero proporciona probabilidades aproximadas, es decir, proporciona

    estimaciones y no valores reales. Adems, los resultados son a posteriori, pues se

    necesita realizar el experimento para poder obtenerlo.

    3. La probabilidad clsica de un evento E, que denotaremos por P(E), se define como el

    nmero de eventos elementales que componen al evento E, entre el nmero de eventos

    elementales que componen el espacio muestral:

    Es la definicin ms utilizada porque supone de antemano, y se necesita como requisito

    indispensable, que todos los eventos elementales tienen la misma probabilidad de ocurrir.

    Axiomas de la probabilidad

    Recordemos primero que las frecuencias relativas de una distribucin tenan las

    siguientes propiedades:

    1. Las frecuencias relativas son mayores o iguales que cero.

    2. La frecuencia relativa del espacio muestral es igual a la unidad.

    3. Si dos eventos son mutuamente excluyentes, es decir que no ocurren

    simultneamente, entonces la frecuencia relativa de su unin es la suma de las

    frecuencias relativas de cada uno.

    Tomando en cuenta que la probabilidad de un evento, de acuerdo a la definicin ya

    expuesta, es la frecuencia relativa cuando se aumenta el tamao de la muestra, se tienen

    lo siguiente.

    Si E es un eventode un espacio muestral S y P(E) es la probabilidad de E, entonces se

    satisfacen los axiomas de la probabilidad:

    1. 0 P(E) 1.

    2. P(S) = 1.

    3. Si E1, E2, ... , En son eventos mutuamente excluyentes, entonces

    Con estos axiomas podremos tratar algunas de las propiedades de la probabilidad de

    eventos.

  • Posibilidades y probabilidades

    Se habla muy comnmente en sitios de apuestas, como en las autdromos o hipdromos,

    de que "las apuestas a tal o cual participante es de x a y", es decir, que las posibilidades

    de que gane es de x a y. Esta manera de expresarse se refiere al uso de razones.

    En trminos generales, la posibilidad de que ocurra un evento se determina mediante la

    razn de la probabilidad de que ocurra a la probabilidad de que no ocurra.

    Esto quiere decir que si la probabilidad de que un evento ocurra es p, entonces las

    posibilidades de que ocurra son x a y, es decir

    Tales que x y y son enteros positivos.

    Por ejemplo: Si se tiran dos monedas normales (no trucadas), la probabilidad de que las

    dos monedas caigan cara es de . Esto quiere decir si alguien apuesta a que las dos

    monedas no caen simultneamente en cara, la posibilidad de ganar la apuesta es de

    es decir, 3 a 1.

    Hemos de considerar que si es mayor la probabilidad de que no ocurra un evento,

    entonces se acostumbra mencionar las posibilidades en contra del evento.

    Por ejemplo: Si se tira un dado no trucado, sabemos que la probabilidad de obtener un

    cuatro es 1/6, es decir que la posibilidad de obtener un cuatro es de 1 a 6; pero se

    acostumbra decir que las posibilidades en contra, esto es, de no obtener un cuatroes de 6

    a 1.

    Inversamente, en el caso de tener las posibilidades de un evento, entonces es fcil

    obtener su probabilidad, pues si la posibilidad de un evento es de x a y, entonces la

    probabilidad p de que ocurra tal evento es

    Por ejemplo: En la Copa Mundial de Futbol Francia 1998 se deca que el equipo mexicano

    tena una posibilidad de 1 a 75 de llegar a ser el campen del torneo.

    Si se desea encontrar la probabilidad de que el equipo mexicano llegase a ser campen,

    entonces se tiene que

    es la probabilidad de que ocurriese el evento.

    Esto tiene la ventaja de que permite, en combinacin con el tercer axioma de la

  • probabilidad, medir la confiabilidad que tienen las opiniones de las personas sobre las

    posibilidades que le asignan a algunos eventos. Esto quiere decir que el clculo de las

    probabilidades de dos eventos mutuamente excluyentes a partir de las posibilidades

    otorgadas de manera subjetiva resulta como un criterio de consistencia.

    Por ejemplo: Un criminlogo piensa que las posibilidades de que en la prxima semana la

    cantidad de delitos en una ciudad aumente con respecto a la anterior es de 5 a 2, de que

    sea la misma cantidad de delitos es de 1 a 3 y las posibilidades de que aumente la

    cantidad o sea la misma es de 7 a 4.

    Si se desea saber si son consistentes las probabilidades correspondientes habra que

    hacer los clculos.

    Las probabilidades de aumente la cantidad de delitos, sea igual la cantidad de delitos, y

    de que aumente o sea igual la cantidad de delitos es, respectivamente, de

    y dado que (como son eventos mutuamente excluyentes) no es lo mismo que 7/11,

    entonceslos criterios del criminlogo pueden ser cuestionados.

    Propiedades de la probabilidad de eventos no elementales

    Cuando se tienen eventos elementales no existe mucho problema en el sentido del

    clculo de las probabilidades, pues basta con una contabilizacin o el uso directo

    del clculo combinatorio. Pero en el caso de eventos no elementales, que son los

    compuestos por ms de un evento elemental, el proceder de manera anloga resulta muy

    complejo y las operaciones pueden sobrepasar la capacidad de clculo existente. Sin

    embargo, utilizando los axiomas de la probabilidad y las siguientes propiedades, se

    podrn expresar las probabilidades de estos eventos en trminos de los eventos

    elementales que lo componen, siempre y cuando se conozcan las probabilidades de

    stos.

    Veamos la probabilidad de una unin de eventos, la cual la podremos calcular de la

    siguiente manera:

    Propiedad 1. Si A y B son dos eventos, la probabilidad de que ocurra A o B es igual a la

    suma de las probabilidades de ocurrencia de A y de B, menos la probabilidad de que

    ocurran A y B simultneamente. Es decir,

    P(AB) = P(A) + P(B) - P(AB)

  • Ahora, si el caso es que los eventos sean mutuamente excluyentes se tiene:

    Propiedad 2. Si dos eventos, A y B, son mutuamente excluyentes entonces la probabilidad

    de que ocurra A o B es igual a la suma de las probabilidades de ocurrencia de A y de B.

    Es decir

    P(AB) = P(A) + P(B)

    Otra propiedad que se deriva de las anteriores es cuando se busca la probabilidad del

    complemento de un evento E, que denotaremos como ~E:

    Propiedad 3. Si E es un evento y ~E su complemento, entoncesP(~E) = 1 - P(E)

    Retomando los conceptos de eventos dependientes o condicionales, se va a definir

    la probabilidad condicional como sigue:

    Propiedad 4. La probabilidad de que ocurra un evento A dado que ocurri el evento B (el

    evento A depende del evento B), denotado P(A|B), es:

    Hay que notar que esta propiedad no es conmutativa, situacin que s ocurre con la

    probabilidad de unin o la interseccin de eventos, por lo que no hay que confundir P(A|B)

    y P(B|A).

    Finalmente, el criterio para la independencia de eventos queda como sigue:

    Propiedad 5. Dos eventos A y B son independientes si y slo si

    P(A|B) = P(A) y P(B|A) = P(B)

    o, que es lo mismo:

    P(AB) = P(A) P(B)

    BIBLIOGRAFA

    CABALLERO, Wilfredo Introduccin a la Estadstica

    Serie Libros y Materiales Educativos N 28

    I edicin. San Jos, Costa Rica

    IICA, 1981

  • CARRASQUILLA E. Pedro Manual para la confeccin de grficos estadstico

    DEC-CGR, Direccin de Estadsticas y Censos

    Panam. Repblica de Panam.

    DEC-CGR Manual para la elaboracin y publicacin de

    Cuadros estadsticos (tercera edicin)

    Direccin de estadstica y Censos.

    Panam. Repblica de Panam.

    NEZ del Benavente Estadstica bsica para planificacin. 6ta.edicin

    Arturo Siglo XX! Editores S.A,

    Mxico. 1977

    ALLEN L. Webster, Estadstica Aplicada a los Negocios y la Economa.

    Ed. McGraw Hill. Mxico

    3 Edicin, 2000.

    SPIEGEL, Murray R. Estadstica.

    Ed. McGraw-Hill. Mxico,

    3 Edicin, 2002.

    CASTILLO Padilla J. Gmez Arias J. Estadstica Inferencial Bsica

    Ed. Iberoamericana, 1998.