matematica-provabilidad

43
- 1 - Materia: HERRAMIENTAS MATEMÁTICAS III (ESTADÍSTICA I) Profesor: MARIO MARÍN Módulo 1: 1 ESTADISTICA: DEFINICIÓN Definición: "Es el conjunto de métodos y técnicas que permiten determinar, de una muestra debidamente representativa de una población, los valores estadísticos, a fin de poder inferir sobre los parámetros poblacionales con un cierto grado de bondad" Esta definición comprende tanto a la estadística descriptiva como a la estadística inferencial. Mark Berenson y David Levine 1 , definen Estadística descriptiva como El conjunto de métodos que incluyen la recolección, presentación y caracterización de un conjunto de datos con el fin de describir apropiadamente sus características”. Mientras que a la estadística inferencial la definen como Conjunto de métodos que hacen posible la estimación de una característica de la población o la toma de una decisión referente a una población basándose solo en los resultados de una muestra”. La comprensión de estas definiciones se ve facilitada si se aclaran convenientemente algunos términos de las mismas. 1.1 POBLACIÓN: ¿Que se entiende por población? Definición: "El conjunto de datos cuantificable pertenecientes al sistema en estudio constituye la población." Esto implica que si el sistema en estudio es la producción agrícola ganadera de la Provincia de Córdoba, entonces el mismo estará constituido por todos los establecimientos agropecuarios de la Provincia. Si en cambio se pretende estudiar la edad promedio de los estudiantes de la Universidad Empresarial Siglo 21, la población estará conformada por todos los estudiantes de esa Institución. Si se presenta en un Estudio Publicitario, la necesidad de plantear una campaña para promover la venta de un nuevo perfume en la ciudad de Córdoba, la población a estudiar estará constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y elegir un perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates producidos en las quintas de los alrededores de la ciudad, entonces todas las quintas con producción de tomates próxima a la ciudad de Córdoba se constituirán en la población. Pudiere ser de importancia para un nuevo gobierno provincial prever el comportamiento de los contribuyentes a las obligaciones impositivas, en caso de reducir el monto de los impuestos, en este caso la población estará constituida por todos los contribuyentes A fin de poder tomar las medidas más adecuadas será necesario contar con la mayor información posible, si los datos informativos con los que contamos provienen del estudio de toda la población, no sería necesario realizar ninguna inferencia, decimos que se ha efectuado un censo de la población. Pero en ese caso dicha mayor 1 Estadística Básica en Administración pág.2

Upload: pablo-mansilla

Post on 17-Sep-2015

13 views

Category:

Documents


0 download

DESCRIPTION

Matematica-provabilidad

TRANSCRIPT

  • - 1 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Mdulo 1: 1 ESTADISTICA: DEFINICIN

    Definicin: "Es el conjunto de mtodos y tcnicas que permiten determinar, de una muestra debidamente representativa de una poblacin, los valores estadsticos, a fin de poder inferir sobre los parmetros poblacionales con un cierto grado de bondad"

    Esta definicin comprende tanto a la estadstica descriptiva como a la estadstica

    inferencial. Mark Berenson y David Levine1, definen Estadstica descriptiva como El

    conjunto de mtodos que incluyen la recoleccin, presentacin y caracterizacin de un conjunto de datos con el fin de describir apropiadamente sus caractersticas.

    Mientras que a la estadstica inferencial la definen como Conjunto de mtodos que hacen posible la estimacin de una caracterstica de la poblacin o la toma de una decisin referente a una poblacin basndose solo en los resultados de una muestra.

    La comprensin de estas definiciones se ve facilitada si se aclaran convenientemente

    algunos trminos de las mismas.

    1.1 POBLACIN:

    Que se entiende por poblacin?

    Definicin: "El conjunto de datos cuantificable pertenecientes al sistema en estudio constituye la poblacin."

    Esto implica que si el sistema en estudio es la produccin agrcola ganadera de la

    Provincia de Crdoba, entonces el mismo estar constituido por todos los

    establecimientos agropecuarios de la Provincia. Si en cambio se pretende estudiar la

    edad promedio de los estudiantes de la Universidad Empresarial Siglo 21, la poblacin

    estar conformada por todos los estudiantes de esa Institucin. Si se presenta en un

    Estudio Publicitario, la necesidad de plantear una campaa para promover la venta

    de un nuevo perfume en la ciudad de Crdoba, la poblacin a estudiar estar

    constituida por todas las mujeres de dicha ciudad en condiciones de seleccionar y

    elegir un perfume. Si se pretendiere realizar un estudio sobre la calidad de los tomates

    producidos en las quintas de los alrededores de la ciudad, entonces todas las quintas

    con produccin de tomates prxima a la ciudad de Crdoba se constituirn en la

    poblacin.

    Pudiere ser de importancia para un nuevo gobierno provincial prever el

    comportamiento de los contribuyentes a las obligaciones impositivas, en caso de

    reducir el monto de los impuestos, en este caso la poblacin estar constituida por

    todos los contribuyentes

    A fin de poder tomar las medidas ms adecuadas ser necesario contar con la mayor

    informacin posible, si los datos informativos con los que contamos provienen del

    estudio de toda la poblacin, no sera necesario realizar ninguna inferencia, decimos

    que se ha efectuado un censo de la poblacin. Pero en ese caso dicha mayor

    1

    Estadstica Bsica en Administracin pg.2

  • - 2 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    exactitud va acompaada por un mayor costo y tiempo que evidentemente encarece el

    proceso. Es decir, los resultados que puede entregarnos un censo tienen el carcter

    de ser exactos, pero los costos que determinan los mismos pueden no justificar

    dicha exactitud cuando, con muestras debidamente seleccionadas se determinan

    esos valores con un cierto grado de error que se puede regular y que ms adelante

    veremos.

    Por otra parte en algunas situaciones particulares el censo se presenta impracticable o

    puede no ser conveniente. Piense el lector que si el estudio se refiriere al

    comportamiento de las abejas en un colmenar, la poblacin tendra el carcter de

    infinita y por lo tanto sera imposible censarla.

    Supongamos que se desata una epidemia en la poblacin y debemos analizar la

    respuesta a un cierto medicamento. Pretender estudiar la respuesta de toda la

    poblacin a la nueva droga llevara un tiempo enorme tal que al cumplirse tal vez no

    tendra sentido la aplicacin del medicamento.

    Una Empresa automotriz recibe de una Autopartista una partida de 500 pernos de

    pistn, Recepcin debe decidir su aceptacin. Dentro de los ensayos a realizar sobre

    las piezas, adems de dimensiones y dureza se debe efectuar un ensayo de traccin

    para el cual sera necesario destruir la pieza, en este caso sera entonces imposible

    ensayar todas ellas. Por otro lado, si el verificar las dimensiones constituyere otro

    ensayo a realizar, genera en la cantidad de pernos verificados un efecto particular

    sobre el operario que lo realiza, lo cul lo lleva a cometer errores, en algunos casos

    superiores a los que se cometeran efectuando un muestreo. Tendramos tambin

    que tener en cuenta el costo de mano de obra que representa la verificacin de esos

    elementos.

    Esto que hemos expresado nos lleva a la necesidad de poder tomar decisiones en

    base a las inferencias que sobre una poblacin podemos hacer de resultas del anlisis

    y estudio de una muestra de la misma. 1.2 MUESTRA:

    De acuerdo a lo visto en el tem anterior, estudiar el comportamiento de una poblacin

    a travs de un censo, se torna en la mayora de los casos impracticable, es por esa

    razn que el anlisis se efecta por medio de una muestra que est constituida por

    una parte de todos los valores poblacionales.

    Definicin: Una muestra estar constituida por un subconjunto de la poblacin."

    Cada uno de los elementos que forman parte de la muestra se denominan observacin.

    MUESTRA DEBIDAMENTE REPRESENTATIVA

    Si bien es cierto que una muestra est constituida por elementos pertenecientes a la poblacin, tendremos que comprender que no todo subconjunto de la poblacin se

    constituye en una muestra debidamente representativa. Vale tal vez recordar que en 1936 en vsperas a las elecciones presidenciales de EE.UU., la encuestadora

    LITERARY DIGEST pronostic el triunfo del candidato Republicano con un apreciable

  • - 3 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    margen por sobre su opositor Rooselvet. El pronstico se basaba sobre los resultados

    de una encuesta hecha sobre una muestra de dos millones de habitantes. No

    obstante el triunfo fue del candidato demcrata y el error en la inferencia se deba a

    que los encuestados fueron seleccionados entre los poseedores de automviles y

    abonados telefnicos. En esos momentos los que estaban mejor posicionados para

    poseer automvil y lneas telefnicas correspondan a la clase media y alta, en su

    mayora con tendencias republicanas, pero el triunf qued en manos de Rooselvet

    apoyados por la masa poblacional de menores recursos.

    Definicin: Una muestra se dice que es debidamente representativa de una poblacin cuando presenta sus mismas caractersticas.

    Presentar las mismas caractersticas que la poblacin implica que, si el 20% de la

    poblacin cumple con una determinada propiedad, se espera que el 20% de la

    muestra cumpla con esa misma propiedad.

    Esto permite disminuir los errores que se cometen cuando se efecta la inferencia de

    los parmetros poblacionales a partir de los valores determinados en la muestra. 1.3. VALORES ESTADSTICOS

    El estudio realizado sobre una muestra nos permite determinar valores cuyas

    caractersticas nos referiremos ms adelante y a los cuales se los denomina

    estimadores pudiendo tambin tomar el nombre de valores estadsticos, mediante

    los cuales se podr efectuar una correcta estimacin sobre los valores de la

    poblacin.

    Por otra parte, los valores propios de la poblacin toman el nombre de Parmetros.

    Si se pretendiere determinar el salario de los empleados metalrgicos del Pas,

    tomaramos una muestra constituida por operarios de distintas empresas y distintas

    provincias y siempre proporcional al nmero de operarios de cada lugar, el salario

    promedio obtenido en la muestra se denomina estadstico, mientras que el salario

    promedio de toda la poblacin obrera metalrgica se constituye en parmetro 1.4. PARMETROS

    Definicin: Los valores en estudio, que en la muestra toman el nombre de Estadsticos, en la poblacin se los denominan Parmetros.

    Definicin: Se define como bondad al margen de seguridad con que se realiza la inferencia de acuerdo a los estudios realizados sobre la o las muestras.

    Aseverar que tal poltico ganar las prximas elecciones presidenciales no tiene peso

    como informacin si no se lo acompaa con un grado de seguridad. Indicar que las

    encuestas los dan ganador por tal cantidad de puntos, solo es tomado en cuenta

    cuando se acompaa esa informacin con una determinada seguridad.

  • - 4 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    2. Variable, Datos

    Debemos tener en cuenta que la Estadstica basa su aplicacin en el estudio y anlisis

    de nmeros los que se denominan Datos. Si dichos datos son obtenidos a travs de

    una muestra, se los llama observaciones, las que deben responder a una determinada caracterstica que es la que tenemos en estudio, puede ser la

    produccin avcola en la provincia, la inversin de dinero en publicidad en los distintos

    medios durante el ao 1998, o a la cantidad de precipitaciones en el sur de la

    provincia, la concurrencia a un Centro Comercial, las temperaturas mximas diarias

    durante el mes de marzo en una determinada localidad, el nmero de alumnos

    ingresados en cada una de las Universidades de la provincia. De Crdoba en el

    corriente ao, cada una de estas toma el nombre de Variable. En definitiva cada vez

    que nos aboquemos a un estudio estadstico debemos de tener en cuenta que dicho

    estudio corresponde a una Variable, y que de sta se tendrn Datos y los que

    corresponden a Observaciones realizadas. Mediante la aplicacin de mtodos y

    tcnicas estadsticas se estudian estas observaciones y se determinan los

    estadsticos.

    2.1 TIPO DE VARIABLE

    En una fbrica de automotores puede considerarse necesario determinar el nmero de

    automviles de cada modelo producidos durante el ltimo trimestre, a fin de poder

    compararlo con las unidades producidas durante el mismo perodo del ao anterior y

    poder prever la produccin para los futuras perodos. Al Ministerio de Agricultura y

    Ganadera, le ser imprescindible definir la cantidad de hectreas sembradas de maz

    en todo el Pas y en condiciones de ser levantadas en la prxima cosecha. En la

    localidad de Embalse de Ro Tercero, se tienen piletas en donde se efecta la cra de

    pejerreyes y por lo tanto le ser de suma importancia definir, para cada perodo del

    proceso el tamao promedio de los peces. Para una planta generadora de energa

    elctrica, le es necesario determinar los picos de consumo de energa durante el da y

    el consumo durante las diferentes pocas del ao. Puede ser deseable para la

    Secretara de Cultura de la Municipalidad de la ciudad de Crdoba, definir el grado de

    calidad que poseen los Artistas Plsticos, para lo cul ser necesario valorizar las

    obras de cada uno de ellos. Observar el lector que el tipo de dato de cada una de las

    incgnitas en estudio puede tener caractersticas diferentes. En el estudio de la

    produccin de automviles, la cantidad de unidades producidas es un nmero entero

    definido, no es as en el caso de querer determinar la longitud de los peces que se

    cran en Embalse, ya que la exactitud de la misma depender del instrumento con que

    se realice el proceso. En el caso de pretender determinar el grado de calidad de los

    maestros plsticos de Crdoba, no hay la menor duda en que, la definicin de la

    misma depender del criterio experiencia y capacidad de quien realice la valorizacin

    de cada obra. Es decir ser necesario efectuar una clasificacin de los tipos de datos:

    Tipos de Datos

    Cuantitativos

    Cualitativos

    Discretos

    Continuos

    Nominales

    Jerarquizados

  • - 5 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Discretos: Se dice que un valor es discreto cuando es el resultado de un conteo.

    Nmero de televisores por hogar

    Cantidad de alumnos aprobados o reprobados en una evaluacin Nmero de habitantes por mdicos en una localidad; etc.

    Tmense stos como modelos de datos discretos

    Continuos: Se dice que una variable es del tipo continuo cuando asume valores dentro de un intervalo de nmeros reales.

    Las alturas de los alumnos de un curso

    La longitud de peces en un lago

    El volumen de precipitaciones anuales etc.

    Es decir en definitiva, cuando el valor del dato u observacin se mide en un intervalo,

    decimos que es del tipo continuo

    Nominales: Cuando los valores que adopta la variable en estudio puede ser

    clasificada de acuerdo a categoras, tal como lo sera el responder a una encuesta

    efectuada al personal de una Empresa automotriz y en la cual se plantea la situacin

    de cada uno en cuanto a su estado civil. Sabemos que en este caso se tendran las

    categoras de:

    Soltero casado viudo divorciado

    O el caso de realizar un estudio en un club social, en donde nos encontraremos con

    que sus asociados se encuentran categorizados por edad segn:

    Infantiles cadetes mayores

    En estos casos en donde los datos se pueden agrupar por categoras es necesario

    introducir, a fin de poder realizar su estudio, una cierta codificacin. De cualquier

    manera no se podrn hacer estudios matemticos entre categoras.

    Jerarquizados: Este tipo de dato se presenta cuando es necesario otorgarle a la

    variable una cierta jerarqua de orden. Supongamos tener que estudiar el grado de

    calidad de las obras expuestas por un cierto nmero de plsticos de Crdoba a fin de

    asignar los correspondientes premios. A tal efecto ser necesario acudir al juicio de

    un perito que permita definir el grado de categora de cada uno de los participantes,

    esto implica que en el proceso de jerarquizar las obras de cada uno influir el

    criterio de quin realiza el estudio, tal vez de ser otro el que efecte el anlisis pudiere

    modificar dicho orden. Como conclusin entonces no podr en este tipo de variable

    asegurar la exactitud del clculo

    2.2. VALORES ESTADSTICOS

  • - 6 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Al definir los objetivos de la Estadstica, expresbamos la necesidad de poder inferir

    sobre las caractersticas de la poblacin, a travs del anlisis y estudio de la muestra.

    Todos los valores que se determinan en la muestra se denominan estadsticos,

    mientras que los valores propios de la poblacin se denominan parmetros. Adems

    los valores estadsticos se pueden clasificar de acuerdo a sus caractersticas de la

    siguiente manera:

    Media

    Valores

    estadsticos

    De tendencia

    central o posicin

    De dispersin

    Mediana

    Moda

    Rango

    Desvo medio

    Varianza

    Desviacin estndar

    Coeficiente de variacin

    SERIE SIMPLE

    A los efectos de preparar un Congreso Internacional en una zona del Sur del Pas, se

    ha solicitado el registro de las temperaturas mnimas de los ltimos once das del mes

    de julio del ao anterior, obteniendo como respuesta los siguientes datos:

    -2 0 1 -1 -3 -1 -2 -2 1 0 -2

    La primera operacin a realizar par el estudio de esa muestra es la de ordenar las

    observaciones de menor a mayor.

    El conjunto de observaciones ordenadas de menor a mayor se denomina Serie

    Simple.

    -3 -2 -2 -2 -2 -1 -1 0 0 1 1

    En este caso, la variable en estudio est dada por las temperaturas y cada una de las

    observaciones corresponder a un nuevo valor adoptado por la incgnita.

    x = temperatura

    n = nmero de observaciones = 11

    La Serie simple se puede expresar como:

    x1 x2 x3 x4 . . . . . . . . . . . . . . . . . . . . . . . . . . .xn

  • - 7 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    donde:

    x1= -3 y xn = 1

    Con todos los valores que adopta la variable en estudio se genera una distribucin,

    denominada Distribucin de la Variable en estudio

    2-3. MEDIA

    Se define como media aritmtica o promedio de una distribucin al cociente entre la

    suma de todas las observaciones dividido el nmero total de ellas:

    Es conveniente aclarar que la media poblacional se define como:

    x1 + x2 + x3 + . . . . + xN

    = --------------------------------

    N

    N tamao de la poblacin

    Cuya denotacin general es

    N

    xi = 1

    N

    Mientras que en la muestra el estadstico x corresponde a la media de la muestra. x1 + x2 + . . . . . . . + xn

    x = -------------------------------- n es el nmero de observaciones. n

    Se denota como:

    n

    xi x = 1

    n El siguiente diagrama representa la analoga entre la media poblacional para una poblacin y la media muestral para una muestra:

  • - 8 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Poblacin

    Tamao: N

    Muestra

    x Tamao: n

    En nuestro caso:

    -3+(-2)+(-2)+(-2)+(-2)+(-1)+(-1)+0+0+1+1

    x = ------------------------------------------------------ = -1 11

    Dentro de los valores estadsticos de posicin central la media es el de mayor

    representatividad, pero debemos tener presente que a su ves es el ms sensible a

    los valores extremos de la distribucin

    Los valores extremos de la distribucin pueden influir en el valor de la media y de esa

    manera hacerle perder su condicin de referente, tenga Ud. en cuenta el siguiente

    ejemplo: En una Empresa con 9 operarios que ganan cada uno de ellos la cantidad de

    $1000 mensuales, y con un Gerente general cuyo sueldo es de $10.000, el sueldo

    promedio para esa distribucin ser:

    1000 + 1000 + 1000 + . . . . + 10000 19.000

    = ---------------------------------------------- = -------------

    10 10

    = $ 1900

    Esto estara indicando que el sueldo promedio de los empleados de la empresa es de

    $1900, cifra esta que de ninguna manera representa la realidad.

    Recordar

    MEDIA Cantidad de elementos Poblacin

    Muestra

    x

    N

    n

    2.4. MEDIANA

    Se define como Mediana de una distribucin, al valor que ocupa el punto medio de la

    distribucin

    Ocupar el punto medio de la distribucin implica que la mediana deja a la izquierda la

    misma cantidad de valores que a la derecha. Todos los valores que se encuentran a la

    izquierda son menores o eventualmente iguales a l, mientras que los valores que se

    ubican a la derecha sern mayores o eventualmente iguales a l.

  • - 9 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Continuando con el ejemplo referido a las temperaturas en una localidad del Sur:

    -3 -2 -2 -2 -2 -1 -1 0 0 1 1 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11

    Me = x6 = -1

    Teniendo presente que el nmero de observaciones n = 11 el valor que ocupa el

    lugar central de la distribucin corresponder a x6 y por lo tanto la mediana toma el

    valor de -1.

    Cuando el nmero de componentes de la distribucin es impar, la mediana est

    perfectamente definida, pero para el caso de que n sea par, no se tiene un nico valor

    central, en este caso la mediana estar dada por el promedio de los dos valores

    centrales. Suponiendo que se le quitara el ltimo valor a la distribucin de

    temperaturas que estamos analizando, el nmero de observaciones n = 10 y los dos

    valores centrales seran x5 y x6.

    -3 -2 -2 -2 -2 -1 -1 0 0 1 x1 x2 x3 x4 x5 x6 x7 x8 x9 x10

    x5 + x6

    Se tendra en este caso que Me = -------------

    2

    Podemos generalizar el valor de la mediana para una distribucin de n valores

    teniendo en cuenta que el nmero de observaciones sea par o impar:

    Si n es impar Me = x i donde i = (n+1)/2

    Mediana x(n/2) + x(n/2 +1)

    Si n es par Me = ------------------ 2

    Para determinar el valor de la mediana de una serie simple o distribucin de

    frecuencia es necesario tener en cuenta el nmero de observaciones, si n es impar, la

    mediana pertenece a la distribucin y esta dada por el valor que ocupa el punto

    central de la misma. En el caso de que n sea impar, el valor de la mediana esta dado

    por el promedio de los dos valores centrales, esto implica que puede pertenecer a la

    distribucin solo en el caso de que los valores centrales sean iguales:

    a) 4 6 6 8 Me = 6 b) 2 10 18 20 Me = 14

  • - 10 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    c) 4,3 5,8 6,2 7,2 8,5 9,6 Me = 6,7 d) 2 3 3 6 9 Me = 3 e) 3,5 4,7 6,8 7,3 9,6 10 12,5 Me = 7,3

    Observe el lector que a diferencia de la media o promedio la cul se ve influenciada

    por los valores extremos, segn ya vimos, no ocurre lo mismo con la mediana la cul

    se presenta como insensible a los valores extremos y por lo tanto describe con mayor

    exactitud las distribuciones en donde los valores extremos son sensibles .Son ejemplo

    de este tipo de distribuciones:

    a) los ingresos personales

    b) Las retribuciones generales en una empresa

    c) Gastos domsticos

    d) Ingresos netos por hogar, etc.

    No obstante todo esto las propiedades que presenta la media y que veremos

    ms adelante la hace ms atractiva para su utilizacin.

    2.5. MODA

    Se define como Moda de una distribucin al valor que ms veces se repite.

    En nuestro caso -2 se repite en cuatro oportunidades y por lo tanto ste valor se

    constituye en moda de la distribucin.

    Mo = -2

    Con respecto a este valor es necesario aclarar que si en una distribucin se tiene ms

    de un valor con el mismo mximo de repeticiones, cada uno de ellos se constituir en

    una nueva moda, es decir que una distribucin puede tener ms de una moda. En

    caso de tener dos modas se la denomina bimodal y en caso de tres trimodal, etc.

    As mismo si se presentare el caso en que todos los valores de la distribucin tienen

    el mismo nmero de repeticiones, diremos que dicha distribucin no tiene moda.

    FRECUENCIA

    Dada una distribucin se define como Frecuencia de un valor, al nmero de veces que

    el mismo se repite.

    Ejemplo:

    En la distribucin correspondiente a las temperaturas mnimos tomadas en una

    localidad del Sur del Pas durante los ltimos 10 das, defina para cada valor su

    frecuencia: -2 -2 -4 -1 -1 -1 0 -3 -2 -1

    para -4 su f = 1

    -3 su f = 1

    -2 su f = 3 -1 su f = 4

    0 su f = 1

  • - 11 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Clase xi fi

    1 0 2

    2 1 5

    3 2 7

    4 3 8

    5 4 16

    6 5 5

    7 6 4

    8 7 3

    f = 10

    Tenga en cuenta que la suma de todas las frecuencias es igual al nmero total de

    observaciones.

    2.6. DISTRIBUCIN DE FRECUENCIA

    En la mayora de los casos nos encontraremos con una cantidad de observaciones n

    que superan los 20, por lo tanto pretender operar con una serie simple se tornara

    engorroso, en estos casos ser conveniente seleccionar los valores de acuerdo a una

    determinada clase y determinar de cada una de ellas su frecuencia, de all que es

    comn encontrar a este tipo de distribucin como Distribucin de intervalos, a los

    efectos de facilitar el aprendizaje del alumno subdividiremos este tipo de distribucin

    en dos grupos:

    1) cuando la amplitud de intervalo es igual a 1

    2) cuando la amplitud del intervalo de clase toma un valor mayor a 1

    Caso a analizar

    Supongamos tener que estudiar el nmero de accidentes que se producen en una

    playa de estacionamiento durante los ltimos 50 das. Los datos relevados son los

    siguientes

    3 6 4 4 4 3 2 7 5 4 4 1 0 4 2 1 3 2 2 0 1 4 4 7 4 3 2 1 4 2 5 4 3 5 6 7 4 4 5 2 3 6 4 3 1 3 4 4 5 6

    Es observable que trabajar con todos los valores como lo presenta la serie simple

    sera por dems engorroso si no se dispusiera de una computadora, pero si

    clasificamos los valores, en este caso de acuerdo a su valor numrico y para cada

    uno de ellos determinamos su frecuencia, podramos confeccionar una tabla de las

    siguientes caractersticas:

    Tabla 1.1

  • - 12 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Clase xi fi xi * fi

    1 0 2 0

    2 1 5 5

    3 2 7 14

    4 3 8 24

    5 4 16 64

    6 5 5 25

    7 6 4 24

    8 7 3 21

    50 177

    8

    fi =i 50 Si ahora analizamos la tabla de esta manera, se simplifica enormemente la

    determinacin de la media ya que en lugar de efectuar la suma de todas las

    observaciones, efectuaremos el producto de cada valor por su frecuencia y la suma de

    estos productos lo dividiremos por el nmero total de observaciones.

    8

    ( Xi . fi ) 1

    x = fi 1

    Nota: Debemos tener presente que estamos frente a una muestra

    A los efectos de facilitar los clculos, generemos en la tabla una nueva columna

    conteniendo los productos de xi * fi.

    Tabla 1.2

    De esta manera podemos calcular la media como: n

    ( xi. fi ) i =1

    x = = 177 / 50 = 3,54 n

    El valor de la media o promedio de la distribucin es de

    x = 3, 54

    2.7. FRECUENCIA RELATIVA

    Definicin: Se define como frecuencia relativa de un valor y se expresa como fri, al

    cociente entre su frecuencia y la suma de todas las frecuencias (la suma de todas las frecuencias es igual al nmero de elementos de la distribucin).

    f fri =

    i =

    fi

  • - 13 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fi = n por lo tanto tambin se puede expresar

    fi

    fr i = ---------

    n Podemos ampliar la tabla de frecuencias con una nueva columna que contenga la fr de

    cada clase:

    Tabla 1-3

    Clase xi fi xi * fi fri

    1 0 2 0 0,04

    2 1 5 5 0,1

    3 2 7 14 0,14

    4 3 8 24 0,16

    5 4 16 64 0,32

    6 5 5 25 0,1

    7 6 4 24 0,08

    8 7 3 21 0,06

    50 177 1

    Propiedad:

    La sumas de todas las frecuencias relativas correspondientes a los valores

    clases de una distribucin es igual a 12:

    fri = fr1 + fr2 + fr3 . . . . . . . . + fr n

    Tener en cuenta:

    El concepto de frecuencia relativa, la media de una distribucin poblacional tambin se

    puede expresar como:

    (xi . fi)

    = -------------- = (xi . fi/fi ) es decir

    fi

    2 Demostracin

    fri = fr1 + fr2 + fr3 . . . . . . . . + fr n

    f1 f2 f3 fn fi

    = --- + --- + ---- + + --- = ------- = 1

    fi fi fi fi fi

  • - 14 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Clase xi fi xi * fi fri fai

    1 0 2 0 0,04 2

    2 1 5 5 0,1 7

    3 2 7 14 0,14 14

    4 3 8 24 0,16 22

    5 4 16 64 0,32 38

    6 5 5 25 0,1 43

    7 6 4 24 0,08 47

    8 7 3 21 0,06 50

    50 177 1

    = (xi. fri)

    2.8 FRECUENCIA ACUMULADA

    Se define como frecuencia acumulada de una clase (por ejemplo i) y se la denota como fai, a la suma de su frecuencia y la suma de las frecuencias de los valores que

    le anteceden.

    Analicemos la tabla 1.3 de la pgina anterior,(corresponda al nmero de accidentes

    que se produjeron durante los ltimos 50 das en una playa de estacionamiento),

    teniendo en cuenta la definicin de frecuencia acumulada tendremos:

    Tabla 1.4

    Cules son las bondades que nos brinda la frecuencia acumulada:

    a) Nos indica con su lectura el nmero de valores pertenecientes a la distribucin

    que se ubican a la izquierda de cada uno de ellos. Si se quiere saber cuantos

    das se registraron menos de 2 accidentes, se tendr la frecuencia acumulada

    del 1, es decir 7, lo que implica que de los 50 das analizados solo en 7 de ellos

    se tuvieron menos de dos accidentes diarios, pero con valores menores o iguales

    a 2 se tuvieron 14, quiere decir que, de los 50 das, en 14 de ellos se tuvieron 2 o

    menos de 2 accidentes diarios, este anlisis indica tambin que, del total de das

    analizados, 7 de ellos tuvieron exactamente 2 accidentes diarios.

    b) Ms adelante cuando efectuemos su graficacin Ud. podr visualizar con mayor

    claridad esta propiedad. c) Tambin nos permite determinar rpidamente el valor de la mediana. Analizando

    nuestro caso, el nmero de observaciones es par, por lo que la mediana ser el promedio de los dos valores centrales, el x n/2 y el x (n/2 + 1). . Para determinar el

    valor que ocupa la posicin n/2 ( en este caso 50/2 =25, el x25 , nos ubicamos en

    la columna correspondiente a frecuencia acumuladas y determinamos a cual de las clases le corresponde la menor frecuencia acumulada que contiene a n/2, en este caso le corresponde a la quinta clase, cuyo valor es el 4, desde la x23 ,

    hasta la x38 le corresponden 4, por lo tanto la Me = 4

  • - 15 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Clase xi fi xi * fi fri fai fds

    1 0 2 0 0,04 2 48

    2 1 5 5 0,1 7 43

    3 2 7 14 0,14 14 36

    4 3 8 24 0,16 22 28

    5 4 16 64 0,32 38 12

    6 5 5 25 0,1 43 7

    7 6 4 24 0,08 47 3

    8 7 3 21 0,06 50 0

    50 177 1

    2.9 FRECUENCIA DESACUMULADA

    Se define como frecuencia desacumulada de un valor, fds de una distribucin, a la

    diferencia entre el nmero total de observaciones y su frecuencia acumulada.

    Es decir que para un valor cualquiera se verifica que:

    fdsi = n - fai

    Analicemos la Tabla 1.5 a la cual se le creo una nueva columna conteniendo la

    frecuencia desacumulada, aplicando su definicin

    Tabla 1.5

    De la definicin se desprende que:

    fai + fdsi = n

    Bien podemos decir que la frecuencia desacumulada es el complemento a n de la

    acumulada, es decir que para cada uno de los valores nos indica cuantos tenemos a la

    derecha de l. La frecuencia desacumulada del valor de x=2, nos indica que la

    distribucin posee 36 observaciones mayores que ese valor. Tambin podramos

    valernos de este parmetro para la determinacin de la mediana, dejamos para que

    Ud. efecte el anlisis correspondiente a esa situacin Analizaremos ms adelante el

    diagrama representativo de ambas frecuencias correspondientes a una distribucin

    DISTRIBUCIN DE FRECUENCIAS PARA DATOS NOMINALES

    Consideremos las ventas de los distintos tipos de sabor de gaseosas realizadas en el

    Bar de una Universidad durante un da de concurrencia normal del alumnado.

    Colas 55 Naranja 63 Limn 72 Tnicas 44 Agua c/gas 15 Agua s/gas 18 Jugos 33

    En este caso no tiene sentido determinar el valor de la media de la distribucin,

    tngase en cuenta que las clases estn dadas por los distintos tipos de bebidas, luego

    tiene sentido decir que la ms vendidas son las bebidas de limn, siguindole en

  • - 16 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Xi f i fr i fa fds

    3 1 0,05 1 19

    4

    2

    0,1

    3

    17

    5 4 0,2 7 13

    6 5 0,25 12 8

    7 4 0,2 16 4

    8 2 0,1 18 2

    9 1 0,05 19 1

    10 1 0,05 20 0

    20

    1

    importancia las de naranja, es decir el valor de tendencia central que utilizaremos en

    casos como estos le corresponde a la Moda. S sera conveniente generar una tabla

    de frecuencias y determinar los porcentajes de cada uno de los sabores.

    Tabla 1.6

    xi fi fri fi%

    Agua c/gas 15 0,05 5 Agua s/gas 18 0,06 6

    Jugos 33 0,11 11

    Tnicas 44 0,1467 14,67

    Colas 55 0,1833 18,33

    Naranjas 63 0,21 21

    Limn 72 0,24 24

    fi = 300 fi% = 100

    3-0 DIAGRAMAS

    El poder graficar los valores estadsticos nos permite realizar una lectura rpida de la distribucin y sacar conclusiones inmediatas de la misma.

    Sera suficiente abrir una hoja de clculo para observar la cantidad variada de grficos

    con que puede ser representada una distribucin: Diagramas de: Lneas, Barras,

    Barras acumuladas, de Sectores o circular, Diagramas x-y, de Bastones etc. En este

    texto haremos referencia a los diagramas: Circular, de Bastones e Histogramas y a

    una combinacin de los grficos de Bastones, Barras y x-y Dispersin.

    Ejercicio

    Supongamos tener para analizar las notas obtenidas por 20 alumnos de una divisin

    en la asignatura de Estadstica:

    9 7 6 6 6 5 3 4 5 5 8 7 8 7 7 6 5 6 4 10

    Generaremos una distribucin de frecuencias complementndola con: Frecuencias relativas, Frecuencia acumulada y por ltimo Frecuencia desacumulada.

    Tabla 1.7

    Toda vez que se presenta una tabla tal como la 3.1, la primera pregunta que surge es,

    que se debe graficar debe de tenerse siempre en cuenta que cada vez que se

  • - 17 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fre

    cu

    en

    cia

    habla de graficar estamos deseando volcar en forma grfica una cierta relacin. En la

    presente situacin, la variable en estudio es la calificacin, por lo cual se podra

    graficar la relacin:

    Calificacin y frecuencia Calificacin y

    frecuencia relativa Calificacin y

    frecuencia acumulada Calificacin y

    frecuencia desacumulada

    3.1 Diagrama de bastones:

    Llevaremos en el eje de las abscisas las calificaciones y en el eje de las ordenadas las

    frecuencias y representamos mediante un segmento centrado en cada una de las

    calificaciones su correspondiente frecuencia; tendremos nuestro primer diagrama.

    Cada uno de los bastones corresponde a la frecuencia de cada calificacin y toma el

    nombre de densidad de frecuencia entendindose como tal al cociente:

    fi

    dfi = ---- es decir frecuencia por unidad de intervalo de clase

    x

    Grfico 1.1

    Diagrama de Bastones

    6

    5

    4

    3

    2

    1

    0

    3 4 5 6 7 8 9 10

    calificaciones

    3.2 DIAGRAMA DE SECTORES

    Para este grfico debemos tener presente que el ngulo central del crculo es de 360

    y que cada una de las clases estar dada por un sector cuyo ngulo ser proporcional

    a su frecuencia:

    Supongamos la calificacin de 3 cuya frecuencia es 1 tendremos que:

    20 (suma de todas las frecuencias) ------------------------ 360

    a 1 (frecuencia del 3) ----------------------- 1 = 360. 1 / 20 = 18

  • - 18 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Analicemos la calificacin del 4 cuya frecuencia es 2:

    Si a 20 (frecuencia total) ---------------------------- 360

    A 2 (frecuencia del 4) ---------------------------- 2 = 360. 2 /20 = 36

    Repitamos el procedimiento para el 5 el cul tiene frecuencia 4

    Si a 20 le corresponde ----------------------------360

    A 4 ---------------------------- 4 = 360. 4/20 = 72

    Debe tenerse en cuenta que en todos los casos la operacin que nos permite

    determinar el ngulo de cada sector est dado por el producto entre 360 y el cociente de la frecuencia de la calificacin en estudio y la suma de todas las frecuencias (N),

    cociente ste que segn ya vimos corresponde a la frecuencia relativa (fri = f / N), es

    decir que el ngulo correspondiente a un determinado sector est dado por el producto entre 360 y su frecuencia relativa:

    i = 360. fri

    Grfico 1.2

    Diagrama de Sectores

    10 3 9

    4

    8

    5

    7

    6

    En realidad es ms interesante plantear este mismo diagrama pero expresado en

    porcentajes, para lo cul el anlisis es muy similar al anterior. Al total de

    observaciones, 20 en este caso, le corresponder el 100% y por lo tanto para

    cualquiera de las observaciones con frecuencia fi le corresponde ser:

    Si a 20 --------------------------- 100%

    fi --------------------------- %i = 100. fi / 20

    Nuevamente nos encontramos con que el porcentaje correspondiente a cada una de

    las calificaciones estar dado por el producto entre 100 y la frecuencia relativa

    correspondiente a cada una de ellas. El grfico tiene la misma estructura anterior.

  • - 19 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Grfico 1.3

    Diagrama de Sectores Calificaciones

    en porcentajes

    8

    10%

    10 9 5%

    5%

    3

    5% 4

    10%

    7

    20%

    5

    20%

    6

    25%

    3.2-HISTOGRAMA DE FRECUENCIAS:

    ste es otro de los diagramas de gran utilizacin para el cul es necesario considerar

    un sistema de ejes cartesianos ortogonales, debiendo representar en el eje de las

    abscisas las calificaciones y en el de las ordenadas la frecuencia, las clases estn

    dadas por las calificaciones. El intervalo entre dos clases sucesivas se denomina

    amplitud de intervalo, en este caso es la unidad y se la expresa como x = 1. Si

    consideramos el diagrama de bastones y a partir del extremo inferior de cada uno de

    ellos llevamos tanto a izquierda como a derecha la mitad del intervalo, en nuestro

    caso 1 / 2 = 0,5 y levantamos las ordenadas correspondientes, nos encontramos con

    un diagrama de barras sin discontinuidades al que denominaremos Histograma, en

    este caso de Histograma de Frecuencias.

    Grfico 1.4

  • - 20 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Fre

    cu

    en

    cia

    Histograma de Frecuencias

    6

    5

    4

    3

    2

    1

    0

    0 1 2 3 4 5 6 7 8 9 10 11

    Calificaciones

    La superficie encerrada por cada una de las barras est dada por el producto entre la

    base x por la altura que segn ya vimos estaba dada por la densidad de frecuencia.

    dfi = fi /x por lo tanto:

    Si = x. dfi = x. fi / x = fi

    Cada una de ellas tendr un valor igual a su frecuencia y el rea total del diagrama

    ser entonces la suma de todas las frecuencias e igual a N.

    Si = fi = N

    3.4 - POLGONO DE FRECUENCIAS

    Si se unen los puntos medios superiores de cada una de las barras del histograma y

    se considera cero las frecuencias de las clases adyacentes a los extremos de la

    distribucin, se formar con el eje de las abscisas un polgono denominado, en este

    caso, como Polgono de Frecuencias:

    Grfico 1.5. Polgono de frecuencias

  • - 21 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fi

    6

    5

    4

    3

    2

    1

    0

    2 3 4 5 6 7 8 9 10 11

    xi

    El rea encerrada por el polgono de frecuencias es igual al rea encerrada por el

    histograma de frecuencias.

    Consideremos la barra del histograma correspondiente al valor de la variable x = 6. Observamos que mientras que la superficie del tringulo superior de la barra que pertenece al histograma no pertenece al polgono, la superficie del tringulo inferior no perteneciente al histograma si pertenece ahora al polgono, como las superficies de

    ambos tringulos son iguales3, lo son tambin las superficies del polgono y del

    histograma de frecuencias.

    3.5 - HISTOGRAMA DE FRECUENCIAS RELATIVAS

    Si en el eje de ordenadas se representan a las frecuencia relativas en lugar de las frecuencias, se obtiene el Histograma de Frecuencias Relativas que tendr las

    mismas caractersticas que el diagrama de frecuencias ya que fri = fi / N, es decir que

    se divide a los valores de la ordenada por un valor constante N y por lo tanto grficamente representa un cambio de escalas.

    En este caso la altura de cada barra esta dada por la densidad de frecuencia relativa

    dfri = fri / x

    y por lo tanto al igual que en el diagrama anterior, la superficie encerrada por cada una de las barras del Histograma ser igual a su frecuencia relativa:

    Si = x. fri / x = fri

    De tal manera que el rea encerrada por el Histograma de frecuencias relativas ser ahora igual a la suma de todas las frecuencias relativas y por tal razn igual a 1:

    Si = fri = 1

    Grfico 1.6

    3 Dos tringulos rectngulos en A y A con los ngulos y iguales por opuestos por el vrtice, y

    alternos internos entre paralelas y el lado 11 = 22= x / 2 por lo tanto son iguales.

  • - 22 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fr

    Histograma de Frecuencia Relativas

    0,3

    0,25

    0,2

    0,15

    0,1

    0,05

    0

    2 3 4 5 6 7 8 9 10 11

    x

    3.6 POLGONO DE FRECUENCIAS RELATIVAS

    De la misma manera en que definimos al polgono de frecuencias, se define tambin al

    polgono de frecuencias relativas. Tanto la superficie encerrada por el polgono de

    frecuencias relativas como el del Histograma de esas mismas frecuencias son iguales

    a 1.

    Grfico 1.7

  • - 23 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    5 4 6 3 4 5 3 7 3 4 2 0 2 1 3 4 2 5 6 1

    xi fi fai

    0 1 1

    1 2 3

    2 3 6

    3 4 10

    4 4 14

    5 3 17

    6 2 19

    7 1 20

    Histograma y Polgono de Frecuencias Relativas

    0,3

    0,25

    0,2

    0,15

    0,1

    0,05

    0

    2 3 4 5 6 7 8 9 10 11

    3.7 FRECUENCIA ACUMULADA

    Supongamos analizar el nmero de accidentes de trabajo que se producen

    diariamente en una empresa metalrgica local, para lo cul se han considerado los

    detectados durante los ltimos veinte das.

    Confeccionaremos una tabla de frecuencias:

    Tabla 1.8

    fi = 20

    Para confeccionar el grfico de frecuencias acumuladas llevaremos sobre el eje de las

    abscisas los valores observados y en el eje de las ordenadas las frecuencias

    acumuladas.

    Para el primer valor de la distribucin cero, la frecuencia acumulada vale 1, este valor

    se mantendr constante hasta 1 en donde la frecuencia acumulada toma el valor de 3, se mantiene constante hasta el valor observado de 2 en donde la fa adopta el valor de

  • - 24 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fre

    cu

    en

    cia

    a

    cu

    mu

    lad

    a

    6 y as sucesivamente hasta el valor de 7 en donde fa toma el valor de 20 y se

    mantiene constante con este valor. Siga esto en el grfico 1.8.

    Grfico 1.8

    FRECUENCIA ACUMULADA

    22 20 18 16 14 12 10

    8 6 4 2 0

    0 1 2 3 4 5 6 7 8 9

    OBSERVACIONES

    Observe el lector con que claridad este diagrama le entrega informacin. Por ejemplo

    analizando la observacin 4, el punto inferior de la barra indica que menores a 4

    accidentes diarios se han producido en 10 oportunidades mientras que el punto

    superior indica que en 14 oportunidades se han producido 4 o menos accidentes

    diarios. De igual manera en 17 oportunidades se produjeron menos de 6 accidentes en

    un da y que en solo 2 oportunidades se produjeron 6 accidentes.

    De igual manera podemos graficar la frecuencia desacumulada conjuntamente con la

    acumulada tal como lo muestra el Grfico 1.8 denominado comnmente como grfico

    de escalones. Debe tenerse en cuenta que para cualquier valor observado la suma de

    la frecuencia acumulada y la desacumulada es igual al nmero total de observaciones.

    fa + fds = n

  • - 25 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fre

    cu

    en

    cia

    Grfico 1.9

    22 20 18

    16

    14

    12 10

    8 6

    4 2

    0

    0 1 2 3 4 5 6 7 8 9

    observaciones

    Frecuencia acumulada

    Frecuencia desacumulada

    La interseccin de ambas grficas debe de verificarse para fa = fds = n/2.

    En el punto de interseccin ambas frecuencias son iguales por lo que podemos decir

    que:

    por lo que

    y

    fa + fds = fa + fa = n

    2 fa = n

    fa = n / 2

    RELACIN ENTRE MEDIA, MEDIANA Y MODA

    Cuando nos referimos al histograma de frecuencias relativas decamos que el rea

    encerrada por cada una de las barras nos entregaba el valor de la frecuencia relativa

    del valor correspondiente a dicha barra... Si este concepto lo extendemos a toda la

    distribucin podemos asegurar que considerando un determinado intervalo de las

    observaciones el rea encerrada por el histograma en dicho intervalo ser igual a su

    frecuencia relativa, valor que segn ya vimos multiplicada por 100 nos entrega el

    porcentaje de observaciones comprendidas en ese intervalo. Adems demostramos

    que la superficie encerrada por el histograma de frecuencias relativas era igual a la

    superficie del polgono de fr. Simplificando, el rea encerrada por el polgono de

    frecuencias relativa es igual a 1 y esto implica tambin que encierra el 100% de las

    observaciones.

    Analicemos las distribuciones correspondientes a las calificaciones obtenidas por tres

    divisiones que denominaremos como A, B y C en la asignatura de Estadstica:

  • - 26 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    A B C

    xi fi fi fi

    1 6 0 0

    2 8 1 0

    3 5 2 1

    4 4 4 1

    5 3 5 2

    6 2 6 4

    7 1 5 5

    8 1 4 7

    9 0 2 5

    10 0 1 2

    30 30 27

    Tabla 1.9

    Las tres distribuciones tienen caractersticas distintas, veamos:

    A) =. (xi.fi) / N = 3,1667

    Me = (x15 + x16) / 2 = 3

    Mo = 2

    B) =. (xi.fi) / N = 6

    Me = x16 = 6

    Mo = 6

    C) = (xi.fi) / N = 7,296

    Me = x14 = 8

    Mo = 8

    Si graficamos los histogramas y polgonos de las frecuencias relativas de cada una de

    las distribuciones relativas suavizando convenientemente los lados del polgono, nos

    encontraremos con los siguientes grficos:

  • - 27 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    frecu

    en

    cia

    rela

    tiva

    Grfico 1.10 (Divisin A)

    Histograma y polgono de frecuencias

    relativas

    0,3

    0,25

    0,2

    0,15

    0,1

    0,05

    0

    1 2 3 4 5 6 7 8 9 10

    observaciones

    Grafico 1.11 (Divisin B)

    Histograma y polgono de frecuencias

    relativas

    0,25

    0,2

    0,15

    0,1

    0,05

    0

    1 2 3 4 5 6 7 8 9 10 11

    obs e r vacione s

    Grafico 1.12 (Divisin C)

    Histograma y polgono de frecuencias

    relativas

    0,3

    0,25

    0,2

    0,15

    0,1

    0,05

    0

    1 2 3 4 5 6 7 8 9 10 11

    observaciones

  • - 28 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    3,1 3,4 3,6 3,6 3,6 3,7 3,7 3,8 3,8 3,9 3,9 4 4 4,1 4,2 4,2 4,3 4,3 4, 4,5 4,6

    En el caso de la divisin B se observa una cierta simetra respecto a un eje vertical

    coincidente con la mediana la moda y la media, decimos entonces que la distribucin

    es del tipo Normal, y que en ese caso coinciden los tres valores ; Me y Mo.

    En el A la distribucin se presenta en forma asimtrica y en este caso decimos que

    corresponde a una asimtrica derecha asignndosele un signo positivo. A su vez, la

    observacin de mayor ordenada le corresponder a la moda y la media tendr que

    dividir al rea total en dos reas iguales, de acuerdo a su grfica y a sus valores se

    observa que la media tiene un valor mayor a la mediana y que a su vez sta se ubica

    entre la media y la moda.

    Al analizar la ltima distribucin C observamos que la misma es asimtrica, tiene sesgo

    izquierdo y se le asigna signo negativo. Nuevamente la moda queda definida por

    correspndele a la abscisa de mayor ordenada, la mediana Me si bien en este caso

    coincidira con el valor de la moda, la media se ubica a la izquierda de la moda, no

    olvidemos que la distribucin pivotea en ese punto . La mediana se ubica en general

    entre la media y la moda aunque en este caso por tratar con variable discreta, la Me

    coincide con la Mo.

    En toda distribucin sesgada ya sea a la derecha o a la izquierda, el segmento

    comprendido por la media y la mediana es aproximadamente un tercio del segmento

    comprendida entre la media y la moda.

    Una distribucin puede ser:

    Simtrica = Me = Mo

    Distribucin Derecha < Me < = Mo

    Asimtrica

    Izquierda > Me > = Mo

    3.2 DISTRIBUCIN DE INTERVALOS DE CLASE

    En una unidad militar de entrenamiento para futuros oficiales, se han determinado los

    tiempos que tardan los integrantes de un pelotn en cruzar la pista de combate. Estos

    valores expresados en minutos son los siguientes:

    El jefe de pelotn necesita realizar un estudio estadstico sobre estos tiempos a los

    efectos de determinar:

    a- Qu proporcin de hombres tardan menos de 3,5 en cruzar la pista de combate

    b- Qu proporcin de los hombres del pelotn tardan menos de 4 en cruzar la pista

    En casos como el presentado, donde el nmero de observaciones es mayor a 20 y la

    variable en estudio es del tipo continua, se hace necesario definir como clases a

    intervalos y determinar como frecuencia de cada uno de ellos al nmero de

    observaciones que contienen. En este caso la distribucin toma el nombre de

    distribucin de intervalos de clase.

    Para generar una distribucin de intervalos de clase debe tener en cuenta:

    a) La cantidad de intervalos: La determinacin del nmero de intervalos, a los que

    llamaremos como k est relacionada con el nmero de observaciones n.

    Mientras que algunos operadores definen:

  • - 29 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    k = n

    Otros deciden optar por la expresin:

    k = 1+ log2(n)

    Pero en general se puede definir el valor de k teniendo en cuenta que:

    5

  • - 30 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Podemos ahora confeccionar la tabla de distribucin de intervalos de clase, teniendo

    en cuenta que, a los efectos de referenciar a cada intervalo, definiremos al punto

    medio de cada uno de ellos como el valor representativo e igual a la semisuma de sus

    lmites, toma el nombre de marca de clase y se lo denota como xmi.

    3,09 3,39 3,69 3,99 4,29 4,6

    [`---------------)[--------------)[-----------------)[-----------------)[-------------------]

    3,24 3,54 3,84 3,14 3,44

    3.2 DETERMINACIN DE LA MEDIA

    Para determinar la media de la distribucin consideramos que todos los valores

    pertenecientes a cada intervalo estn uniformemente distribuidos en dicho intervalo,

    de esta manera la suma de todos ellos estar dada por el producto entre la marca de

    clase por la frecuencia de ese intervalo.

    = ( xmi * fi )

    N Para su determinacin creamos una nueva columna conteniendo los productos de

    xmi*fi:

    Tabla 1.10

    Li ls fi xmi xmi * fi 3,09 3,39 1 3,24 3,24

    3,39 3,69 4 3,54 14,16

    3,69 3,99 6 3,84 23,04

    3,99 4,29 5 4,14 20,7

    4,29 4,6 5 4,445 22,225

    21 83,365

    83,365 =

    21

    = 3,9697

    Esto nos indica que el tiempo promedio empleado por los integrantes del pelotn para

    cruzar la pista de combate es de 3,9697

    HISTOGRAMA DE FRECUENCIA

    Para confeccionar el Histograma y Polgono de frecuencias debemos tener presente

    que las frecuencias de los intervalos adyacentes a los extremos de nuestra distribucin

    son nulas, adems se representa en el eje horizontal las marcas de clase.

  • - 31 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Li ls fi xmi Xmi * fi fai fdsi 2,79 3,09 0 2,94 0 0 21 3,09 3,39 1 3,24 3,24 1 20 3,39 3,69 4 3,54 14,16 5 16 3,69 3,99 6 3,84 23,04 11 10 3,99 4,29 5 4,14 20,7 16 5 4,29 4,6 5 4,445 22,225 21 0 4,6 4,39 0 4,74 0 21 0

    f

    Grfico 1.13

    7

    6

    5

    4

    3

    2

    1

    0

    2,94 3,24 3,54 3,84 4,14 4,445 4,74

    x

    3.3 DETERMINACIN DE LA MEDIANA

    La mediana tendr que estar ubicada en el intervalo cuya menor frecuencia acumulada contiene a la observacin X (n/2), es por lo tanto conveniente determinar las

    columnas que contengan a las frecuencias acumuladas y desacumuladas.

    Tabla 1. 11

    De acuerdo a la tabla, la mediana se ubica en el intervalo [3,69 ; 3,99) al que denominaremos intervalo medial, y para el cul la frecuencia acumulada es de 11 y por lo tanto contiene a los valores correspondientes a x10 y x11, pero faltara

    determinar el valor que ms se aproxime al real.

    Para la determinacin de la mediana en una distribucin de intervalos de clase

    tendremos dos mtodos:

    a) Mtodo grfico

    Tracemos los diagramas correspondientes a la frecuencia acumulada:

  • - 32 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fa

    fa -

    fd

    s

    Analizando dicho diagrama podemos observar que de los 21 integrantes del pelotn

    solo 5 de ellos cruzan la pista en menos de 3,54, es decir que, mediante anlisis del diagrama podemos reconstruir la tabla.

    Grfico 1.14

    25

    20

    15

    10

    5

    0

    2,94 3,24 3,54 3,84 4,14 4,445 4,74

    x

    Combinemos en un mismo diagrama, las representaciones de frecuencia acumulada y

    desacumulada. Este grfico toma el nombre de Ojiva.

    Grfico 1.15

    25

    20

    15

    10

    5

    0

    2 2,5 3 3,5 4 4,5 5

    -5

    x

    Como ambas frecuencias se representan en el eje vertical, en el punto interseccin

    ambas son iguales y como su suma

    Fa + frds = N

  • - 33 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    1212

    1010

    88

    66

    44

    22

    00

    33,,6699 Me 33,,9999

    Debe verificarse que el valor de esas frecuencias, en ese punto es igual a N/2.

    Como la mediana es el valor que ocupa el punto medio, la abscisa correspondiente al

    punto interseccin tendr su valor. Por lo tanto las coordenadas del punto interseccin

    sern (Me; n/2).

    b) Mtodo Analtico

    Analizaremos el intervalo medial:

    Grfico 1.16

    12

    10

    8

    6

    4

    2

    0

    3,69

    Li x

    Me 3,99

    Ls

    Al iniciar el intervalo 3,69 su frecuencia acumulada tiene el valor de 5 (que denominaremos frecuencia acumulada inferior y la denotaremos como fai). De la

    misma manera al finalizar ese intervalo (x = 3,69) su frecuencia acumulada es de 11 (a

    la denominaremos frecuencia acumulada superior y la denotaremos como fas). Esa

    variacin de frecuencia acumulada de 5 a 11 es justamente la frecuencia

    correspondiente al intervalo medial (fm = 6). Adems como el total de observaciones

    es de 21, N/2 = 10,5.

    Consideremos los tringulos 123 y 123 ambos rectngulos en 2 y 2 respectivamente. Esos tringulos son semejantes y por lo tanto sus lados homlogos son

    proporcionales. Si reemplazamos tendremos:

    2 3 1 - 2 ---------- = -------------

    2 3 1 2

    fm x

  • - 34 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    3,54

    3,84

    x

    4,14

    f

    Despejando Me tendremos:

    ------ ------- = ---------

    (N/2 fai) Me Li

    x (N/2 fai) Me = Li + -----------------

    fm

    En este caso particular, la Me = 3,69 + 0,3 *((10,5 - 5) / 6

    Me = 3,965

    3.4- DETERMINACIN DE LA MODA

    Se define como intervalo modal al intervalo de mayor frecuencia, en este caso

    corresponder a [3,69; 3,99) con frecuencia 6, coincide con el medial, pero bien podra

    no coincidir, para la determinacin de la moda, consideremos en el histograma de

    frecuencia, el intervalo modal y los intervalos adyacentes.

    Grfico 1.17

    7

    6

    5

    4

    3

    2

    1

    0

    Li Ls

    Si definimos a d1 = (frecuencia del intervalo modal) (frecuencia del intervalo que le antecede):

    di = 6-4 = 2

    y como d2 = (frecuencia del intervalo modal) (menos la frecuencia del intervalo que le sucede):

    d2 = 6-5 = 1

    Como li se define al inicio del intervalo modal (3,69), el valor de la moda de una

    distribucin de intervalos de clase esta dada por la expresin:

  • - 35 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    X2 F2 0 0 1 6 2 8 3 4 4 3 5 2 6 2 7 1 8 0

    26

    Mo = Li + x. ( d1/(d1+d2) ) En este caso tendremos:

    Mo = 3,69 + 0,3 (2 / ( 2+1) ) = 3,89

    Conclusiones:

    En una distribucin de intervalos de clase, la moda se encuentra siempre ubicada en

    el intervalo modal, pero desplazada hacia el intervalo adyacente de mayor frecuencia.

    Los valores determinados para la media, mediana y moda, indican que la distribucin

    tiene un leve sesgo derecho:

    Media = 3,9697 Mediana Me = 3,965

    Moda Mo = 3,89

    > Me > Mo

    4- VALORES DE DISPERSIN

    Son suficientes los valores de posicin central para determinar las caractersticas de

    una distribucin? Para responder a esta pregunta observemos la siguiente situacin:

    Tenemos tres distribuciones que presenten la misma media, la misma moda y la

    misma mediana pero no obstante ello las tres son distintas.

    Pueden tenerse dos distribuciones mismo nmero de elementos o tambin

    conformadas por los mismos elementos y no obstante ello ambas son distintas.

    Tabla 1. 12

    X1 F1 0 0 1 3 2 4 3 7 4 5 5 4 6 2 7 1 8 0

    26

  • - 36 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Grfico 1.19

    8

    7

    6

    5

    4

    3

    2

    1

    0

    0 2 4 6 8 10

    Grfico 1.20

    9

    8

    7

    6

    5

    4

    3

    2

    1

    0

    0 1 2 3 4 5 6 7 8 9

    Es necesario entonces considerar valores que nos determinen que tn cuan dispersos

    estn. Estos valores se denominan valores de dispersin:

    4.1 RANGO O AMPLITUD

    Definicin

    La diferencia entre los valores extremos de una distribucin se denomina Alcance o

    Rango y se lo denota como R

    Si definimos a xn como el mayor valor observado y a x1 como el ms pequeo,

    entonces:

    R = xn x1

  • - 37 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Si bien, una vez ordenados todos los valores, el clculo de la amplitud o recorrido es

    simple e inmediata, no nos brinda ninguna informacin sobre las caractersticas de los

    valores intermedios. Veamos las siguientes distribuciones:

    A) 0 1 1 2 4 6 8 10 12 14

    B)

    50

    50,1

    50,2

    50,3

    50,5

    50,6

    50,7

    50,8

    60

    64

    En la distribucin A R = 14 0 = 14

    En la distribucin B R = 64 50 = 14

    Ambas tienen el mismo nmero de elementos, el mismo alcance, no obstante ello son

    distintas, es decir que el Rango o Amplitud de una distribucin nos entrega una

    informacin limitada.

    4.2 DESVO MEDIO

    Para determinar el grado de dispersin de los valores de la distribucin, debemos

    definir con respecto a que punto de referencia se toman las distancias, el punto de

    referencia ms utilizado es la media de la de la distribucin

    Considerando el ejercicio de pag. 39 (Los tiempos que los integrantes de un pelotn

    tardan en cruzar la pista de combate), la distribucin de intervalos la representbamos

    como:

    3,09 3,39 3,69 3,99 4,29 4,6

    [`---------------)[--------------)[-----------------)[-----------------)[-------------------]

    3,24 3,54 3,84 3,14 3,44

    d1

    = 3,9697

    d2

    En el primer intervalo se encuentra una sola observacin, la cul consideramos es

    coincidente con la marca de clase, luego su distancia respecto a la media ser:

    d1 = xm1 -

    La dispersin de los valores ubicados en el segundo intervalo, en este caso son 4 y

    habiendo considerado que los mismos se encuentran uniformemente distribuidos en

    dicho intervalo, la dispersin respecto a la media estar dada por el producto de la

    distancia de la marca de clase por el nmero de observaciones

    d2 = xm2 -

  • - 38 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Podramos intentar considerar como un valor representativo de la dispersin de los

    valores respecto a la media, al promedio de los desvos medios:

    pdm = (mxi ). fi

    N

    Pero nos encontramos con que la suma de todos los desvos es nula y siempre lo

    sern por considerar como punto de referencia a la media. Todas las distancias de las

    marcas de clase que se ubiquen a la izquierda de la media sern negativas, mientras

    que las distancias de los que se ubiquen a la derecha sern positivas. El problema

    radica en anular los signos negativos, para ello podemos:

    a) considerar los desvos absolutos medios, de esta manera no se tendra ningn

    desvo negativo y la suma de los desvos absolutos medios sera distinta de cero,

    salvo el caso en que todas las observaciones sean iguales. La expresin matemtica

    quedara como:

    DM = mxi

    N

    . fi

    Esta expresin se define como Desvo medio (Promedio de los desvos absolutos

    medios).

    En nuestro caso en estudio conformaremos la tabla correspondiente a la distribucin

    de intervalos pero incluiremos una nueva columna conteniendo los desvos absolutos

    medias.

    Tabla 1. 13

    Li ls fi xmi Xmi * fi fai fdsi !xi - media!.fi

    2,79 0 0 2,94 0 0 21 0,000 3,09 3,39 1 3,24 3,24 1 20 0,730 3,39 3,69 4 3,54 14,16 5 16 1,719 3,69 3,99 6 3,84 23,04 11 10 0,779 3,99 4,29 5 4,14 20,7 16 5 0,851 4,29 4,6 5 4,445 22,225 21 0 2,376 4,6 4,99 0 4,74 0 21 0 0,000

    21 83,365 6,455

    Aplicando la frmula correspondiente, el desvo medio ser: 6,455

    DM = ------------------ 21

    DM = 0,3074

  • - 39 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    2

    2

    4.3 VARIANZA

    Otra forma de obtener todos los desvos positivos, sera elevndolos al cuadrado es

    decir:

    pdmc = (mxi ) .if

    N Esta expresin que definimos como: el promedio de los desvos cuadrticos medios y se denomina Varianza.

    Es conveniente entonces considerar una nueva columna conteniendo la suma de los

    desvos cuadrticos medios tal como la tabla:

    Tabla 1. 14

    Li ls fi xmi Xmi * fi fai fdsi !xi -media!.fi (xi-media)2.fi

    2,79 0 0 2,94 0 0 21 0,000 0 3,09 3,39 1 3,24 3,24 1 20 0,730 0,53255244 3,39 3,69 4 3,54 14,16 5 16 1,719 0,73878118 3,69 3,99 6 3,84 23,04 11 10 0,779 0,10102891 3,99 4,29 5 4,14 20,7 16 5 0,851 0,14490505 4,29 4,6 5 4,445 22,225 21 0 2,376 1,12925624 4,6 4,99 0 4,74 0 21 0 0,000 0

    21 83,365 6,455 2,647

    Var(x) =2,647 / 21 = 0,126 minutos al cuadrado

    Tambin se la denota como:

    2 = 0,126 min utoscuadrados

    4.4 DESVIACIN ESTANDAR

    La Varianza es un valor que determina un cierto grado de dispersin, pero en relacin

    a lo que nosotros buscbamos, nos encontramos con que no tenemos el promedio de

    los desvos medios, si no que contamos con el promedio de los desvos cuadrticos

    medios. Una aproximacin estara obteniendo la raz cuadrada de la varianza:

    =

    O abreviando

    ( xi ) fi N

    = Var ( x) =

    = 0,126 = 0,3549

  • - 40 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    fre

    cu

    en

    cia

    Definimos a la desviacin estndar como la raz cuadrada de la varianza y

    prcticamente entrega el grado de dispersin de los valores de una distribucin con

    respecto a la media.

    Para dos distribuciones con la misma media, tendr ms dispersin aquella que tiene

    una mayor desviacin estndar, tal como lo indica la grfica

    Grfico 1.21

    Desvo estndar = 2

    Desvo estndar =0,5

    Desvo estndar =1

    x

    4.4 COEFICIENTE DE VARIACIN

    En muchas oportunidades es conveniente comparar distribuciones de distinta media o

    de distinto tipo, por ejemplo si analizamos alturas y peso de los alumnos de un curso

    de una Universidad, los valores de posicin central y de dispersin de una de ellas

    estarn dados en metros o centmetros, pero los de la otra sern en Kg. , luego en

    principio sera incorrecto pretender comparar las dispersiones de esas distribuciones,

    a fin de poder comparar se opera con el Coeficiente de Variacin, que esta dado por el

    cociente entre el desviacin estndar de la distribucin y su media, expresada de

    manera porcentual:

    CV =

    . 100%

    Como tanto la desviacin estndar y la media tienen las mismas unidades, al dividirlas

    se simplifican y nos queda un coeficiente, es adimensional. Por otra parte el CV

    entrega la proporcin de la desviacin estndar respecto de la media. En el caso que

    nos ocupa el:

    CV = 0,3549

    3,9697'

    .100 = 8,94

    CV = 8,94%

    Supongamos que se realiza el estudio de altura y peso de los alumnos de un curso, y

    que los resultados arrojados son:

  • - 41 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    Desviacin estndar Media CV Del Peso = 10Kg 71 k.o. 14,08%

    Altura = 6cm 168 cm 3,57% Estos ltimos valores del CV indican que, la distribucin correspondiente a la altura

    tiene menos dispersin que la correspondiente a los pesos.

    4.5 CUARTILES Y PERCENTILES

    En muchas ocasiones es necesario contar con una subdivisin de los datos en

    determinadas fracciones, llamados en de manera general como fractiles. De esta

    manera una fraccin o proporcin de datos caen en un fractil o por debajo de ste. De

    acuerdo al nmero de subdivisiones los fractiles toman un nombre determinado, as

    estas pueden ser:

    a) en 10 partes. En este caso cada una de esas partes toman el nombre de

    decil

    b) en cuatro partes: En ese caso cada una de ellas toma el nombre de cuartil c) en cambio si la subdivisin es en 100 partes, se la denomina a cada una de

    ella como centil.

    El alcance interfractil, dada por la diferencia entre dos fractiles constituye una medida

    de dispersin entre ellos.

    En general los fractiles ms utilizados lo constituyen los cuartiles y percentiles.

    Subdividir a los datos en cuatro fractiles implica que el 50% de los datos estn por

    debajo del segundo cuartil y el 75% de las observaciones estn por debajo del tercer

    cuartil, representados grficamente implica:

    X1 Q1 Q2 Q3 Xn

    Una cuarta parte de las observaciones se encuentran por debajo de Q1, como que

    tambin estn por debajo de Q2. Entre Q3 y Q1 se concentra el 50% de las

    observaciones. Es necesario aclarar que Q1 como Q2 y Q3 son los puntos fractiles,

    por debajo de cada uno de ellos se encuentran los porcentajes los correspondientes

    porcentajes de datos.

    Cuando el nmero de valores no es lo suficientemente grande la determinacin exacta

    de los cuartiles puede ser complicada, ya que es factible que el valor del cuartil quede

    entre observaciones, de cualquier manera en general podemos decir que la

    determinacin de cada cuartil quede satisfecha con las expresiones:

    La determinacin de los cuartiles para datos no agrupados estn dadas por las

    expresiones:

    Q1 =

    Q2 =

    Q3 =

    X (1 / 4 N +1 / 4)

    X (1 / 2 N +1 / 2)

    X (3 / 4 N +1 / 4) Observe que el valor del segundo cuartil corresponde al valor de la mediana. Si

    recordamos que, el rea encerrada por el polgono de frecuencias era igual al nmero

  • - 42 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    de observaciones, sera lgico suponer entonces que en un diagrama correspondiente

    al polgono de frecuencias suavizado, las superficies encerradas por dicho diagrama

    sern proporcionales al nmero de observaciones correspondientes a la misma. Con

    este concepto definimos los cuartiles grficamente segn grfico 1.22.

    Grfico 1.22

    Q1 Q2 Q3

    Se define como Rango Intercuartil o propagacin media a la diferencia:

    R I = Q3 Q1

    Percentiles: De la misma manera en que la distribucin en estudio la podemos dividir

    en cuatro partes, en el caso de hacerlo en 100 cada una de ellos tomar el nombre de

    percentil, un percentil z cualquiera es un valor tal que z por ciento de las

    observaciones quedan a su izquierda mientras que (100 - z) porcientos de los

    valores quedan a su derecha. El percentil 80 est dejando a su izquierda el 80% de los

    valores de la distribucin, es decir todos aquellos menores a el, y por lo tanto el 20%

    de la distribucin lo superan, es decir quedan a su derecha.

    Grfico 1.23

    fdp

    xi

    80

  • - 43 - Materia: HERRAMIENTAS MATEMTICAS III (ESTADSTICA I) Profesor: MARIO MARN

    4.6 REGLA EMPRICA

    Segn vimos en el punto anterior, dada una distribucin, el valor de su desviacin

    estndar nos indica el grado de dispersin de sus valores con respecto a la media,

    pero es en realidad la Regla Emprica, quien relaciona a los dos parmetros : y con

    el siguiente enunciado:

    En el intervalo centrado en la media y tal que su origen izquierdo est dado por la

    media menos un desviacin estndar y el derecho por la media ms un desviacin

    estndar, se agrupa el 68 % de los valores de la distribucin; En el intervalo

    comprendido por la media menos dos desviaciones estndar y ms dos desviacioness

    se ubica el 95% de los valores de la distribucin, por ltimo en el intervalo

    comprendido por la media menos tres desviaciones estndar y la media ms tres

    desvos estndar se tendr el 99,7% de N (suele considerarse en muchas

    oportunidades en este intervalo el 100% de N).

    Debe de tener en cuenta que, entre el inicio de la grfica y su fin, se encuentran

    ubicados todos los valores de la distribucin N.

    Grfico 1.24

    fdp

    - 3 - 2 -1 +1 +2 +3 xi

    68% N

    95%N

    99,72% N

    Resumen Regla Emprica

    ( 1 ) se tiene el 68% de N

    ( 2 ) se tiene el 95% de N

    ( 3 ) se concentra el 100% de N