notas de apoyo tada03 2016.pdf

Upload: jaair-saalazar

Post on 24-Feb-2018

225 views

Category:

Documents


0 download

TRANSCRIPT

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    1/33

    MCII JJSA Pgina 1de 33

    1. INTRODUCCION

    El concepto de Estadstica es muy amplio, y sus aplicaciones directas o indirectas, muy

    numerosas; resulta difcil, por ello, dar una definicin. Sin embargo, la idea ms adecuada es

    considerar que incumbe a la Estadstica la recogida, ordenacin, resumen y anlisis de datos de

    cualquier tipo sobre colectivos, lo que significa que no tiene sentido pensar en un dato aislado o

    individual como terreno de trabajo de la Estadstica: es necesario, pues, considerar un grupo de

    elementos (personas, animales, cosas, experimentos, etc.) a los que se refieren los datos que se

    consideran. Este conjunto puede venir dado de dos formas que condicionan toda clasificacin interna

    de la Estadstica, y que son las siguientes:

    a) Poblacin, o conjunto de todos los elementos cuyo estudio nos interesa. Si se dispone de datos de

    una o ms variables sobre la poblacin completa, o se puede acceder a ellos, la Estadstica tendr

    como misin que la recogida sea adecuada, se ordenen, se estructuren y se resuman dichos datos

    para su mejor comprensin, es decir, que se describan. Ello nos llevar a hablar de Estadstica

    Descriptiva. Por ejemplo, el conjunto de los varones mayores de 65 aos y residentes en una

    provincia sera una poblacin.

    b) Muestra, o conjunto de elementos de los que efectivamente se dispone de datos, y que es una

    parte (a menudo pequea) de la poblacin. Cuando no se puede acceder a los datos de toda la

    poblacin, que es lo ms frecuente, y se debe trabajar con slo los de la muestra, a la simple

    descripcin de los datos se aade el inters por valorar hasta qu punto los resultados de la muestra

    son extrapolables o generalizables a la poblacin; en consecuencia, ser necesario utilizar no slo las

    tcnicas de la Estadstica Descriptiva, siempre obligadas en todo caso para la comprensin de los

    resultados, sino tambin otras que permiten inferir afirmaciones sobre la poblacin a partir de los

    datos de la muestra y que constituyen la Estadstica Inferencialo Inferencia Estadstica.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    2/33

    MCII JJSA Pgina 2de 33

    Por ejemplo, el grupo de los varones mayores de 65 aos y residentes en una provincia que

    son usuarios de bibliotecas pblicas sera una muestra de la poblacin citada en el prrafo anterior

    (otra cosa es que la muestra fuese o no representativa del conjunto de tal poblacin).

    Los elementos fundamentales de la descripcin de una variable son los que siguen en los

    apartados siguientes, que se pueden resumir de esta forma:

    - En primer lugar, se har hincapi en que lo que se estudia son en realidad las variables, lo que

    nos obligar a distinguir los tipos bsicos de ellas, porque tienen un tratamiento distinto en

    todo lo que sigue.

    - Las distribuciones de frecuencia son necesarias en el paso siguiente para expresar los

    resultados obtenidos mediante tablas estadsticas.

    - Las grficas estadsticas dan una informacin similar a la de las tablas, pero de forma ms

    directa; de ellas trata otro apartado.

    - Finalmente, el resumen de la informacin se realiza mediante las medidas de centralizacin,

    dispersin y posicin.

    2. TIPOS DE VARIABLES.

    Lo que se estudia en una muestra o poblacin es una serie de variables en cada individuo o

    elemento. Lo usual es considerar primero las variables una a una, sin plantearse problemas de

    asociacin entre ellas, por lo que podemos pensar slo en una variable de cuyos datos imaginamos

    disponer en una muestra (el nmero de datos es el llamado Tamao de Muestra, para el quehabitualmente se utiliza la letra n). Los tipos de variables, y consecuentemente las clases de datos que

    se pueden encontrar, son bsicamente las siguientes:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    3/33

    MCII JJSA Pgina 3de 33

    A) Variables CUALITATIVAS, tambin llamadas CARACTERES, VARIABLES CATEGRICAS o ATRIBUTOS,

    que son aquellas que no necesitan nmeros para expresarse; cada forma particular en que pueden

    presentarse se denomina modalidad. Por ejemplo, el sexo de una persona es una variable cualitativa y

    varn o mujer son sus nicas modalidades. En consecuencia, para una variable cualitativa, cada

    dato no es ms que la informacin de que un determinado elemento de la muestra presenta una

    determinada modalidad. Entre la variables cualitativas cabe distinguir:

    a1) las variables cualitativas ORDINALES, que son las que teniendo ms de dos modalidades

    tienen establecido un orden natural entre las mismas, de forma que sus modalidades se enuncian

    siguiendo una cierta ordenacin ascendente o descendente y no de otra manera. Por ejemplo, la

    variable gravedad del pronstico de lesiones traumticas podra tener como orden natural entre sus

    modalidades leve, moderado, grave, etc., pero nunca diramos grave, leve, moderado,

    etc. en este orden.

    a2) las variables cualitativas PURAS, que no tienen un orden natural preestablecido entre sus

    modalidades, y podemos utilizar cualquier ordenacin para ellas, como por ejemplo el grupo

    sanguneo o la nacionalidad de una persona (no hay que confundirse con ordenaciones arbitrarias,

    como el orden alfabtico, pensando que convierten en ordinales a las variables, ya que no significan

    una verdadera ordenacin natural de las modalidades).

    a3) las variables DICOTOMICAS, que tienen slo dos modalidades posibles, y en las que ni

    siquiera tiene sentido plantearse si son o no ordinales; El hecho de tener slo dos modalidades les

    confiere caractersticas especiales. Cabe citar como ejemplos el ya citado del sexo, el pertenecer o no

    a una asociacin, o en general cualquier situacin que slo admita una respuesta s o no.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    4/33

    MCII JJSA Pgina 4de 33

    B) Variables CUANTITATIVAS o NUMERICAS, que son aquellas que necesitan nmeros para ser

    expresadas, como la edad de alguien o el nmero de pginas de un libro. Cada forma particular en

    que se presentan es un valor numrico, y un dato es en estas variables un nmero que refleja el valor

    de la variable en un elemento de la muestra. Tambin pueden distinguirse al menos dos subtipos:

    b1) las variables cuantitativas DISCRETAS, cuyos valores son aislados (habitualmente nmeros

    enteros), de forma que pueden enumerarse y existen valores consecutivos entre los que no puede

    haber otro; Por ejemplo, un resumen puede tener 349 350, pero no 349.17 palabras.

    b2) las variables cuantitativas CONTINUAS, que pueden tomar cualquier valor numrico,

    entero o decimal, de forma que tericamente entre dos valores posibles siempre se pueden encontrar

    otros (entre 65.3 Kg. y 65.4 Kg. de peso siempre est 65.37 Kg., por ejemplo), aunque en la prctica el

    nmero de cifras decimales est limitado y la variable se maneja en cierto modo como discreta.

    La distincin entre los distintos tipos de variables es importante porque las tcnicas a aplicar a

    cada uno pueden ser muy diferentes, y muchos parmetros y clculos tienen sentido para las

    variables de un tipo y no para las de otro. Hay que tener en cuenta tambin que una misma variable

    de la realidad puede venir expresada de diversas maneras, incluso como cualitativa o como

    cuantitativa, dependiendo de que usemos valores numricos o slo modalidades; pinsese, por

    ejemplo, en que la estatura puede darse en centmetros (variable cuantitativa continua) o diciendo de

    alguien que es bajo, mediano o alto (variable cualitativa ordinal). En estos casos, debe quedar

    claro que la variable es en esencia cuantitativa y que su tratamiento como cualitativa supone una

    prdida de calidad en la informacin, slo admisible si no podemos disponer de los datos numricos.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    5/33

    MCII JJSA Pgina 5de 33

    3. DISTRIBUCIONES DE FRECUENCIA Y TABLAS ESTADISTICAS.

    Sea cual sea el tipo de variable, lo que se tiene como informacin de una variable en una

    muestra es un nmero finito n de datos, es decir, de valores o de anotaciones sobre qu modalidad

    (cualitativas) o qu valor (cuantitativas) tiene cada elemento de la muestra; a este conjunto de datos

    se le llama distribucin y, salvo cuando el tamao de muestra n sea muy pequeo, se debe resumir

    para que el lector pueda comprender bien los resultados.

    Un primer y obligado paso de ese resumen de datos es el simple recuento de las repeticiones

    de un mismo valor o modalidad; ello nos conduce al concepto fundamental de frecuencia, con dos

    enfoques:

    - Frecuencia absolutaes el nmero de veces que una modalidad o un valor de una variable aparece

    entre los datos de una muestra; si en una muestra de la variable nivel de estudios aparecen 148

    personas con nivel de estudios superiores, diremos que 148 es la frecuencia absoluta de la

    modalidad superiores. Naturalmente, el nmero total de datos es n y, por tanto, la suma de las

    frecuencias absolutas de todas las modalidades o valores debe ser igual al tamao muestral n.

    - Frecuencia relativa de una modalidad o valor de una variable es su frecuencia absoluta dividida

    entre el tamao muestral, es decir, la proporcin de veces que aparece esa modalidad o valor entre

    todos los datos de la muestra; si la frecuencia absoluta 148 del ejemplo anterior corresponde a una

    muestra de 2000 personas, diremos que la frecuencia relativa de la modalidad AB es 148/2000 =

    0.074. Es claro que la suma de las frecuencias relativas de todas las modalidades o valores debe ser 1,

    ya que las absolutas suman n y estamos dividiendo entre n. Es muy habitual expresar las frecuenciasrelativas como porcentajes (multiplicndolas por cien) y entonces la frecuencia relativa del ejemplo

    sera 7.4 % y la condicin de la suma sera que deben sumar 100 %, lo que se entiende mejor (la

    frecuencia relativa es la parte del total de datos que corresponde a cada valor o modalidad).

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    6/33

    MCII JJSA Pgina 6de 33

    Las frecuencias absolutas y relativas son aplicables a cualquier tipo de variable, y de ah su

    importancia; adems, pese a su simplicidad, dan lugar a conceptos muy importantes, como el de

    proporcin, y son la base sobre la que se construye cualquier resumen de los datos. Usando como

    ejemplo el grupo sanguneo en una muestra de doscientas personas, la tabla siguiente sirve para

    resumir lo que, si no, sera una tediosa lista de doscientos grupos sanguneos:

    Grupo sanguneo de una muestra de 200 personas.

    Modalidades Frecuencia absoluta Frecuencia relativa (%)

    O 85 0.425 (42.5%)

    A 53 0.265 (26.5%)

    B 48 0.240 (24.0%)

    AB 14 0.070 ( 7.0%)

    Totales 200 1.000 (100%)

    Una tabla como esta se denomina distribucin de frecuencias, y puede incluir tambin las

    llamadas frecuencias acumulativas, que son la suma de las frecuencias del valor o modalidad que se

    considere y de todos los anteriores; puede haber frecuencias acumulativas absolutas o relativas, y en

    todo caso slo tienen sentido con variables cuantitativas o cualitativas ordinales, ya que hay que

    poder fijar cuales son los valores o modalidades anteriores. As, por ejemplo, las frecuencias

    acumulativas no son definibles en el ejemplo del grupo sanguneo, que es una variable cualitativa

    pura. Veamos un ejemplo donde s lo son, de una variable cuantitativa discreta.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    7/33

    MCII JJSA Pgina 7de 33

    En este segundo ejemplo, cuya tabla se encuentra a continuacin, el nmero n de datos es 500

    y la variable toma seis valores distintos (0,1,2,3,4 y 5) en la muestra. No se deben confundir los

    valores de la variable, que son el nmero de visitas (ninguna, una, dos, etc.) de cada persona a la

    biblioteca en ese mes, con las frecuencias absolutas, que son el nmero de personas cuyo nmero de

    visitas es uno determinado: que 210 sea la frecuencia absoluta del valor 0 quiere decir que de entre

    las 500 personas consideradas en el estudio 210 no han ido ninguna vez a la biblioteca en ese mes, es

    decir, que el valor de la variable es "cero" para ellas; esta frecuencia absoluta 210 supone el 42% de

    500, por lo que 0.42 42% es la frecuencia relativa del valor 0 de la variable.

    Visitas mensuales a una biblioteca de una muestra de 500 usuarios inscritos

    Valores Frec. absoluta Frec. relativaFrec. absol.

    acumulativa

    Frec.

    relat.acumulativa

    0 210 42.0% 210 42.0%

    1 178 35.6% 388 77.6%

    2 68 13.6% 456 91.2%

    3 24 4.8% 480 96.0%

    4 14 2.8% 494 98.8%

    5 6 1.2% 500 100.0%

    Totales 500 100%

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    8/33

    MCII JJSA Pgina 8de 33

    Por lo que se refiere a las frecuencias acumuladas o acumulativas (es lo mismo), y usando

    como ejemplo las que se recogen en la tabla, podemos observar que las frecuencias acumuladas del

    primer valor coinciden con las 210 y 42% ya comentadas para ese valor, lo que es lgico porque no

    hay ningn valor anterior con cuyas frecuencias sumarlas; a partir del segundo rengln s tenemos

    acumulacin (388=210+178 y 77.6% = 42.0% + 35.6%), para el tercer valor se suman tres sumandos y

    as sucesivamente. Ntese que las ltimas frecuencias acumuladas tienen que coincidir con el nmero

    de datos vlidos total (en este ejemplo 500) y con el 100%, ya que se han sumado todas las

    frecuencias absolutas y relativas, respectivamente.

    En el caso de las variables continuas, el nmero de valores distintos que puede tomar la

    variable es infinito, tericamente, y en la prctica puede ser bastante grande: pinsese que si

    medimos, por ejemplo, la estatura en centmetros de una muestra de personas adultas podemos

    tener fcilmente sesenta o setenta valores distintos. Esto provoca que a menudo las tablas tuvieran

    que ser muy extensas, con muchsimos renglones, lo que las hara intiles por incomprensibles. Para

    evitarlo, se hacen agrupaciones de varios valores ( por ejemplo, las estaturas 160, 161, 162, 163 y 164

    se pueden agrupar en el intervalo 160-164); de esta forma, se pueden encontrar tablas construdas

    agrupando los valores en intervalos cuando hay muchos valores entre el mnimo y el mximo; el

    concepto importante es entonces el de marca de clase o valor medio del intervalo, que es, por

    ejemplo, 162 en el caso citado del intervalo 160-164. Adems, es muy conveniente que los intervalos

    tengan todos la misma longitud.

    En las tablas as, con clases, las frecuencias se dan para cada intervalo, pero no para cada valor

    de la variable; podemos saber, por ejemplo, que en una muestra hay 32 personas que miden entre

    160 y 164 cm., pero no cuntas de ellas miden en particular 163 cm.; hay, por tanto, una prdida deinformacin con respecto a lo que sera una tabla detallada.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    9/33

    MCII JJSA Pgina 9de 33

    Por esta razn, y gracias a los avances de la Informtica que permiten almacenar muchos

    valores y trabajar con ellos rpidamente, las tablas con intervalos ya no se usan, como hasta hace

    pocos aos, para realizar clculos sobre la variable, sino que su utilidad queda reducida a la mejor

    comprensin de las tablas y a la elaboracin de grficos. Todo ello significa que las ganancias en

    comprensin al hacer intervalos se corresponden necesariamente con prdidas de informacin (se

    pierde el detalle) y por ello para los cmputos numricos se usan los datos originales de uno en uno,

    mientras que para tablas y grficas es frecuente usar intervalos.

    4. GRAFICAS ESTADISTICAS

    Las distribuciones de frecuencias se presentan en tablas como las anteriores, o bien en

    grficas. La representacin grfica se utiliza para facilitar al lector la comprensin de los resultados,

    pero no aade ninguna informacin sobre la que contendra una tabla de frecuencias; el objetivo de

    las grficas es que la informacin impacte directamente al lector y que se exprese el perfil de la

    distribucin, pero no debe olvidarse el rigor en aras de la esttica: las grficas deben reflejar

    fielmente lo que tratan de representar, fundamentalmente las frecuencias de cada modalidad o valor.

    Por ello la regla fundamental para la construccin de una grfica es que:

    Las reas (o longitudes) han de ser proporcionales a las frecuencias,

    condicin inexcusable para que una grfica sea correcta.

    Adems, con carcter general puede recomendarse que el pie de la grfica expliqueconvenientemente de qu se trata, que no se intente representar demasiada informacin en una sola

    grfica, que los detalles sean lo suficientemente visibles, etc.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    10/33

    MCII JJSA Pgina 10de 33

    Existen diversos tipos de grficas, cada uno de ellos adecuado a un cierto tipo de variables, por

    lo que podemos clasificar las grficas atendiendo a estos tipos.

    As, para caracteres o variables CUALITATIVAS se pueden mencionar:

    - El diagrama de barras o rectngulos, consistente en asociar a cada modalidad de la variable

    un rectngulo cuya superficie refleje su frecuencia: las modalidades se suelen situar en

    horizontal y la escala de frecuencias absolutas o relativas en vertical. Si las bases de los

    rectngulos se dibujan todas iguales, par cumplir la regla fundamental antes citada basta

    tomar como alturas de los rectngulos directamente las frecuencias, sin mayor complicacin

    (el rectngulo de una modalidad con frecuencia 7 tendr altura 7 y as con todas). Los

    rectngulos suelen representarse separados en este tipo de grficas, que tambin pueden

    aparecer con las barras horizontales y las modalidades situadas verticalmente.

    - El diagrama de sectores, que refleja como sectores de un crculo las frecuencias de cada

    modalidad. Como el radio es constante en un crculo, para cumplir la regla fundamental de

    proporcionalidad basta hacer al ngulo de cada sector proporcional a la frecuencia, lo que se

    consigue multiplicando los 360 del crculo por la frecuencia relativa de cada modalidad. Este

    tipo de grficas es muy til para comparar los resultados de una variable cualitativa en dos o

    ms muestras.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    11/33

    MCII JJSA Pgina 11de 33

    Hay otras grficas menos frecuentes pero igualmente vlidas para variables cualitativas; cabe

    citar los pictogramas, en los que se representa una misma figura para cada modalidad pero con

    tamao proporcional a las frecuencias (pictograma por extensin) o una misma figura repetida

    tantas veces como sea necesario para reflejar la frecuencia de cada modalidad (pictograma por

    repeticin), los cartogramas, en los que se representa cada modalidad sobre puntos o regiones de

    un mapa, o los diagramas de superficie, en los que se divide una figura geomtrica, generalmente

    un rectngulo, en trozos proporcionales a las frecuencias.

    Por su parte, para variables CUANTITATIVAS los tipos de grficas ms importantes son los

    siguientes:

    - Para variables discretas, el diagrama de segmentos. Las variables discretas toman valores

    aislados, como puntos sueltos, en la recta de los nmeros; sta suele representarse

    horizontalmente con los valores negativos a la izquierda del cero y los positivos a la derecha;

    por esos puntos sueltos, la grfica adecuada para las variables discretas es el diagrama de

    segmentos, en el que sobre cada valor de la variable se coloca verticalmente un segmento que

    tiene una longitud proporcional a su frecuencia; as se consigue que la abscisa (horizontal)

    refleje los valores y que la ordenada (vertical) exprese las frecuencias de la variable. Es lo

    mismo usar para ello frecuencias absolutas o relativas, ya que las dos clases de frecuencias son

    a su vez proporcionales por la propia definicin de frecuencia relativa; por ello podemos hacer

    el diagrama con frecuencias absolutas o relativas, a voluntad. Junto con el diagrama de

    segmentos, puede dibujarse una lnea quebrada que una los extremos superiores de los

    segmentos, que se llama polgono de frecuencias; a veces este polgono (que

    matemticamente no es tal, sino una poligonal) se representa slo, como si se hubieranborrado los segmentos verticales. El polgono de frecuencias tambin puede usarse junto con:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    12/33

    MCII JJSA Pgina 12de 33

    - El histograma o histograma de rectngulos, que es la grfica adecuada para representar

    variables cuantitativas continuas. Estas variables cubren tericamente con sus valores a la

    recta de los nmeros reales, o al menos de un cierto intervalo, de manera que infinitamente

    junto a un valor se encontrara otro y no se producen saltos entre ellos. En la prctica, esto

    se traduce en que casi siempre se maneja un gran nmero de valores distintos y ello hace poco

    adecuado para estas variables un diagrama de segmentos; por ello, y para respetar la

    continuidad de la variable, lo que se hace es agrupar los valores en intervalos y grficamente

    se representan rectngulos yuxtapuestos cuyas bases descansan sobre la horizontal y cuyas

    alturas son tales que el rea de cada rectngulo sea proporcional a la frecuencia de cada

    intervalo. A veces estos histogramas son llamados errneamente diagramas de barras.

    5. PARAMETROS DE UNA DISTRIBUCION

    Se trata de resumir ms la informacin de una tabla o de una grfica, y de encontrar algunos

    valores lo ms simples posible que nos permitan dar informacin sobre la muestra o comparar dos

    muestras entre s. Para hacer ese resumen o informacin de los datos hay tres enfoques

    fundamentales:

    - En primer lugar, dar un valor lo ms representativo posible de todos los valores de la muestra, que

    no sea, por tanto, ni de los ms bajos ni de los ms altos. As se crean las medidas parmetros de

    centralizacin, tendencia central o posicin central.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    13/33

    MCII JJSA Pgina 13de 33

    - En segundo lugar, y como complemento a lo anterior, dar una valoracin de hasta qu punto los

    datos se parecen entre s o bien estn muy diferenciados (dispersos); adems, cuanto ms se

    parezcan entre s los valores que nos salen, ms se parecern al representante o parmetro de

    centralizacin que elijamos, y mejor sera ste. Por todo esto conviene medir las diferencias

    internas de los datos mediante las medidas parmetros de dispersin.

    - Finalmente, en tercer lugar, se puede tambin tratar de medir qu valor supera a una cierta

    porcin o proporcin de valores, o lo que es lo mismo, tratar de informar sobre la distribucin de

    la variable diciendo a cuntos de sus valores supera uno dado. Para ello se usan los cuantiles como

    medidas parmetros de posicin.

    Definiremos a continuacin los ms importantes entre todos los parmetros de estos tres tipos y para

    ilustrar su clculo usaremos el ejemplo siguiente, donde los datos son el nmero de hermanos

    (excluido l mismo) de una muestra de 13 nios; presentamos los datos ordenados de menor a mayor

    para mejor comprensin, pero en principio los datos nos vendran en cualquier orden. Supongamos

    que son los siguientes:

    0 0 0 0 1 1 1 2 2 3 4 5 7

    Vamos a definir ahora las medidas ms importantes:

    Primer grupo: PARAMETROS DE CENTRALIZACION.

    Entre los parmetros de centralizacin, tambin llamados de tendencia central o de posicin

    central, tres son las definiciones destacables:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    14/33

    MCII JJSA Pgina 14de 33

    La MODA: es el valor de la variable que tiene mayor frecuencia en la muestra, es decir, el que

    se repite ms (moda se asocia con lo ms frecuente). En nuestro ejemplo es el valor 0, que tiene una

    frecuencia absoluta de cuatro, que es la ms grande. La moda puede definirse para cualquier tipo de

    variables. Tambin se puede hablar de moda local o secundaria, que sera cualquier valor ms

    frecuente que sus adyacentes, es decir, con ms frecuencia que la que tengan el anterior y el

    posterior, lo que requiere al menos orden en los datos; no hay ninguna moda secundaria en nuestro

    ejemplo.

    La MEDIANA: es el valor que est en el centro de la distribucin, es decir, el valor que supera a

    la mitad de los de la muestra y se ve superado por la otra mitad (salvo empates en ambos casos); se

    calcula buscando el valor de la muestra que ocupa el lugar (n+1)/2, con los datos ordenados. En

    nuestro ejemplo es el valor 1, que corresponde al sptimo lugar (que deja seis por debajo y seis por

    encima). La mediana no puede definirse para variables cualitativas puras, sino slo para ordinales y

    cuantitativas, ya que necesita un orden en los datos.

    La MEDIA MEDIA ARITMETICA: es el centro de gravedad de la distribucin, o fiel de la

    balanza entre todos los datos. Se calcula sumando los datos y dividiendo entre el tamao de la

    muestra, esto es, entre el nmero de datos. En nuestro ejemplo, la suma de los datos es 26 y el

    nmero de ellos 13, de forma que la media vale 26/13 = 2.00 ; por su propia naturaleza, la media slo

    es definible para variables cuantitativas, ya que si no hay nmeros no se puede sumar. Es la ms

    importante de las medidas de centralizacin y en general de todos los parmetros estadsticos y al ser

    centro de gravedad tiene la propiedad de que si hallamos las diferencias de cada dato con ella

    (llamadas desviaciones), la suma de estas diferencias o desviaciones es SIEMPRE CERO para cualquier

    distribucin de cualquier variable, lo que resulta clave para la definicin de las medidas de dispersin.En nuestro ejemplo, con media de 2, las desviaciones (que se obtienen restando cada dato menos la

    media) son:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    15/33

    MCII JJSA Pgina 15de 33

    -2 -2 -2 -2 -1 -1 -1 0 0 +1 +2 + 3 +5

    que como puede calcularse suman cero (las negativas, que proceden de datos inferiores a la media,

    suman 11, y las positivas, que proceden de datos superiores a la media, suman +11, de modo que

    todas suman 0).

    Existen otras medidas de centralizacin de uso menos frecuente, como la media ponderada

    (que es una media aritmtica con distintos pesos de importancia para los distintos datos), la media

    geomtrica (raz ensima del producto de los datos) o la media armnica (la inversa de la media

    aritmtica de los inversos de los datos).

    Segundo grupo: PARAMETROS DE DISPERSION.

    Por su parte, las medidas de dispersin se basan en la idea de medir las diferencias entre unos

    datos y otros midiendo las diferencias de cada dato con la media, esto es, usando las desviaciones; sin

    embargo, como stas siempre suman cero, es preciso considerar su valor absoluto o su cuadrado para

    que ello no ocurra (seran ya todas positivas). Las ms importantes medidas de dispersin son las

    siguientes:

    La DESVIACION ABSOLUTA MEDIA: es la media aritmtica de los valores absolutos de las

    desviaciones, por lo que se calcula tomando como positivas todas las desviaciones, sumndolas y

    dividiendo entre n; en nuestro ejemplo la suma de los valores absolutos (no confundir con frecuencias

    absolutas, que no tiene nada que ver) sale 22 y por tanto la desviacin absoluta media vale 22/13 =1.69 ; el tener que usar valores absolutos complica los desarrollos matemticos con este parmetro y

    por eso se usa poco, pese a su valor intuitivo. Es mucho ms importante:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    16/33

    MCII JJSA Pgina 16de 33

    La VARIANZA: es la media aritmtica de los cuadrados de las desviaciones, por lo que se

    calcula elevando al cuadrado cada desviacin, sumando esos cuadrados y dividiendo entre n; en

    nuestro ejemplo resulta 58 la suma de cuadrados de las desviaciones, con lo que la varianza es 58/13

    = 4.46 ; el cuadrado es matemticamente mucho ms manejable que el valor absoluto, lo que hace de

    la varianza la reina de los parmetros de dispersin desde un punto de vista terico. Sin embargo, el

    hecho de que carezca de interpretacin intuitiva y que sus unidades sean cuadradas (hermanos

    cuadrados?) hace que es la prctica se use mucho ms su raz cuadrada, la DESVIACION STANDARDo

    DESVIACION TIPICA, con mucho la ms usada de las medidas de dispersin, y que en nuestro ejemplo

    valdra 2.11, con lo que el informe ms habitual para nuestros datos dara una media de 2.00 y la

    desviacin tpica de 2.11 como parmetros ms informativos. Por motivos difciles de explicar aqu,

    relacionados con cuestiones de inferencia estadstica, es ms recomendable usar el denominador n-1

    en lugar del n al calcular la varianza y la desviacin tpica de una muestra, quedndose el n para el

    caso en que se conoce toda la poblacin; en nuestro ejemplo, pues, sera mejor calcular como

    varianza 58/12 = 4.83 y como desviacin standard su raz cuadrada 2.20 (estos ltimos seran la

    varianza muestral o quasivarianza y la desviacin tpica muestral y seran los utilizados en la prctica,

    aunque la definicin terica sea con denominador n por ser la varianza una "media"). A efectos

    comparativos entre distintas muestras e incluso entre distintas variables, se define:

    El COEFICIENTE DE VARIACION, que es el cociente, a menudo expresado en tanto por ciento,

    entre la desviacin tpica y la media de una distribucin. Es una especie de desviacin tpica relativa,

    y en nuestro ejemplo valdra 2.2011/2.00 = 1.100055 bien 11005.05% (ntese que no es un

    verdadero porcentaje, porque puede valer ms del 100%); este resultado indicara mucha dispersin

    en los datos del ejemplo en relacin con la media.

    Adems de las citadas, la ms simple de las medidas de dispersin es el RANGO, RECORRIDO

    AMPLITUD, que es la diferencia entre el valor mximo y el mnimo de la muestra, y que indica qu

    extensin de la recta de los nmeros ocupan los datos de nuestra muestra.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    17/33

    MCII JJSA Pgina 17de 33

    Tercer grupo: CUANTILESO PARAMETROS DE POSICION

    Los cuantiles completan el cuadro de los parmetros de una distribucin. En cierto modo

    pueden ser considerados como medidas de centralizacin (de hecho la mediana es uno de ellos) y

    tambin como medidas de dispersin (algunas pueden construirse a partir de ellos) pero en realidad

    son medidas de posicin. Se define el cuantil p como aquel valor de la variable (que puede estar o no

    en la muestra) que supera al p% de los datos de la muestra; resultan tiles slo cuando la muestra es

    numerosa y permiten saber en que posicin se encuentra un valor dado con respecto al conjunto de

    una muestra o poblacin. Se definen entre los ms importantes:

    Los CUARTILES, que definen las cuartas partes de la muestra mediante tres cortes: el primer

    cuartil deja por debajo al 25% de la distribucin, el segundo coincide con la mediana y el tercero deja

    por debajo al 75% de la distribucin. No tienen mucho sentido en muestras pequeas, pero en

    nuestro ejemplo valdran respectivamente 0, 1 y 3.5 (que estn situados en las posiciones tercera y

    media, sptima y dcima y media de los datos ordenados).

    Los DECILES, que dan nueve cortes para definir de diez en diez por ciento los valores de la

    distribucin; as, el primer decil deja por debajo una dcima parte de la distribucin, el segundo dos

    dcimas partes, etc., hasta nueve deciles.

    Los PERCENTILES, que son como los deciles pero de uno en uno por ciento, y por tanto son

    noventa y nueve; por ejemplo, el percentil 37 deja por debajo al 37% de la distribucin, y est claro

    que no tienen sentido en muestras tan pequeas como la de nuestro ejemplo, ya que trece

    elementos no se pueden partir en cien partes.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    18/33

    MCII JJSA Pgina 18de 33

    Todos los cuantiles son definibles sobre variables cuantitativas o sobre cualitativas ordinales,

    porque requieren siempre que los datos estn ordenados.

    Los cuantiles ms prximos al percentil 50, como la propia mediana o los cercanos a ella,

    pueden considerarse como parmetros de centralizacin y sin embargo los ms lejanos al centro

    ayudan a medir la dispersin; por ejemplo, si restamos el tercer cuartil menos el primero obtenemos

    el RANGO INTERCUARTLICO, que es una medida de dispersin. Con el rango intercuartlico estamos

    midiendo la extensin que nos cubre la mitad central de nuestros datos; recurdese que el RANGO

    era la extensin cubierta por toda la muestra ordenada (se define como mximo menos mnimo),

    mientras que el RANGO INTERCUARTILICO es la extensin cubierta por la mitad central de los datos

    ordenados, excluyendo la cuarta parte inicial (los que son inferiores al primer cuartil) y la cuarta parte

    final (los que son superiores al tercer cuartil).

    ESTADISTICA DESCRIPTIVA

    La estadsticase ocupa de recopilar datos, organizarlos en tablas y grficos y analizarlos con un

    determinado objetivo.

    La estadstica puede ser descriptiva o inferencial. La estadstica descriptiva tabula, representa y

    describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La

    estadstica inferencial infiere propiedades de gran nmero de datos recogidos de una muestra

    tomada de la poblacin.

    Nosotros slo estudiaremos la estadstica descriptiva. En ella debemos tener en cuenta las siguientesetapas:

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    19/33

    MCII JJSA Pgina 19de 33

    a) Recoleccin de datos

    b) Organizacin de datos

    (1)Tabulacin

    (2)Graficacin

    c) Anlisis y medicin de datos

    a)

    Recoleccin de datos

    Para esta etapa tomaremos los siguientes conceptos bsicos:

    Poblacin: conjunto de observaciones efectuadas

    Individuo: cada elemento de la poblacin.

    Atributo: caracterstica investigada en la observacin. Estos pueden ser cualitativos (sexo, religin,

    nacionalidad) o cuantitativos (estatura, peso, rea estos son continuos, se miden en nmeros

    reales-; nmero de hijos, nmero de golesdiscretos, se miden en nmeros enteros-)

    Por ejemplo: si se desea realizar un estudio estadstico de las estaturas de los alumnos de tercer ao,

    Poblacin: conjunto de estaturas

    Individuo: cada estatura

    Atributo: la estatura

    Teniendo presente la clasificacin, clasifica los siguientes atributos

    1. Afiliacin poltica de los habitantes de la Capital de Chile.

    2. Cantidad de ganado vacuno en las provincias de la Ro Bueno y La Unin.

    3. Religin de los padres de familia de la comunidad educativa Santa Cruz.

    4. Ingresos de los obreros.

    5. Cantidad de alumnos de las diferentes carreras de la Facultad de Ciencias Exacta en la U.L.A.

    6. Sexo de los alumnos de una escuela.

    7. Estado civil de los habitantes de la ciudad de Ro Bueno.8. Cantidad de pelculas nacionales estrenadas durante un ao.

    9. Color de cabellos de los alumnos de un curso.

    10.Puntaje obtenido por los alumnos que ingresan a la carrera de Medicina.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    20/33

    MCII JJSA Pgina 20de 33

    b) Organizacin de los datos

    (1) Tabulacin: puede ser a travs de una serie simple, con la presentacin de los datos recogidos en

    forma de tabla ordenada, o a travs de la agrupacin de datos, este mtodo se utiliza cuando el

    nmero de observaciones es muy grande.

    Ejemplo: En un curso de 40 alumnos, se desea estudiar el comportamiento de la variable estatura,registrndose los siguientes valores:1,52 1,64 1,54 1,64 1,73 1,55 1,56 1,57 1,58 1,581,59 1,53 1,60 1,60 1,61 1,61 1,65 1,63 1,79 1,631,62 1,60 1,64 1,54 1,65 1,62 1,66 1,76 1,70 1,691,71 1,72 1,72 1,55 1,73 1,73 1,75 1,67 1,78 1,63

    i. Serie simple: Completa los cuadros siguientes, ordenando los datos obtenidos.

    Alumno Talla Alumno Talla Alumno Talla Alumno Talla1 1,52 11 21 31

    2 1,53 12 22 32

    3 1,54 13 23 334 1,54 14 24 34

    5 1,55 15 25 35

    6 1,55 16 26 367 1,56 17 27 37

    8 1,57 18 28 389 1,58 19 29 39

    10 1,58 20 30 40

    ii. Agrupacin de datos por serie o distribucin de frecuencias: se registra la frecuencia de cada valor

    de la variable. La frecuencia puede ser absoluta (f), nmero que indica la cantidad de veces que la

    variable toma un cierto valor, relativa (fr), cociente entre la frecuencia absoluta de cada valor de la

    variable y el nmero total de observaciones; relativa porcentual que es el porcentaje de la fr;

    frecuencia Acumulada la suma de la fi y la acumulada porcentual, que el la suma de fr% .

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    21/33

    MCII JJSA Pgina 21de 33

    Volviendo al ejemplo anterior, completa la tabla de serie de frecuencias.x (tallas) Absoluta

    fiRelativafr = f/n

    R. Porcentual(100.fr) %

    AcumuladaFa

    Ac. PorcentualFa %

    1,52 1 1/40 = 0,025 2,5 % 1 2,5%1,53 1 1/40 = 0,025 2,5% 2 5%1,54 2 2/40 = 0,05 5% 4 10%

    1,551,56

    1,571,58

    1,59

    1,601,61

    1,621,63

    1,64

    1,651,66

    1,67

    1,681,69

    1,701,71

    1,721,731,74

    1,75

    1,761,77

    1,781,79

    A cunto es igual el total de la columna de frecuencias absolutas? Por qu?

    ................................................................................................................................... A cunto es igual el total de la columna de frecuencias relativas? Por qu?................................................................................................................................... Y el total de la columna de porcentajes?...................................................................................................................................

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    22/33

    MCII JJSA Pgina 22de 33

    Agrupacin de datos por intervalos de clase: intervalos iguales en los que se divide el nmero

    total de observaciones. Es conveniente utilizar los intervalos de clase cuando se tiene un gran nmero

    de datos de una variable continua.

    Cmo saber cuntos intervalos considerar? Cmo determinar su amplitud?

    Primero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el

    menor de los valores obtenidos.

    Rango = xmxxmn

    Calcula el rango de los datos de nuestro ejemplo.

    ....................................................................................................................................

    Luego debemos establecer el nmero de intervalos (N) y determinar la amplitud (A) de los mismos.

    A = rango / N (N tu lo eliges, pero es conveniente que no sea muy pequeo)

    Si queremos trabajar con 10 intervalos, cul es, para nuestro caso, la amplitud de cada uno de

    ellos? De ser necesario, podemos aproximar el valor hallado

    ......................................................................................................................................

    Siendo el primer intervalo [1,52 ; 1.55) completa la tabla con todos los restantes. Observa que el

    extremo izquierdo del intervalo se usa un corchete * , lo que indica que tomamos este valor, en

    cambio en el derecho usamos ) que nos indica que el intervalo es abierto, o sea, no se toma este

    valor. La Marca de clasees el promedio aritmtico de los extremos del intervalo.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    23/33

    MCII JJSA Pgina 23de 33

    Tallas Marca de clase

    (MC)

    fi fr fr% Fa Fa%

    [1,52 ; 1.55) 1,535[1,55 ; 1,58) 1,565

    [1,58 ; 1,61) 1,595

    Totales

    Investiga sobre el nmero de hermanos de cada alumno de tu curso y dispone los datos obtenidosen una serie o distribucin de frecuencias.

    Estas son las notas obtenidas por los 100 candidatos que se presentaron a un concurso:38 51 32 65 25 28 34 12 29 4371 62 50 37 8 24 19 47 81 5316 62 50 37 4 17 75 94 6 25

    55 38 46 16 72 64 61 33 59 2113 92 37 43 58 52 88 27 74 6663 28 36 19 56 84 38 6 42 5098 51 62 3 17 43 47 54 58 2612 42 34 68 77 45 60 31 72 2318 22 70 34 5 59 20 68 55 4933 52 14 40 38 54 50 11 41 76

    Presenta dichos datos en una tabla de intervalos de clase.

    En una cierta ciudad de la provincia de Valdivia, se registra el nmero de nacimientos ocurridos

    por semana durante las 52 semanas del ao, siendo los siguientes los datos obtenidos:

    6 4 2 8 18 16 10 6 7 5 12 8 912 17 11 9 16 19 18 18 16 14 12 7 103 11 7 12 5 9 11 15 9 4 1 6 117 8 10 15 3 2 13 9 11 17 13 12 8

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    24/33

    MCII JJSA Pgina 24de 33

    Confecciona una tabla de intervalos de clase.

    Las edades de veinte chicos son 12, 13, 14, 10, 11, 12, 11, 13, 14, 12, 10, 12, 11, 13, 12, 11, 13, 12,

    10 y15. Organiza los datos en una tabla de frecuencias.

    Qu porcentaje de chicos tienen 12 aos?

    Cuntos chicos tienen menos de 14 aos?

    En cada da del mes de enero, en el camping Igl hubo la siguiente cantidad de turistas: 12, 14, 17,

    16, 19, 15, 15, 21, 24, 26, 28, 24, 25, 26, 20, 21, 34, 35, 33, 32, 34, 38, 40, 43, 41, 45, 50, 53, 58.

    Construye una tabla de frecuencias para estos datos.

    (3) Grficos: la recopilacin de datos y la tabulacin pueden traducirse grficamente mediante

    representaciones convenientemente elegidas: barras, sectores circulares, mapas curvas, etc.

    Los grficos permiten visualizar e interpretar el fenmeno que se estudia, en forma ms clara.

    Las barrasse utilizan generalmente para representar atributos cualitativos o cuantitativos discreto. La

    longitud es igual a la frecuencia de cada observacin. Pueden ser barras simples o mltiples, segn se

    trate de representar uno o ms atributos.

    Las barras pueden ser horizontales o verticales.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    25/33

    MCII JJSA Pgina 25de 33

    Grfico de barras compuesto: Remuneraciones medias (ao Z)

    Los grficos circulares o grficos de tortason tiles para comparar datos pues, en general, trabajan

    con porcentuales. El rea de cada sector representa el porcentaje que corresponde a la frecuencia de

    0

    100

    200

    300

    400

    500

    600

    Enero Febrero Marzo

    Industrial

    Bancario

    Adm. Pblica

    Educativo

    Comercio

    0 20 40 60

    Grf. de barras: Evaluacin del gobierno X

    neutra

    negativa

    positiva

    positiva

    negativa

    neutra

    positiva

    negativa

    neutra

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    26/33

    MCII JJSA Pgina 26de 33

    un cierto valor de la variable. Esta representacin es conveniente cuando el nmero de sectores es

    pequeo y sus reas estn bien diferenciadas.

    Evaluacin del gobierno X

    El histogramase utiliza para representar una tabla de frecuencias de intervalos de clase.

    Sobre el eje horizontal se representan los intervalos de clase y sobre el eje vertical, las frecuencias de

    los intervalos.

    El grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un intervalo de

    clase y cuya altura representa la frecuencia del intervalo.

    El polgono de frecuenciasse construye uniendo los puntos medios de los lados opuestos de las bases

    de cada rectngulo. Si se quiere cerrar el rectngulo, se agregan dos intervalos: uno anterior y otro

    posterior al ltimo y se prolonga el polgono hasta los puntos medios de estos intervalos.

    Las curvasse utilizan generalmente para representar la variacin de una variable a travs del tiempo

    (aos, meses, horas, etc.). Sobre el eje horizontal figuran los perodos de tiempo.

    0

    200

    400600

    800

    1000

    1200

    1400

    1600

    1800

    1965

    1966

    1967

    1968

    1969

    importacin

    de la

    Argentina

    exportacin

    de laArgentina

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    27/33

    MCII JJSA Pgina 27de 33

    Variacin del valor de las importaciones y exportaciones de la Argentina en millones de

    dlares

    Estas son slo algunas de las formas posibles de graficacin y las que encontrars con ms frecuencia.

    Construye el histograma y el polgono de frecuencias para la tabla del ejercicio de intervalos declase, de la pgina 3, de las tallas...

    c) Anlisis y medicin de datos

    Para describir un conjunto de datos, se calculan algunas medidas que resumen la informacin y quepermiten realizar comparaciones.

    Medidas de posicin: se utilizan para encontrar un valor que represente a todos los datos. Las msimportantes son: la media aritmtica, la moday la mediana.

    La media aritmtica o promedio ( x ) de varios nmeros se calcula como el cociente entre lasuma de todos esos nmeros y la cantidad de nmeros que sumamos .

    La moda(Mo)es el valor que ms se repite.Puede suceder que haya ms de una moda o ninguna(si todos los valores tienen igual frecuencia).

    La mediana (Me)es el valor que ocupa el lugar central al ordenar los datos de menor a mayor. Sila cantidad de datos es par, la mediana es el promedio entre los dos valores centrales.

    Los sueldos de cinco empleados de una empresa son: $ 400000, $500000, $450000, $600000 y$3500000. Calcula el sueldo medio, la moda, si es que existe, y la mediana e indica cul representamejor a los datos.

    El entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la prximacompetencia de estilo libre. Segn los tiempos en segundos que obtuvieron los postulantes de lascinco ltimas carreras de 100 m de estilo libre, qu nadador le conviene elegir?

    Diego 61,7 61,7 62,3 62,9 63,1Toms 61,5 62,9 62,9 63,7 63,7

    Sergio 60,7 62,4 62,7 62,7 63,2

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    28/33

    MCII JJSA Pgina 28de 33

    Para poder decidir, calcula las medidas de posicin de cada uno.

    promedio moda mediana

    Diego 62,34 61,7 62,3

    TomsSergio

    En promedio, los nadadores ms rpidos son ................................ y ................................., pero esto no

    significa que hayan tenido el mismo rendimiento; por eso necesitamos las otras medidas de posicin:

    de ellos dos, tanto la moda como la mediana indican que ................................ fue ms veloz. Sin

    embargo, para elegir el nadador adecuado, no basta con considerar las medidas de posicin, ya que

    tambin es necesario que su rendimiento sea parejo, es decir, que los tiempos de sus 100 m libres no

    tengan mucha dispersin.

    Medidas de dispersin: nos informan cmo estn distribuidos los datos. La ms importante es el

    desviacin estndar (

    ), que mide la dispersin de los datos con respecto al promedio. Cuanto menor

    es el desvo estndar, menos dispersos estn los datos con respecto al promedio.

    Para calcular el desvo estndar, seguimos los siguientes pasos:

    Calculamos la diferencia entre cada uno y el promedio.

    Elevamos al cuadrado cada una de las diferencias anteriores.

    Sumamos todos los valores hallados en el paso anterior y dividimos el resultado por la cantidad de

    datos. As obtenemos la varianza.

    Calculamos el desviacin estndar (

    )como la raz cuadrada de la varianza.

    n

    xxn

    i

    i

    1

    2

    n: nmero de datos

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    29/33

    MCII JJSA Pgina 29de 33

    Diego y Sergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo promedio y sin

    embargo sus tiempos estn distribuidos de manera diferente.

    Calcula los desvos estndares de los tiempos de los nadadores:

    Tiempos de Diego

    xi (xix) (xix)2

    61,7 -0,6461,7 -0,64

    62,3 -0,04

    62,9 0,56

    63,1 0,76total

    Entonces:

    Podemos ver que el desvo estndar de ................................... es menor que el de

    ................................., lo cual indica que el promedio representa mejor los datos de

    ................................., porque sus tiempos fueron menos dispersos.

    Entonces, aunque cinco datos son muy pocos para hacer estadstica, si con esa informacin hay que

    elegir un nadador de ese equipo para la prxima competencia, conviene que sea

    .......................................

    5Diego

    Sergio

    Tiempos de Sergio

    xi (xix) (xix)2

    total

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    30/33

    MCII JJSA Pgina 30de 33

    CALCULOS DE ESTADIGRAFOS EN DATOS TABULADOS

    Si los datos estn agrupados ya sea en tablas de frecuencias simples o en intervalos de clase, debemos

    utilizar un criterio diferente para calcular los distintos estadgrafos. Analicemos el siguiente ejemplo:

    Consideremos la siguiente distribucin de frecuencias que corresponden a los puntajes de 50

    alumnos en una prueba.

    Intervalos M.C.(x)

    fi fx Fa

    [6065) 62,5 5 312.5 5[6570) 67,5 5 337.5 10

    [7075) 72,5 8 580 18[7580) 77,5 12 930 30 Intervalo mediano

    [8085) 82,5 16 1320 46 Intervalo modal[8590) 87,5 4 350 50

    TOTALES 50 3830

    La Media Aritmtica:

    f

    xfx

    6.7650

    3830x ptos. 77 ptos.

    Para calcular La Mediananecesitamos la siguiente frmula:

    i

    a

    f

    AFn

    LMe

    2

    Donde: L es el lmite inferior del intervalo mediano.

    Faes la frecuencia acumulada hasta antes del

    intervalo mediano.

    fi es la frecuencia absoluta del intervalo mediano.

    A es la Amplitud del intervalo.

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    31/33

    MCII JJSA Pgina 31de 33

    en el ejemplo, la cantidad de datos es 50, luego 50 : 2 = 25, y la Fa 25 se encuentra en el intervalo [7580) ya que el 25 esta aqu, en cambio en la anterior (18) no esta. Luego el intervalo mediano es [75

    80)Entonces: L = 75 (lmite inferior)

    fi= 8A = 5 (8075 = 5)

    Fa= 18 (frecuencia acumulada del intervalo anterior)

    375.79375.4758

    5775

    8

    5182

    50

    75

    Me 79 ptos.

    y finalmente, para calcular la Moda en datos agrupados, utilizamos la siguiente frmula, teniendopresente que la clase modales la que tiene mayor frecuencia, y esta es la Frecuencia Modal.

    Add

    dLMo

    21

    1

    L = 80 (intervalo modal [8085), ya que la frecuencia es 16, que es la mayor)d1= 1612 = 4 (diferencia con la frecuencia anterior)

    d2= 164 = 12 (diferencia con la frecuencia siguiente)A = 5

    Luego, 25,8116

    20805

    124

    480

    Mo puntos. 81 puntos.

    Se estima que el valor ms repetido de los puntajes de esta prueba fue el 81.

    L: Lmite real inferior de la clase modal.

    d1: es la diferencia entre la frecuencia modal y la frecuencia anterior.

    d2: es la diferencia entre la frecuencia modal y la frecuencia siguiente.

    A: amplitud del intervalo

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    32/33

    MCII JJSA Pgina 32de 33

    Ejercicios

    1) Los siguientes datos numricos corresponden a la cantidad de veces que cada alumno de un grupo

    ha ido a un recital o concierto.

    243211630324693216

    Calcula, sin tabular, Media, moda, mediana, desviacin, n, rango.

    2) En un diagnostico de educacin fsica se pidi a los alumnos de los cuartos medios que hicieran

    abdominales durante 3 minutos. Se obtuvieron los siguientes resultados:

    4 A: 45 38 43 29 34 60 54 27 32 33 23 34 34 28 56 62 56 57 45 47 48 54

    33 45 44 41 34 36 34 54

    4 B: 43 45 44 38 34 46 43 42 43 45 57 44 38 38 37 43 61 38 37 45 28 42

    41 49 40 37 34 44 41 43

    cul de los dos cursos tiene el rendimiento ms parejo? qu distribucin estadstico permite

    comparar la distribucin de este tipo de datos?

    3) A continuacin se presentan los resultados de ambos cursos en la prueba de diagnstico de salto

    largo.

    4 A : 3.2 3.5 4.9 5.0 3.1 4.1 2.9 2.8 3.8 4.5 4.3 4.5 4.1 5.8 3.9 3.6 4.2 4.6 1.92.8 2.9 3.3 3.9 4.2 4.1 4.3 4.6 4.4 3.8 3.6

    4 B : 3.5 2.9 1.3 1.7 3.6 5.6 2.8 5.2 5.3 4.1 4.1 4.4 1.6 5.1 4.3 5.0 5.3 3.2 2.8

    2.6 5.5 5.4 4.8 4.9 4.3 2.9 3.9 5.4 5.3 4.2

  • 7/25/2019 NOTAS DE APOYO TADA03 2016.pdf

    33/33

    a) Calcula el promedio de ambos cursos.

    b) Construye una tabla de frecuencias para cada curso

    c) Cul de los dos cursos tuvo un rendimiento mas parejo?

    4) Se han medido 75 alumnos, en centmetros, obtenindose los siguientes datos:

    175 156 172 159 161 185 186 192 179 163 164 170 164 167 168 174 172 168 176 166

    167 169 182 170 169 167 170 162 172 171 174 171 155 171 171 170 157 170 173 173

    174 168 166 172 172 158 159 163 163 168 174 175 150 154 175 160 175 177 178 180

    169 165 180 166 184 183 174 173 162 185 189 169 173 171 173

    Agrupa estos resultados en 8 intervalos y confecciona una tabla de frecuencias y calcula las medidas

    de tendencia central y de dispersin. Adems, grafica esta tabla.

    5) A los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos han sido:

    87 105 88 103 114 125 108 107 118 114 129 100 106 113 105 111 94 115 89 82

    141 92 132 112 97 135 101 104 130 99 114 91 145 95 101 115 104 87 108 115

    103 132 110 113 102 109 124 98 140 107 93 108 122 117 114 141 116 108 102 101

    118 138 99 105 112 94 96 132 118 123 108 131 127 100 91

    Agrupa los datos en intervalos de amplitud 8. y haz lo mismo que en problema anterior.