universidad nacional hermilio valdizan facultad de … · 2020. 11. 30. · medidas para describir...

38
BIOESTADÍSTICA Dr. Abner A. Fonseca Livias PROFESOR PRINCIPAL UNIVERSIDAD NACIONAL HERMILIO VALDIZAN FACULTAD DE ENFERMERÍA

Upload: others

Post on 31-Jan-2021

9 views

Category:

Documents


0 download

TRANSCRIPT

  • BIOESTADÍSTICA

    Dr. Abner A. Fonseca Livias

    PROFESOR PRINCIPAL

    UNIVERSIDAD NACIONAL HERMILIO VALDIZAN

    FACULTAD DE ENFERMERÍA

  • MEDIDAS PARA DESCRIBIR

    VARIABLES NUMÉRICAS

    Dr. Abner A. Fonseca Livias

    PROFESOR PRINCIPAL

    UNIVERSIDAD NACIONAL HERMILIO VALDIZAN

    FACULTAD DE ENFERMERÍA

  • MEDIDAS

    • Medidas de tendencia central

    • Medidas de dispersión

    • Medidas de percentiles o posicionamiento

    • Medidas de distribución o de forma

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 3

    1 ESTADISTICA PRIMER PARCIAL.ppt#130. MEDIDAS DE TENDENCIA CENTRAL1 ESTADISTICA PRIMER PARCIAL.ppt#162. DESCRIPCIÓN DE UNA VARIABLE NUMÉRICA1 ESTADISTICA PRIMER PARCIAL.ppt#178. MEDIDAS DE POSICIÓN O CUANTILES1 ESTADISTICA PRIMER PARCIAL.ppt#191. Coeficiente de Asimetría

  • MEDIDAS DE TENDENCIA CENTRAL

    • Media aritmética

    • Mediana

    • Moda

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 4

  • MEDIA ARITMÉTICA

    • Es la que se obtiene sumando los datos y dividiéndolos

    por el número de ellos.

    – Características:

    • No es para distribuciones cualitativas.

    • Esta afectada por todos los valores que asume la

    variable.

    • Si presenta valores extremos bajos o altos, se

    recomienda usar otra medida de tendencia central.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 5

  • MEDIA ARITMÉTICA

    • La fórmula que se emplea depende si se trabaja

    con N o n.

    • La media aritmética es útil con datos no agrupados

    y agrupados.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 6

    1

    N

    i

    i

    x

    N ==

    n

    i

    i

    x

    xn

    =

    Media de la

    poblaciónMedia de la

    Muestra

  • MEDIA ARITMÉTICA PARA DATOS

    NO AGRUPADOS

    • Los datos no agrupados no están en tabla de frecuencia.

    • Ejemplo: El profesor de estadística desea conocer el

    promedio de las siguientes notas:

    3,2 3,1 2,4 4,0 3,5 3,0 3,5 3,8 4,2 4,0

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 7

  • MEDIA ARITMÉTICA PARA DATOS

    AGRUPADOS

    • Es para datos agrupados en tablas, la media aritmética

    es igual a la sumatoria del producto de las clases por

    la frecuencia sobre el número de datos. Se puede

    calcular de la N o n.

    • También se trabaja con marca de clase (Mc) por

    frecuencia y se divide por el número de datos.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 8

  • MEDIA ARITMÉTICA PARA DATOS

    AGRUPADOS EN FRECUENCIA

    Preguntas

    buenas

    Frecuencia

    1 15

    2 13

    3 8

    4 19

    5 21

    6 5

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 9

    Pasos:

    1. Realizar sumatoria del producto de las

    clases por su frecuencia absoluta.

    2. Dividir la sumatoria sobre el número total de datos.

  • MEDIA ARITMÉTICA PARA DATOS

    AGRUPADOS EN MARCA DE CLASE

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 10

    Pasos:

    1. Realizar sumatoria del producto

    de la marca de clase (Mc) por su

    frecuencia absoluta.

  • MEDIA ARITMÉTICA PARA DATOS

    AGRUPADOS EN MARCA DE CLASE

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 11

    2. Dividir la sumatoria sobre el número total de datos.

  • VENTAJAS Y DESVENTAJAS DE LA

    MEDIA

    Ventajas

    • Es la medida de tendencia central más usada.

    • El promedio es estable en el muestreo.

    • Es sensible a cualquier cambio en los datos (puede ser

    usado como un detector de variaciones en los datos).

    • Se emplea a menudo en cálculos estadísticos

    posteriores.

    • Presenta rigor matemático.

    • En la gráfica de frecuencia representa el centro de

    gravedad.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 12

  • VENTAJAS Y DESVENTAJAS DE LA

    MEDIA

    Desventajas

    • Es sensible a los valores extremos.

    • No es recomendable emplearla en distribuciones muy

    asimétricas.

    • Si se emplean variables discretas o cuasi-cualitativas, la

    media aritmética puede no pertenecer al conjunto de

    valores de la variable.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 13

  • CÁLCULO DE MEDIA

    ARITMÉTICA EN EXCEL Y SPSS• Trabajar con la base de datos que se

    tiene.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 14

  • MEDIANA (Me)

    • La mediana divide a la población exactamente en dos

    partes iguales. La cantidad de datos que queda por

    debajo y por arriba de la mediana son iguales.

    Corresponde al percentil 50%.

    Se puede calcular Me para:

    • Datos no agrupados:

    – Impares

    – Pares

    • Datos agrupados

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 15

  • MEDIANA PARA DATOS NO

    AGRUPADOS IMPARES

    Encontrar la mediana para los siguientes datos:

    4 1 2 3 4 2 2 1 5 5 3

    SOLUCIÓN:

    • PASO 1: Ordenar los datos.

    1 1 2 2 2 3 3 4 4 5 5

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 16

  • MEDIANA PARA DATOS NO

    AGRUPADOS IMPARES

    • PASO 2: Localizar el valor que divide en dos partes

    iguales el número de datos.

    • La mediana es 3, dejando 5 datos a cada lado.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 17

  • MEDIANA PARA DATOS NO

    AGRUPADOS PARES

    • Modifiquemos el ejemplo anterior, eliminando el

    último dato. Encontrar la mediana:

    4 1 2 3 4 2 2 1 5 5

    SOLUCIÓN

    • PASO 1: Ordenar los datos.

    1 1 2 2 2 3 4 4 5 5

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 18

  • MEDIANA PARA DATOS NO

    AGRUPADOS PARES

    • PASO 2: Localizar el valor que divide en dos parte

    iguales el número de datos.

    • El punto medio se encuentra entre dos valores: 2 y

    3, por tanto, el valor de la mediana será 2,5.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 19

  • MEDIANA PARA DATOS

    AGRUPADOS• Calcular la mediana a partir de frecuencia

    relativa acumulada (H) en la siguiente

    tabla de frecuencia:

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 20

  • MEDIANA PARA DATOS

    AGRUPADOS• PASO 1: Localizar la frecuencia relativa acumulada

    que contiene la mediana (50%).

    • La Me se encuentra entre las clases 3 y 4.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 21

  • MEDIANA PARA DATOS

    AGRUPADOS• PASO 2: Interpolar los datos para encontrar la Me.

    • Se ordena según la jerarquía de los datos de H

    (mayor a menor) lo cual incluye a las clases, para

    encontrar el punto que divide en 2 partes iguales.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 22

  • MEDIANA PARA DATOS

    AGRUPADOS• La diferencia es 27,1%. Para llegar al 50%, se debe

    incrementar en 4,2% partiendo desde la clase 30.

    45,8%+ 4,2% = 50,0%

    • Con una regla de tres simples se halla el incremento

    en unidades la clase para ese 4,2%.

    10 27,1%

    Incremento 4,2 %

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 23

  • MEDIANA PARA DATOS

    AGRUPADOS• Para llegar al 50% de los datos, a la clase

    30 debemos incrementarle 1,55.

    Me = 31,55

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 24

  • MEDIANA PARA DATOS

    AGRUPADOS• Calcular la mediana a partir de intervalos de clase

    para datos agrupados en la siguiente tabla.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 25

  • MEDIANA PARA DATOS

    AGRUPADOS• PASO 1: Localizar entre qué intervalos de clase se

    encuentra la Me, lo cual está entre el intervalo de clase

    4, para ser más preciso, entre los valores 45,21 y 53,21.

    • Hasta 45,21 hay agrupados el 42,50% de los datos, y

    hasta 53,21 se resume el 60,00% de los datos.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 26

  • MEDIANA PARA DATOS

    AGRUPADOS• PASO 2: Interpolar los datos para encontrar la

    mediana. Se ordena jerárquicamente:

    • Entre los dos límites superiores abarcan un total de

    17,50% de los datos. Se debe aumentar en 7,50%

    los datos desde límite superior del tercer intervalo

    de clase.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 27

  • MEDIANA PARA DATOS

    AGRUPADOSPara incrementar al 50%, se determina la diferencia

    (42,5 + 7,5) y se procede:

    8,00 17,50%

    Incremento 7,50%

    • Para llegar al 50% de los datos, 45,21 se aumenta

    en 3,43 unidades.

    Me = 45,21+ 3,43 Me = 48,6430/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 28

  • MEDIANA PARA DATOS

    AGRUPADOS

    La fórmula para calcular la mediana

    • La mediana parte del límite superior del intervalo

    de clase anterior, la cual simbolizaremos por Lsi-1,

    siendo i igual a 4 (cuarto intervalo de clase). A este

    valor se le suma el incremento para llegar al 50%

    de los datos:

    • Me = Ls i-1 + Incremento

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 29

  • MEDIANA PARA DATOS

    AGRUPADOS• El incremento resulta de multiplicar el incremento para

    llevar la frecuencia al 50% (50% - Hi-1) por el ancho de

    la clase (A) sobre la diferencia porcentual entre los

    límites superiores (Hi – Hi-1):

    • Simplificando aún más la fórmula, recordemos que Hi –

    Hi-1 es lo mismo la frecuencia relativa del intervalo de

    clase i (hi).

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 30

  • MODA

    • Valor que aparece con mayor frecuencia. Una

    distribución unimodal tiene una sola moda y una

    distribución bimodal tiene dos.

    Ejemplo: moda para datos no agrupados

    • Los siguientes 30 datos a personas sobre la marca de

    gaseosa que más consume a la semana:

    Marca 1 Marca 2 Marca 1 Marca 1 Marca 1 Marca 3

    Marca 1 Marca 3 Marca 1 Marca 2 Marca 1 Marca 1

    Marca 2 Marca 1 Marca 3 Marca 3 Marca 2 Marca 1

    Marca 1 Marca 1 Marca 1 Marca 3 Marca 1 Marca 2

    Marca 3 Marca 1 Marca 3 Marca 3 Marca 2 Marca 3

    •30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 31

  • MODA

    SOLUCIÓN

    • PASO 1: Determinar las frecuencias de cada valor

    de la variable.

    La marca 1 se repite 15 veces

    La marca 2 se repite 6 veces

    La marca 3 se repite 9 veces

    • PASO 2: la moda representa el valor que más se

    repite. En este caso es la marca 1.

    Mo = Marca 1

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 32

  • MODA

    • Ejemplo: moda para datos agrupados

    • Calcular la moda a partir de la siguiente

    tabla de frecuencia:

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 33

  • MODA

    SOLUCIÓN

    • Las marcas de clase que más frecuencias

    tienen son 11 y 13, por tanto decimos que

    es un caso donde aparecen dos modas

    (bimodal).

    Mo1 = 11

    Mo2 = 13

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 34

  • MODA

    Calculo de la moda mediante fórmula

    • Algunos autores suelen aplicar una

    fórmula para determinar la moda para

    tablas de frecuencia.

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 35

  • DESCRIPCIÓN DE UNA VARIABLE

    NUMÉRICA

    MEDIDAS DE DISPERSIÓN

    • Desviación Estándar

    • La varianza.

    • Coeficiente de variación

    30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 36

  • DESVIACIÓN ESTÁNDAR (S)

    • Es el promedio de distancias que tienen los datos

    respecto a la media aritmética. Llamada también

    desviación típica.

    • La fórmula para datos no agrupados es:

    Donde:

    • = sumatoria del cuadrado de las desviaciones.

    • n / N = muestra o población30/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 37

    1

    X(

    S 1

    2

    2)

    s −

    ==

    =

    n

    n

    i

    xi

    1

    X(

    1

    2

    2)

    ==

    =

    N

    N

    i

    i

    Para la población

    )X(2

    xi − )X(2

    −i

    Para la muestra

  • DESVIACIÓN ESTÁNDAR (S)

    • Ejemplo:

    • Desviación estándar: 1.9730/11/2020 7:59 a. m. Dr. Abner A. Fonseca L. 38

    X X- (X- )29 3.29 10.807 1.29 1.656 0.29 0.086 0.29 0.085 -0.71 0.514 -1.71 2.943 -2.71 7.37

    Media ( ) 5.71428571 23.43

    1

    X(

    S 1

    2

    )

    =

    =

    n

    n

    i

    xi

    17

    23.40

    S 1

    −=

    =

    n

    i

    9.3S =