felipe sepúlveda lópez biólogo marino estadística biología marina 200 3 estadística...

Post on 02-Feb-2016

225 Views

Category:

Documents

5 Downloads

Preview:

Click to see full reader

TRANSCRIPT

Felipe Sepúlveda LópezBiólogo Marino

Estadística Biología Marina 2003

Estadística (Bioestadística)

Estadística (Bioestadística)

fsl001@ucn.cl

Sobre mi…Sobre mi…

• No soy un estadístico.»Tesis 2002 en…»Magíster en Cs. del Mar…

• El énfasis del curso esta en la práctica de la herramienta estadística y no en los teoremas y demostraciones.

Estadística Biología Marina 2003

¿Porque deberíamos saber ¿Porque deberíamos saber “algo” de estadistica?“algo” de estadistica?

• Es necesario aprender las propiedades de la estadística, para utilizarla en diseños experimentales y análisis de datos.

• Como biólogos debemos desarrollar nuestra habilidad para discriminar argumentos científicos (o pseudo-científicos).

Estadística Biología Marina 2003

Que es lo que espero de Uds.Que es lo que espero de Uds.

• ATENCIÓN en la clases y Ayudantías

• Retroalimentación hacia mi con respecto a lo que les gusta y no les gusta del curso.

(criticas constructivas)

Estadística Biología Marina 2003

Objetivos del CursoObjetivos del Curso

• Entender los principales fundamentos de la estadística descriptiva e inferencial.

• Entender los principios generales sobre los cuales están basados los test estadísticos más comunes utilizados en biología.

Estadística Biología Marina 2003

• Conocer los principales supuestos (pre-requisitos), de los test más comunes y entender el impacto de sus violaciones.

• Ser capaz de desarrollar variados análisis estadísticos utilizando las herramientas de Excel y SYSTAT.

Estadística Biología Marina 2003

Clases y AyudantíaClases y Ayudantía• Cátedra:

» Lunes 14:00 - 15:30 (Sala 12).» Martes 14:00 – 15:30 (Sala 10).

• Ayudantía:1) Miércoles 14:00 – 15:30 (Sala 1).

2) Miércoles 9:55 – 11:25 (Sala 1).

Laboratorio de Computación

Lunes – 14 – Abril Miércoles - 16 – Abril

Lunes – 12 – Mayo Miércoles 14 – Mayo

Lunes – 9 – Junio Miércoles 11 – Junio

Lunes – 14 – Julio Miércoles 16 – Julio

EvaluaciónEvaluación

Estadística Biología Marina 2003

1° prueba = 30% 13 – Mayo – 2003

2° prueba = 30% 1 – Julio – 2003

Seminario = 40% 8 – Julio – 2003

TextosTextos

Estadística Biología Marina 2003

• Guía del curso estadística de biología marina. UCN, 2003.

• Zar, J.H. 2000. Biostatistical Analysis (4th edition), Prentice-Hall, Upper saddle River, New Jersey.

• Spiegel, M.R. 1991. Estadística. McGrawHill.

• STEEL, R.G.D. and TORRIE, 1980, J.H. Principles and procedures of statistics: a biometrical approach. 2.ed. New York : McGraw-Hill,. 631p.

• Sokal, R.L. & F.J. Rohlf. 1995. Biometry (3rd edition), W.H. Freman & Co., New York, or

Preparación de clases.Preparación de clases.

• Leer el capítulo apropiado desde los textos mencionados y traer las preguntas clases.

• Si tienen alguna pregunta…¡Preguntar inmediatamente!. No existen las preguntas estupidas.

• Para las ayudantías, se debe manejar los contenidos para practicar con ejercicios.

Estadística Biología Marina 2003

• Siempre venir a clases y ayudantías con:

– Guía de clases, con tablas

– CALCULADORA

Estadística Biología Marina 2003

• Por favor no sean participantes pasivos de la clase.

• Por favor no sean participantes pasivos de la clase.

• Y si quedan dudas….» Lunes 10:00 – 11:30.

» Martes 10:00 – 11.30.

¿Qué es la Estadística?¿Qué es la Estadística?

• Estadísticas (plural): Datos recogidos de forma sistemática para obtener información sobre un tema (demográfico, social, económico, biológico, etc..)

Ejemplo: Captura de Anchovetas, goles del último clásico.

• Estadística (singular): Disciplina que comprende técnicas de recolección, presentación, análisis e interpretación. Permite poner a prueba de hipótesis y tomar decisiones en base a la teoría de probabilidades.

• Bio-Estadística: aplicación de herramientas de estadística en el área biológica

Estadística Biología Marina 2003

Algunas utilidades de la Algunas utilidades de la EstadísticaEstadística

Descripción Diseño Test de hipótesis

Provee de resúmenes de datos.Ayuda a descubrir patrones o tendencias.Evalúa la magnitud y dirección de los efectos experimentales.

Ayuda al diseño de experimentos y estudios de campo.

Permite tomar decisiones a priori sobre la utilidad de algún experimento.

Evalúa hipótesis biológicas a través de tests, para verificar si los patrones observados son consistentes con las predicciones.

Tipos de estadística (función):Tipos de estadística (función):

• Descriptiva:Analiza una población sin pretender sacar conclusiones generales (conclusiones validas para dicha población)

Ordenamiento y descripción de un conjunto de datos

Estadística Biología Marina 2003

• Inferencial:Tiene como propósito inducir leyes de comportamiento de una población a partir de muestras.

A partir de una muestra se obtienen conclusiones de toda la población

Usos de la estadística: Usos de la estadística: Descripción & Síntesis.Descripción & Síntesis.

• Generar un resumen de los datos.

• Ayuda a descubrir tendencias (inducción) a través de la examinación de resúmenes de patrones estadísticos

Para tener en cuenta: En un resumen estadístico mucha información se pierde. Por lo tanto, ¡SIEMPRE se debe conservar los datos crudos!

Estadística Biología Marina 2003

Usos de la estadística: Inferencial.Usos de la estadística: Inferencial.

• ¿Las diferencias observadas son “reales” o simplemente provocadas por accidente?

• Para responder esta pregunta, necesitamos conocer la probabilidad de que los resultados observados se deban efectivamente a un accidente o coincidencia?

• Los test estadísticos nos permiten calcular esta probabilidad y elaborar conclusiones

Estadística Biología Marina 2003

Usos de la estadística: Diseño Usos de la estadística: Diseño experimental.experimental.

• Focalización del esfuerzo

• Decidir a priori sobre la utilidad de un experimento

Estadística Biología Marina 2003

“Llamar a un estadístico después de que el experimento esta terminado, quizás no va a servir mas que para pedirle que realice una autopsia; seguramente el va a estar capacitado para decir de que murió el experimento”

Sir Ronald Fisher

Toma de muestras o “muestreo”Toma de muestras o “muestreo”

• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)

• Unidad: Miembro individual de la población.

• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.

• Variable: Característica de una unidad, que es medida en todas la unidades de la muestra.

Estadística Biología Marina 2003

Estadística Biología Marina 200

3

Población Muestra Variable

Mujeres y hombres chilenos, entre 16 a 26 años.

100 hombres y mujeres jóvenes

de todas las capitales

regionales de Chile.

Nivel de nicotina medida en una

muestra sanguínea.

x

Población

muestra

Lo que la estadística puede y no Lo que la estadística puede y no puede hacer:puede hacer:

Estadística Biología Marina 2003

Puede NO Puede

•Proveer de criterios objetivos para evaluar hipótesis.•Ayuda a optimizar esfuerzos•Ayuda a evaluar críticamente argumentos

•Decir la verdad absoluta (solo una verdad probabilística)•Ayudar a un diseño pobre•Indicar significancia biológica: La significancia estadística no significa signifcancia biológica (vice versa)

Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.• Datos en Escala Proporcional:

Existe un tamaño de intervalos constante, entre unidades adyacentes.

Existe un punto “0” que presenta significado físico.Ej: tamaños, conteos, pesos, volúmenes….

Estadística Biología Marina 2003

• Datos en Escala de Intervalos:Poseen un tamaño de intervalos constante, entre unidades

adyacentes.No tienen un punto “0” con valor físico.

Ej: temperatura en °C o °F.

Kelvin [K] Kelvin [K]0 absoluto tiene importancia física

Variables circulares

Estadística Biología Marina 200

3

Tipos de Variables (datos) Biológicas.Tipos de Variables (datos) Biológicas.

• Datos en Escala Ordinal (“orden”):Existe una diferencia relativa entre las magnitudes de

nuestras variables.

Ej: Tamaño celular 1,2 o 3; Color mas oscuro, mas claro, intermedio….

• Datos en Escala Nominal:– La variable se identifica por una cualidad “atributo” de esta.

Ej: Fenotipos como color de ojos, cabello. Machos o Hembras.

Datos Continuos y DiscretosDatos Continuos y Discretos

• Continuas: Permiten cualquier valor entre un determinado rango de mediciones observadas.Ej.: Altura de 35-36cm, entre ellas puede estar 35.2 o 35.1888 o 35.18878456….

• Discretas: Variables que pueden tomar solo valores enteros.Ej: Número de ostiones, personas.

Estadística Biología Marina 2003

Exactitud (accuracy):Exactitud (accuracy):

• ¿Qué tan cerca se encuentra nuestro valor observado del valor real?:

Estadística Biología Marina 2003

yx

observadoesperado

Modelos propuestos:

a) Y es una función lineal de X.

b) Y es una función no lineal de X.

Modelo mas exacto

Modelo menos exacto b es el modelo mas exacto:

Los valores observados están, en promedio, mas cerca de los observados

Precisión:Precisión:• ¿Qué tan cerca se encuentra, una de otra

medición, realizadas sobre una misma variable?– Se encuentra altamente influenciada por la

experiencia y rigurosidad de quien realiza la medición.

Estadística Biología Marina 2003

-5.56cm

-5.60cm

-5.58cm

-5.286cm

-5.749cm

-5.582cm

Precisión v/s Exactitud:Precisión v/s Exactitud:

Pobre

Buena

PobreBuena

Precisión

Exactitud

Tipos de Escalas de Datos:Tipos de Escalas de Datos:

• Escala Proporcional

• Escala Intervalos

• Escala Ordinal

• Escala Nominal

–Datos Continuos

–Datos Discretos

Estadística Biología Marina 2003

Estadística Biología Marina 200

3

Figuras Significativas y Figuras Significativas y Redondeo de Datos:Redondeo de Datos:

• Los dígitos de un número que denotan la exactitud la medición = Fig. Significativa.

Ejemplos:

7 cm = 1

7.04 cm = 3

7.14 cm = 3

7.90 cm = ?

Estadística Biología Marina 2003

21.00 parásitos = ?

321 parásitos = ?

44 parásitos = ?

Estadística Biología Marina 200

3

255

25.5

2.55

0.255

0.0255

2.55 x 102

2.55 x 101

2.55

2.55 x 10-1

2.55 x 10-2

Todos tienen3 cifras

significativas

Todos tienen3 cifras

significativas

En notación científica

Más Casos: Más Casos:

Rangos Implicados:Rangos Implicados:

Estadística Biología Marina 2003

•El largo del ala de una mariposa es de 5.4 cm.

“Esta medición implica una exactitud de 0.1cm”

•Por convención, teóricamente el largo del ala

de la mariposa está entre : 5.35 – 5.455.35 – 5.45

Rango implicado a nuestra exactitud

Otros ejemplos:Otros ejemplos:

Estadística Biología Marina 2003

Valor RangoFiguras

SignificativasExactitu

d

8 7.5 - 8.5 1 1

8.3 8.25 – 8.35 2 0.1

8.328.315 – 8.325

3 0.01

Aproximaciones y Redondeo:Aproximaciones y Redondeo:

78.3 = 79145.6 = 146

Estadística Biología Marina 2003

Pero: 56.5 ?

Si el ultimo digito anterior es par … aproximar hacia abajo

Si el último digito anterior es impar … aproximar hacia arriba

48.5 = 48

57.5 = 58

Distribuciones de Frecuencias:Distribuciones de Frecuencias:

• Tablas de frecuencias: Clasificación, ordenamiento y resumen de una gran cantidad de información.

• Consiste simplemente en:– Una lista de los valores observados en la

variable bajo estudio.– Cuantas veces este valor se repite.

Estadística Biología Marina 2003

Ubicación de nidos de gorriones:Ubicación de nidos de gorriones:

UbicaciónNúmero de

nidos observados

a- Canaletas 56

b- Balcones 60

c- Cavidades de Construcciones

46

d- Ramas de Árboles

49 a b c d

0

10

20

30

40

50

60

Ubicación de Nidos

Estadística Biología Marina 2003

Tabla de FrecuenciasTabla de FrecuenciasDistribución de Distribución de FrecuenciasFrecuencias

Confección de tabla:Confección de tabla:

¿Como construimos una tabla de frecuencias cuando nuestros datos

no son nominales?

¿Como construimos una tabla de frecuencias cuando nuestros datos

no son nominales?

Estadística Biología Marina 2003

Para empezar determinar:

Rango de datos

Número de clases

Amplitud de intervalo de clases

Determinar rango clase

Rango de datosRango de datos

• Distancia entre el dato máximo y mínimo

Estadística Biología Marina 2003

mínmáx XXR mínmáx XXR

Consumo de proteínas de 20 Consumo de proteínas de 20 ostiones de laboratorio.ostiones de laboratorio.

21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22

Rango = 35-16 = 19

Número de ClasesNúmero de Clases

• Número de categorías o intervalos en el que se va a dividir la información

Estadística Biología Marina 2003

Se puede determinar arbitrariamente en base a la variación de nuestros datos.

Generalmente varía entre 5 a 20 categorías

Se puede determinar arbitrariamente en base a la variación de nuestros datos.

Generalmente varía entre 5 a 20 categorías

En este ejemplo se utilizarán 5 clases.En este ejemplo se utilizarán 5 clases.

Amplitud de intervaloAmplitud de intervalo

• Cantidad de datos que están comprendidos en un intervalo de clase.

Estadística Biología Marina 2003

clasesdeNúmero

RangoIntervAmpl ..

Del ejemplo: 19/5 = 3.8 ≈ 4

Solo se aproxima si los datos son discretos o enteros

Rango de claseRango de clase

• Significa hallar los límites inferiores y superiores de cada intervalo– Para ello al dato menor se le suma la

amplitud del intervalo (4 en este caso).

– La marca de clase corresponde al valor medio ubicado en cada rango de clase.

Estadística Biología Marina 2003

21 25 35 22 1824 21 23 16 2327 17 26 19 2920 19 20 23 22

Rango de clase Marca clase

16 19 17.516, 17, 18 y 19 = 4

Amplitud de intervalo

Marca de clase

¿Cómo queda el resto de la

tabla?

Debería quedar así:Debería quedar así:

Rango de clase Marca clase

16 19 17.5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Frecuencia AbsolutaFrecuencia Absoluta• Es el número de veces que se repiten los

valores dentro de los diferentes intervalos en que se ha dividido la información

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frecuencia Absoluta

16 19 17.5 5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Frecuencia RelativaFrecuencia Relativa• Es el valor que resulta al dividir cada una de las

frecuencias absolutas entre el total de frecuencias o datos y multiplicarlas por 100 para que sean expresadas en porcentaje

Estadística Biología Marina 2003

Rango de clase

Marca clase Frec. Abs. Frecuencia Relativa

16 19 17.5 5 25

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Frecuencia Absoluta AcumuladaFrecuencia Absoluta Acumulada

• Se obtiene sumando y acumulando los valores absolutos clase por clase en orden ascendente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

16 19 17.5 5 25 5

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

Frecuencia Relativa AcumuladaFrecuencia Relativa Acumulada

• Se obtiene sumando y acumulando los valores relativos clase por clase en orden ascendente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5

24 27 25.5

28 31 29.5

32 35 33.5

¿Cómo queda el resto de la tabla?

Estadística Biología Marina 200

3

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

Debería quedar así:Debería quedar así:

Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus

Representación gráfica de tablas Representación gráfica de tablas de frecuenciade frecuencia

• Histograma:– Se obtienen al graficar las

marcas de clase (abscisa) versus la frecuencia (ordenada).

Estadística Biología Marina 2003

0

2

4

6

8

10

17.5 21.5 25.5 29.5 33.5Proteinas consumidas

Fre

cu

en

cia

Polígono de FrecuenciasPolígono de Frecuencias

• Se produce fácilmente al conectar con una línea las marcas de clases adyacentes.

Estadística Biología Marina 2003

0

2

4

6

8

10

17.5 21.5 25.5 29.5 33.5Proteinas consumidas

Fre

cue

nci

a

OjivasOjivas• Se obtienen al graficar las frecuencias

acumuladas absolutas o relativas

Estadística Biología Marina 2003

0

20

40

60

80

100

120

17.5 21.5 25.5 29.5 33.5

Proteinas consumidas

Fre

cue

nci

a

Tipos de distribuciones de Tipos de distribuciones de frecuenciafrecuencia

• En función de la forma:

Estadística Biología Marina 2003

En función de la dispersiónEn función de la dispersión

Estadística Biología Marina 2003

Medidas Descriptivas NuméricasMedidas Descriptivas Numéricas

Estadística Biología Marina 2003

““A través de este tipo de estimaciones es posible A través de este tipo de estimaciones es posible hacer generalizaciones del todo a partir de una parte hacer generalizaciones del todo a partir de una parte del todo”del todo”

Conceptos para tener en cuenta:

• Población

• Muestra

• Muestras aleatorias

• Parámetros

• Estadísticos

• Población o Universo: Corresponde a todo el grupo de cosas animales o personas sobre las que queremos obtener información. (esta definida en base a nuestros requerimientos)

• Muestra: Porción de la población sobre la que tomamos información para obtener conclusiones sobre la población.

Estadística Biología Marina 2003

Muestra aleatoriaMuestra aleatoria• Requisito clave:

““Cada miembro de la población debe Cada miembro de la población debe tener una opción igual e independiente tener una opción igual e independiente

de ser elegido”de ser elegido”

Estadística Biología Marina 2003

Asignar número a miembros de la población

Tablas de Números Aleatorios

Pero: En la mayoría de los casos no es posible asignar número aleatorios.

Es necesario tener en cuenta consideraciones biológicas mas que matemáticas.

De esta manera:De esta manera:

• Una muestra tomada aleatoriamente, debe representar a la población.

• Si la muestra es representativa de mi población, entonces podemos “inferir cosas” de la población, con cierto nivel de seguridad y exactitud.

Estadística Biología Marina 2003

Parámetros y EstadísticosParámetros y Estadísticos

• Toda medición o estimación que este caracterizando y describiendo a nuestra población es llamada PARAMETRO.

Raramente es posible calcular parámetros

¿Porque?¿Porque?

Estadística Biología Marina 2003

SoluciónSolución

• Realizar estimaciones de un parámetro poblacional mediante:

ESTADISTICOSESTADISTICOS

Estadística Biología Marina 2003

Todo buen estadístico debe ser:

Insesgado

Consistente

Eficiente

Medidas de Tendencia Central:Medidas de Tendencia Central:

• Representa a la suma de las observaciones divididas por el número de observaciones

Estadística Biología Marina 2003

La MediaLa Media

N

XiX

ni

i

1

N

XiX

ni

i

1

Ejemplo:

52.540.860.058.052.5

62.240.849.252.540.8

= 50.9

• Con datos agrupados se calcula por:

Estadística Biología Marina 2003

921.52320

425.52724

129.53128

133.53532

5

Frec. Abs.

fi

17.5

Marca clase Xi

1916

Rango de

clase

N = 20

= 22.3 grs= 22.3 grs

ni

i

ni

i

fi

fiXiX

1

1

Marca Clase

Frecuencia Absoluta

Comentarios acerca de la media.Comentarios acerca de la media.

• La media es un número ÚNICO

• La media de la muestra ( ), es un buen estimador de

• Es un estadístico poco “resistente”, ya que es fuertemente influenciado por los valores extremos

Estadística Biología Marina 2003

X

Me La MedianaLa Mediana

• Es el valor medio. • Esto es el punto medio de las observaciones cuando estas han

sido ordenas en orden ascendente

Impares ParesMe= X(n+1)/2 Me=(Xn/2 + Xn/2+1)/2

11,13,15,16,17 11,13,15,16,17, 20

Estadística Biología Marina 2003

Me = 15 Me = 15.5

• Con datos agrupados se calcula por:

Me = Límite inferior +0.5n – frec. acum.

ant.x Ancho intervalo

del intervaloNro. Obs en

Intervalo

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulada

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

1.- Calculamos la posición: Me = X(n+1)/2 = X(20+1)/2 = X10.5

2.- Aplicamos la fórmula: Me = (20)+ ((0.5x20)-5)/9 x 4 = 22.2

La ModaLa Moda

• La moda el valor mas frecuente.• Es decir, el valor que más se repite dentro de las

observaciones realizadas.

Estadística Biología Marina 2003

Ejemplo: Datos del coeficiente intelectual de un grupo de alumnos: 100, 95, 105, 110, 100.

Entonces la moda es 100

• Para datos ordenados en una tabla de frecuencia:

• La moda corresponde a la marca de clase más frecuente

Estadística Biología Marina 2003

Rango de clase

Marca clase

Frec. Abs.

Frec. Rel.

Frec.Abs. Acumulad

a

Frec.Rel. Acumulada

16 19 17.5 5 25 5 25

20 23 21.5 9 45 14 70

24 27 25.5 4 20 18 90

28 31 29.5 1 5 19 95

32 35 33.5 1 5 20 100

La Mediana y la Moda no son La Mediana y la Moda no son afectadas por valores extremos.afectadas por valores extremos.

Alemania 59

España 84

Inglaterra 78

Italia 41

Japón 47

Noruega 78

Nueva Zelanda 102

EEUU 61

Somalia 748

Analicemos el siguiente ejemplo:

Tasa de mortalidad infantil en diferentes países (muertes anuales/ 10000 habitantes)

Media = 144 muertes/10000

Mediana = 78 muertes/10000

Moda = 78 muertes/10000

Relaciones entre medidas de Relaciones entre medidas de tendencia centraltendencia central

Estadística Biología Marina 2003

• Ahora que podemos describir nuestra población a partir de una medida central.

• ¿Qué mas sería interesante conocer y estimar?

Estadística Biología Marina 2003

Analicemos la siguiente figura:

Las MEDIAS y las MEDIANAS son iguales.

Pero las DISTRIBUCIONES son diferentes

Medidas de Dispersión o Medidas de Dispersión o VariabilidadVariabilidad

• Adicionalmente a la medición de tendencia central, es recomendable tener una medición de la dispersión de los datos.

– De esta manera es posible tener una idea de cuan esparcidos se encuentran las mediciones en torno al centro de la distribución

Estadística Biología Marina 2003

Existen variados estadísticos de Existen variados estadísticos de dispersión, los más utilizados dispersión, los más utilizados son:son:

• El Rango

• Suma de la desviaciones de la media al cuadrado (SS).

• Varianza (S)

• Desviación estándar (DE ó S2)

• Coeficiente de variación (CV)

• Los Cuantíles

Estadística Biología Marina 2003

El RangoEl Rango

• Corresponde a la diferencia entre el dato mayor y el dato menor.

Estadística Biología Marina 2003

Rango = Xmax – Xmin

S SSuma de las desviaciones de la Suma de las desviaciones de la

media al cuadradomedia al cuadrado

• Este valor entrega una idea de cuán lejos se encuentran los datos con respecto a la media.

• Su compresión es clave para entender el significado de cada una de las demás medidas de dispersión que existen

Estadística Biología Marina 2003

2)( XXiSS

Reflexione con las siguientes preguntas

• ¿Porqué se emplean desviaciones de la media al cuadrado?

• ¿Qué indica una SS grande?• ¿Qué indica una SS pequeño?• ¿Qué indica una SS igual a 0?

•Calcule la media y SS para el peso (grs) del músculo abductor de las siguientes almejas: 7.4, 8.1, 6.3, 8.6, 7.9, 6.9

Media = 7.5 SS = 3.08

Estadística Biología Marina 2003

S2VarianzaVarianza

• Corresponde a la media de la suma de cuadrados (por eso es llamada media cuadrática)

Estadística Biología Marina 2003

N

Xi

22 )(

1

)( 22

n

XXiS

Población

Muestra

¿Cuál es la diferencia entre una y otra?

• La varianza de una muestra esta dividida por n-1 (llamado “grados de libertad” o GL),

• Esto permite una estimación no segada y más conservadora ya que no sobreestima el valor de σ2 que presenta un N desconocido

Estadística Biología Marina 2003

SDesviación EstándarDesviación Estándar

• Simplemente es estimada a través la raíz cuadrada de la varianza.

• Tener en cuenta que este valor tiene las mismas unidades que las mediciones originales.

Estadística Biología Marina 2003

2SS Calcular S2 y S a partir delos datos anteriores

Calcular S2 y S a partir delos datos anteriores

C VCoeficiente de VariaciónCoeficiente de Variación

• Es el cuociente de la desviación estándar y la media aritmética, expresado en porcentaje.

Estadística Biología Marina 2003

100X

DSCV

• La desviación estándar y la varianza tienen magnitudes que son dependientes de los datos.

El Coeficiente de variación NO

Ratones Elefantes

Media 0.78 cm 78.0 cm

DS 0.26 cm 26.0 cm

Estadística Biología Marina 2003

CV 33.3% 33.3%

• El coeficiente de variación expresa la variabilidad de la muestra relativa a la media de la muestra

Tamaño de las orejas de elefantes y ratones

En que especie varia más el

tamaño de orejas

Medidas de posición. Cuantíles

• Son estadísticos que dividen una distribución de frecuencias en cuatro, diez o cien partes iguales

• La mediana es el valor que se encuentra en la mitad de nuestra distribución (es decir es el 50avo percentil),

Estadística Biología Marina 2003

Otros cuantíles son:Cuartíles (4), Quintiles (5),

Decíles (10), Percentíles (100)

• Los cuartíles son estadísticos que dividen en cuatro partes iguales nuestra información, donde cada parte incluye el 25% de las observaciones

Estadística Biología Marina 2003

1er cuartíl

2do cuartíl

3er cuartíl

25% 25% 25% 25%

Mediana

Rango Intercuartílico

• Con la siguiente formula es posible calcular cualquier percentil, determinado la posición de la variable en un set de datos

Estadística Biología Marina 2003

100)1(

pX n

Percentil

buscado

5 5 7 8 9 9 910

12

1414

1517

1825

30

31

6472

88 8990

92

98

Ranking 4

5 6 7 8 9 1011

1213

1415

16

17

1819

20 2122

23

24

Ejemplo:

Calcular la media ± DS 34.6 34.1

¿Son estos los mejores estadísticos para este caso?

• Mediana = ?

Estadística Biología Marina 2003

5 5 7 8 9 9 910

12

1414

1517

1825

30

31

6472

88 8990

92

98

Ranking 4

5 6 7 8 9 1011

1213

1415

16

17

1819

20 2122

23

24

Veamos con el Rango intercuartílico

En posición 12.5.

Valor = 16

• Rango intercuartílico

Primer cuartíl (25avo percentil)

Tercer cuartíl (75avo percentil)

100)1(

pX n

(24 + 1) x 0.25 = 6.25 (24 + 1) x 0.75 = 18.75

X6 y X7 = 9 entonces:

Valor = 9

X18= 64 y X19=72

entonces (72-64)x0.75 = 6

Valor = 64+6 = 70

Percentiles en tablas Percentiles en tablas de frecuenciade frecuencia

• Se procede de la misma forma con la que se calculó la mediana.

• Pero ahora no estamos interesados en 50avo de nuestra distribución.

• Debemos encontrar las posiciones 25avo y 75avo.

Estadística Biología Marina 2003

Cálculo de rangointercuartílico

Volvamos al ejemplo de los ostiones

Consumo de proteínas (grs.) de 20 ostiones Argopecten purpuratus

Estadística Biología Marina 2003

Rango de

clase

Marca de

clase

Frecuencia

Absoluta

Frec. absoluta

acumulada

16 19 17.5 5 5

20 23 21.5 9 14

24 27 25.5 4 18

28 31 29.5 1 19

32 35 33.5 1 20

Per.25 = Límite inferior +0.25n – frec. acum.

ant.x Ancho intervalo

del intervalo Nro. Obs en Intervalo

Per.75 = Límite inferior +0.75n – frec. acum.

ant.x Ancho intervalo

del intervalo Nro. Obs en Intervalo

Q1 (percentil 25): (20+1) (0.25)= 5.25

Q3 (percentil 75): (20+1) (0.75)= 15.75

= 20

= 25

Tener PresenteTener Presente• Si los datos no se distribuyen en forma

normal, no se debe usar la DS y la Media como únicos y exclusivos estimadores.

• Para ello existen dos alternativas.• Usar la mediana y el rango intercuartílico• Mejor todavía, usar los “cinco estimadores“

Estadística Biología Marina 2003

Mínimo 1°cuartil Mediana 3°cuartil máximo

• Una manera de presentar los 5 estimadores son los gráficos de caja o “BOX PLOT”

Estadística Biología Marina 2003

0 10 20 30 40 50 60 70 80 90 100datos

top related