BASES ESTADISTICAS PARAEL MUESTREO DE PLAGAS YMODELOS MATEMATICOS
UTILIZADOS EN EPIDEMIOLOGIA
M.C. LUIS EMILIO CASTILLO MARQUEZ
UNIVERSIDAD AUTONOMA CHAPINGODEPARTAMENTO DE PARASITOLOGIA AGRICOLA
AREA DE ESTADISTICA Y APOYO
Debido a la naturaleza de las poblaciones de organismos plaga es necesario recurrir al uso de herramientas estadísticas como el muestreo, con el fin de poder caracterizar
a las poblaciones e
intentar modelar
matemáticamente su comportamiento para realizar predicciones.
El muestreo estadístico
se define como la rama de la estadística que a partir de una fracción de la población (muestra) permite estimar parámetros con el fin de caracterizarla y realizar inferencia.
Aunque hoy en día existen técnicas estadísticas y matemáticas que relacionan un gran numero de variables y permiten realizar análisis mas exhaustivos y complejos de las plagas y enfermedades, es necesario realizar correctamente el proceso de muestreo, ya que la información derivada de este servirá
de base para análisis
sencillos o complejos.
Contar con información de mala calidad lleva a realizar análisis y conclusiones también de mala calidad.
DEFINICIONES BASICAS DE MUESTREO
Población. Conjunto de individuos u objetos con características comunes. La delimitación física de la población la establece el investigador según su interés experimental y su experiencia.
●
El total de hectáreas de cultivo de tomate en el Estado de Morelos.
●
El total de huertas de manzana en Cuauhtemoc, Chihuahua.
●
El total de árboles en una huerta de durazno.
●
Producción.
●
% de daño
●
Numero de mazorcas por planta
●
Numero de granos por vaina
Variable. Una característica de interés experimental inherente a la población, y cuya medición es posible.
Parámetro. Un valor cuantificable que permite describir a una población.
●
Media
●
Mediana
●
Varianza
●
Desviación estándar
Unidad de muestreo.
Área física mínima, sobre la cual se tomará información, y que integrara la muestra según el tamaño que se
haya determinado.
Unidad de muestreo
Unidad de muestreo
Unidad de muestreo
Unidad de muestreo
Unidad de muestreo
Unidad de muestreo
Marco de muestreo. Total de unidades de muestreo en que esta dividida la población. Se representa por N.
Si se tiene como población un total de 1000 árboles y se toma como unidad de muestreo a 1 árbol, entonces el marco de muestreo estará
constituido por 1000 unidades de
muestreo. N=1000
Tamaño de muestra. Numero de unidades de muestreo que integran la muestra. Se representa por n.
Si se decide tomar una muestra de tamaño 130, significa que de las 1000 unidades de muestreo (árboles) se elegirán al azar 130. n=130
Si se tiene como población un total de 1000 árboles y se toma como unidad de muestreo a un conjunto de 10 árboles, entonces el marco de muestreo estará
constituido por 100
unidades de muestreo. N = 100
Si se decide tomar una muestra de tamaño 6, significa que de las 100 unidades de muestreo (conjuntos de 10 árboles) se elegirán al azar 6. n=6
Existen diversos factores que influyen sobre la calidad de los datos colectados en un proceso de muestreo:
●
El tamaño de la unidad de muestreo●
La biología de la plaga
●
La hora y los factores climáticos al momento de la toma de muestra●
La parte de la planta que se examina
Tradicionalmente, en estudios para el manejo de plagas y enfermedades se emplean como unidades de muestreo
cuadros de
terreno (cuadrantes) de dimensiones variadas, transectos (líneas de recorrido con puntos de muestreo) cuando se trata de cultivos hortícolas, o árboles cuando se trata de cultivos frutícolas.
Para cuadrantes
Teóricamente si el área bajo estudio es relativamente homogénea,entre más pequeñas sean las unidades de muestreo los datos derivados de la muestra reflejarán con mayor precisión a las variables de interes. Cuando el área bajo estudio no es homogénea implica que el tamaño de muestra a tomar debe ser grande.
Teóricamente si el área bajo estudio es grande, es necesario tomar unidades de muestreo de gran tamaño, pero entre mas heterogénea sea el área bajo estudio los datos de la muestra no reflejarán el comportamiento real de las variables de interes.
¿Como determinar el tamaño óptimo del cuadrante a utilizar?
Se utiliza la comparación de la
media
y la varianza
de los datos obtenidos en varios cuadrantes de un tamaño determinado
Tamaño de la unidad de muestreo (m2)
Varianza/media
Optimo
Optimo
La longitud de cada segmento de recorrido puede variar de acuerdo al tamaño del área a recorrer y la precisión deseada.
Transecto
Conocer la biología del organismo plaga es de gran ayuda en el muestreo para obtener información de calidad.
La temperatura, la humedad y otras variables climáticas influyen sobre la presencia y ausencia de organismos plaga.
DIFERENTES TIPOS DE METODOS DE MUESTREO ESTADISTICO
●
Muestreo aleatorio simple●
Muestreo cualitativo
●
Muestreo estratificado●
Muestreo sistematico
Muestreo aleatorio simple. Todas las unidades de muestreo tienen la misma oportunidad de ser incluidas en la muestra. Las unidades de muestreo son
homogéneas.
La selección de las unidades de muestreo que integraran la muestra se realiza mediante el uso de una tabla de números aleatorios
El inconveniente principal radica en que entre más grande sea el marco de muestreo (N) , más difícil será
utilizar la tabla.
Este método de muestreo es mas fácil de utilizar cuando el marco de muestreo es pequeño.
Identificar las unidades de muestreo que integran la muestra es otro procedimiento tedioso.
sy ny
n 12
i2 2
i 1
n
=−
−=∑
Y Ny=
yy
n
ii 1
n
= =∑
Media
Varianza
Total
(z ) var(y)1 /2−αy +/-Límites para el error de estimación de la media
var(y)(N n)sNn
2
=−
Varianza de la media
nNs
Nd
zs
2
1 /2
2
2
≥⎡
⎣⎢
⎤
⎦⎥ +
−α
Tamaño de muestra optimo
¿Por qué
calcular los límites para el error de estimación ?
Velocidad = Distancia / Tiempo
Si se esta en China y se recorre un kilómetro en una hora, entonces nuestra velocidad es de 1 Km/h
Si se esta en Tejupilco
y se recorre un kilómetro en una hora, entonces nuestra velocidad es de 1 Km/h
Velocidad = Distancia / Tiempo FORMULA
Estimador: Ecuación asociada a un componente estadístico, la cual pretende determinar el valor aproximado de un parámetro, pero al ser ocupada en repetidas ocasiones, sobre datos de un mismo conjunto homogéneo, los resultados pueden coincidir o variar no drásticamente.
yy
n
ii 1
n
= =∑ 2
3
2.5
3
3.2
2.6
3
2.8 2.6 3 2.9 3.1
3.2 2.9 3.1 2.5 2.8 2.8
n = 4 3 2.6 2.5 2.8
Media = 2.833
n = 4 2.5 2.9 3.1 2.6
n = 4 2 2.6 3 2.9 Media = 2.625
Media = 2.725
Media = 2.775
Al utilizar un estimador puntual
no siempre se obtiene el valor verdadero del parámetro.
Es necesario utilizar un estimador por intervalo, el cual indica los valores entre los cuales se encuentra el verdadero valor del
parámetro (LI, LS).
Un estimador puntual
es aquel que genera un solo dato al estimar al parámetro.
Muestreo cualitativo. Se utiliza cuando las unidades de muestreo son homogéneas, y se quiere estimar un porcentaje o proporción.
Se registra la presencia o ausencia de una característica de interés
No se cuantifica la intensidad de la característica de interés, solo si esta presente o ausente.
Es por esto que solo es posible, al usar este método de muestreo, estimar proporciones o porcentajes.
Se registra si el tubérculo esta enfermo (1) o si esta sano
(0)
No interesa que tan dañado estén los tubérculos, solo si están sanos o enfermos.
p = 1 o 100%
6 de las 12 plantas de col fueron atacadas.
Se tiene un porcentaje de ataque del 50.
Aunque algunas plantas son atacadas con mayor intensidad solo interesa registrar si son atacadas o no.
pR
n
ii 1
n
= =∑
(z ) var(p)1 /2−α
pq(N n)N(n 1)
−−
p +/-
Var(p)=
nNpq
Nd
zpq
1 /2
2≥⎡
⎣⎢
⎤
⎦⎥ +
−α
Proporción
Límites para el error de estimación
Varianza de la proporción
Tamaño de muestra óptimo
Muestreo estratificado. Se utiliza cuando se presenta variabilidad en las unidades de muestreo en que se divide a una población.
Las unidades de muestreo que son parecidas entre sí
se agrupan en estratos, los cuales son diferentes unos con otros.
yU y
NES
i ii 1
L
= =∑
Y NyES ES=
(z ) var(y )1 /2 ES−αyES
[ ]var(y )
U var(y )
NES
i2
ii=1
L
2=∑
+/-
Media estratificada
Total estratificado
Límites para el error de estimación
Varianza de la media estratificada
( )n
U sw
Nd
zU s
i2i2
ii=1
L
2
1 /2
2
i i2
i 1
L≥
⎛
⎝⎜
⎞
⎠⎟
⎡
⎣⎢
⎤
⎦⎥ +
∑
∑− =α
( )
( )n
U s
Nd
zU s
i ii=1
L 2
2
1 /2
2
i i2
i 1
L≥
⎡
⎣⎢
⎤
⎦⎥
⎡
⎣⎢
⎤
⎦⎥ +
∑
∑− =α
Tamaño de muestra óptimo bajo asignación General
( )U s
U s
i i
i ii 1
L
=∑
wi
=
Tamaño de muestra óptimo bajo asignación Neyman
( )
( )n
N U s
Nd
zU s
i i2
i=1
L
2
1 /2
2
i i2
i 1
L≥
⎡
⎣⎢
⎤
⎦⎥
⎡
⎣⎢
⎤
⎦⎥ +
∑
∑− =α
UNiwi
=
Tamaño de muestra óptimo bajo muestreo proporcional
Se recomienda utilizar asignación general cuando se conoce las características de los estratos y uno puede decidir el valor de las wi
o cuando se quiere dar la misma importancia a todos los estratos, aquí
w1
= w2
= …. = wL
.
Se recomienda utilizar asignación Neyman cuando la varianzas de los estratos sean muy diferentes. Las formulas correspondientes ponderan la variabilidad interna de los estratos.
Se recomienda utilizar asignación proporcional cuando el tamaño de los estratos sean muy diferentes. Las formulas correspondientes ponderan el tamaño de cada estrato.
Al obtener el tamaño de muestra óptimo
con el muestreo estratificado es necesario dividirlo entre el total de estratos definidos para
el
estudio, para saber cuantas unidades de muestreo formaran la muestra en cada estrato.Si se definen 4 estratos, si n
= 20 (con la formula de tamaño de
muestra óptimo) y si se tiene:
w1
= 0.12
w2
= 0.20
w3 = 0.40
w4
= 0.28
Entonces ni
= n (wi
)
n1
= (20)(0.12) = 2.4 3
n2
= (20)(0.20) = 4 4
n3
= (20)(0.40) = 8 8
n4
= (20)(0.28) = 5.6 6
Muestro sistemático. Es similar, en las condiciones de uso y en las formulas utilizadas, al muestreo aleatorio simple, lo que cambia sustancialmente es la forma de tomar
la muestra.
Suponga que se tiene un marco de muestreo (N) de 108 árboles de manzano y se quiere tomar una muestra n = 15.Emplear el muestreo aleatorio simple implica el uso de la tabla de números aleatorios para determinar las unidades de muestreo que integraran la muestra, después identificar las unidades de muestreo en el campo, lo anterior sería un proceso muy tedioso.Utilizando el muestreo sistemático se calcula:
k ≤
N/n
≤
108/ 15
≤
7.2 k = 7
Se tomará
una
muestra sistemática de 1 en 7.
PROCEDIMIENTOS DE MUESTREO
Son los aparatos o herramientas que en algunas ocasiones son utilizadas como auxiliar para tomar la muestra.
( )s(y) n
100%⎛
⎝⎜
⎞
⎠⎟
( )sy100%
⎛⎝⎜
⎞⎠⎟
( )(y) n(C)(s)
100%⎡
⎣⎢
⎤
⎦⎥
C.V.=
V.R. =
P.R.N. =
Coeficiente de variación
Variación relativa
Precisión relativa neta
Existen dos formas comunes de determinar la disposición espacial de organismos plaga:
1).-
Relación σ2
vs
μ
2).-
Prueba de bondad de ajuste. Prueba ji-cuadrado.
Si σ2
= μ
, entonces la disposición espacial es de tipo aleatoria
Si σ2
> μ
, entonces la disposición espacial es de tipo contagio
Si σ2
< μ
, entonces la disposición espacial es de tipo regular
PRUEBA DE BONDAD DE AJUSTE
PRUEBA JI-CUADRADO
Ho : Los datos se ajustan a la distribución w
vs
Ha : Los datos no se ajustan a la distribución w
(O E )E
i i2
ii 1
K −
=∑J =
Se rechaza Ho si J >
Ei
= N (Pi
)
χα2 ( )v
ex!
x−λ λ
[ ]P(x 1)k (x 1)
x(T)−
+ −⎡⎣⎢
⎤⎦⎥
xs x
2
2 −x
mk m+
mk
1k
+⎛⎝⎜
⎞⎠⎟−
λ
= np
P(X) = X= 0, 1, 2 , …….., ∞
Distribución Poisson
. Disposición espacial aleatoria
P(0) =
Distribución Binomial
Negativa. Disposición espacial de contagio
P(X) =
m = k = T =
X= 0, 1, 2 , …….., ∞
FUNDAMENTOS ESTADÍSTICOS PARA ESTUDIOS DE EPIDEMIOLOGÍA
Una epidemia puede ser definida como un incremento de la enfermedad en el tiempo.
La curva de progreso de la enfermedad
es una gráfica de proporción de la enfermedad contra el tiempo.
La determinación o cuantificación de el progreso de la enfermedad es deseable por numerosas razones incluyendo:
1).-
Evaluación de estrategias de control.
2).-
Predicción de futuros niveles de la enfermedad.
3).-
Verificación de modelos de simulación de enfermedades de planta y predicción.
Monitorear: Huésped Medioambiente Patógeno Manejo
Modelos para determinar la proporción de enfermedad a través del tiempo:
●
Exponencial
●
Logístico
●
Monomolecular
●
Gompertz
●
Bertalanffy-Richards
Área bajo la curva.
Se tiene que ajustar el modelo seleccionado según el patrón que presenten los datos al realizar la gráfica.
A partir del modelo ajustado se utiliza la formula de Simpson para determinar el área bajo la curva
( )= + + + + + +Δx
y y y y y yn34 2 4 20 1 2 3 4 ........Área
Δx = incremento
n = Numero de segmentos deseados (debe ser par)
Máximo
Se deriva al modelo ajustado, con respecto a la variable que representa al tiempo.
Se encuentran la raíz de la derivada del modelo
Se determina el máximo del modelo ajustado
t % % esperado10 3 1.05120 5 4.52030 20 17.44240 45 48.68750 85 81.42860 95 95.90670 100 99.89380 100 100.83
=+ −
10111 6 05 0 1494
.. .e tN
K1 et a rt=+ −
= (80 –
10) / 8 = 8.75
( )= + + + + + +Δx
y y y y y yn34 2 4 20 1 2 3 4 ........Área
[ ]8 753
1051 4 4 52 2 17 442 10083.
. ( . ) ( . ) ..... .+ + + +=
= 3172.9
Δx
El calculo de área bajo la curva sirve para comparar, mediante la técnica de análisis de varianza, si el progreso de una enfermedad es el mismo para diferentes variedades de un cultivo.