predicción de la respuesta a la selección y consanguinidad con selección genómica
Post on 08-Jan-2016
49 Views
Preview:
DESCRIPTION
TRANSCRIPT
Predicción de la respuesta a la selección y
consanguinidad con selección genómica
Beatriz Villanueva
Jornada Selección Genómica, Zaragoza 2009
Tesis de Hans Daetwyler
1. Predicción de tasa de respuestaPLoS ONE (2008): Daetwyler, Villanueva, Woolliams
Genetics (en revisión): Daetwyler, Pong-Wong, Villanueva , Woolliams
2. Predicción de tasa de consanguinidadJABG (2007): Daetwyler, Villanueva, Bijma, Woolliams
no
suponerla cte puede ↓ si precisión es suficientemente
alta
Predicción de la precisión
correlación entre valores mejorantes verdaderos y estimados
1. Predicción de respuesta
G = i rAA A / L
Predicción de precisión con evaluación genómica
•Mayoría de los estudios hasta ahora– Simulación
•Ventajas de predicción determinística– Rápida– Proporciona mejor entendimiento de
como interaccionan factores implicados– Muy útil en el diseño a priori de
estrategias de selección/mejora
Modelo
• nG loci potenciales afectando al carácter
• genes candidatos o marcadores muchos pueden tener efecto 0
• bialélicos, aditivos, independientes
• nP fenotipos• Muestra 1 Estimar efecto de cada alelo
• Regresión de fenotipos sobre número de alelos de referencia - un locus cada vez
• Muestra 2 Predecir valores mejorantes
Escenarios
• Carácter continuo
• Carácter dicotómico2 fenotipos (ej. sano, enfermo)estudio poblacional
• Carácter dicotómicoestudio caso-control
Individuos seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad
Fórmula para un carácter continuo
12
2
ˆ
h
hr AA
= precisión
= número fenotipos/número loci
h2 = heredabilidad
AAr ˆ
87.01)3.0(10
)3.0(10ˆ
AAr
= 10000/1000 = 10
= 0.3
Carácter dicotómico
• Variable subyacente
• Precisión valores mejorantes en escala subyacente
umbral
Affected (1)Unaffected (0)
Fórmula para un carácter dicotómico
• Expresando h2 en escala subyacente:
12
2
ˆ
o
oAA h
hr
= número fenotipos/número loci
= hered. escala subyacente
q = prevalencia
iq = media en escala subyacente
de individuos afectados
2lh
)1(22
22
ˆqqih
qihr
ql
ql
AA
• La misma si expresamos h2 en escala observada:
AffectedUnaffected
Fórmula para un carácter dicotómicoEstudio caso-control
q = prevalencia
w = prevalencia dentro de la muestra
iq = media en escala subyacente de individuos afectados
x = punto de truncamiento
Individuos seleccionados en función de que tengan (casos) o no tengan (control) una determinada enfermedad
AffectedUnaffected
ch
hr
o
oAA
2
2
ˆ
112 )1()](1)[1( wwxiihqqc l
)1()1( qq iwwii
Simulaciones
• Individuos no relacionados
• Loci additivos, independientes
• Frecuencias alélicas
–Uniforme, Beta (forma U)
• Efectos alélicos
–Exponencial, Normal
• nG = 1000
• nP varía (diferentes nP/nG )
Simulaciones
• Muestra 1: fenotipos y genotipos
–Estimar efecto de substitución alélica con regresión
• Muestra 2: genotipos
–Estimar valor aditivo
• Algunos escenarios: un % de efectos fijado a 0 (Va constante)
loci
jiji xg ˆ
= 0.50 = 5.00 P %error P %error Continuo 0.1 0.22 3.6 0.58 0.4 0.5 0.45 0.5 0.85 0.1 0.9 0.56 0.2 0.91 0.1 Dicotómico 0.1 0.13 6.6 0.38 1.6 población 0.5 0.28 0.6 0.68 0.2 Dicotómico 0.1 0.21 2.4 0.56 1.9 caso-control 0.5 0.41 3.0 0.82 2.9
Comparación predicción-simulación = nP/1000, q = 0.1, w = 0.5
= 0.50 = 5.00 P %error P %error Continuo 0.1 0.22 3.6 0.58 0.4 0.5 0.45 0.5 0.85 0.1 0.9 0.56 0.2 0.91 0.1 Dicotómico 0.1 0.13 6.6 0.38 1.6 población 0.5 0.28 0.6 0.68 0.2 Dicotómico 0.1 0.21 2.4 0.56 1.9 caso-control 0.5 0.41 3.0 0.82 2.9
Comparación predicción-simulación = nP/1000, q = 0.1, w = 0.5
Error: C < Dp < Dc
Error ↓ con np
Efecto de diferentes distribuciones para Frecuencias alélicas/Efectos alélicos
sobre la precisión
Carácter continuo, h2 = 0.5
Simulated
Predicted Uni/Nrm Uni/Exp Beta/Nrm Beta/Exp 0.5 0.45 0.45 0.45 0.44 0.44 1.0 0.58 0.58 0.58 0.58 0.58 5.0 0.85 0.85 0.85 0.85 0.85 10.0 0.91 0.91 0.91 0.91 0.91
Efecto de fijar un % de loci efecto = 0
Carácter continuo = 0.02 = 400/20000
Simulated
h2 Predicted 0% of nG 0 95% of nG 0
0.1 0.045 0.043 0.057 0.5 0.100 0.097 0.101 0.9 0.133 0.135 0.129
Carácter dicotómicoEstudio poblacional
Prevalencia AAr ˆ simulada
0.05 0.89 0.810 0.10 0.58 0.814 0.20 0.41 0.814 0.30 0.35 0.813 0.40 0.32 0.813 0.50 0.31 0.813
= 10, = 0.2
predicha0.816
AAr ˆ
Precisión de GEBV Carácter continuo
= 10
= 0.02
= 0.5
= 1= 2= 5
= 20
Resistencia enfermedades
Producción
Mas fenotipos
Heritability
= 10
= 0.02
= 0.5
= 1= 2= 5
= 20
Precisión de GEBVCarácter dicotómico
Menor precisión máxima que con caracteres continuos sobre todo con baja
q = 0.5
= 1
= 0.64 2oh
2lh
Fórmula predictiva
• Aumenta con heredabilidad• Aumenta con número de fenotipos• Disminuye con número de loci
12
2
ˆ
h
hr AA
GP
P
nhn
hn
2
2
Ejemplo 1• h2 = 0.25
• nP = número de individuos con fenotipos (y genotipos) = 2000
• nG = número de QTL = 500
Precisión = 0.1
Ejemplo 2• h2 = 0.25
• nP = número de individuos con fenotipos (y genotipos) = 2000
• nG = número de QTL + 49500 marcadores = 50000
Precisión = 0.9
Predicciones funcionan bien para loci independientes
PEROcuando nG es alto esta suposición no es válida
Interpretar nG como segmentos cromosómicos independientes
Predicción con otros métodos de evaluación genómica
(GBLUP y BayesB)
•BLUP genómico (GBLUP)
varianza igual para todos los loci
•BayesB utiliza informacion a priori
varianzas difieren entre loci
algunos loci tienen efecto 0
Diferencia fundamental entre métodos: Suposición acerca de las varianzas de los
efectos de los marcadores
GBLUP versus BayesB
• Simulaciones
BayesB mejor que GBLUP
Número pequeño de QTL (≤ 50)
• Datos reales
BayesB ≈ GBLUP
GBLUP versus BayesB
• NQTL bajo
ventaja de BayesB
• NQTL alto
precisión de BayesB ≈ precisión de GBLUP
Predicción de precisión con GBLUP
GP
P
nhn
hn
2
2
número de loci (independientes)
AAr ˆ
sustituir Me por nG en la fórmula
Me = número de segmentos cromosómicos independientes
eP
PAA Mhn
hnr
2
2
ˆ
independiente de NQTL
Me = 2NeL/log(4NeL) (Goddard, 2008)
Predicción de precisión con GBLUP
• NQTL bajo (< Me )
ventaja de BayesB
eP
PAA Mhn
hnr
2
2
ˆ
• NQTL alto (> Me)
precisión de BayesB precisión de GBLUP
QTLP
PAA Nhn
hnr
2
2
ˆ
Predicción de precisión con BayesB
),min(2
2
ˆ
eQTLP
PAA MNhn
hnr
Predicción de precisión con BayesB
Ne Me 0.03 Me 0.05 Me 0.15 Me 0.3 Me 0.5 Me 0.75 Me 1 Me
200 445 12 24 73 146 243 365 486
1000 1890 51 101 303 606 1010 1515 2020
2000 3774 95 189 567 1134 1890 2835 3780
Simulaciones
• 10 cromosomas (1 M)• Poblaciones en equilibrio mutación-deriva• Número loci segregando: ~ 5000• Diferentes valores para Ne, nP , h2
2NeL/log(4NeL) = 20Ne/log(40Ne)
NQTL expresado como proporción de Me
0.00
0.20
0.40
0.60
0.80
1.00
0 300 600 900 1200 1500 1800 2100
ResultadosA
cc
ura
cy
Number of QTL
h2=0.1
h2=0.3
h2=0.5
BLUP
0.00
0.20
0.40
0.60
0.80
1.00
0 300 600 900 1200 1500 1800 2100
ResultadosA
cc
ura
cy
Number of QTL
h2=0.1
h2=0.3
h2=0.5
BayesBBLUP
Predicción Simulación
a)
b)
0
0.2
0.4
0.6
0.8
1N
e200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
a)
b)
0
0.2
0.4
0.6
0.8
1N
e200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0
0.2
0.4
0.6
0.8
1N
e200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
h2 = 0.3
a)
b)
0
0.2
0.4
0.6
0.8
1
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
a)
b)
0
0.2
0.4
0.6
0.8
1
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0
0.2
0.4
0.6
0.8
1
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Ne200,
NP
200
Ne200,
NP
1000
Ne2000,
NP
2000
Accu
racy
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0
0.2
0.4
0.6
0.8
1
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
NP
1000,
h0.1
NP
1000,
h0.3
NP
1000,
h0.5
NP
500,
h0.3
NP
2000,
h0.3
Ac
cu
rac
y
0.03 Me BayesB 0.5 Me BayesB 1 Me BayesB GBLUP
Predicción Simulación
Ne = 1000
Predicción de Me
),min(2
2
ˆ
eQTLP
PAA MNhn
hnr
eP
PAA Mhn
hnr
2
2
ˆ
GBLUP BayesB
AAr ˆ : precisión de estimas con GBLUP o con BayesB
cuando NQTL ≥ Me
2ˆ
2ˆ
2 /)1(ˆAAAAPe rrhnM
Predicción de Me
h2 = 0.3, NQTL = Me
eM
Ne nP GBLUP BayesB Me Goddard
200 200 294 579 445
200 1000 487 584 445
1000 500 803 1187 1890
1000 1000 890 1243 1890
1000 2000 1014 1280 1890
Predicción de NQTL
),min(2
2
ˆ
eQTLP
PAA MNhn
hnr
BayesB
AAr ˆ : precisión de estimas con BayesB
cuando NQTL < Me
2ˆ
2ˆ
2 /)1(ˆAAAAPQTL rrhnN
Predicción de NQTL
QTLN sigue tendencia de NQTL
0
300
600
900
1200
1500
1800
2100
0.55 0.65 0.75 0.85 0.95
Accuracy BayesB
Nu
mb
er
of
QT
L
Simulated NQTL
Predicted NQTL
Resumen predicción/respuesta
•Predicción precisa
•Válida para diferentes distribuciones
•Fórmula sencilla
•Útil en diseño a priori de programas
•Extendida para predecir precisión con GBLUP y BayesB
•Útil para estimar Me y NQTL
2. Predicción de tasa de consanguinidad
JABG (2007): Daetwyler, Villanueva , Bijma, Woolliams
Tasa de consanguinidad
Métodos propuestos para aumentar G
Aumento en F
Ej. Selección tradicional basada en BLUP•Mayor G a corto plazo, menor a largo plazo•Efectos a corto plazo freq. alta de alelos deletéreos
¿Ocurre lo mismo con selección genómica?
0
1
2
3
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Masal
BLUP
Genómica
Daetwyler et al. (JABG, 2007)
Tasa de consanguinidad con•Selección masal (basada sólo en P de candidatos)•BLUP•Selección genómica
Heredabilidad
Tas
a co
nsan
guin
idad
(%
)
Tasa de consanguinidad con•Selección masal (basada sólo en P de candidatos)
G = i A = i hA
h2 alta ↑ Correlación entre hermanos ↑ co-selección de hermanos ↑ F
h2 alta ↑ efecto Bulmer ↓ varianza genética entre familias ↓ co-selección de hermanos ↓ F
BALANCE
F más alto a h2
intermedias
0
1
2
3
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Masal
Heredabilidad
Tas
a co
nsan
guin
ida
d (%
)
Tasa de consanguinidad con•BLUP
G = i A
↑ ↑ efecto Bulmer pero depende menos de h2
F ↓ con h2
co-selección de hermanos siempre ↓ con h2
0
1
2
3
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Masal
BLUP
Heredabilidad
Tas
a co
nsan
guin
ida
d (%
)
depende de h2 + info. parientes
h2 baja ↑ correlación entre hermanos ↑ co-selección de hermanos ↑ F
• ↑ precisión en y
información de antepasados y parientes colaterales
• ↑ precisión en
información del individuo y su descendencia
Ai = ½ As+½ Ad+mi
sA dA
im
En la práctica:
BLUP ↑ a través de ↑ en y
Selección genómica ↑ a través de ↑ en
sA dA
im
Ejemplo
• Individuo sin registro, sólo con información de padres
DSi AAA ˆ)5.0(ˆ)5.0(ˆ
• EBVs de padres tienen precisión = 1 ( )AA ˆ
71.0)5.0()5.0(21222
ˆ
AAAAA
=> Diferencia 0.85 – 0.71 = 0.14 viene de un aumento en la precisión de la estima del
término mendeliano
• Meuwissen et al. = 0.85
Tasa de consanguinidad con•Selección genómica
Marcadores proporcionan información sobre mi
↓ impacto de información genealógica
F menor ↓ co-selección de hermanos ↓ F
Ai= ½ As+½ Ad+mi
Énfasis sobre selección entre familias disminuye Énfasis sobre selección dentro de familias aumenta
0
1
2
3
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Masal
BLUP
Genómica
Heredabilidad
Tas
a co
nsan
guin
ida
d (%
)
Tasa de consanguinidad con•Selección genómica
F menor
Además
0
1
2
3
0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1
Masal
BLUP
Genómica
Heredabilidad
Tas
a co
nsan
guin
ida
d (%
)
↑ ↑ efecto Bulmer ↓ varianza genética entre familias ↓ co-selección de hermanos ↓ F
• Aumento en precisión de la estima del término mendeliano
• Siempre dará mayor G para una F
• Ventaja no solo a corto plazo sino también a largo plazo
¿Va el aumento de ganancia genética acompañado de un aumento de la
consanguinidad?
NO
Consanguinidad calculada con datos genotípicos
¿¿ ??
Consanguinidad calculada con genealogías
Valor esperado suponiendo loci neutrales
Selección Genómica
No libre de consanguinidad
Selección optimizada optimizar contribuciones para maximizar
G restringiendo F
Todavía válida
top related