Sei sulla pagina 1di 16

XXXV INTERNATIONAL SODEBRAS CONGRESS

01 a 03 de junho de 2016
Foz do Iguau - PR

REGRESSO COM MQUINAS


DE VETORES SUPORTE E
SELEO DE ATRIBUTOS VIA
ALGORITMO GENTICO
APLICADA EM SELEO
GENMICA
BRUNO ZONOVELLI
CARLOS CRISTIANO
HASENCLEVER BORGES, WAGNER
ANTONIO ARBEX, FABRIZZIO
COND DE OLIVEIRA, IGOR
MAGALHES RIBEIRO

Contedo
Introduo
Objetivo
Metodologia
Resultados

Concluso

Introduo
O

melhoramento gentico animal ou


vegetal seleciona e acasala os indivduos
superiores.

processo pode ser lento e custoso.

seleo genmica (SG) uma soluo.

SG permite selecionar o animal no


incio da vida.

GEBV

= w1x1 + w2x2 + w3x3..., sendo w o


efeito do marcador e x o seu valor
genmico

sucesso na seleo
genmica depende,
em geral, de trs
itens:

o tamanho da
populao de
referncia;
a herdabilidade;
e o tamanho do
desiquilbrio de
ligao entre os
marcadores e o
locus

Introduo
As

clulas possuem pares de genes,


sendo uma cpia da me e outra do pai.

Cada

gene possui uma sequncia de


DNA que conhecida como alelos.

interao entre alelos conhecida


como dominncia ou recessividade.

relao entre os genes chamada de


epistasia.

Objetivos

Desenvolver um modelo capaz de trabalhar


com :

Um amostra ou populao de referncia


pequena;

Trabalhar com epistasia ou interao entre


os genes, durante a construo do
modelo.

Metodologia

Metodologia
A

primeira fase seleciona as variveis


mais relevantes por meio de seleo de
atributos via SNP Markers Selector (SMS).

segunda etapa a avaliao de cada


subconjunto pelo SVR, comparando-os
com o grupo completo de marcadores e
o grupo com somente os SNPs causais.

Bases dados simulados


100

100

500

1000

2000

Resultados Etapa Seleo


POP
100
500
1000

Total
8
13
8

VP
2
5
5

FP
6
8
3

ACC
0,91
0,92
0,97

POP
100
500
1000

Total
100
34
9

VP
2
4
5

FP
98
30
4

ACC
0,950
0,990
0,998

Resultados Et. de Avaliao


POP
100
500
1000
POP
100
500
1000

Inicial
VP
-0,04(0,30) 0,42(0,38)
0,43(0,15) 0,57(0,09)
0,41(0,04) 0,57(0,07)
Inicial
-

SMS
0,60(0,23)
0,59(0,09)
0,58(0,07)

VP
SMS
0,45(0,22) 0,83(0,06)
0,54(0,08) 0,58(0,07)
0,61(0,04) 0,61(0,04)

Concluses
A

seleo genmica um campo de


estudo amplo e com muitos desafios.

mtodo proposto apresentou


resultados promissores nas bases com as
caractersticas descritas gerando um
aumento na correlao final.

Concluses
O

SMS manteve um comportamento


estvel mesmo com as variaes no
tamanho da populao de referncia e
do nmero de marcadores.

dimensionalidade das bases de dados


mostrou-se um problema.

Concluses
Os

chips atuais vo de 3000 at 1 milho


de marcadores.

Indicando

a necessidade da utilizao
de mtodos que sejam robustos na
seleo desses marcadores.

Bibliografia

CORTES, C.; VAPNIK, V. Support-vector networks. Machine


learning, v. 20, n. 3, p. 273 - 297, 1995.
GODDARD, M. E.; HAYES, B. J. Mapping genes for complex
traits in domestic animals and their use in breeding
programmes. Nature Reviews Genetics, Nature Publishing
Group, v. 10, n. 6, p. 381 - 391, 2009.
MSZROS, G. et al. Genomic analysis for managing small and
endangered populations: A case study in tyrol grey cattle.
Frontiers in Genetics, Frontiers, v. 6, p. 173, 2015.
OLIVEIRA, F. C. de et al. Metodologia para seleo de
marcadores com mquina de vetores suporte com regresso.
In: . [S.l.]: Embrapa, 2014. p. 101 - 126. ISBN 978-85-7035-382-5.
OLIVEIRA, F. C. de et al. Snps selection using support vector
regression and genetic algorithms in gwas. BMC genomics,
BioMed Central Ltd, v. 15, n. Suppl 7, p. S4, 2014.

Agradecimentos
Aos

meu Orientadores (Carlos Cristiano e


Wagner Arbex)
Aos Colegas Igor e Fabrizzio
Aos Professores
A UFJF e PGMC
A EMBRAPA gado de leita Juiz de Fora
A CAPES e FAPEMIG

Potrebbero piacerti anche