Sei sulla pagina 1di 2

Analizador de formas de tubrculos de papa a partir del reconocimiento de Patrones de Imgenes

Hualla1, Vilma R.; Gmez1, Ren; Simon1, Reinhard; Ros1 Silvana R.; Vega1 Mariflor E.; Salas1, Elisa
1

Centro Internacional de la Papa (CIP), Apartado 1558, Lima 12, Per v.hualla@cgiar.org

RESUMEN
En centros de investigacin biolgica del mundo se evala una gran cantidad de clones o accesiones de manera manual, siendo muy costoso. El contar con herramientas que permiten que la evaluacin se realice en corto plazo y con menor sesgo en los datos sera de gran ayuda. Caracterizar muestras de tubrculos a partir de una imagen facilitar el trabajo para los investigadores, el analizar las formas de tubrculos como parte de la caracterizacin morfolgica podra realizarse de una manera fcil, bajando los costos en la investigacin y disminuyendo la variabilidad entre datos. Asimismo se podra evaluar grandes cantidades de muestras y el factor tiempo no sera un problema. Y sobre todo podemos aumentar la objetividad de las evaluaciones fenotpicas, obteniendo datos cuantitativos los cuales son compatibles con bases de datos que nos permitir combinar los datos fenotpicos y genotpicos, obteniendo mayor explotacin de la informacin. Este programa piloto permite clasificar 5 formas generales de tubrculos de papa: Comprimido, Redondo, Oblongo, Oblongo-alargado y Alargado; y dos formas secundarias: no aplanado y aplanado. Para la determinacin de forma general de tubrculos se analizaron 244 fotos, el programa mostr un error de clasificacin de 1.2 %. Y para formas secundarias se analiz 200 fotos con un error de clasificacin de 0.05 %.

INTRODUCCIN
En los programas de investigacin como Mejoramiento Gentico, Bancos de Germoplasma y evaluaciones de cultivos en general, es importante contar con herramientas bioinformticas que faciliten la tarea del investigador. En la actualidad, la cuantificacin de los rasgos fenotpicos se realiza de manera semi-manual, haciendo que la tarea de analizar grandes conjuntos de datos sea muy costosa, adems consumen mucho tiempo y son propensos a errores. Frente a estas deficiencias, el anlisis automatizado de la diversidad biolgica a travs de las imgenes se ha convertido en un elemento bsico en la biologa moderna. Las caractersticas de medicin de plantas u objetos a travs de anlisis de imgenes tienen el potencial para aumentar la objetividad de las evaluaciones fenotpicas, proporcionando datos susceptibles de anlisis cuantitativos, para combinar los datos fenotpicos con los genotpicos. En los ltimos aos las medidas morfomtricas son de gran utilidad en el entorno biolgico (Claude, 2008). Recientemente se ha desarrollado un software para analizar caractersticas de tomate denominado Analizador de tomate (TA) (Van der Knaap et al., 2008). En este trabajo hemos escogido una herramienta llamada EBImage (Pau et al., 2010) en conjunto con el paquete estadstico R (R development core team, 2012) y las libreras rpart (Therneau et al. 2012), GTK2, y el software Image Magick (2006). Con el desarrollo de este piloto se evala el potencial del uso del paquete EBImage en el reconocimiento de Imgenes para las formas de tubrculos de papa, ste proporciona la funcionalidad de lectura, escritura, procesamiento y anlisis de imgenes, es compatible con ms de 95 formatos de imagen a travs de su interfaz para ImageMagick. El paquete rpart est basado en la tcnica de rboles de decisin. Todas estas herramientas en conjunto permiten realizar el procesamiento de seales, modelizacin estadstica, aprendizaje automtico y visualizacin de datos.

MATERIALES Y MTODOS
Los cdigos de programacin fueron realizados usando el entorno R2.13.0 con los paquetes EBImage y rpart, GTK+ Versin 2.22.0-2. Se utiliz la librera rpart para la clasificacin de las

XXV Congreso de la Asociacin Latinoamericana de la Pap a - ALAP, 17/20 de septiembre de 2012, Uberlndia, MG, Brazil

formas evaluadas debido a que mostr mayor rapidez y eficacia comparada a otros clasificadores (Hualla, V. 2012). Se realiz la evaluacin de 100 clones de tubrculos de papa del rea de mejoramiento, los cuales fueron caracterizados morfolgicamente de la forma tradicional (Gmez et al. 2004, 2012). Luego se procedi a la toma de fotos, cada foto estuvo previamente codificada, acompaada de una mini carta de colores y una regla. Posteriormente las fotos fueron trabajadas para obtener una tamao de 100 a 300 Kb con un fondo oscuro para facilitar el reconocimiento por el programa. Para el desarrollo del programa se consider las formas ms usuales de tubrculos: Comprimido (1), Redondo (2), Oblongo, Oblongo alargado (7) y Alargado (8) Y para forma secundaria: Ausente (0) y Aplanado (1). La informacin obtenida fue utilizada para la validacin del programa. Para la clasificacin de la forma general de tubrculo, el programa lee el objeto de corte longitudinal o tubrculo entero y para la forma secundaria: el corte es transversal.

RESULTADOS Y CONCLUSIONES
La herramienta Analizador de Formas de Tubrculos fue evaluada exitosamente en forma de piloto. Se analizaron 444 fotos del programa de germoplasma y del programa de Mejoramiento Gentico. El programa puede analizar fotos individuales o grupales, asimismo el usuario puede elegir que foto que desea leer. El programa para analizar Formas de tubrculos de Papa, demostr alta precisin al clasificar las fotos con un error de clasificacin muy baja; para formas generales del tubrculo se analizaron 244 donde el error de clasificacin es 1.2% y para forma secundaria es 0.5%. Es decir que el programa discrimin eficientemente los 5 tipos de formas generales de tubrculos de papa: Comprimido, Redondo, Oblongo, Oblongo-alargado y Alargado; y las formas secundarias: no aplanado y aplanado. Aunque los programas pueden ayudar en gran medida trabajos rutinarios y mecnicos, son necesarios los conocimientos de los investigadores para poder seleccionar el material correcto para las fotos, as como para la discriminacin de otras caractersticas de los tubrculos.

AGRADECIMIENTOS
A Ing. Walter Amoros, Pablo Carhuapoma y al Dr. David Tay por su apoyo.

BIBLIOGRAFA
Claude J. (2008). Morphometrics with R. Springer. Austria Gmez, R. (2004). Seminario Taller Nacional de Caracterizacin in situ Gua para las Caracterizaciones Morfolgicas Bsicas en Colecciones de Papas Nativas (sexta aproximacin). Centro Internacional de la Papa. Lima. 44-67. Gmez, R.; Salas. A; Carrillo. O.; Gaspar, O.; Tay, D. (2012). Descriptores morfolgicos de papas cultivadas y silvestres. Centro Internacional de la Papa. Lima. 1-30. En impresin. Hualla M. V. (2012) Aplicacin de tres clasificadores en dos descriptores morfolgicos a partir del reconocimiento de patrones de imgenes de tubrculos. Tesis en impresin. ImageMagick (2006). URL http://www.imagemagick.org/ Pau G, Sklyar O., Huber W (2010) Introduction to EBImage, an image processing and analysis toolkit for R. European Bioinformatics Institute. GTK2(2012) http://sourceforge.net/userapps/mediawiki/alex-sh/index.php?title=Main_Page GTK+ 2.22.0-2 R Development Core Team (2012). R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria.URL http://www.Rproject.org. Therneau, T. and B. Atkinson (2012) RPART: Recursive Partitioning. Package 3.1-52 URL http://cran.r-project.org/web/packages/rpart/index.html Van der Knaap, E.; Gray, S.; Fujimuro, K.; Lang, L.; Dujmovic, N.; Sullivan, D.; Brewer, M.; Gonzalo, M.; Rodriguez, G.; Anderson, C. (2008). Tomato Analyzer User Manual Version 2.2.0.0. URL http://www.oardc.ohio-state.du/vanderknaap/TArelease.htm.

Potrebbero piacerti anche