EVALUACIN DE IMGENES ESPECTRALES PARA LA INSPECCIN DE
ADULTERANTES EN TRMINOS DE TRIGO BLANDO, YUCA Y FLAVONO DE
MAZ EN TRIGO AVATAR ORGNICO (TRITICUM SPP.) FL Resumen Al considerar la seguridad alimentaria y el enorme inters del mercado, es necesario un mtodo de alta eficiencia para asegurar la autenticidad del producto alimenticio. Para este objetivo, se explor la obtencin de imgenes espectrales para la deteccin cuantitativa de fl ujo de trigo orgnico irlands (OWF) adulterado con trigo blando (WF), yuca (CaF) y cornfl (CoF). Se recogieron imgenes hiperespectrales (900e1700 nm) de muestras de OWF con una serie de porcentajes de adulteracin. Los espectros adquiridos fueron pre-procesados por la segunda derivada (2 Der) y la variable estndar normal (SNV) antes del modelado. Luego se emplearon la regresin de mnimos cuadrados parciales (PLSR) y la regresin de componentes principales (PCR) para el anlisis cuantitativo de la proporcin de adulteracin de CoF, CaF y WF en OWF. Para desarrollar modelos simplificados ms eficaces, se seleccionaron tres grupos de longitudes de onda de caractersticas a partir de las grficas de carga del anlisis de componentes principales (PCA) y del algoritmo de iteracin de primera derivada y media de centrado (FMCIA). Los modelos desarrollados con FMCIA fueron mejores que el PCA. Despus, las longitudes de onda de las caractersticas correspondientes se redujeron an ms sobre la base de coeficientes de regresin de modelo (RC). El resultado ptimo de la deteccin de la mezcla fue obtenido por el modelo RCFMCIA-PLSR, con un coeficiente de determinacin de la prediccin (R2P) de 0,973 y un error cuadrtico medio de prediccin (RMSEP) de 0,036 para OWF adulterado con CoF, R2P de 0,986 y RMSEP de 0,026 para OWF adulterado con CaF y R2P de 0,971 y RMSEP de 0,038 para OWF adulterado con WF. Los mapas de visualizacin se generaron calculando la respuesta espectral de cada pxel en las muestras. Este resultado indica que la imagen espectral integrada con anlisis multivariable tiene el potencial de autenticar las mezclas en fl ujo de trigo especfico en el intervalo de 3e75% (p / p). Introduccin El fraude alimentario se est convirtiendo en el gran desafo para los gobiernos, la industria y las organizaciones que establecen normas, ya que las cadenas de suministro de alimentos se han vuelto cada vez ms globales y complejas (Ottavian et al., 2014, Huang et al., 2015, Jha et al. , 2015, Qin et al., 2016). La adulteracin de los alimentos es una consecuencia de la adicin de impurezas extraas que normalmente no estn contenidas en las sustancias alimentarias originales (Zhang et al., 2013; Zhu et al., 2011). La adicin fraudulenta de sustancias no autnticas abarca la tergiversacin o la sustitucin deliberada de un producto alimenticio sin la comprador para obtener ganancias econmicas (Spink, 2012). Por lo tanto, la adulteracin motivada econmicamente es una causa raz de los riesgos alimentarios de salud pblica que lleva a los consumidores a dar la mxima atencin a la adulteracin de alimentos. Los alimentos orgnicos se consideran mucho ms respetuosos con el medio ambiente y populares, respetando el estircol verde, la rotacin de cultivos y el control biolgico de plagas establecidos en las normas orgnicas de la Unin Europea (UE). Durante la ltima dcada, la demanda de alimentos producidos orgnicamente ha aumentado de manera significativa (David et al., 2012). Debido a la motivacin para el beneficio econmico, la adulteracin de alimentos orgnicos se ha convertido en un problema imperativo. La autenticacin de alimentos bsicos orgnicos ha sido explorada actualmente por algunos investigadores. Basado en el modelado independiente suave de la analoga de clase (SIMCA) y K vecinos ms cercanos (KNN), Borges et al. (2015) verific la adulteracin del arroz orgnico mediante la determinacin de 20 elementos qumicos usando espectrometra de masas de plasma acoplado inductivamente (ICPMS). La discriminacin entre trigo orgnico y trigo convencional tambin se ha realizado midiendo d15N y d13C de aminocidos mediante cromatografa de gases de combustin de la relacin de istopos de espectrometra de masas (GC-C-IRMS) (Paolini et al., 2015). Sin embargo, estos enfoques demorados y destructivos no son adecuados para la rpida clasificacin y deteccin en la industria alimentaria. Debera llevarse a cabo la deteccin rpida de la harina de trigo blando desconocida (WF) mezclada en trigo orgnico (OWF). Adems, el OWF es casi el mismo color que la mandioca (CaF), y similar al maz fl (CoF), lo que hace que sea ms difcil identificarlos despus de la adulteracin. Debido a la creciente necesidad de adulteraciones sutiles en los alimentos, es necesario explorar un mtodo rpido, preciso y no destructivo para la determinacin cuantitativa de contaminantes en OWF. Durante las ltimas dcadas, se han desarrollado algunas tcnicas de deteccin rpidas y no destructivas para evaluar la calidad de los alimentos (Alexandrakis et al., 2012, Liu et al., 2014b, Magwaza et al., 2012, Zhu et al., 2013, Soukoulis et al., 2013, Cubero et al., 2011, Zhu et al., 2016). Entre ellos, la tcnica de la mquina o la visin por computadora es una herramienta de medicin ampliamente utilizada para adquirir y analizar la informacin bidimensional de superficie (Sanz, 2012, Sonka et al., 2014, Wu y Sun, 2013c, Jackman et al., 2009 Du y Sun, 2005). La informacin relacionada con la superficie puede ser representada por una imagen para la deteccin de la calidad, clasi fi cacin y clasificacin de los productos agrcolas (ElMasry et al., 2012a; Patel et al., 2012). Aunque los aspectos externos incluyendo la forma, el color y los defectos pueden ser fcilmente evaluados por la visin de la mquina, los parmetros de calidad relacionados con composiciones qumicas son difciles de determinar con slo tcnicas de imagen (Patel et al., 2012). Recientemente, las tcnicas de espectroscopa, como la espectroscopa visible / infrarroja (Sankaran y Ehsani, 2013), espectroscopa Raman (Boyac et al., 2014, Zheng y He, 2014, Lee y Herrman, 2016) y espectroscopa de resonancia nuclearmagntica (Ohtsuki et al. 201 y Botosoa, 2015) han recibido mucha atencin en la investigacin para el anlisis qumico de la materia prima, la discriminacin y el monitoreo del proceso, pero estas tcnicas espectroscpicas no pueden proporcionar imgenes visuales de muestras enteras. Para superar estos problemas, la formacin de imgenes espectrales desarrollada uniendo tcnicas de imagen y espectroscpicas puede proporcionar simultneamente informacin espacial y espectral de un objeto, lo que significa que esta tcnica puede proporcionar caractersticas fsicas y qumicas de un objeto al mismo tiempo (Su et al. 2015, Sun, 2010, Dissing et al., 2013, Xie et al., 2016, Ravikanth et al., 2016). La imagen hiperespectral puede se descomponen en una serie de imgenes bidimensionales que corresponden a nmeros de longitudes de onda especficas que reflejan caractersticas qumicas del objeto (He y Sun, 2015, Iqbal et al., 2014, Kamruzzaman et al., 2012, 2015, Zhang et al., 2016, Pan et al., 2016). Adems de los productos alimenticios (Barbin et al., 2012b, Elmasry et al., 2012b, Feng y Sun, 2012, Wu y Sun, 2013b, Feng y Sun, 2013, Feng et al., 2013, ElMasry et al. Barbin et al., 2013), esta tcnica ha sido empleada en una amplia gama de campos tales como la agricultura (por ejemplo, cereales, frutas) (Liu et al., 2013a, Mahesh et al., 2015) (Scheibelhofer et al., 2012), farmacutica (Brondi et al., 2014, Muench, 2014), microbiana (Gowen et al., 2015, Leroux et al., 2015), mdica (Lu y Fei, 2014), geolgicas (por ejemplo, cartografa regional, interpretacin estructural) (Kurz et al., 2013; Van der Meer et al., 2012). En cuanto al anlisis rpido y no destructivo de los productos alimenticios bsicos, se han aplicado imgenes hiperespectrales para la evaluacin de protenas, almidones y amilosa en arroz (Liu et al., 2014a), contenido de azcar en patatas (Rady et al., 2015) , clasificacin de variedades y crecimiento de hongos en granos de arroz (Siripatrawan y Makino, 2015, Wang et al., 2015), Fusarium head blight en granos de trigo (Barbedo et al., 2015), flotoxina B1 en cereales de maz (Kandpal et al. 2015), la clasificacin de los frijoles negros (Jun et al., 2015), el tiempo de coccin ptimo de los hervidos patatas (Do Trong et al., 2011), y rastros de cacahuete en la harina de trigo (Mishra et al., 2015). Sin embargo, hasta donde sabemos, an no se ha publicado ninguna investigacin para el anlisis cuantitativo de contaminantes como el WF, CaF y CoF en OWF basados en imgenes espectrales. El objetivo general de esta investigacin se centra en investigar el potencial de la imagen hiperespectral (900e1700 nm) para la visualizacin cuantitativa rpida de la contaminacin por OWF. Por lo tanto, este estudio se realiz principalmente (1) extrayendo datos de imgenes hiperespectrales de todas las muestras, (2) estableciendo regresin de mnimos cuadrados parciales (PLSR) y modelos de regresin de componentes principales (PCR) en la regin de longitud de onda completa, (3) seleccin de longitudes de onda caractersticas altamente vinculados al atributo intrnseco de estas muestras, (4) la identificacin de optimalomodelos basados en longitudes de onda caractersticas, y (5) el desarrollo de algoritmos de procesamiento de imgenes para representar los resultados de prediccin visual. En particular, se present y verific un nuevo mtodo de seleccin de longitudes de onda para el modelado. 2. Materiales y mtodos 2.1. Preparacin de la muestra y adquisicin de la imagen espectral En este estudio, las muestras finas y en polvo de OWF (variedad: Avatar, origen: Irlanda) fueron certificadas por Organic Trust en Irlanda (IE-ORG-03, UE / composicin fue: 75,3% de carbohidratos, 10,1% de protenas, 1,4% de grasa y 3,1% de fibra. Se produjeron otras muestras lquidas, incluyendo WF, CoF y CaF comunes en un sistema convencional sin seguir los estndares orgnicos, y sus composiciones fueron 76,3%, 92,0% y 93,0% de carbohidratos, 10,3%, 0,6% y 0,8% de protenas, 0,98%, 0,7 % y 0,3% de grasa, y 2,7%, 0,1% y 4,7% de fibra, respectivamente. Todas estas muestras fueron recolectadas y transportadas a laboratorios de Refrigeracin de Alimentos y Tecnologa de Alimentos Computarizada (FRCFT), University College Dublin (UCD), Irlanda. A continuacin, las muestras de OWF fueron adulteradas con CaF, CoF y WF en el intervalo de 3e75% (p / p), con incrementos de aproximadamente 3%. Especficamente, el CaF, CoF y WF fueron pesados individualmente junto con OWF, bien mezclados y homogeneizados para obtener un peso de muestra total de 35 g cada vez en cada nivel adulterante. A continuacin, se obtuvieron 150 muestras (6 muestras por nivel adulterante? 25 niveles) para cada tipo de adulteracin. All se seleccionaron al azar 90 muestras (4 muestras por niveles de nivel adulterante? 25) como el conjunto de calibracin y se seleccionaron las 60 muestras restantes (2 muestras por nivel de nivel adulterante? 25 niveles) como conjunto de prediccin. Las muestras se colocaron por separado en frascos de plstico transparentes circulares una a una y se formaron imgenes utilizando el sistema de formacin de imgenes hiperespectral en la espectro de 900e1700 nm mencionado por ElMasry et al. (2011a, b). Este sistema de imgenes hiperespectrales pushbroom de laboratorio analiza la lnea de muestra, y consiste principalmente en una computadora con un software de control (SpectralCube, Spectral Imaging Ltd., Finlandia), una cmara CCD (Xeva 992, Xenics Infrared Solutions, Blgica) un espectrgrafo (ImSpector N17E, Spectral Imaging Ltd., Oulu, Finlandia), dos lmparas de iluminacin de 500 W tungstenehalogen (V-light, Lowel Light Inc., EE.UU.) y un motor paso a paso (GPL- DZTSA-1000-X, Zolix Instrument Co., China). La luz reflejada de la muestra es capturada por el sistema de formacin de imgenes hiperespectrales en ejes espectrales espaciales y el incremento espectral entre las bandas contiguas es de aproximadamente 3,34 nm en el intervalo espectral de 897e1753 nm produciendo 256 bandas. Basndose en este sistema, se recogieron las imgenes de 690 muestras (60 \ mu g para muestras puras, 150 \ mu g para muestras adulteradas). Los datos espectrales correspondientes a cada muestra eran tridimensionales, incluyendo informacin espacial y espectral, con 256 bandas (897e1753 nm) en sentido l, 320 pxeles (0,578 mm / pxel) en direccin x y n pxeles (0,578 mm / pxel) en la direccin y (determinada por la longitud de la muestra). Los diferentes niveles de adulteracin que no pueden ser reconocidos por ojos desnudos, podra ser la visualizacin espacial basndose en la tcnica de imgenes espectrales. 2.2. Extraccin de la regin de inters Como muchos ruidos se observaron en las regiones de 897e957 nm y 1665e1753 nm en las imgenes corregidas, la regin restante de 957 a 1665 nm (212 bandas) se puede seguir utilizando. Para minimizar la perturbacin de la geometra del instrumento y la corriente oscura de la cmara, se registraron imgenes de referencia blancas (~ 99% de reflectividad) y oscuras (0% de reflectividad). Las imgenes de reflexin cruda se calibraron a continuacin en imgenes de reflexin relativa basadas en las imgenes de referencia blancas y oscuras (Firtha, 2006; ElMasry et al., 2007). Las imgenes corregidas se utilizaron para seleccionar las regiones de inters (ROI). Se construy una imagen de mscara binaria restando una imagen de banda de baja reflectividad (por ejemplo, 1443 nm) de una imagen de banda de alta re fl exin (por ejemplo, 1204 nm) dentro de la misma imagen hiperspectral corregida. Despus de retirar el fondo y la sombra de la imagen hiperspectral corregida, se llevaron a cabo operaciones morfolgicas tales como erosin o dilatacin sobre la mscara binaria resultante para eliminar las partes aisladas procedentes de los bordes de los frascos de plstico. Esto result en una mscara final que contena slo ROI. Los valores medios de reflexin de todos los pxeles en el ROI se pueden extraer basndose en las seales espectrales. Los datos espectrales de cada ROI se promediaron a un espectro para representar cada muestra. Se repiti el mismo protocolo para todas las imgenes hiperespectrales de las muestras ensayadas. 2.3. Pretratamiento espectral Despus de adquirir los datos espectrales promedio del ROI, fue necesario mejorar la relacin seal-ruido para un modelo mejor y robusto. Antes del modelado, los datos espectrales de las muestras fueron pre-procesados por la segunda derivada (2 Der) (suavizado Savitsky Golay, ventana de 7 puntos, polinomio de 2 orden) y la variable normal estndar (SNV). El segundo enfoque Der se plantea para calcular la derivada al suavizar los espectros y tomar el doble del valor suavizado a las longitudes de onda correspondientes (Tsai y Philpot, 1998). El pretratamiento SNV exige el clculo de la media y la desviacin estndar (StdDev) de los valores espectrales. El formato del espectro corregido se genera mediante esta ecuacin:
donde xcs es datos espectrales corregidos, x es el espectro original, xav es el
promedio de los n valores espectrales en el rango de longitudes de onda completas 2.4. Desarrollo y evaluacin de modelos En este estudio, los modelos de calibracin y prediccin del anlisis cuantitativo de adulteracin de OWF fueron explorados por PCR y PLSR. Estos modelos se desarrollaron mediante la utilizacin de los espectros en la datamatriz espectral (X) para predecir las proporciones de adulterante en OWF en el vector columna (Y). El rendimiento de estos modelos se evalu mediante el coeficiente de determinacin y el error cuadrtico medio de la calibracin (R2 C, RMSEC), la validacin cruzada (persianas venecianas) (R2 CV, RMSECV) y la prediccin (R2 P, RMSEP). Las fuentes relevantes de variabilidad de datos fueron modificadas por las variables latentes (LVs). Se seleccion el nmero de VL segn el criterio del error de prediccin ms bajo en la validacin cruzada (veneciana) y la evaluacin de la varianza explicada en los bloques X e Y (Mazivila et al., 2015). El modelo ptimo debera tener R2 C, R2 CV y R2 P ms altos y el menor error de clasificacin, RMSEC, RMSECV y RMSEP. En general, siempre se espera que adquiera RMSE mucho ms cerca de 0 y R2 ms enfoque a 1, pero un R2 de ms de 0,90 muestra un excelente rendimiento y menos de 0,82 significa un rendimiento pobre (Williams, 2001). 2.5. Seleccin de longitud de onda caracterstica Por otro lado, los espectros que contienen grandes volmenes de informacin no son adecuados para la deteccin en lnea. La seleccin de la longitud de onda tiene como objetivo elegir varias bandas ptimas para representar los datos hiperspectrales originales. En este estudio, las longitudes de onda ptimas para el anlisis cuantitativo de adulteracin OWF se seleccionaron sobre la base de anlisis de componentes principales (PCA). Las cargas resultantes de PCA se consideran como una indicacin de longitudes de onda caractersticas que no sufre de redundancia (Su y Sun, 2016a). Las longitudes de onda correspondientes al pico y al valle del grfico de cargas mostraron grandes diferencias en la reflectividad y se consider que tenan una gran contribucin a las cargas de PC. En este estudio, la combinacin de longitudes de onda caractersticas seleccionadas por PCA mtodo se contrast con un nuevo enfoque denominado el primer derivado y el algoritmo de iteracin centrada media (FMCIA) que concatena la primera derivada y el MC para el tratamiento de datos espectrales con espectros estandarizados generados por su StdDev (Su y Sun, 2016b, Su y Sun, 2016c). Como medida para cuantificar el grado de variacin de los valores de los datos espectrales, el StdDev se calcul a cada longitud de onda de todos los espectros procesados posteriormente. Dado que todas las variables se ajustan a la misma escala, los coeficientes StdDev resultantes muestran la importancia relativa de los espectros. El grfico de cargas de FMCIA se considera como una indicacin de las longitudes de onda optimizadas. La longitud de onda caracterstica se selecciona en la regin espectral donde existe una gran diferencia en los coeficientes StdDev. A continuacin, las longitudes de onda de las caractersticas seleccionadas pueden reducirse an ms mediante los coeficientes de regresin (RC) del modelo PLSR (Su y Sun, 2016d). El propsito de la facilitacin del modelo es establecer un modelo muy eficaz y simplificado con menos longitudes de onda caractersticas para la identi fi cacin y visualizacin del porcentaje de adulteracin. 2.6. Anlisis de imgenes espectrales En contraste con otras tcnicas de espectroscopia, la superioridad de la imagen espectral existe en la transferencia de modelos de anlisis multivariante a cada pxel de la imagen, generando un mapa de visualizacin con proporciones de adulteracin. En primer lugar, una imagen espectral tridimensional a longitudes de onda caractersticas se convirti en una matriz bidimensional. Esta matriz se multiplic entonces por coeficientes de regresin del modelo ptimo. Despus, la matriz resultante se repleg para formar un mapa de prediccin, donde los niveles de adulteracin dentro de todos los puntos se exhibieron y se visualizaron por colores. Todos los datos multivariados y el anlisis de imgenes se ejecutaron mediante scripts escritos en casa dentro del software Matlab 7.12 (The Math- Works Inc., Natick, MA, EUA). En la Fig. 1 se muestra un diagrama de flujo que contiene los principales pasos del anlisis cuantitativo de la adulteracin de OWF usando imgenes espectrales. 3. Resultados y discusin 3.1. Caractersticas espectrales de las muestras En la Figura 2 se muestran claramente los espectros de cada categora y proporciones de adulteracin OWF de 3% a 75%. Como se desprende de la Figura 2a, las curvas espectrales de diferentes variedades presentan una tendencia similar, pico y valle, lo que indica su similitud en composiciones qumicas (por ejemplo, protenas, carbohidratos, grasas) y longitudes de onda caractersticas. Especficamente, se observ que tres picos de absorcin estaban presentes en alrededor de 980 nm, 1200 nm y 1450 nm que se relacionaron respectivamente con OeH que estira el segundo sobretono, CeH que estira el segundo sobretono y OeH que estira los primeros acordes (Wu y Sun, 2013a). En comparacin con el pico de absorcin a 980 nm, la variacin de las huellas espectrales de diferentes flanes a 1450 nm (OeH estirando el primer tono) fue ms significativa, seguida por el pico de absorcin a 1200 nm. Adems, las caractersticas espectrales observadas de OWF eran marcadamente diferentes de las otras tres. Estas diferencias en los valores de reflexin fueron causadas principalmente por factores genticos y ambientales, as como por sus sitios de origen. Sin embargo, las caractersticas espectrales de OWF fueron mucho ms similares con WF. Esto se debi principalmente a su mismo cultivar y origen geogrfico. En la Fig. 2 (lecho), podemos observar que existen diferencias espectrales en las proporciones de adulteracin (3% e75%) entre las diversas adiciones (CoF, CaF y WF) de OWF. Los diferentes colores de las curvas espectrales de abajo hacia arriba en la figura 2 (lecho) representan una proporcin de adulteracin del 3% al 75%. Adems, es bastante evidente que los espectros de la figura 2d se reunieron en un espacio estrecho en comparacin con los espectros de la figura 2b, c. Este fenmeno fue posiblemente asociado con el atributo intrnseco similar entre OWF y WF. 3.2. Modelado en el rango espectral completo Se considera que el efecto de dispersin y el ruido aleatorio pueden atenuarse mediante pretratamientos apropiados. La Tabla 1 presenta los principales parmetros estadsticos de los modelos de PCR y PLSR establecidos utilizando espectros en bruto en el espectro de 957e1665 nm (212 variables) y los enfoques de preprocesamiento (SNV y evaluando las mezclas (CoF, CaF y WF) en OWF. La propiedad de la PCR calibrada y PLSRmodels fue validado sobre la base de persianas venecianas de validacin cruzada seguida de validacin externa independiente. Se observ que tanto PCR como PLSR posean un rendimiento similar. Para la inspeccin de adulterante CoF, los espectros procesados por el 2 Der mostr un mejor efecto en el modelo PLSR (R2 P 0,986, RMSEP 0,026). Con respecto a la mezcla de CaF en OWF, los resultados de validacin cruzada de ambos modelos de PCR y PLSR pre-procesados por SNV fueron mejores que los obtenidos utilizando espectros de Der Der y crudo. La similitud en el rendimiento del modelo implicaba la efectividad del SNV. Cuando se aplicaron los modelos de PCR y PLSR desarrollados al conjunto de validacin independiente, se predijeron los niveles de contaminante de CaF en OWF con R2 P superior de 0,988, RMSEP de 0,089 y R2P de 0,980, RMSEP de 0,143 basado en SNV, respectivamente. Sin embargo, los valores muy altos de RMSEP redujo la precisin de ambos modelos para la prediccin con el valor P de 0,049 de ANOVA. Aunque los valores RMSEP ms bajos fueron adquiridos por PCR y los modelos PLSR desarrollados con 2nd Der, los valores ms altos de RMSEC y RMSECV observados revelaron que estos modelos no pueden funcionar con precisin para el desarrollo del modelo de calibracin. Con slo cuatro LVs, el modelo de PCR establecido utilizando el espectro bruto se sobrevivi con R2 C de 0,978, RMSEC de 0,032, R2 CV de 0,976, RMSECV de 0,034 y R2P de 0,976, RMSEP de 0,071, as como el valor P de 0,045 de ANOVA. Los resultados indicaron que ninguno de los enfoques espectrales de preprocesamiento proporcion el avance del rendimiento del modelo, lo que estaba de acuerdo con las investigaciones similares anteriores (Barbin et al., 2012a, Kamruzzaman et al., 2013a, b). En comparacin con la PCR, el mejor resultado para la deteccin de adulterante WF se produjo por PLSR utilizando SNV, con R2 P de 0,976, RMSEP de 0,035. En general, PLSR y SNV mostr un rendimiento ligeramente estable y mejor que la PCR y 2 Der. Por lo tanto, el modelo SNV-PLSR fue ms apropiado para detectar adulteracin OWF. 3.3. Seleccin de longitudes de onda ptimas Con el fin de desarrollar un sistema de imgenes multiespectral para mejorar la velocidad de procesamiento, un precursor importante es elegir variables de caractersticas del rango de longitud de onda completa (212 variables). Los coe fi cientes ponderados resultantes de PCA fueron utilizados para la seleccin de longitudes de onda caractersticas (Rodrguez-Pulido et al., 2013, ElMasry et al., 2011a, b). Las variables correspondientes al pico y al valle del coe fi ciente de regresin presentaron mayores diferencias en la reflectividad y desempearon un papel importante en los modelos establecidos. Mediante este enfoque, se identificaron respectivamente cinco longitudes de onda de caractersticas (1088, 1188, 1262, 1423 y 1658 nm) y siete longitudes de onda de caractersticas (987, 1094, 1205, 1285, 1423, 1625 y 1658 nm) de las grficas de carga de PC1 y PC2 como se muestra en la Fig. 3. Las diferencias de los valores de la resistencia se relacionaron con las caractersticas de absorcin espectral, tales como armnicos y combinaciones de vibraciones fundamentales. Adems, se eligi otra combinacin de longitudes de onda caracterstica que refleja las caractersticas espectrales de todos los flujos a travs de FMCIA. Como se describe en la Fig. 4a, todos los espectros de flujo fueron procesados primero por 1 Der (ventana de 7 puntos, 1 polinomio de orden) combinada con MC. Basndose en este procedimiento, se utiliz el grfico de carga del coeficiente StdDev resultante de FMCIA para elegir las longitudes de onda ms significativas. Las variables correspondientes al pico y al caudal del coeficiente presentaron mayores diferencias y jugaran un papel importante en modelos simplificados para el desarrollo de sistemas de imgenes multiespectrales. Como se muestra en la figura 4b, se seleccionaron ocho bandas de caractersticas en el espectro de 957e1665 nm (212 bandas) de ocho longitudes de onda (1141, 1349, 1362, 1396, 1426, 1443, 1645 y 1658 nm) basndose en este enfoque. 3.4. Modelo PLSR facilitado para medir el grado de contaminacin OWF Las longitudes de onda de las caractersticas seleccionadas fueron adoptadas para construir modelos PLSR optimizados para evaluar el grado de contaminacin de OWF como mostrados en la Tabla 2. Los parmetros obtenidos de R2 y RMSE demostraron que todos los modelos simplificados tenan una capacidad razonable para predecir la contaminacin por OWF. Se encontr que la precisin del modelo PLSR desarrollado utilizando SNV fue equivalente a los modelos simplificados sin pretratamiento, especialmente para FMCIA-PLSR y PC2- Modelos PLSR. Sin embargo, despus del pre-procesamiento con SNV, el desempeo del modelo PC2-SNV-PLSR fue mejorado un poco obvio. Adems, el modelo PC1-SNV-PLSR tambin mostr una mejor precisin para medir la WF adulterada en OWF. Basndose en el mtodo de seleccin de la longitud de onda de PCA, los resultados ptimos para detectar todos los contaminantes (CoF, CaF y WF) fueron recogidos y presentados en la Fig. 5 (a, b, c), respectivamente. Para las longitudes de onda de caractersticas seleccionadas mediante FMCIA, sus capacidades predictivas en los modelos PLSR fueron mucho mejores sin tener en cuenta el pretratamiento espectral, alcanzando altos R2 P de 0,975, 0,985 y 0,971, as como bajo RMSEP de 0,035, 0,027 y 0,038 para evaluar la CoF, CaF y adulteracin de WF. Los resultados de prediccin de las mezclas en OWF adquiridas por los modelos FMCIA-PLSR ptimos se muestran en la Fig. 6. Estos modelos simplificados tienen la capacidad de ser utilizados para disear sensores multispectrales ms simples para la implementacin en tiempo real. 3.5. Otra optimizacin del modelo PLSR para la prediccin de contaminantes Para el anlisis PLSR, el RC estandarizado tiene una gran influencia en la contribucin de variables independientes a la prediccin de variables dependientes. Aunque la FMCIA en este estudio se consider como el mejor mtodo de seleccin de longitud de onda, las longitudes de onda de las caractersticas obtenidas no mantuvieron el mismo significado para el modelado. Es esencial evaluar y eliminar ms a fondo las variables independientes con RC menos significativo. Tales variables con menores valores absolutos de coe fi ciente pueden identificarse a partir de las grficas de carga de RC en el modelo PLSR. Los coeficientes FMCIA- PLSR de la Fig. 7 representan respectivamente las ocho longitudes de onda caracterstica (1141, 1349, 1362, 1396, 1426, 1443, 1645 y 1658 nm) para la prediccin de contaminantes incluyendo CaF, CoF y WF en OWF. En este estudio, estas ocho longitudes de onda de caractersticas con valores absolutos de RC menores que 18 se consideraron como longitudes de onda de caractersticas secundarias que deberan eliminarse. Como resultado, las longitudes de onda ms importantes de cuatro (1349, 1396, 1645 y 1658 nm), cinco (1396, 1426, 1443, 1645 y 1658 nm) y seis (1141, 1396, 1426, 1443, 1645 y 1658 nm ) se utilizaron para desarrollar los modelos PLSR ms simples para detectar los contaminantes CaF, CoF y WF, respectivamente. En consecuencia, las ecuaciones (4) y (6) se derivaron de las nuevas longitudes de onda de cuatro, cinco y seis alineadas con los nuevos coeficientes adquiridos en el modelo RC-FMCIA-PLSR en lugar de utilizar los valores de coeficiente original del modelo FMCIA-PLSR desarrollado usando ocho longitudes de onda. Especficamente, se detectaron diferentes niveles de contaminantes de CaF basndose en la ecuacin de regresin siguiente: Adems, otra frmula se muestra a continuacin para determinar WF usando el modelo RC-FMCIA-PLSR:
El rendimiento de los modelos RC-FMCIA-PLSR para la deteccin cuantitativa de
CaF, CoF y WF en OWF se resumi en la Tabla 3. El R2 P ms alto de 0.986, 0.973 y 0.971 con menor RMSEP de 0,026, 0,036 y 0,038 se lograron mediante el modelo optimizado RC-FMCIA-PLSR para evaluar la adulteracin de CaF, CoF y WF. En comparacin con los modelos originales de longitud de onda completa, as como con los modelos FMCIA-PLSR, se obtuvieron precisiones paralelas o superiores mediante modelos RC-FMCIA-PLSR utilizando menos longitudes de onda centrales. Especficamente, el rendimiento del modelo desarrollado utilizando cinco longitudes de onda estuvo muy cerca del modelo utilizando ocho longitudes de onda para evaluar la adulteracin de CoF. Por el contrario, la mejor precisin para la deteccin de OWF adulterado con CaF se recogi por RC-FMCIA-PLSR utilizando slo cuatro longitudes de onda caracterstica (1349, 1396, 1645 y 1658 nm), en lugar de la FMCIA-PLSR modelo establecido utilizando ocho longitudes de onda (1141, 1349, 1362, 1396, 1426, 1443, 1645 y 1658 nm). Este resultado demostr que el resto de cuatro longitudes de onda (1141, 1362, 1426 y 1443 nm) fue intil para la deteccin de CaF. Sin embargo, las tres octavas longitudes de onda (1141, 1426 y 1443 nm) desempearon un papel importante en la determinacin de la adulteracin de la FM. Sin embargo, al utilizar estas seis longitudes de onda de caractersticas (1141, 1396, 1426, 1443, 1645, 1658 nm), la precisin de la deteccin de la adulteracin de WF era inesperadamente inferior a la adulteracin de CoF y CaF, lo que significaba que era ms difcil distinguir el WF en OWF. Una de las razones principales es probablemente que las diferencias de variedad entre OWF y CaF, as como OWF y CoF son mayores que las de OWF yWF. Adems, se observ que las diferencias entre R2 C, R2 CV y R2 P eran muy pequeas en el modelo RC-FMCIA-PLSR, lo que podra indicar la solidez de este modelo fi nal. Por lo tanto, era factible suponer que las longitudes de onda de caractersticas extradas utilizando RC- FMCIA se pueden utilizar como las longitudes de onda ms representativas para desarrollar sistemas multiespectrales para aplicaciones en lnea. 3.6. Deteccin visual Los adulterantes en OWF no slo se detectaron sobre la base de los modelos desarrollados utilizando datos espectrales, sino que tambin se pueden visualizar en la dimensin espacial a partir de imgenes espectrales. Esta tcnica tiene una ventaja obvia para identificar tanto los gradientes como las distribuciones espaciales de muestras especficas por visualizacin espacial en cada pxel de la imagen en base a sus caractersticas espectrales. El modelo RC-FMCIA-PLSR simplificado se transfiri en cada pxel para calcular el producto de punto entre los coeficientes ptimos de regresin y los valores espectrales de todos los pxeles de la imagen para la visualizacin espacial. La Fig. 8 presenta las imgenes de falso color resultantes de algunas muestras (la proporcin de adulterante WF en OWF en este caso). Estos mapas de distribucin se generaron al predecir las variaciones en la proporcin de adulteracin junto con una escala de color lineal de baja (azul) a alta (roja). Las diferencias espectrales de pxeles indicaron la concentracin de mezcla en OWF. Este tipo de identi fi cacin visual no puede lograrse usando ojos desnudos, sino que se realizara mediante imgenes multiespectrales. Era distinto distinguir el proporcin de adulteracin que vara de muestra a muestra e incluso dentro de la misma muestra. En consecuencia, los resultados fueron muy grficos y optimistas para presentar el potencial de la tcnica de imgenes espectrales para la prediccin rpida y no destructiva de adulterantes en OWF. 3.7. Discusin Las categoras de diferentes flanes y proporciones de adulterantes (CoF, CaF y WF) en trigo Avatar fueron evaluadas con precisin basndose en la tcnica de imgenes espectrales utilizando longitudes de onda de caractersticas seleccionadas. En esta investigacin, las muestras espec fi cas de trigo de Avatar (origen: Irlanda) que fueron certificadas como orgnicas por el Organic Trust en Irlanda (IE-ORG-03, UE / agricultura no UE) fueron adulteradas con otras tres ms baratas. Todava se desconoce si el clasificador estaba realmente influenciado por caractersticas espectrales especficas relacionadas con la agricultura orgnica, ya que dos muestras de diferentes productores diferiran espectralmente por varias razones (por ejemplo, procesamiento, manipulacin, almacenamiento, tipo de suelo, clima, etc.). Por lo tanto, este estudio no implic la investigacin de distinguir entre las plantas originadas de las granjas que practican la agricultura orgnica y la agricultura tradicional. Tambin se observ que el modelo ptimo de PLSR logr unas precisiones muy altas (Rp2 0,971e0,986) para detectar impurezas (3e75%) en OWF. Los resultados de prediccin encontrados en este estudio fueron similares a los mencionados por Liu et al. (2013a, b) para detectar el polvo de raz de loto adulterado con almidn de patata y camote (R2 P 0,959e0,990). Rady et al (2015) informaron que los enfoques apropiados de pretratamiento y modelizacin pueden mejorar la precisin del resultado, lo que indic que los mtodos propuestos en nuestra investigacin eran aceptables basados en la comparacin de dos mtodos espectrales de preprocesamiento (SNV y II Der ) y dos mtodos de modelado (PCR y PLSR). Adems, grandes variaciones de composiciones genticas o qumicas entre estas fluctuaciones hicieron posible la deteccin efectiva de adulterantes. Se encontr que el R2 disminuy dramticamente cuando la adulteracin proporcin fue inferior al 3% (Liu et al., 2013a, b). Esto significaba que cuanto mayor era la proporcin de adulterante, mejor era el resultado de la deteccin. Como las proporciones de impurezas en OWF fueron de 3% a 75%, esto proporcion una probabilidad razonable de la mayor precisin obtenida en nuestro estudio. Adems, aunque hubo tres categoras de impurezas en OWF, estas impurezas se mezclaron, respectivamente y por separado, con OWF y cada impureza contena solamente una variedad fl. La nica fuente de adulterantes puede dar lugar a mayores tasas de exactitud. Adems, una serie de estudios han puesto de relieve los mayores resultados de prediccin de las tcnicas espectroscpicas, junto con el anlisis multivariante en la deteccin de la adulteracin de alimentos. Por ejemplo, se obtuvo el Rp2 ms alto de 0,99 para determinar la adulteracin del almidn (1 e35% en peso de almidn) en polvo de cebolla (Lohumi et al., 2014), basndose en el modelo infrarrojo por transformada de Fourier (FT-IR) y PLSR. Los mejores resultados de evaluacin de la adulteracin de alimentos no slo se lograron mediante la deteccin de alimentos en polvo sino que tambin se present en la determinacin de materias extraas en las carnes picadas. Especficamente, el modelo PLSR obtuvo respectivamente el Rp2 ms alto de 0,97, 0,99 y 0,99, para detectar adulterantes que incluyeron pollo, cerdo y carne de caballo minados en carne de res o cordero recientemente amamantada basada en imgenes hiperspectrales (Kamruzzaman et al., 2016, 2015, 2013). En sus estudios, las muestras de carne de vacuno picada o de cordero fueron adulteradas con estos adulterantes en el intervalo 0e40% o 50% (p / p) a intervalos de aproximadamente 2%. Por lo tanto, la mayor precisin de deteccin de la adulteracin en este estudio es perfectamente lgico y razonable. 4. Conclusiones Con la globalizacin y los sistemas de distribucin rpida, los incidentes de adulteracin alimentaria pueden tener repercusiones internacionales con consecuencias extremas. Por lo tanto, existe un creciente requisito para el desarrollo de mtodos analticos rpidos, de bajo costo y efectivos para probar la adulteracin. Este estudio ha enfatizado el potencial de la imagen hiperespectral en tndem con anlisis multivariantes para la deteccin en tiempo real de aditivos (CoF, CaF y WF) en especfico OWF (variedad: Avatar) cultivado en Irlanda. Se encontr que el mtodo de seleccin de longitud de onda basado en FMCIA era mejor que PCA. Por otra parte, el modelo RC-FMCIA-PLSR utilizando menos longitudes de onda mostr precisiones anlogas o incluso mejores para la deteccin de OWF adulterado con CaF, CoF y WF, dando R2P superior de 0.986, 0.973 y 0.971 con menor RMSEP de 0.026, 0.036 y 0.038, respectivamente. Los resultados demostraron que el modelo PLSR optimizado puede utilizarse eficientemente para evaluar contaminantes (CoF, CaF y WF) en OWF. Tambin revel que el OWF especfico contaminado por CaF y CoF puede ser detectado con ms precisin que el OWF mezclado con WF comn. Adems, la representacin simultnea de la informacin espectral y de imagen espacial est exclusivamente involucrada en la formacin de imgenes espectrales. Aunque los contaminantes (WF, CaF y CoF) investigados en este estudio son slo tres categoras, es posible detectar la presencia de otras categoras adulteradas desconocidas o cuestiones exticas basadas en la metodologa utilizada. Hasta donde sabemos, esta es la primera vez que la imagen espectral se aplica a la deteccin de contaminantes en productos especficos de trigo orgnico.