Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Introducción
Otra de limitación de MARS (y de todas las otras técnicas discutidas hasta ahora)
es que asume que las calificaciones JAR son independientes de cada una. Este
es un caso raro. En casi todas las categorías de producto, muchos atributos
sensoriales suben y caen ya sea junto u opuesto al otro, y, por eso, están
intercorrelacionados. El cuatro caso de estudio sobrelleva esta limitación. La
regresión de mínimos cuadrados parciales (PLS) con variables postizas posee
todas las ventajas de MARS pero no requiere que los atributos JAR sean
independientes uno de otro. Aunque las salidas de una regresión PLS pueden
ser difíciles de interpretar, el abordaje provee con mucho, si no más, información
acerca de la relación entre calificaciones JAR y gusto general mientras que hace
la menor cantidad de asunciones sobre la naturaleza de la data JAR.
Un caso de estudio de regresión previamente mencionado presenta dos técnicas
relacionadas: el modelo de posibilidades proporcionales (Proportional odds
model (POM)) y el modelo de peligros proporcionales (proportional hazard model
(PHM)). Aunque ambos son un tipo de análisis de regresión, proveen resultados
más similares al ANOVA que a una regresión estándar. En vez de concentrarse
en predecir el gusto general, POM y PHM proveen con tests generales para
diferencia entre la prueba de muestras y comparaciones de parejas para
determinar cuál de las muestras es significativamente diferente a la otra. Ambos
enfoques toman en cuenta la naturaleza ordinal de los datos de escala JAR, pero
ninguno brinda un tratamiento especial al medio de la categoría JAR en le escala.
Si las comparaciones estadísticas de las pruebas de producto son el objetivo
primario del análisis, pueden ser considerados POM y PHM. Mientras que estos
métodos están basados en regresión, su objetivo de diferenciar distribuciones
JAR de productos los pone en la tabla 1 debajo de “Preguntas involucrando solo
datos JAR”, específicamente bajo la pregunta, “¿Son las distribuciones de
puntos JAR similares entre productos?”
- Correlación (Vea apéndice T)
- Regresión (vea apéndice U)
- MARS (vea apéndice V)
- Mínimos cuadrados parciales postizos (PLS) (Vea apéndice W)
Análisis de datos para métodos alternativos a escalas JAR
- Recolectando información de intensidad y hedónica por separado (Vea
apéndice X)
- Diseño experimental (Vea apéndice Y)
- Escala de puntos ideales (Vea apéndice Z)
Resumen y conclusiones
Este manual provee una mirada profunda a las escalas JAR, incluyendo su
aplicación, construcción y análisis. Después de una sección introductoria, una
breve historia del origen y la evolución del uso de la escala JAR fue presentada.
Esta fue seguida de una discusión practica sobre la construcción de escalas JAR
incluyendo el número de puntos de escala, identificación y ubicación de las
anclas de escala, selección de atributos, y ubicación en le balotarlo. Una sección
sobre usos apropiados e inapropiados de las escalas JAR. Un extensivo
resumen de los beneficios y riesgos fue presentado después, incluyendo riesgos
que son comunes a todas las escalas así también como aquellos riesgos que
son únicos para el uso de escalas JAR. Fueron incluidas alternativas a escalas
JAR para el investigador que escoja otros medios para obtener información de
diagnóstico del producto. Finalmente, más de 25 métodos de análisis de datos
de escala JAR son presentados en la forma de casos de estudio usando datos
nativos de un banco de datos común. Los casos de estudio, todos en formato
similar, describen el objetivo, requerimientos, cálculos, salidas, e interpretación
de cada método, seguido de una sección de pros y contras con una
recomendación final acerca de su uso. Estos análisis de casos desde
representaciones graficas simples a computaciones complejas que requirieron
de conocimiento estadístico avanzado o software especializado o ambos.
También se presentaron casos de estudio para alternativas a escalas JAR,
aunque estos están basados en bancos de datos únicos. Los casos de estudio
demostraron que, con un análisis e interpretación apropiados, las escalas JAR
proveen de una guía accionable para el desarrollo de producto.
Referencias
_1_ Ennis, D. M., Analytic Approaches to Accounting for IndividualIdeal Points,
IFPress,Vol. 8 No. 2, 2005, pp. 2–3.
_2_ Moskowitz, H. R., Munoz, M. S., and Gacula, M. C., Viewpointsand
Controversies in Sensory Science and Consumer Product Testing, Food &
Nutrition Press, Inc., Trumbull, CT,2003, pp. 416–430.
_3_ Coombs, C. H., A Theory of Data, John Wiley & Sons, Inc.,NewYork, 1964.
_4_ Kruskal, J. B., “Multidimensional Scaling by Optimizing Goodness of Fit to a
Nonmetric Hypothesis,” Psychometrika, Vol. 29, 1964, pp. 1–27.
_5_ Schutz, H. G., “Consumer DataSense and Nonsense,” FoodQuality
Preference,Vol. 10, 1999, pp. 245–251.
_6_ Riskey, D. R., “Use and Abuses of Category Scales in
SensoryMeasurement,” J. Sens. Stud.,Vol. 1, 1986, pp. 217–236.
_7_ Likert, R., “A Technique for the Measurement of Attitudes,”Arch. Psychol.,
1932, p. 140.
_8_ Thurstone, L. L., “Attitudes Can Be Measured,” Am. J. Sociol.,Vol. 33, No. 4,
1928, pp. 529–552.
_9_ Osgood, C. E., Suci, G. J., and Tannenbaum, P. H., The Measurementof
Meaning, University of Illinois Press, Urbana, IL, 1957, pp. 155–159.
_10_ Coombs, C. H., “Psychological ScalingWithout a Unit of
Measurement,”Psychol. Rev.,Vol. 57, 1950, pp. 145–158.
_11_ Jones, L. V., Peryam, D. R., and Thurstone, L. L., “Developmentof a Scale
for Measuring Soldiers’ Food Preferences,” Food Res.,Vol. 20, 1955, pp. 512–
520.
_12_ Gridgeman, N. T., “A Comparison of Some Taste-Test Methods,”J. Food
Sci.,Vol. 16, 1961, pp. 171–177.
_13_ Moskowitz, H. R., “Subjective Ideals and Sensory Optimizationin Evaluating
Perceptual Dimensions in Food,” J. Appl. Psychol.,Vol. 56, 1972, p. 60.
_14_ McBride, R. L., “Range Bias in Sensory Evaluation,” J. Food Technol.,Vol.
17, 1982, pp. 405–410.
_15_ Frijters, J. E. R., and Rasmussen-Conrad, E. L., J. Gen. Psy-chol.,Vol. 107,
1982, pp. 233–247.
_16_ Booth, D. A., Thompson, A., and Shahedian, B., “A Robust, Brief Measure
of an Individual’s Most Preferred Level of Salt in an Ordinary Foodstuff,” Appetite:
J. Intake Res., Vol. 4, 1983, pp. 301–312.
_17_ McBride, R. L., and Booth, D. A., “Using Classical Psychophysics to
Determine Ideal Flavor Intensity,” J. Food Technol., Vol. 21, 1986, pp. 775–780.
_18_ Connor, M. T., and Booth, D. A., “Preferred Sweetness of a Lime Drink and
Preference for Sweet Over Non-Sweet Foods,” Appetite,Vol. 10, 1988, pp. 25–
35.
_19_ Sheperd, R., Farleigh, C. A., Land, D. G., and Franklin, J. G., “Validity of
Relative-to-Ideal Rating Procedure Compared with Hedonic Rating,” in Progress
in Flavor Research, 4th Weurman Flavor Research Symposium, Elsevier Science
Publishers, Amsterdam, 1984, pp. 103–110.
_20_ Vickers, Z., Holton, E., andWang, J., “Effect of Ideal-Relative Sweetness on
Yogurt Consumption,” Food Quality Preference, Vol. 12, No. 8, 2001, pp. 521–
526.
_21_ Epler, S., Chambers, E., IV, and Kemp, K., “Just About Right Scales are
Not Useful for Measuring Sweetness in Lemonade,” J. Sens. Stud.,Vol. 13, 1998,
pp. 191–198.
_22_ Earthy, P. J., MacFie, J. H., and Duncan, H., “Effect of Question Order on
Sensory Perception and Preference in Central LocationTrials,” J. Sens. Stud.,Vol.
12, 1997, pp. 215–237.
_23_ Moskowitz, H. R., Munoz, M. S., and Gacula, M. C., Viewpoints and
Controversies in Sensory Science and Consumer Product Testing, Food &
Nutrition Press, Inc., Trumbull, CT, 2003.
_24_ Lawless, H. T., and Heyman, H., Sensory Evaluation of Food— Principles
and Practices, Chapman and Hall,NewYork, 1998.
_25_ Bendig, A.W., and Hughes, J. B., II, “Effect of Amount ofVerbal Anchoring
and Number of Rating-Scale Categories Upon Transmitted Information,” J. Exp.
Psychol., Vol. 40, No. 2, 1953, pp. 87–90.
_26_ Kim, W., Ennis, D., and O’Mahony, M., “A New Approach to Category
Scales of Intensity II: Use of d_ Values,” J. Sens. Stud.,Vol. 13, 1998, pp. 251–
267.
_27_ Pokorny, J., and Davidek, J., “Application of Hedonic Sensory Profiles for
the Characterization of Food Quality,” Die Nahrung, Vol. 8, 1986, pp. 757–763.
_28_ Stewart, D. W., Shamdasani, P. N., and Rook, D. W., Focus Groups: Theory
and Practice, 2nd ed., Thousand Oaks California: Sage Publications, 2007.
_29_ Baxter, I. A., and Jack-Schroder, M. J. A., “The Use of Repertory Grid
Method to Elicit Perceptual Data from Primary School Children,” Food Quality
Preference, Vol. 9, 1999, pp. 73–80.
_30_ Tang, C., and Heymann, H., “Multidimensional Sorting, Similarity Scaling
and Free-Choice Profiling of Grape Jellies,” .Sens. Stud.,Vol. 17, No. 6, 2002,
pp. 493–509.
_31_ Gacula, M. C., Jr., Mohan, P., Fuller, J., Pollack, L., and Moskowitz, H.R.,
“Questionnaire practice: What happens when
the JAR scale is placed between two “overall” acceptance scales?”J. Sens.
Stud.,Vol. 23, 2008, pp. 136–147.
_32_ Lovely, C., and Meullenet, J. F., “A Comparison of Statistical Approaches
for the Optimization of StrawberryYogurt Formulation,” 7th Pangborn Sensory
Science Symposium, 2007.
_33_ Parducci, A., and Perrett, L. F., “Category Rating Scales: Effects of Relative
Spacing and Frequency of Stimulus Values,” J. Exp. Psychol. Monogr.,Vol. 89,
1971, pp. 427–452.
_34_ Poulton, E. C., “Models for Biases in Judging Sensory Magnitude,” Psychol.
Bull.,Vol. 86, 1979, pp. 777–803.
_35_ Riskey, D. R., Parducci, A., and Beauchamp, G. K., “Effects of Context in
Judgments of Sweetness and Pleasantness,” Percept. Psychophys.,Vol. 26,
1979, pp. 171–176.
_36_ Johnson, J., and Vickers, Z., “Avoiding the Centering Bias or Range Effect
when Determining an Optimum Level of Sweetness in Lemonade,” J. Sens.
Stud.,Vol. 2, 1987, pp. 283–292.
_37_ Moskowitz, H. R., Food Concepts and Products: Just In Time Development,
Food & Nutrition Press, Inc., Trumbull, CT, 1994.
_38_ Moskowitz, H. R., “Just About Right _JAR_ Directionality and theWandering
Sensory Unit in Data AnalysisWorkshop: Getting the Most Out of Just-About-
Right Data,” Food Quality Preference,Vol. 15, 2004, pp. 891–899.
_39_ Popper, R., Rosenstock, W., Schraidt, M., and Kroll, B. J., “The Effect of
Attribute Questions on Overall Liking Ratings,” Food Quality Preference,Vol. 15,
2004, pp. 853–858.
_40_ Popper, R., Schraidt, M., and Kroll, B. J., “When Do Attribute Ratings Affect
Overall Liking Ratings,” presented at the 6th Pangborn Sensory Sciences
Symposium, Harrogate International Center,York, 7–11 Aug. 2005.
_41_ van Trip, H., Punter, P., Mickartz, F., and Kruithof, L., “The Quest for the
Ideal Product,” J. Food Quality Preference, 2007. _42_ Moskowitz, H. R.,
“Learning from the Competition Through Category Appraisal: One Practitioner’s
Keys to Faster and More Efficient Product Development,” Food Service Technol.,
Vol. 1, No. 2, 2001, pp. 103–118.
_43_ Gacula, M. C., Jr., Singh, J., Bi, J., and Altan, S., Statistical Methods in
Food and Consumer Research, 2nd edition, Academic, San Diego, CA, 2009.
MNL63-EB/Feb. 2009
Introducción y Objetivos
El método de demostración de datos gráfico proporciones de datos del J.A.R
a través de productos y atributos, o ambos. El objetivo de este método es
proveer un método que visualice la distribución de datos del J.A.R. Esto es
descriptivo/ Método de resumen y no un método inferencial.
Requisitos
Este método requiere la distribución de frecuencia para cada atributo, para
cada producto, y una aplicación de gráfico de barras.
"Como hacerlo"
Resuma la distribución de los datos en una tabla de frecuencia para cada
producto por la combinación de atributos. Represente gráficamente estos
resúmenes usando gráficos de barras o gráficos de barras acumulativos de las
frecuencias. Ambos pueden ser agrupados por la escala categórica del
producto, como se muestra en los dos ejemplos de abajo. Los gráficos de barras
también pueden ser mostrados en un producto X de atributo.
Ejemplos de Datos del Estudio de Casos
Los ejemplos a continuación utilizan el atributo de sabor para productos 170,
896, y 914. Figura 1 (a) y (b) de distribución agrupada de frecuencia por la
categoría de escala y por producto, respectivamente. La figura 2 muestra un
gráfico de barras acumulativo.
Resultados y Conclusiones
El ejemplo 1 (a) de Distribuciones graficas de Frecuencia (agrupada por la
categoría de escala del J.AR) compara modelos de respuesta para tres
productos.
En la gráfica se muestra que por encima del 82 % (84 / 102) los encuestados
marcaron en el Sabor del producto 896 "Sobre lo adecuado," mientras que sólo
el 62 % (63 / 102) marcó en el sabor del producto 170 "Sobre lo adecuado" y
sólo el 44 % (45 / 102) del producto 914 marcó "Sobre lo adecuado."
Pues bien, los gráficos de barras pueden ser usados como ilustradores,
mostrando el número actual de respuestas dadas en cada categoría para tres
productos en el mismo diseño. Es fácil ver en el diseño mostrado debajo que el
producto 896 fue considerado
APÉNDICE A: DEMOSTRACIÓN DE DATOS GRÁFICOS 15
"Sobre lo adecuado" en sabor por la mayor parte de encuestados N = 84,
mientras que el producto 914 fue catalogado como "insuficiente" sabor por 48
asesores y "Sobre lo esperado" por 45 asesores.
Recomendación
Este método es recomendado para todos los datos de la escala J.A.R como una
herramienta de evaluación.
1 Director, Sensory Science, Flavor Technology R&D, Solae Company, LLC, P.O.
100
frecuencia de las respuestas
90
80
70
60
50
40
30
20
10
0
Algo J.A.R (Sobre lo
Insuficiente Algo Excedido Excedido
Insuficiente Adecuado)
Producto 170 2 14 63 21 2
Producto 189 0 5 84 12 1
Producto 914 6 48 45 3 0
100%
90% 82%
80%
% Respuestas 70% 62%
60%
47% 44%
50%
40%
30% 21%
20% 14% 12%
10% 5% 6% 3% 0%
2% 2% 0% 1%
0%
Producto 170 Producto 189 Producto 914
Insuficiente Algo Insuficiente
J.A.R (Sobre lo Adecuado) Algo Excedido
Excedido
Fig.1- (a) Frecuencia de sabor J.A.R. (b) Porcentaje de Sabor J.A.R (%).
Respuestas
Producto
6 48 45 3
914
Producto
5 84 12
189
Resultados y conclusiones
Las clasificaciones muestran que los tres productos marcaron por debajo del
70% “Correcto” criterio de tamaño, y los productos 170, 896 y 914 no cumplían
con los criterios que para el sabor. El gráfico Efectos Netos muestra claramente
que la muestra 914 carece de sabor. Aunque el Producto 914 cumplió con el
70% de lo esperado para el color, los Efectos Neto sugieren que puede haber
margen de mejora haciendo que el producto sea un poco más oscuro.
Las calificaciones reales también revelan la polarización de las respuestas de
tamaño para los tres productos y pueden sugerir la existencia de más de un
segmento de consumo en la muestra. Debido a la polarización, los efectos netos
no proporcionan una dirección clara para los cambios de producto para el
tamaño, ya que se encuentran por debajo del criterio del 20% de efecto neto en
este ejemplo. La muestra 170 se puntuó ligeramente por debajo del criterio del
70% para sabor; sin embargo, las respuestas "No Correcto " son similares para
cada extremo de la escala, una vez más no dando una orientación obvia para la
mejora.
Pros y contras
Los beneficios del uso de este método incluyen la facilidad de cálculo, la
presentación visual y la simplicidad de examinación e interpretación de un
estadístico de resumen. En los casos en que los datos sobre cada lado de
“Correcto” se agregan, los efectos netos pueden ser no representativos de la
magnitud de las diferencias entre los productos ya que la información sobre el
grado de “No suficiente” o “Demasiado” se pierden. Otra desventaja de este
método es que si los datos JAR se distribuyen bimodalmente debido a
segmentos de consumidor que pueden tener diferentes expectativas con
respecto a la intensidad del producto, los resultados pueden ser engañosos en
cuanto a que los efectos Netos pueden ser artificialmente bajos. Otra advertencia
gira en torno a la suposición de que si un producto se reformula para abordar el
sesgo en un lado de “Correcto” esto no causaría una sesgada en el otro lado de
“Correcto”. En color para el producto 914, por ejemplo, si el color fuera
reformulado para ser más oscuro. ¿Algunos de los encuestados que califican
actualmente el producto “apenas correcto” ahora clasifican el color demasiado
oscuro?
Recomendación
La escala grafica para los datos de la escala JAR se recomienda como un
componente de presentación de un análisis JAR, pero no se recomienda como
método de análisis independiente.
Apéndice C: Diferencia de porcentaje de la norma y diferencia de porcentaje de
“JustRight”
Gloria A. Gaskin1 and Joni L. Keith1
Introducción y Objetivo:
La diferencia porcentual con el análisis de la norma determina si él % de las
respuestas por la escala JAR cumplen o exceden una norma establecida. Si no
lo hacen, también determina la dirección de los desequilibrios de las respuestas
de la escala JAR. La Diferencia porcentual del análisis "JustRight" no se basa
en una norma, pero compara las respuestas con las de la categoría
"JustAboutRight". Si se encuentra una diferencia significativa, las respuestas se
comparan entre sí. El análisis se realiza en una combinación producto-atributo a
la vez, pero no hay límite en cuanto a cuántos productos o atributos pueden ser
analizados.
Requisito:
Estos análisis requieren el tamaño de base (n) yuna distribución de frecuencia
marginal para cada atributo de escala JAR y producto a analizar.
"Cómo":
Existen dos métodos para utilizar esta técnica dependiendo de si se ha
establecido un valor normativo para el "JAR" deseado.
Análisis A: Diferencia de porcentaje de la norma utilizada cuando se ha
establecido un valor normativo para el porcentaje “JAR”
1. Determinar las respuestas de "JAR%" normalizadas para ser utilizadas en
el análisis, por ejemplo, 70%.
2. ¿El JAR% real es igual o mayor que la norma establecida?
3. a. En caso sea afirmativo, no se requiere más análisis; Si el JAR% es
menor que la norma establecida, continúe con el análisis.
1 2 3 4 5 6 7 8 9 10
Son 1 y 2
CODIGO El JAR Valor diferentes
JAR SUMA a
DEL >= 1Y2 4Y5 Max critico de 4 y 5 conclusiones
(n; %) (o n)
PRODUCTO 70%? 0.05 con p=
0.05?
170 63 NO 16 23 39 23 27 NO
porcentaje 61.76 15.69 22.55 EL PRODUCTO
N/A, 914 NO TIENE
896 84 SI 5 13 18 13 14 JAR>=70% SUFICIENTE
porcentaje 82.35 4.9 12.75 SABOR,
914 45 NO 54 3 57 54 37 SI INCREMENTAR
porcentaje 44.12 52.94 2.94 SU SABOR.
a mayor de 1+2 o 4+5
TABLA 2- ATRIBUTO: SABOR, OPCION A
1 2 3 4 5 6 7 8 9 10
Son 1 y 2
CODIGO El JAR Valor diferentes
JAR SUMA
DEL >= 1Y2 4Y5 Maxa critico de 4 y 5 conclusiones
(n; %) (o n)
PRODUCTO 70%? 0.05 con p=
0.05?
N/A,
170 85 SI 11 6 17 11 14 JAR>=70%
porcentaje 83.33 10.78 5.88 TODOS LOS
N/A, PRODUCTOS
896 98 SI 1 3 4 3 N/A JAR>=70% SON
porcentaje 96.08 0.98 2.94 CONSIDERADOS
N/A, "JAR", NO HAY
914 81 SI 21 0 21 21 16 JAR>=70% NINGUNA
porcentaje 79.41 20.59 0 ACCION.
a mayor de 1+2 o 4+5
1 2 3 4 5 6 7 8 9 10
Son 1 y 2
CODIGO El JAR Valor diferentes
JAR SUMA
DEL >= 1Y2 4Y5 Maxa critico de 4 y 5 conclusiones
(n; %) (o n)
PRODUCTO 70%? 0.05 con p=
0.05?
170 37 NO 24 41 65 41 41 SI
porcentaje 36.27 23.53 40.20 REDUCIR EL
896 40 NO 22 40 62 40 39 SI TAMAÑO DE
porcentaje 39.22 21.57 39.22 LOS
914 32 NO 28 42 70 42 44 NO PRODUCTOS
porcentaje 31.37 27.45 41.18 170 Y 914.
TABLA 4- ATRIBUTO: TAMAÑO, OPCION B
1 2 3 4 5 6 7 8
Son1,2,4,5
CODIGO Valor diferentes Es JAR mejor
SUMA
DEL 1,2,3,4 JAR critico que el que otros Conclusiones
(o n)
PRODUCTO 0.05 JAR p=0.05?
p=0.05?
16+23 63
170 =39 61.76 102 62 SI SI
LA MISMA
CONCLUSION
QUE LA
porcentaje 38.24 OPCION A
1 2 3 4 5 6 7 8
Son1,2,4,5 Es JAR
CODIGO Valor
SUMA diferentes mejor que
DEL 1,2,3,4 JAR critico Conclusiones
(o n) que el JAR otros
PRODUCTO 0.05
p=0.05? p=0.05?
11+6 85
170 =17 83.33 102 62 SI SI
EN TODOS LOS CASOS
NO MAS LA MISMA CONCLUSION
porcentaje 16.67 ANALISIS ES LA OPCION A.
1+3+4
896 98 102 62 SI SI
NO MAS
porcentaje 3.92 96.08 ANALISIS
21+0
914 =21 81 102 62 SI SI
NO MAS
porcentaje 20.59 79.41 ANALISIS
1 2 3 4 5 6 7 8
Son1,2,4,5 Es JAR
CODIGO Valor diferentes mejor
SUMA
DEL 1,2,3,4 JAR critico que el que Conclusiones
(o n)
PRODUCTO 0.05 JAR otros
p=0.05? p=0.05?
170 21+41=65 37 102 62 SI NO
EN TODOS LOS
IR A LA CASOS LA MISMA
OPCION CONCLUSION ES
porcentaje 63.73 36.27 A LA OPCION A.
896 22+40=62 40 102 62 NO NO
IR A LA
OPCION
porcentaje 60.78 39.22 A
¿Se ha
establecido
Determine n, el
una norma o
un mínimo número total de
porcentaje de respuestas.
NO
respuesta casi
correcto?
NO UN NÚMERO
RAZONABLE
PUEDE SER 70%
CORRECTO SI Sume el número de respuestas
de los extremos de cada
categoría.
SI
¿Se ha IGNORA LAS
SI
logrado la OTRAS
respuesta RESPUESTAS
mínima
casi
correcta?
USANDO P= 0,5 HAY
NO ALGUNA DIFERENCIA
NO SIGNIFICATIVA ENTRE
LAS RESPUESTAS
“CORRECTAS” Y LA
COMBINACION DE
SUMA LAS RUPUESTAS DE LOS LAS RESPUESTAS EN
EXTREMOS BAJOS CON LOS LOS EXTREMOS.
EXTREMOS ALTOS
SI
Fig 1. Escala JAR: diferencia porcentual desde la norma (diagrama de flujo para las opciones A Y B
Pro y Contras:
Recomendación:
ReferenciasBibliográficas:
Apendice D: La media
I. INTRODUCCION Y OBJETIVOS
El objetivo del análisis de la media es determinar si, en promedio, el producto
marca "Just About Right" o si hay un sesgo de "demasiado" o "no es suficiente"
de un atributo. Este método de análisis utiliza sólo los datos JAR. Mientras que
el cálculo de los medias JAR se completa individualmente para cada producto,
estos medias pueden compararse (véanse los Apéndices I y J). Para determinar
si la media es estadísticamente diferente del punto medio de la escala ver el
Apéndice F.
II. REQUISITOS
Para realizar un análisis de la media, se necesitan las puntuaciones de datos
brutos para cada encuestado y el producto para los atributos de interés.
III. ¿CÓMO?
Cada puntuación media se calcula sumando los valores de los datos brutos para
cada combinación de atributo / producto y luego dividiendo la suma por número
de respuestas para esa combinación de atributo / producto. La media se compara
entonces con el valor "Just About Right". Por ejemplo, en una escala simétrica
de 5 puntos, que va de 1 a 5, la media de la muestra se comparará con el valor
"JAR" de 3.
Introducción y Objetivos
Las desviaciones media direccional y absoluta son estadísticas que se pueden usar
para resumir y verificar el balance de la data JAR. La data JAR es analizada
separadamente para cada producto y por cada atributo.
La desviación media direccional es el promedio registrado diferenciado de las
clasificaciones del valor de “Justo a tiempo” (JAR). En una escala de 5 puntos de
Justo a tiempo, el rango de la media direccional va de -2 a +2 (Perfecto=0). Puntajes
que son cercanos a -2 indican que la respuesta a ese atributo fue “Demasiado bajo”.
Los puntajes que son cercanos a +2 indican que la respuesta para ese atributo fue
de “Demasiado alto”. Las desviaciones media direccional es un simple
desplazamiento de la media, explicado en el apéndice D.
La desviación media absoluta resume la extensión de la clasificación del valor de
“Justo a tiempo”. En una escala de 5 puntos, la desviación media absoluta tiene un
rango de 0, cuando todas las decisiones son “Justo a tiempo” a +2, cuando todas
las decisiones son de uno o del otro extremo del final de la escala. A diferencia de
los porcentajes en los puntajes “Perfecto”, las desviaciones absolutas pueden ser
calculadas para cada individuo y la desviación media absoluta puede ser analizada
por cualquiera de los procedimientos estadísticos de parámetros estandarizados.
La desviación media absoluta resume la distancia promedio al valor de “Justo a
tiempo”, mientras que la desviación media direccional resume la dirección promedio
a los atributos del valor de “Justo a tiempo”.
Requerimientos
Para calcular los valores de las desviaciones medias direccional y absoluta tienes
que tener la distribución de los puntajes del JAR para cada combinación de producto
y atributo.
¿Cómo hacerlo?
Desviación Media Direccional
1) Calcular el puntaje medio
2) Sustraer el valor de “Justo a tiempo” dentro de la escala.
1Centro de Investigación Fonterra, Paquete Privado 11 029, Carretera de Granja Lechera, North
Palmerston, Nueva Zelanda.
las calificaciones, la columna 5 resta 3, del valor obtenido en la escala de “Justo a
tiempo”, y la columna 6 muestra los valores absolutos de aquellas diferencias. La
tabla 2 resume los cálculos para las propiedades de Tamaño, Color, Sabor,
Fino/Grueso, y Viscosidad para los productos 170, 896 y 914.
Tabla 2. Puntajes de la media direccional y la media absoluta para el ejemplo del conjunto de datos.
Resultados y conclusiones
De los puntajes medios mostrados en la tabla 2, podemos sacar las siguientes
conclusiones.
Tamaño: No hubo mucha diferencia entre las muestras y estuvieron cerca
del “Perfecto”, a pesar de que todas fueron ligeramente muy largas.
Color: La muestra 896 estuvo más cerca del “Perfecto” que las otras
muestras. La muestra 914 estuvo muy clara.
Sabor: La muestra 896 estuvo más cerca del “Perfecto” que las otras
muestras; la muestra 914 fue la más lejana del “Perfecto”. Esta muestra no
tenía mucho sabor.
Fino/grueso: La muestra 896 estuvo más cercana al “Perfecto”; la muestra
914 fue la más lejana del “Perfecto”. Esta muestra fue demasiado gruesa y
las otras dos muestras eran ligeramente muy finas.
Viscosidad: No hubo mucha diferencia entre las muestras; la muestra 896
fue la ligeramente la más cerca al “Perfecto” que las otras dos muestras. La
muestras 914 no fue lo suficientemente viscoso y las muestras 170 y 896
fueron ligeramente muy viscosas.
Comparaciones de producto
La muestra 896 fue la más cerca al “Perfecto” para todos los atributos
comparados con las otras dos muestras.
La muestra 914 fue la más alejada del Perfecto” para la mayoría de
atributos. Fue muy claro, no tuvo suficiente sabor, fue muy grueso y no fue
lo suficientemente viscoso.
La muestra 170 estuvo cercana al “Perfecto” pero no tuvo respuestas tan
satisfactorias como la muestra 896.
A favor y en contra
Este análisis dio una medida de su extensión a través del valor “Justo a tiempo” y la
dirección de la desviación promedio para ese valor. Lo último puede usarse para
sugerir direcciones para realizar mejoras.
Una limitación potencial para la desviación estadística es el cálculo requerido de
dos pasos para la desviación estadística. Mientras son insignificantes en paquetes
como SAS, SPSS, R y JMP, requiere una programación extra para sistemas como
Excel. Este análisis puede ser mejorado con una representación gráfica.
Recomendación
Este análisis es muy útil en resumir el cambio promedio y su difusión del valor de
“Justo a Tiempo” en la escala JAR. Sin embargo, este no aporta ningún significado
estadístico para evaluar las diferencias entre los productos o la variabilidad
inherente en las medidas.
Vea las Tablas 1 y 2. El producto 170 podría considerarse "Just About Right" por la
cantidad de color, cantidad de sabor y grosor, y se percibió que era "demasiado
grande" en tamaño y "demasiado pegajoso" en comparación con el "ideal".
El producto 458 podría considerarse "Just About Right" para el tamaño y el grosor,
y se percibía que era "demasiado bajo" en color, "demasiado alto" en intensidad de
sabor y "demasiado pegajoso" en comparación con el "ideal".
TABLA 1-Promedio de calificaciones de cinco productos para cinco
atributos JAR. N = 102. Las puntuaciones medias en negrita son
significativamente diferentes del punto de mediana escala de 3,0, en α =
0,05.
Intensidad de Grosor
sabor Delgado/Grueso
Código de Producto Tamaño Color Adherencia
170 3.2 3.0 3.1 2.9 3.1
458 3.0 2.9 3.4 2.9 3.1
523 3.2 2.9 3.2 2.9 3.1
896 3.2 3.0 3.1 2.9 3.1
914 3.1 2.8 2.4 3.2 3.0
Intensidad de Grosor
sabor Delgado/Grueso
Código de Producto Tamaño Color Adherencia
170 0.026 0.227 0.329 0.059 0.004
458 1.000 0.001 0.000 0.163 0.023
523 0.106 0.134 0.001 0.004 0.001
896 0.015 0.320 0.049 0.070 0.001
914 0.347 0.000 0.000 0.001 0.551
El Producto 523 podría considerarse "Just About Right" para el tamaño y la cantidad
de color, y se percibió como "demasiado alto" en intensidad de sabor y "demasiado
fino" y "demasiado pegajoso" en comparación con el "ideal".
El producto 896 podría considerarse "Justo a la derecha" por la cantidad de color y
grosor, y se percibió como "demasiado grande", "demasiado alto" en la intensidad
del sabor y "demasiado pegajoso" en comparación con el "ideal".
El Producto 914 podría considerarse "Just About Right" para tamaño y adherencia,
y se consideró demasiado bajo en color, "demasiado bajo" en intensidad de sabor
y "demasiado grueso" en comparación con el "ideal".
Pros y contras
Este es un análisis simple para realizar y puede proporcionar orientación para el
desarrollo de productos sobre cómo los cambios direccionales a un atributo de
producto pueden aumentar su aceptabilidad. Este método es razonable de usar
cuando no hay una norma establecida para el porcentaje esperado de "Just About
Right" respuestas.
Este método supone una distribución normal de las respuestas. La distribución de
las respuestas debe examinarse antes de realizar este procedimiento, es decir,
revisar las frecuencias de las distribuciones como una tabla de valores numéricos o
como un histograma; Si hay una distribución bimodal, entonces una prueba simple
de la media generalmente no es apropiada ver Apéndice D.
La comparación de los promedios con el punto medio de la escala proporciona
orientación direccional sobre los cambios del producto; Se requieren datos
adicionales para sacar conclusiones sobre la cantidad absoluta de cambio para el
atributo especificado para aumentar la aceptabilidad del consumidor.
Este método no permite comparaciones directas entre muestras; Se necesitarían
análisis adicionales (ver Apéndice J) para comparar dos o más productos.
Recomendación
Este método de análisis se recomienda cuando sólo hay datos JAR disponibles de
una población unimodal, para permitir la comparación de los atributos individuales
del producto a la "Ideal".
TABLA 1-Resumen de los métodos para comparar las distribuciones de JAR entre
los productos.
2 Productos 3 Productos
Formato de Método Escala JAR Escala JAR Escala JAR Escala JAR
la Prueba para 2 para 3 o más para 2 para 3 o más
categorías categorías categorías categorías
Cada X X X X
evaluador CMR
evalua todos Stuart- X X
los productos Maxwell
X
McNemar
Diferentes X X X X
evaluadores Chi-
evalúan cada cuadrado
producto
CMH
Hipótesis Alternativa GL Value p-value
Las puntuaciones medias de la fila 2 0.174 0.916
difieren
Asociación General 4 1.691 0.792
CMH
Hipótesis Alternativa GL Value p-value
Las puntuaciones medias de la fila 2 24.53 <0.0001
difieren
Asociación General 4 29.94 <0.0001
CMH
Hipótesis Alternativa GL Value p-value
Las puntuaciones medias de la fila 2 63.98 <0.0001
difieren
Asociación General 4 77.77 <0.0001
Atributo= Frecuencia JAR de delgado /grueso
Producto 1 2 3 Total
170 13 84 5 102
896 9 90 3 102
914 4 77 21 102
CMH
Hipótesis Alternativa GL Value p-value
Las puntuaciones medias de la fila 2 23.73 <0.0001
difieren
Asociación General 4 29.70 <0.0001
CMH
Hipótesis Alternativa GL Value p-value
Las puntuaciones medias de la fila 2 7.51 0.023
difieren
Asociación General 4 11.13 0.025
Donde:
n11= número de asesores que dieron la calificación de “demasiado poco” para ambos
productos
n12= número de asesores que dieron una calificación de “demasiado poco” para el
producto A y una calificación de “exacto” al producto B
n.1= número de asesores que dieron la calificación de “demasiado poco” para el
producto A
n1.= número de asesores que dieron la calificación de “demasiado poco” para el
producto B
La estadística de prueba 16.62 es mayor que el valor crítico de 13.82 de una tabla
de distribución de chi cuadrado con 2 grados de libertad al nivel de signifi cado de
0.001. Esto indica que existe una diferencia estadísticamente significativa entre los
productos 170 y 896 en las distribuciones de la escala JAR para la cantidad de
sabor.
Conclusión del análisis
La conclusión de que hay una diferencia estadísticamente significativa en las
distribuciones de puntaje JAR para la cantidad de sabor entre el Producto 170 y el
Producto 896 no indica al investigador cómo difieren las distribuciones de los
puntajes JAR. El investigador a menudo puede determinar cómo las distribuciones
difieren simplemente mirando la tabla de frecuencias. En este ejemplo, el producto
896 recibió más puntajes que el producto 170 en la categoría "Exacto" (84 frente a
63). Un análisis de seguimiento que puede ser de interés para el investigador es
combinar las respuestas en las categorías "Demasiado poco" y "Demasiado" y usar
el método McNemar para determinar si hay una diferencia en el número de "Exacto"
Y "No es exacto" las respuestas entre los dos productos. Este análisis de
seguimiento le dirá al investigador si una proporción significativamente mayor de
evaluadores dio calificaciones de "Exacto" a un producto que el otro.
Beneficios del Análisis
El método de Stuart-Maxwell permite al investigador determinar si existe una
diferencia significativa en las distribuciones de puntaje JAR entre dos productos en
la situación en que la escala JAR contiene tres o más categorías y cada evaluador
evaluó ambos productos. Otro enfoque, la prueba de McNemar, requiere que los
datos se combinen en dos categorías. El método Stuart-Maxwell proporciona más
precisión que el método del chi-cuadrado para probar situaciones en las que los
mismos evaluadores evalúan todos los productos. Cuando la escala JAR contiene
tres categorías, las fórmulas están disponibles para calcular la estadística de prueba
sin el uso de una computadora.
Advertencias
El método Stuart-Maxwell no está disponible por nombre en la mayoría de los
programas informáticos de análisis estadísticos más comunes. Sin embargo, dado
que el método Stuart-Maxwell es un caso especial del método CMH, cualquier
programa de software que realice el método CMH proporcionará también el método
Stuart-Maxwell. Como con el método CMH, este método también requiere ciertos
supuestos de homogeneidad para ser válido.
Recomendaciones
El método de Stuart-Maxwell se puede utilizar para comparar las distribuciones de
puntajes JAR de dos productos cuando los productos son evaluados por el mismo
grupo de evaluadores. Si cada producto es evaluado por un grupo diferente de
evaluadores, entonces este método no es apropiado y se debe usar un método de
chi-cuadrado o una técnica más general como una regresión ordinal.
Método McNemar
El método de McNemar se puede utilizar para determinar si hay diferencias en las
distribuciones de puntajes JAR entre dos productos cuando los datos de la escala
JAR se han combinado en dos categorías. El método McNemar es apropiado
cuando ambos productos han sido evaluados por los mismos evaluadores.
Objetivos del Análisis
La hipótesis nula probada por el método McNemar es que las proporciones de las
puntuaciones JAR en las dos categorías son iguales para los dos productos que se
comparan. La hipótesis alternativa es que las proporciones para los dos productos
son diferentes. El método McNemar se utiliza típicamente para determinar si hay
diferencias en las distribuciones de puntajes JAR entre dos productos cuando las
calificaciones en la escala JAR se han combinado en dos categorías de una de las
siguientes maneras:
• "Demasiado poco" y "Demasiado" clasificaciones combinadas para crear las
categorías "Exacto" y "No es exacto"
• "Demasiado poco" y "Exacto" clasificaciones combinadas para crear las categorías
"Demasiado poco o exacto" y "demasiado"
• "Exacto" y "Demasiado" clasificaciones combinadas para crear las categorías "muy
poco" y "Exacto o demasiado" .La prueba de McNemar se puede utilizar como una
prueba de seguimiento después de un resultado estadísticamente significativo del
método de Cochran Mantel Haenszel (CMH) o el método de Stuart-Maxwell para
determinar cómo las distribuciones de las puntuaciones JAR difieren entre dos
productos.
Requisitos para el análisis
Para utilizar el método McNemar, ambos productos deben haber sido evaluados por
los mismos evaluadores. Los datos deben ser ordenados primero en una tabla que
enumera el número de evaluadores que dieron la misma clasificación en la escala
JAR al Producto A y Producto B y al número de evaluadores que dieron
calificaciones diferentes al Producto A y al Producto B como se muestra a
continuación. El ejemplo siguiente muestra la disposición de datos cuando los
valores de escala se han combinado para crear las dos categorías "Exacto" y "No
es exacto".
Clasificación del Producto B
Clasificación del Producto “Exacto” “No es Exacto”
A
“Exacto” n11 n12
“No es Exacto” n21 n22
Donde:
n11= número de asesores que dieron la calificación “Exacto” a ambos productos
n12= número de asesores que dieron la calificación “Exacto” para el producto A y la
calificación “No exacto ” para el producto B
n21= número de asesores que dieron la calificación “Exacto” para el producto B y la
calificación “No exacto ” para el producto A.
n22= número de asesores que dieron la calificación “No Exacto” a ambos productos.
Recomendaciones
Se recomienda utilizar el método McNemar cuando se comparan dos productos, la
escala JAR se ha colapsado en dos categorías y cada evaluador ha evaluado una
muestra de ambos productos. Si cada producto es evaluado por un grupo diferente
de evaluadores, entonces este método no es apropiado y se debe usar un método
de chi-cuadrado o una técnica más general como una regresión ordinal.
Método Chi-cuadrado
El método del chi-cuadrado es apropiado cuando cada evaluador evalúa solamente
un producto y el investigador desea comparar la distribución de los resultados de
JAR a través de dos o más productos.
Objetivos del Análisis
El método del chi-cuadrado puede utilizarse para probar la hipótesis nula de que no
hay diferencias en las distribuciones de las puntuaciones JAR entre los productos.
La hipótesis alternativa es que al menos un producto es diferente de los demás en
esta escala JAR. Por ejemplo, un producto puede tener una proporción más alta de
resultados en la categoría "Exacto correcto" que otro producto.
Requisitos para el análisis
Este método de análisis requiere que las calificaciones de los evaluadores sean
independientes. Esto generalmente implica que un grupo diferente de evaluadores
evalúa cada producto. Tenga en cuenta que puede ser posible estructurar las
pruebas para que las calificaciones de los evaluadores de los productos múltiples
se comporten como si fueran independientes (por ejemplo, separando las
evaluaciones de los productos por un periodo de tiempo suficientemente largo para
que los evaluadores no recuerden sus evaluaciones previas) .
Donde:
n11= número de asesores que dieron la calificación "muy poco" para un producto A
n1.= número de evaluadores que calificaron el Producto A
n.1= suma del número de calificaciones de "muy poco" para todos los productos
n..=suma del número de clasificaciones en todas las categorías JAR para todos los
productos
Dado que esta prueba indica que hay una diferencia estadísticamente
significativa en las distribuciones de los puntajes JAR entre los tres
productos, el investigador puede querer hacer una prueba de seguimiento
para determinar si hay una diferencia significativa en las distribuciones de los
puntajes JAR entre los productos 170 y 896. El primer paso es crear una
subtabla para los productos 170 y 896. Luego calcular el número esperado
de respuestas para cada producto en cada categoría de escala JAR.
Número de respuestas en cada categoría
(Valores esperados entre paréntesis)
Producto Demasiado Exacto Demasiado Totales
poco
170 16 63 23 102
(10.5) (73.5) (18)
896 5 84 13 102
(10.5) (73.5) (18)
Totales 21 147 36 204
Advertencias
Algunos investigadores usan el método del chi-cuadrado en lugar de los
métodos de CMH, Stuart-Maxwell o McNemar para probar las diferencias en
las distribuciones de puntaje JAR entre dos o más productos,
independientemente de si los evaluadores evalúan solo un producto o todos
los productos. Esto es generalmente inválido. La prueba del chi-cuadrado
requiere que las calificaciones de los evaluadores de los productos sean
independientes. En los estudios en los que el mismo evaluador evalúa más
de un producto, las respuestas de los evaluadores individuales sobre
productos múltiples suelen estar positivamente correlacionadas. Los
métodos CMH, Stuart-Maxwell y McNemar toman en cuenta esta correlación,
pero el método chi-cuadrado no. Por esta razón, los métodos de CMH, Stuart-
Maxwell o McNemar son más sensibles que el método del chi-cuadrado
cuando las respuestas para cada evaluador están positivamente
correlacionadas. Si las calificaciones de los evaluadores de los productos
están correlacionadas positivamente, entonces los valores de p del método
del chi-cuadrado son más altos que los valores de p de las pruebas de CMH,
de Stuart-Maxwell, o de McNemar. Por lo tanto, cuando se utiliza la prueba
del chi-cuadrado en una situación donde cada evaluador evalúa dos o más
de los productos en el estudio, existe la posibilidad de que las diferencias en
las distribuciones de las calificaciones JAR entre los productos se declararán
como no significativas cuando estadísticamente Realmente existen
diferencias significativas.
Recomendaciones
Se recomienda el método del chi-cuadrado para comparar las distribuciones
de puntaje JAR entre dos o más productos en situaciones en las que
diferentes grupos de evaluadores evalúan cada producto. En situaciones en
que los productos son evaluados por el mismo grupo de evaluadores, se
recomiendan los métodos CMH, Stuart-Maxwell o McNemar.
Referencias
Correr;salir;
Resultados y Conclusiones