Sei sulla pagina 1di 8

808 APÉNDICE C

Apéndice C: Glosario Coeficiente de correlación de rangos ordenados Medi-


da de la fuerza de la relación entre dos variables; se basa
Alfa (a) Símbolo empleado para representar la probabili- en los rangos ordenados de los valores.
dad de un error tipo I. Véase también Nivel de signifi- Coeficiente de correlación de rangos ordenados de
cancia. Spearman Véase Coeficiente de correlación de rangos
Análisis de varianza Método para analizar las varianzas ordenados.
poblacionales, que permite hacer pruebas de hipótesis Coeficiente de correlación lineal Medida de la fuerza de
acerca de medias de poblaciones. la relación entre dos variables.
Análisis de varianza de dos factores Análisis de varianza Coeficiente de correlación producto-momento de Pear-
que implica datos clasificados según dos factores distintos. son Véase Coeficiente de correlación lineal.
Análisis de varianza de un factor Análisis de varianza Coeficiente de determinación Cantidad de la variación
que implica datos clasificados en grupos de acuerdo con de y que se explica con la línea de regresión.
un solo criterio. Coeficiente de determinación ajustado Coeficiente de
Análisis exploratorio de datos (AED) Rama de la esta- determinación múltiple R2, modificado para justificar el
dística que pone énfasis en la investigación de datos. número de variables y del tamaño de la muestra.
Anchura de clase La diferencia entre dos límites de cla- Coeficiente de determinación múltiple Medida de qué
se inferiores consecutivos en una distribución de fre- tan bien una ecuación de regresión múltiple se ajusta a los
cuencias. datos muestrales.
ANOVA Véase Análisis de varianza. Coeficiente de variación (CV) Razón entre la desvia-
Aproximación de la probabilidad por frecuencia relativa ción estándar y la media, que se expresa como un por-
Valor de probabilidad estimado con base en observacio- centaje.
nes reales. Complemento de un suceso Todos los resultados en los
Bajo control estadístico Véase Proceso estadísticamente que el suceso original no ocurre.
estable. Confusión Situación que se presenta cuando no es posible
Beta (b) Símbolo empleado para representar la probabili- distinguir entre los efectos de dos o más variables.
dad de un error tipo II. Control estadístico de procesos (CEP) Uso de técnicas
Bimodal Se dice que un conjunto de datos es bimodal estadísticas, como gráficas de control, para analizar un
cuando tiene dos modas. proceso o sus salidas y así poder tomar medidas apropia-
Bloque Grupo de individuos similares con respecto a las das con el fin de lograr y mantener un estado de control
formas en que pueden afectar el resultado de un experi- estadístico y mejorar la capacidad del proceso.
mento. Corrección por continuidad Ajuste que se hace cuando
Cambio marginal Para variables relacionadas por una una variable aleatoria discreta se aproxima con una varia-
ecuación de regresión, la magnitud del cambio en la ble aleatoria continua (sección 6-6).
variable dependiente, cuando una de las variables inde- Correlación Asociación estadística entre dos variables.
pendientes cambia en una unidad y las demás variables Cuartil medio La mitad de la suma de los cuartiles pri-
independientes se mantienen constantes. mero y tercero.
Celda Categoría empleada para separar datos cualitativos Cuartiles Los tres valores que dividen datos ordenados en
(o de atributo). cuatro grupos, con aproximadamente el 25% de los valo-
Censo Recolección de datos de cada elemento de una po- res en cada grupo.
blación. Curva de densidad Gráfica de una distribución de proba-
Centroide El punto sx, y d, determinado a partir de un bilidad continua.
conjunto de datos bivariados. Datos Información o números que describen alguna ca-
CM (del error) Cuadrado medio del error; se usa en el racterística.
análisis de varianza. Datos apareados Se dice que en dos muestras hay datos
CM (del tratamiento) Cuadrado medio de tratamientos; apareados cuando cada valor de una de ellas está aparea-
se usa en el análisis de varianza. do con un valor correspondiente de la otra muestra.
CM (total) Cuadrado medio de la variación total; se usa Datos bivariados Datos ordenados en pares.
en el análisis de varianza. Datos categóricos Datos que pueden dividirse en diferen-
Coeficiente de confianza Probabilidad de que un paráme- tes categorías y que se distinguen por alguna característi-
tro de población esté contenido dentro de un intervalo de ca no numérica.
confianza particular; también se denomina nivel de con- Datos continuos Datos que se obtienen de un número in-
fianza o grado de confianza. finito de valores posibles, que corresponden a puntos de
Coeficiente de correlación Medida de la fuerza de la re- una escala continua que abarca un rango de valores sin
lación entre dos variables. huecos, saltos ni interrupciones.
Apéndice C 809

Datos cualitativos Datos que pueden dividirse en diferen- probabilidad de pertenecer a las diferentes categorías o
tes categorías que se distinguen por alguna característica tratamientos.
no numérica. Distribución chi cuadrada Una distribución de probabi-
Datos cuantitativos Datos que consisten en números que lidad continua (se presenta en la sección 7-5).
representan conteos o mediciones. Distribución de frecuencias Lista de valores de datos
Datos de atributo Datos que pueden dividirse en diferen- (individualmente o por grupos de intervalos) junto con
tes categorías que se distinguen por alguna característica sus frecuencias (o conteos) correspondientes.
no numérica. Distribución de frecuencias acumulativas Distribución
Datos de proceso Datos ordenados según alguna secuen- de frecuencias en la que cada clase y frecuencia represen-
cia de tiempo, que miden una característica de bienes o ta los datos acumulativos hasta esa clase inclusive.
servicios que resultan de alguna combinación de equipos, Distribución de frecuencias relativas Variación de la
personas, materiales, métodos y condiciones. distribución básica de frecuencias en la que la frecuen-
Datos de series de tiempo Datos reunidos en diferentes cia de cada clase se divide entre el total de todas las fre-
puntos del tiempo. cuencias.
Datos discretos Datos con la propiedad de que el número Distribución de Poisson Distribución de probabilidad
de valores posibles es un valor finito o que puede contar- discreta que se aplica a ocurrencias de algún suceso du-
se, que resulta en 0 posibilidades, 1 posibilidad o 2 posi- rante un intervalo de tiempo, distancia, área, volumen u
bilidades, etcétera. otra unidad similar que se especifique.
Datos numéricos Datos que consisten en números que re- Distribución de probabilidad Conjunto de valores de
presentan conteos o mediciones. una variable aleatoria junto con sus probabilidades co-
Datos ordenados Datos acomodados en orden. rrespondientes.
Desviación Magnitud de la diferencia entre un puntaje y Distribución F Distribución de probabilidad continua; se
la media; se expresa como x 2 x. explica en la sección 9-5.
Desviación absoluta La medida de variación que es igual Distribución muestral de medias muestrales Distribu-
a la suma de las desviaciones de cada valor respecto a la ción de las medias muestrales que se obtiene al seleccio-
media, dividida entre el número de valores. nar repetidamente muestras de igual tamaño de la misma
Desviación estándar Medida de variación igual a la raíz población.
cuadrada de la varianza. Distribución muestral de proporciones Distribución de
Desviación explicada Para un par de valores de un con- probabilidad de las proporciones muestrales, donde todas
junto de datos bivariados, la diferencia entre el valor de y las muestras tienen el mismo tamaño muestral n.
predicho y la media de todos los valores de y. Distribución normal Distribución de probabilidad con
Desviación media absoluta Medida de variación que es forma de campana, descrita algebraicamente con la fórmu-
igual a la suma de las desviaciones de cada valor respecto la 6-1 de la sección 6-1.
a la media, dividida entre el número de valores. Distribución normal bivariada Distribución de datos
Desviación no explicada Para un par de valores en un apareados en la que, para cualquier valor fijo de una va-
conjunto de datos bivariados, la diferencia entre la coor- riable, los valores de la otra variable están distribuidos
denada y y el valor predicho. normalmente.
Desviación total Suma de la desviación explicada y la Distribución normal estándar Distribución normal con
desviación no explicada para un par dado de valores en una media igual a cero y una desviación estándar igual a 1.
un conjunto de datos bivariados. Distribución t Distribución normal que suele estar asocia-
Diagrama de árbol Representación gráfica de los dife- da con datos muestrales de una población con una desvia-
rentes resultados posibles en un suceso compuesto. ción estándar desconocida.
Diagrama de cuadro y bigotes Véase Gráfica de cuadro. Distribución t de Student Véase Distribución t.
Diagrama de dispersión Representación gráfica de datos Distribución uniforme Distribución de probabilidad en
(x, y) apareados. la que todos los valores de la variable aleatoria son igual-
Diseño de bloques aleatorizado Diseño en el que se ob- mente probables.
tiene una medición para cada tratamiento aplicado a cada Ecuación de regresión Ecuación algebraica que describe
uno de varios individuos apareados según características la relación entre variables.
similares. Ecuación de regresión múltiple Ecuación que expresa
Diseño rigurosamente controlado Diseño experimental una relación lineal entre una variable dependiente y dos o
en el que se obliga a que todos los factores sean constan- más variables independientes (x1, x2,... xk).
tes con el fin de eliminar los efectos de factores ajenos. Efecto placebo Efecto que ocurre cuando un sujeto que
Diseño totalmente aleatorizado Procedimiento de un no recibe tratamiento cree incorrectamente que sí lo está
experimento en el que cada elemento tiene la misma recibiendo y reporta una mejoría en sus síntomas.
810 APÉNDICE C

Eficiencia Medida de la sensibilidad de una prueba no pa- Estimador Estadístico de muestra (como la media de
ramétrica en comparación con una prueba paramétrica muestra x d), que sirve para aproximar un parámetro de
correspondiente. población.
Enfoque clásico a la probabilidad Enfoque en el que la Estimador sin sesgo Estadístico muestral que tiende a
probabilidad de un evento se determina dividiendo el acercarse al parámetro de población para cuya estimación
número de maneras en que éste puede suceder entre el nú- se usa.
mero total de resultados posibles. Estudio ciego Procedimiento utilizado en experimentos,
Error de muestreo Diferencia entre el resultado de una en el que el sujeto no sabe si está recibiendo un trata-
muestra y el resultado real de la población; se debe a fluc- miento o un placebo.
tuaciones aleatorias en las muestras. Estudio de casos y controles Estudio en el que se reúnen
Error estándar de estimación Medida de la disper- datos del pasado (a través del examen de registros, entre-
sión de puntos muestrales alrededor de la línea de re- vistas y otros recursos).
gresión. Estudio de cohorte Estudio de sujetos en grupos identifi-
Error estándar de la media Desviación estándar de to- cados que comparten factores comunes (denominados co-
das las posibles medias muestrales x. hortes), en el que los datos se reunirán en el futuro.
Error máximo de estimado Véase Margen de error. Estudio doble ciego Procedimiento utilizado en un expe-
Error tipo I Error que se comete al rechazar la hipótesis rimento, en el que el sujeto no sabe si está recibiendo un
nula cuando ésta es verdadera. tratamiento o un placebo, y la persona que aplica el trata-
Error tipo II Error que se comete al no rechazar la hipó- miento tampoco lo sabe.
tesis nula cuando ésta es falsa. Estudio longitudinal Estudio de sujetos en grupos identi-
Errores que no son de muestreo Errores debidos a facto- ficados que comparten factores comunes (llamados co-
res externos no relacionados con el muestreo. hortes) y en el que los datos se reunirán en el futuro.
Espacio muestral Conjunto de todos los posibles resulta- Estudio observacional Estudio en el que se observan y
dos o sucesos de un experimento que no se pueden des- miden características específicas, pero no se intenta ma-
componer más. nipular o modificar a los sujetos en estudio.
Estadística Conjunto de métodos para planear experi- Estudio prospectivo Estudio de sujetos en grupos identi-
mentos, para obtener, organizar, resumir, presentar, anali- ficados que comparten factores comunes (denominados
zar e interpretar datos, y para extraer conclusiones con cohortes), en el que los datos se reunirán en el futuro.
base en esos datos. Estudio retrospectivo Estudio en el que se reúnen datos
Estadística descriptiva Métodos empleados para resumir del pasado (a través del examen de registros, entrevistas y
las características clave de datos conocidos. otros recursos).
Estadística inferencial Métodos que implican el uso de Estudio transversal Estudio en el que los datos se obser-
datos muestrales para hacer generalizaciones o inferen- van, miden y reúnen en un punto del tiempo.
cias acerca de una población. Experimento La aplicación de un tratamiento y la poste-
Estadístico Característica medida de una muestra. rior observación de sus efectos sobre los sujetos.
Estadístico de prueba Estadístico muestral que se basa Experimento binomial Experimento que tiene un núme-
en los datos muestrales; sirve para tomar la decisión res- ro fijo de ensayos independientes y en el que cada resul-
pecto a rechazar o no la hipótesis nula. tado pertenece exactamente a una de dos categorías.
Estimado Valor específico o intervalo de valores que se Experimento multinomial Experimento que tiene un
usa para aproximar algún parámetro de población. número fijo de ensayos independientes, y en el que cada re-
Estimado conjunto de p1 y p2 Probabilidad que se obtie- sultado pertenece exactamente a una de varias categorías.
ne combinando los datos de dos proporciones muestrales Factor En análisis de varianza, propiedad o característica
y dividiendo el número total de éxitos entre el número to- que nos permite distinguir unas poblaciones de otras.
tal de observaciones. Factor de corrección por población finita Factor para
Estimado conjunto de s 2 Estimado de la varianza s2 corregir el error estándar de la media cuando el tamaño
que es común a dos poblaciones; se obtiene calculan- de una muestra excede el 5% del tamaño de una pobla-
do un promedio ponderado de las dos varianzas mues- ción finita.
trales. Fórmula de probabilidad binomial Expresión utilizada
Estimado de intervalo Rango de valores usado para esti- para calcular probabilidades en un experimento binomial
mar algún parámetro de población con un nivel de con- (véase la fórmula 5-5 de la sección 5-3).
fianza específico; también se conoce como intervalo de Fractiles Números que dividen los datos en partes de
confianza. aproximadamente el mismo tamaño.
Estimado puntual Valor individual que sirve como esti- Frecuencia acumulativa Suma de las frecuencias de una
mado de un parámetro de población. clase y de todas las clases precedentes.
Apéndice C 811

Frecuencia esperada Frecuencia teórica para una celda Gráfica np Gráfica de control en la que se grafica el nú-
de una tabla de contingencias o tabla multinomial. mero de defectos con el fin de vigilar un proceso.
Frecuencia observada Conteo de frecuencia real regis- Gráfica p Gráfica de control que sirve para vigilar la pro-
trado en una celda de una tabla de contingencias o tabla porción p de algún atributo en un proceso.
multinomial. Gráfica R Gráfica de control basada en rangos muestra-
Frecuencia relativa Frecuencia de una clase, dividida en- les; sirve para vigilar la variación en un proceso.
tre el total de todas las frecuencias. Gráfica s Gráfica de control basada en desviaciones es-
Fronteras de clase Valores que se obtienen de una distri- tándar muestrales; sirve para vigilar la variación en un
bución de frecuencias aumentando los límites de clase proceso.
superior y reduciendo los límites de clase inferior en la Grupo de control Grupo de sujetos en un experimento a
misma cantidad, de forma que no haya huecos entre cla- quienes no se les administra un tratamiento específico.
ses consecutivas. Grupo de tratamiento Grupo de sujetos que reciben al-
Grado de confianza Probabilidad de que un parámetro gún tratamiento en un experimento.
de población esté contenido dentro de un intervalo de Hipótesis Declaración o afirmación acerca de alguna pro-
confianza particular; también se denomina nivel de con- piedad de una población.
fianza. Hipótesis alternativa Afirmación que equivale a la nega-
Grados de libertad Número de valores que pueden variar ción de la hipótesis nula; se denota con H1.
después de haberse impuesto ciertas restricciones a todos Hipótesis nula Aseveración acerca de alguna característi-
los valores. ca de población, que por lo regular implica la ausencia de
Grados de libertad del denominador Grados de liber- una diferencia; se denota con H0.
tad que corresponden al denominador del estadístico de Histograma Gráfica de barras verticales que representa la
prueba F. distribución de frecuencia de un conjunto de datos.
Grados de libertad del numerador Grados de libertad Histograma de frecuencias relativas Variación del histo-
que corresponden al numerador del estadístico de grama básico en la que las frecuencias se sustituyen por
prueba F. frecuencias relativas.
Gráfica Gráfica de control que se usa para vigilar la Histograma de probabilidad Histograma en el que los
media de un proceso. resultados se listan a lo largo del eje horizontal y las pro-
Gráfica circular Representación gráfica de datos en for- babilidades se listan a lo largo del eje vertical.
ma de círculo que contiene divisiones radiales. Interacción En el análisis de varianza de dos factores, el
Gráfica de control Cualquiera de varios tipos de gráficas efecto que se observa cuando uno de ellos varía para dife-
(capítulo 14) que describen alguna característica de un rentes categorías del otro factor.
proceso con el fin de determinar si hay estabilidad esta- Intercepto y Punto en el que una línea recta cruza el eje y.
dística. Intervalo Nivel de medición de datos; caracteriza datos
Gráfica de cuadro Representación gráfica de la disper- que pueden acomodarse en orden y para los que las dife-
sión de un conjunto de datos. rencias entre los valores de los datos son significativas.
Gráfica de Pareto Gráfica de barras para datos cualita- Intervalo de confianza Rango de valores empleado para
tivos, con las barras dispuestas en orden según las fre- estimar algún parámetro de población con un nivel de
cuencias. confianza específico; también se denomina estimado de
Gráfica de puntos Gráfica en la que cada valor de los da- intervalo.
tos se grafica como un punto sobre una escala de valores. Intervalo de predicción Estimado del intervalo de con-
Gráfica de rachas Gráfica secuencial de valores de datos fianza de un valor predicho de y.
individuales a lo largo del tiempo, donde se usa un eje Límite de control Frontera que se usa en una gráfica de
(casi siempre el vertical) para los valores de datos, y el control para identificar puntos inusitados.
otro eje (casi siempre el horizontal) para la secuencia de Límite de control inferior Frontera de una gráfica de
tiempo. control que separa los puntos inusitadamente bajos.
Gráfica de rango Gráfica de control basada en rangos Límite de control superior Frontera que se usa en una
muestrales; sirve para vigilar la variación en un proceso. gráfica de control para separar los puntos inusitadamente
Gráfica de tallo y hojas Método para clasificar y acomo- altos.
dar datos para revelar su distribución. Límites de clase inferiores Los números más pequeños
Gráfica normal cuantilar Gráfica de puntos (x, y), donde que pueden pertenecer a las diferentes clases de una dis-
cada valor de x pertenece al conjunto original de datos tribución de frecuencias.
muestrales, y cada valor y es una puntuación z correspon- Límites de clase superiores Los números más grandes
diente a un valor cuantilar de la distribución normal es- que pueden pertenecer a las diferentes clases de una dis-
tándar. tribución de frecuencias.
812 APÉNDICE C

Límites del intervalo de confianza Dos números que se Muestreo de aceptación Elementos muestrales sin reem-
usan como fronteras superior e inferior de un intervalo de plazo y que permiten rechazar todo el lote con base en el
confianza. número de defectos obtenidos.
Línea central Línea de una gráfica de control que repre- Muestreo de conveniencia Muestreo en el que se selec-
senta un valor central de las mediciones características. cionan datos porque se encuentran disponibles.
Línea de regresión Línea recta que mejor se ajusta a un Muestreo estratificado Muestreo en el que se obtienen
conjunto de puntos que representan datos muestrales apa- muestras de cada estrato (clase).
reados. Muestreo por conglomerados Tipo de muestreo en el
Margen de error Máxima diferencia probable (con pro- que se divide el área de población en secciones (o conglo-
babilidad 1  a) entre el estadístico muestral observado y merados) y luego se seleccionan en forma aleatoria algu-
el verdadero valor del parámetro poblacional. nas de esas secciones; después se eligen todos los miem-
Media La suma de un conjunto de valores, dividida entre bros de las secciones elegidas.
el número de valores. Muestreo sistemático Muestreo en el que se selecciona
Media aritmética Suma de un conjunto de valores dividi- cada k-ésimo elemento.
da entre el número de valores; normalmente se denomina Multimodal Se dice que un conjunto de datos es multi-
media. modal cuando tiene más de dos modas.
Media ponderada Media de un conjunto de valores a los Nivel de confianza Probabilidad de que un parámetro de
que se han asignado diferentes grados de importancia. población esté contenido en un intervalo de confianza
Mediana Valor que está a la mitad de un conjunto de va- particular; también se llama grado de confianza.
lores acomodados en orden por magnitud. Nivel de significancia Probabilidad de cometer un error
Medida de tendencia central Valor que pretende indicar tipo I al realizar una prueba de hipótesis.
el centro de los valores de una colección de datos. Nominal Nivel de medición de datos; caracteriza datos que
Medida de variación Cualquiera de varias medidas dise- consisten únicamente en nombres, etiquetas o categorías.
ñadas para reflejar la magnitud de la variación o disper- Ojiva Representación gráfica de una distribución de fre-
sión de un conjunto de valores. cuencias acumulativas.
Método clásico de prueba de hipótesis Método para pro- Ordinal Nivel de medición de datos; caracteriza datos
bar hipótesis que se basa en una comparación del estadís- que podrían estar acomodados en orden, pero las diferen-
tico de prueba con los valores críticos. cias entre los valores de los datos no pueden determinar-
Método tradicional de prueba de hipótesis Método para se, o bien, carecen de sentido.
probar hipótesis que se basa en una comparación del esta- Parámetro Característica medida de una población.
dístico de prueba y los valores críticos. Pares discordantes Pares de categorías en los que las
Mitad del rango Mitad de la suma de los valores máximo dos categorías son diferentes; se usan en la prueba de
y mínimo. McNemar.
Moda Valor que se presenta con mayor frecuencia. Pendiente Medida de la inclinación de una línea recta.
Modelo matemático Función matemática que se “ajusta” Percentil Los 99 valores que dividen datos clasificados en
o que describe datos de la vida real. 100 grupos, con aproximadamente el 1% de los valores
Muestra Subconjunto de una población. en cada grupo.
Muestra aleatoria Muestra seleccionada de tal manera Población Colección entera y completa de elementos por
que permite a cada miembro de la población tener la mis- estudiar.
ma probabilidad de ser elegido. Polígono de frecuencias Representación gráfica de la dis-
Muestra aleatoria simple Muestra de cierto tamaño se- tribución de los datos, que utiliza segmentos de línea rec-
leccionada de manera que toda posible muestra del mis- ta conectados.
mo tamaño tenga la misma probabilidad de ser elegida. Posibilidades a favor Razón entre la probabilidad de que
Muestra autoseleccionada Muestra en la que los sujetos un suceso ocurra y la probabilidad de que no ocurra; sue-
deciden por sí mismos ser incluidos; también se llama le expresarse como la proporción de dos enteros sin fac-
muestra de respuesta voluntaria. tores comunes.
Muestra de respuesta voluntaria Muestra en la que los Posibilidades de pago Razón de la ganancia neta (si se
sujetos deciden por sí mismos ser incluidos. gana) en relación con lo apostado.
Muestra dependiente Muestra cuyos valores están rela- Posibilidades en contra Razón entre la probabilidad de
cionados con los valores de otra muestra. que un suceso no ocurra y la probabilidad de que ocurra;
Muestra independiente Muestra cuyos valores no están suele expresarse en la forma a:b, donde a y b son enteros
relacionados con los valores de otra muestra. sin factores comunes.
Muestras apareadas Dos muestras que son dependientes Posibilidades reales a favor El recíproco de las posibili-
en el sentido de que los valores de los datos forman pares. dades reales en contra de un suceso.
Apéndice C 813

Posibilidades reales en contra El cociente PsA d>PsAd, Prueba de rangos con signo (o de rangos signados) de
generalmente expresado en la forma a:b (o “a es a b”). Wilcoxon Prueba de hipótesis no paramétrica que se
Potencia de una prueba La probabilidad (1 2 b) de re- utiliza para comparar dos muestras dependientes.
chazar una hipótesis nula falsa. Prueba de significancia Véase Prueba de hipótesis.
Probabilidad Medida de la posibilidad de que ocurra un Prueba de suma de rangos de Wilcoxon Prueba de hipó-
suceso dado; se expresa como un número entre O y 1. tesis no paramétrica que se utiliza para comparar dos
Probabilidad condicional La probabilidad de un suceso, muestras independientes.
dado que algún otro suceso ya ocurrió. Prueba del signo Prueba de hipótesis no paramétrica que
Probabilidad subjetiva Conjetura o estimado de una pro- sirve para comparar muestras de dos poblaciones.
babilidad con base en un conocimiento de las circunstan- Prueba H Prueba no paramétrica de Kruskal-Wallis.
cias relevantes. Prueba U de Mann-Whitney Prueba de hipótesis que
Procedimientos de comparación múltiple Procedimien- equivale a la prueba de suma de rangos de Wilcoxon para
tos para identificar cuáles medias específicas son diferen- dos muestras independientes.
tes, después de concluir que tres o más medias no son Pruebas de distribución libre Pruebas que no requieren
iguales. una distribución específica, como la distribución normal.
Proceso estadísticamente estable Proceso que sólo tiene Véase también Pruebas no paramétricas.
variación natural, sin patrones, ciclos ni puntos inusitados. Pruebas no paramétricas Procedimientos estadísticos
Promedio Cualquiera de varias medidas diseñadas para para hacer pruebas de hipótesis o estimar parámetros, en
revelar la tendencia central de un conjunto de datos. los que no es preciso hacer suposiciones acerca de la na-
Propiedad de mínimos cuadrados Propiedad que afirma turaleza o forma de las distribuciones de las poblaciones;
que, para una línea de regresión, la suma de los cuadrados también se denominan pruebas de distribución libre.
de las desviaciones verticales de los puntos muestrales, Pruebas paramétricas Procedimientos estadísticos basa-
respecto a la línea de regresión, es la más pequeña posible. dos en parámetros de población para probar hipótesis o
Prueba de bondad de ajuste Prueba para determinar qué estimar parámetros.
tan bien alguna distribución de frecuencias observada se Punto influyente Punto que afecta fuertemente la gráfica
ajusta a una distribución teórica. de una línea de regresión.
Prueba de cola derecha Prueba de hipótesis en la que la Punto medio de clase En una clase de una distribución de
región crítica se ubica en el área extrema derecha de la frecuencias, el valor que está a la mitad entre el límite de
distribución de probabilidad. clase superior y el límite de clase inferior.
Prueba de cola izquierda Prueba de hipótesis en la que Puntuación estándar Número de desviaciones estándar
la región crítica está situada en el área extrema izquierda que un valor dado está por arriba o por debajo de la me-
de la distribución de probabilidad. dia; también se llama puntuación z.
Prueba de dos colas Prueba de hipótesis en la que la re- Puntuación z Número de desviaciones estándar que un
gión crítica se divide entre las áreas extremas izquierda y valor dado está por arriba o por debajo de la media.
derecha de la distribución de probabilidad. Racha Secuencia de datos que presentan la misma caracte-
Prueba de hipótesis Método para probar afirmaciones rística; se usa en la prueba de rachas para detectar alea-
acerca de poblaciones; también se llama prueba de signi- toriedad.
ficancia. Rango Medida de variación que es la diferencia entre los
Prueba de homogeneidad Prueba de la aseveración de valores máximo y mínimo.
que diferentes poblaciones tienen la misma proporción Rango de percentiles 10-90 Diferencia entre los percenti-
de alguna característica. les décimo y nonagésimo.
Prueba de independencia Prueba de la hipótesis nula Rango intercuartilar La diferencia entre los cuartiles pri-
que afirma que, en una tabla de contingencias, la varia- mero y tercero.
ble de renglón y la variable de columna no están relacio- Rango ordenado Posición numérica de un elemento en
nadas. un conjunto muestral acomodado en orden.
Prueba de Kruskal-Wallis Prueba de hipótesis no para- Rango semi-intercuartilar La mitad de la diferencia en-
métrica que sirve para comparar tres o más muestras in- tre los cuartiles primero y tercero.
dependientes; también se llama prueba H. Razón Nivel de medición de los datos; caracteriza datos
Prueba de McNemar Usa conteos de frecuencia de datos que pueden ser acomodados en orden, para los que las di-
nominales apareados de dos categorías para poner a prue- ferencias entre los valores son significativas y existe un
ba la hipótesis nula de que las frecuencias de pares dis- punto de partida cero inherente.
cordantes ocurren en la misma proporción. Región crítica El conjunto de todos los valores del esta-
Prueba de rachas Método no paramétrico que sirve para dístico de prueba que harían que se rechazara la hipóte-
detectar aleatoriedad. sis nula.
814 APÉNDICE C

Regla de combinaciones Regla para determinar el número Sesgado No simétrico y que se extiende más hacia un la-
de combinaciones diferentes de elementos seleccionados. do que hacia el otro.
Regla de conteo fundamental Regla que dice que, para Sesgo negativo Sesgado hacia la izquierda.
una secuencia de dos sucesos en la que el primer suceso Sesgo positivo Sesgado hacia la derecha.
puede ocurrir de m maneras y el segundo de n maneras, Simetría Propiedad de datos cuya distribución puede di-
los sucesos juntos pueden ocurrir en un total de m • n ma- vidirse en dos mitades que son aproximadamente imáge-
neras. nes especulares al trazar una línea vertical por la mitad.
Regla de la multiplicación Regla para determinar la pro- Simulación Proceso que se comporta de forma similar a
babilidad de que ocurra el suceso A en un ensayo y de que algún experimento, por lo que se obtienen resultados si-
ocurra el suceso B en un segundo ensayo. milares.
Regla de la suma Regla para determinar la probabilidad Suceso Resultado de un experimento.
de que, en un solo ensayo, ocurra el suceso A o el suceso Suceso compuesto Combinación de sucesos simples.
B, o bien, de que ocurran ambos. Suceso simple Resultado experimental que no puede des-
Regla de permutaciones Regla para determinar el núme- componerse más.
ro de arreglos diferentes de elementos seleccionados. Sucesos dependientes Sucesos para los cuales la ocurren-
Regla del suceso infrecuente Si, bajo un supuesto dado, cia de cualquier suceso individual afecta las probabilida-
la probabilidad de un resultado específico observado es des de ocurrencia de los demás sucesos.
muy pequeña, se concluye que posiblemente el supuesto Sucesos disjuntos o mutuamente excluyentes Sucesos
no sea correcto. que no pueden ocurrir de manera simultánea.
Regla empírica Regla que usa la desviación estándar para Sucesos independientes Sucesos para los cuales la ocu-
dar información sobre datos que tienen una distribución rrencia de cualquiera de ellos no afecta las probabilidades
normal (sección 3-3). de ocurrencia de los demás.
Regla factorial Regla que afirma que n objetos distintos Sucesos mutuamente excluyentes Sucesos que no pue-
se pueden acomodar de n! maneras distintas. den ocurrir de manera simultánea.
Regla práctica del rango Regla que se basa en el princi- Tabla de contingencias Tabla de frecuencias observadas
pio de que, para un conjunto típico de datos, la diferencia en la que los renglones corresponden a una variable de cla-
entre el valor mínimo típico y el valor máximo típico es sificación y las columnas corresponden a otra variable de
de aproximadamente cuatro desviaciones estándar (4s). clasificación; también se denomina tabla de dos factores.
Regresión logística Método usado en la regresión múl- Tabla de dos factores Véase Tabla de contingencia.
tiple cuando la variable ficticia es la variable de res- Tabla de frecuencias Lista de categorías de valores junto
puesta (y). con sus frecuencias correspondientes.
Regresión múltiple Estudio de relaciones lineales entre Tamaño de muestra Número de elementos de una
tres o más variables. muestra.
Regresión por pasos Proceso que implica el uso de dife- Teorema de Chebyshev Teorema que usa la desviación
rentes combinaciones de variables hasta obtener el mejor estándar para dar información acerca de la distribución de
modelo; se usa en regresión múltiple. los datos.
Réplica Repetición de un experimento. Teorema del límite central Teorema que afirma que las
Residual Diferencia entre un valor muestral y observado medias muestrales tienden a distribuirse normalmente,
y el valor de y que se predice con una ecuación de re- con una media m y una desviación estándar s> 1n.
gresión. Tratamiento Propiedad o característica que permite dis-
Resumen de cinco números Valor mínimo, valor máxi- tinguir unas poblaciones de otras; se usa en el análisis de
mo, mediana y el primer y tercer cuartiles de un conjunto varianza.
de datos. Unidades experimentales Sujetos de un experimento.
SC (del error) Suma de cuadrados que representa la va- Valor crítico Valor que separa la región crítica de los va-
riabilidad que se supone es común a todas las poblaciones lores del estadístico de prueba que no conducirían al re-
consideradas; se usa en el análisis de varianza. chazo de la hipótesis nula.
SC (del tratamiento) Medida de la variación entre las Valor de probabilidad Véase Valor P.
medias muestrales; se usa en el análisis de varianza. Valor esperado Para una variable aleatoria discreta, la
SC (total) Medida de la variación total (alrededor de x) en media de los resultados.
todos los datos muestrales combinados; se usa en el análi- Valor P Probabilidad de que un estadístico de prueba, en
sis de varianza. una prueba de hipótesis, sea al menos tan extremo como
Selección aleatoria Selección de elementos muestrales de el que en realidad se obtuvo.
forma que todos los elementos disponibles para ser selec- Valores extremos Valores poco comunes, en el sentido de
cionados tengan la misma probabilidad de ser elegidos. que están muy lejos de la mayoría de los datos.
Apéndice C 815

Valores predichos Valores de una variable dependiente Variables de predicción Variables independientes en una
que se obtienen usando valores de variables independien- ecuación de regresión.
tes en una ecuación de regresión. Variación aleatoria Tipo de variación en un proceso que
Variabilidad de muestreo Variación de un estadístico en se debe al azar; el tipo de variación inherente a cualquier
distintas muestras. proceso que no puede generar todos los bienes o servicios
Variable aleatoria Variable (casi siempre representada exactamente de la misma forma todo el tiempo.
con x) que tiene un solo valor numérico (determinado por Variación asignable Tipo de variación en un proceso, que
el azar) para cada resultado de un experimento. es el resultado de causas identificables.
Variable aleatoria continua Variable aleatoria con valo- Variación debida al error Véase Variación dentro de
res infinitos, que se puede asociar con los puntos en un muestras.
intervalo lineal continuo. Variación debida al tratamiento Véase Varianza entre
Variable aleatoria discreta Variable aleatoria que tiene muestras.
un número finito de valores, o bien, un número de valores Variación dentro de muestras En el análisis de varianza,
que pueden contarse. la variación que se debe al azar.
Variable de respuesta Variable y en una ecuación de re- Variación explicada Suma de los cuadrados de las des-
gresión o en una ecuación de regresión múltiple. viaciones explicadas para todos los pares de datos biva-
Variable dependiente Variable y de una ecuación de re- riados de una muestra.
gresión o de regresión múltiple. Variación no explicada Suma de los cuadrados de las
Variable dicotómica Variable que tiene dos valores dis- desviaciones no explicadas para todos los pares de datos
cretos posibles. bivariados en una muestra.
Variable ficticia o indicadora Variable dicotómica con Variación total Suma de los cuadrados de la desviación
valores posibles de 0 y 1. Se emplea en la regresión múl- total para todos los pares de datos bivariados de una
tiple. muestra.
Variable independiente La variable x de una ecuación de Varianza Medida de variación que es igual al cuadrado de
regresión, o una de las variables x de una ecuación de re- la desviación estándar.
gresión múltiple. Varianza entre muestras En el análisis de varianza, la
Variable interventora Variable que afecta las variables variación entre las diferentes muestras.
que se están estudiando, pero que no está incluida en el
estudio.

Potrebbero piacerti anche