Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CAMPUS QUETZALTENANGO
FACULTAD DE INGENIERIA
CURSO: ESTADISTICA I
Carné: 160030012
CAMPUS QUETZALTENANGO
FACULTAD DE INGENIERIA
CURSO: ESTADISTICA I
Carné: 160030012
1.1.1. Población............................................................................................................................... 4
1.1.3. Muestreo:.............................................................................................................................. 5
I. INTRODUCCIÓN A LA ESTADÍSTICA
1.1. Estadística
Murria R. Spiegel, (1991) dice: "La estadística estudia los métodos científicos para recoger,
organizar, resumir y analizar datos, así como para sacar conclusiones válidas y tomar decisiones
razonables basadas en tal análisis.
1.1.1. Población.
El concepto de población en estadística va más allá de lo que comúnmente se conoce como tal.
Una población se precisa como un conjunto finito o infinito de personas u objetos que presentan
características comunes.
"Una población es un conjunto de todos los elementos que estamos estudiando, acerca de los
cuales intentamos sacar conclusiones". Levin & Rubin (1996).
"Una población es un conjunto de elementos que presentan una característica común". Cadenas
(1974).
1.1.2. Muestra.
"Se llama muestra a una parte de la población a estudiar qué sirve para representarla". Murria R.
Spiegel (1991).
"Una muestra es una colección de algunos elementos de la población, pero no de todos". Levin &
Rubin (1996).
"Una muestra debe ser definida en base de la población determinada, y las conclusiones que se
obtengan de dicha muestra solo podrán referirse a la población en referencia", Cadenas (1974).
1.1.3. Muestreo:
Esto no es más que el procedimiento empleado para obtener una o más muestras de una
población; el muestreo es una técnica que sirve para obtener una o más muestras de población.
Este se realiza una vez que se ha establecido un marco maestral representativo de la población,
se procede a la selección de los elementos de la muestra aunque hay muchos diseños de la
muestra.
1.2. Tipos de estadística
1.2.1. Estadística descriptiva
Se puede definir como un método para describir numéricamente conjuntos numerosos. Por
tratarse de un método de descripción numérica, utiliza el número como medio para describir un
conjunto, que debe ser numeroso, ya que las permanencias estadísticas no se dan en los casos
raros. No es posible sacar conclusiones concretas y precisas de los datos
estadísticos. (Vargas, p.33)
En relación a la estadística descriptiva, Ernesto Rivas Gonzáles dice; "Para el estudio de estas
muestras, la estadística descriptiva nos provee de todos sus medidas; medidas que cuando
quieran ser aplicadas al universo total, no tendrán la misma exactitud que tienen para la muestra,
es decir al estimarse para el universo vendrá dada con cierto margen de error; esto significa que
el valor de la medida calculada para la muestra, en el oscilará dentro de cierto límite de
confianza, que casi siempre es de un 95 a 99% de los casos.(JORGE)
Está fundamentada en los resultados obtenidos del análisis de una muestra de población, con el
fin de inducir o inferir el comportamiento o característica de la población, de donde procede, por
lo que recibe también el nombre de Inferencia estadística.
Según Berenson y Levine; Estadística Inferencial son procedimientos estadísticos que sirven
para deducir o inferir algo acerca de un conjunto de datos numéricos (población), seleccionando
un grupo menor de ellos (muestra).
Una variable es una característica de interés sobre cada elemento individual de una población o
muestra. Un dato es el valor de la variable asociada a un elemento de una población o muestra.
Este valor puede ser número, una palabra o un símbolo. Un experimento es una actividad de la
población planeada curos resultados producen un conjunto de datos. (Guatemala, 2011)
b) Variable bidimensional es una variable en la que cada individuo está definido por
un par de caracteres, (X, Y). Estos dos caracteres son a su vez variables
estadísticas en las que sí existe relación entre ellas, una de las dos variables es la
variable independiente y la otra variable dependiente. Ejemplo: edad y altura de los
alumnos de una clase.
c) Variables pluridimensionales o multidimensionales: recogen información sobre tres o
más características. Ejemplo: edad, altura y peso de los alumnos de una clase.
Variable cuantitativa o escalar. Será una variable cuando pueda asumir sus resultados
en medidas numéricas.
Variables cualitativas nominales. Cuando no es posible hacer medidas numéricas, son
susceptibles de clasificación. Ejemplo: Color de autos: rojo, verde, azul.
Variable cuantitativa discreta. Es aquella que puede asumir sólo ciertos valores,
números enteros. Ejemplo: El número de estudiantes (1,2,3,4)
Variable cuantitativa continua. Es aquella que teóricamente puede tomar cualquier
valor en una escala de medidas, ya sea entero o fraccionario. Ejemplo, Estatura: 1.90 m
(GestioPolis)
1.4. Niveles de medición
1.4.1. Escala Nominal:
La escala de medida nominal, puede considerarse la escala de nivel más bajo, y consiste en la
asignación, puramente arbitraria de números o símbolos a cada una de las diferentes categorías
en las cuales podemos dividir el carácter que observamos, sin que puedan establecerse relaciones
entre dichas categorías, a no ser el de que cada elemento pueda pertenecer a una y solo una de
estas categorías.
Se trata de agrupar objetos en clases, de modo que todos los que pertenezcan a la misma sean
equivalentes respecto del atributo o propiedad en estudio, después de lo cual se asignan nombres
a tales clases, y el hecho de que a veces, en lugar de denominaciones, se le atribuyan números,
puede ser una de las razones por las cuales se le conoce como "medidas nominales".
Por ejemplo, podemos estar interesados en clasificar los estudiantes de la UNESR Núcleo San
Carlos de acuerdos a la carrera que cursan.
Educación 1
Administración 2
Se ha de tener presente que los números asignados a <cada categoría sirven única y
exclusivamente para identificar la categoría y no poseen propiedades cuantitativas.
Los caracteres que posee una escala de medida ordinal permiten, por el hecho mismo
de poder ordenar todas sus categorías, el cálculo de las medidas estadísticas de posición, como
por ejemplo la mediana.
Ejemplo:
Al asignar un número a los pacientes de una consulta médica, según el orden de llegada, estamos
llevando una escala ordinal, es decir que al primero en llegar ordinal, es decir que al primeo en
llegar le asignamos el nº 1, al siguiente el nº 2 y así sucesivamente, de esta forma, cada número
representará una categoría en general, con un solo elemento y se puede establecer relaciones
entre ellas, ya que los números asignados guardan la misma relación que el orden de llegada a la
consulta.
La escala de intervalos iguales, está caracterizada por una unidad de medida común y constante
que asigna un número igual al número de unidades equivalentes a la de la magnitud que posea el
elemento observado. Es importante destacar que el punto cero en las escalas de intervalos iguales
es arbitrario, y no refleja en ningún momento ausencia de la magnitud que estamos midiendo.
Esta escala, además de poseer las características de la escala ordinal, encontramos que la
asignación de los números a los elemento es tan precisa que podemos determinar la magnitud de
los intervalos (distancia) entre todos los elementos de la escala. Sin lugar a dudas, podemos decir
que la escala de intervalos es la primera escala verdaderamente cuantitativa y a los caracteres que
posean esta escala de medida pueden calculársele todas las medidas estadísticas a excepción del
coeficiente de variación.
Ejemplo:
Ejemplo:
En una encuesta realizada en un barrio de esta localidad se observó que hay familias que no
tienen hijos, otras tienen 6 hijos que es exactamente el doble de hijos que aquellas que tienen 3
hijos.
Fuente de Información: Es el lugar, la institución o persona donde están los datos que se
necesitan para cada una de las variables o aspectos de la investigación. Las fuentes de
información son:
Fuentes Primarias o internas: Cuando los datos se obtienen directamente de la
misma persona o entidad utilizando ciertas técnicas. Ejemplo: Llevar a cabo una
encuesta para conocer el grado de satisfacción laboral en los trabajadores de una empresa ¿?.
Fuentes Secundarias o externas: Cuando los datos ya han sido elaborados y procesados
por otras personas o instituciones. Ejemplo: La información estadística que publica el
INE de los diferentes ministerios del Perú.
La recolección de datos se refiere al uso de una gran diversidad de técnicas y herramientas que
pueden ser utilizadas por el analista para desarrollar los sistemas de información, los cuales
pueden ser la entrevista, la encuesta, el cuestionario y la observación.
1.5.2.1.La encuesta.
Una "encuesta" recoge información de una "muestra." Una "muestra" es usualmente sólo una
porción de la población bajo estudio. (Tecnicas de recolección de datos, 2013)
1.5.2.2.Entrevista
La entrevista es una conversación dirigida, con un propósito especifico y que usa un formato de
preguntas y respuestas.
Se establece así un diálogo, pero un diálogo peculiar, asimétrico, donde una de las partes busca
recoger informaciones y la otra se nos presenta como fuente de estas informaciones. Una
entrevista es un dialogo en el que la persona (entrevistador), generalmente un periodista hace una
serie de preguntas a otra persona (entrevistado), con el fin de conocer mejor sus ideas, sus
sentimientos su forma de actuar. (Tecnicas de recolección de datos, 2013)
Tipo de preguntas
*Preguntas abiertas: Son aquellas preguntas que describen hechos o situaciones por parte del
entrevistado con una gran cantidad de detalles que a juicio del entrevistado son importantes.
*Preguntas cerradas :En las preguntas cerradas las respuestas posibles están cerradas al
entrevistado, debido a que solamente puede responder con un numero finito, tal como “ninguno”,
“uno”, o “quince”. Una pregunta cerrada limita las respuestas disponibles al entrevistado
1.5.2.3. Cuestionario
Los cuestionarios proporcionan una alternativa muy útil para la entrevista; si embargo, existen
ciertas características que pueden ser apropiada en algunas situaciones e inapropiadas en otra. Al
igual que la entrevistas, deben diseñarse cuidadosamente para una máxima efectividad.
Selección de formas para cuestionarios
El desarrollo y distribución de los cuestionarios; por lo tanto, el tiempo invertido en esto debe
utilizarse en una forma inteligente. También es importante el formato y contenido de las
preguntas en la recopilación de hechos significativos.
Existen dos formas de cuestionarios para recabar datos: cuestionarios abiertos y cerrados, y se
aplican dependiendo de si los analistas conocen de antemano todas las posibles respuestas de las
preguntas y pueden incluirlas. Con frecuencia se utilizan ambas formas en los estudios de
sistemas. (Tecnicas de recolección de datos, 2013)
1.5.2.4.Observación
Las distribuciones de frecuencias son tablas en que se dispone las modalidades de la variable por
filas. En las columnas se dispone el número de ocurrencias por cada valor, porcentajes, etc. La
finalidad de las agrupaciones en frecuencias es facilitar la obtención de la información que
contienen los datos. Ejemplo: Quieren conocer si un grupo de individuos está a favor o en contra
de la exhibición de imágenes violentas por televisión, para lo cual han recogido los siguientes
datos:
La inspección de los datos originales no permite responder fácilmente a cuestiones como cuál es
la actitud mayoritaria del grupo, y resulta bastante más difícil determinar la magnitud de la
diferencia de actitud entre hombres y mujeres.
Podemos hacernos mejor idea si disponemos en una tabla los valores de la variable acompañados
del número de veces (la frecuencia) que aparece cada valor:
La distribución de frecuencias de los datos del ejemplo muestra que la actitud mayoritaria de los
individuos del grupo estudiado es indiferente.
K= 1+3.3 Log N
Una vez determinado el número de clases, debe decidirse la amplitud de estas. Tomando la
misma amplitud para todas las clases, este valor queda dado por.
Una vez obtenida la amplitud de clase se procede a calcular los intervalos y a realizar el conteo
de valores para determinar la frecuencia de cada uno.
Frecuencia Relativa (fr).- Indica la proporción con que se repite un valor. Es el cociente entre la
frecuencia absoluta y el número total de datos. La suma de las frecuencias relativas es siempre
Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el número total de
datos. Las frecuencias relativas se designan con las letras fr. Se calcula.
Una vez elaborada la tabla de distribución es importante construir su representación visual. Esta
representación revela patrones de comportamiento de la variable en estudio. El tipo de gráfico
que se utilice dependerá del tipo de datos y el concepto a representar.
Las gráficas que generalmente se utilizan para resumir dataos cualitativos, de atributo o
categorías son las gráficas de barras y la de pastel.
xi fi
a favor 50%
en contra 40%
abstención 10%
Para construir el diagrama de sectores partimos del hecho de que un círculo encierra un total de
360 grados. Luego, mediante una regla de tres simple, repartimos los 360 grados en distintos
sectores, de acuerdo con cada porcentaje; tenemos así que para determinar el sector
correspondiente al 50%, resolvemos la ecuación:
Esto es, el 50% corresponde a un sector circular de medida 180 grados. A continuación, con ayuda de
un transportador, señalaremos el sector circular de medida 180 grados. Igualmente, para el 40% se
tiene 144 grados y para el 10% se tiene 36 grados. La siguiente figura muestra la representación
grafica.
2.2.2. Datos cuantitativos
Todo lo que se puede medir y contar, decimos que se puede cuantificar. El concepto “datos
cuantitativos” hace referencia precisamente a eso, a la información tangible, la que es obtenida
mediante algún método de investigación. La manera de cuantificar los datos obtenidos en nuestro
estudio nos dará la pauta de hacia qué rumbo dirigirse, de ahí la importancia de su correcto
análisis para poder demostrar si estamos en lo correcto o no, en la hipótesis planteada.
Se denomina investigación cuantitativa aquella que genera datos numéricos o estadísticos para
cuantificar opiniones, comportamientos o cualquier variable que se haya definido para ser objeto
de estudio. Por lo regular se utiliza como método de recolección las entrevistas caras a cara o vía
telefónica y los diversos tipos de encuestas. Las encuestas online son la mejor solución, ya que
así puedes llegar a más personas en menos tiempo y además, asegurar resultados más honestos
para un posterior análisis. A través de una encuesta online podrás conocer opiniones, actitudes de
los encuestados que formen parte de tu muestra representativa, por lo que también debes de
valorar este factor para reducir el margen de error y el éxito de tu investigación.
2.2.2.1. Histograma
_ Se procede como si existiera una clase adicional al principio y al final, ambas con frecuencia
cero
2.2.2.3. Ojivas
La ojiva: Esta grafica consiste en la representación de las frecuencias acumuladas de una
distribución de frecuencias. Puede construirse de dos maneras diferentes; sobre la base "menor
que" o sobre la base "o más". Puede determinar el valor de la mediana de la distribución.
Una grafica de distribución de frecuencia acumulada es llamada una sola ojiva. Se trazan
los límites reales superiores contra las frecuencias acumuladas.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda sólo nos
revelan una parte de la información que necesitamos acerca de las características de los datos.
Para aumentar nuestro entendimiento del patrón de los datos, debemos medir también su
dispersión, extensión o variabilidad.
La dispersión puede medirse en términos de la diferencia entre dos valores seleccionados del
conjunto de datos, a continuación se presentan tres de las llamadas medidas de distancia.
Es la medida de variabilidad más fácil de calcular. Para datos finitos o sin agrupar, el rango se
define como la diferencia entre el valor más alto (Xn ó Xmax.) y el mas bajo (X1 ó Xmin) en un
conjunto de datos.
Ejemplo:
Si se toman los datos del ejemplo resuelto al construir la tabla de distribución de frecuencia de
las cuentas por cobrar de Cabrera’s y Asociados que fueron los siguientes:
Xi
3.3.1.2.Rango intercuartílico
Con el IQR podremos elaborar los diagramas de caja, que es un instrumento muy visual para
evaluar la dispersión de una distribución.
Ejercicio
Sea un conjunto ordenado de las edades de los veinte sujetos (N=20) de un club.
Para calcular el rango intercuartílico, tendremos que calcular el primer y el tercer cuartil (Q1 y
Q3).
Primer cuartil
El primer cuartil será el sujeto (N+1)/4=21/4=5,25. Como es decimal, será un número entre el
X5=28 y X6=29.
Tercer cuartil
El tercer cuartil es el sujeto 3(N+1)/4=63/4=15,75. Como el número es decimal, el cuartil estará
entre X15=52 y X16=53.
Rango intercuartílico
Una vez hemos calculado en primer y tercer cuartil, ya podemos calcular el rango intercuartílico.
http://www.universoformulas.com/estadistica/descriptiva/rango-intercuartilico/
3.3.1.3.Rango interpercentil
Es la dfiferencia entre el percentil 99 (p99) y el percentil 1(p1)
Rip=p99-p1
http://lourdesdemedida.blogspot.com/
Las descripciones más completas de la dispersión son aquellas que manejan la desviación
promedio respecto a alguna mediad de tendencia central. En esta clasificación las más utilizadas
son la vaianza y la desviación estándar. Ambas medidas dan una distancia promedio de cualquier
observación del conjunto de datos respecto a la medida de la distribución
La varianza es una medida de dispersión relativa a algún punto de referencia. Ese punto de
referencia es la media aritmética de la distribución. Más específicamente, la varianza es una
medida de que tan cerca, o que tan lejos están los diferentes valores de su propia media
aritmética. Cuando más lejos están las Xi de su propia media aritmética, mayor es la varianza;
cuando más cerca estén las Xi a su media menos es la varianza. Y se define y expresa
matemáticamente de la siguiente manera:
Dado un conjunto de observaciones, tales como X1, X2, … , Xn, la varianza denotada
usualmente por la letra minúscula griega δ (sigma) elevada al cuadrado (δ2)y en otros casos S2
según otros analistas, se define como: el cuadrado medio de las desviaciones con respecto a su
media aritmética"
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de Ier año, a saber: 18,23, 25, 27, y 34.
Al calcular la media aritmética (promedio de las edades, se obtuvo 25.4 años, encontrar la
varianza de las edades de estos estudiantes:
( Xi - )2
Xi ( Xi - )
Sin embargo la formula anterior tiene algún inconveniente para su uso en la practica, sobre todo
cuando se trabaja con números decimales o cuando la media aritmética es un número entero.
Asimismo cuando se trabaja con máquinas calculadoras, La tarea de computar la varianza se
simplifica utilizando la formula de computación que se da a continuación:
ΣXi2fi - [(ΣXifi)2/N]
δ2 = ----------------------------
N donde N=Σfi
Ejemplo: Se tienen los datos de una muestra de 30 cuentas por cobrar de la tienda Cabrera’s y
Asociados dispuestos en una tabla de distribución de frecuencias, a partir de los cuales se deberá
calcular la varianza, para lo cual se construye la siguiente tabla estadística de trabajo, si se
calculó anteriormente la media aritmética y se fijó en 43.458 (ver ejemplo del calculo en "media
aritmética para datos agrupados) de la siguiente manera
Punto medios fi Xi2 Xifi X2fi
clases Xi
Propiedades de la varianza :
s siempre un valor no negativo, que puede ser igual o distinta de 0. Será 0 solamente
cuando Xi=
La varianza es la medida de dispersión cuadrática optima por ser la menor de todas.
Si a todos los valores de la variable se le suma una constante la varianza no se modifica.
Veámoslo:
Si todos los valores de la variable se multiplican por una constante la varianza queda
multiplicada por el cuadrado de dicha constante. Veámoslo:
Siendo
Ni è el nº de elementos del subconjunto (i)
S2i è la varianza del subconjunto (i)
Es una medida de la cantidad típica en la que los valores del conjunto de datos difieren de la
media. Es la medida de dispersión más utilizada, se le llama también desviación típica. La
desviación estándar siempre se calcula con respecto a la media y es un mínimo cuando se estima
con respecto a este valor.
Se calcula de forma sencilla, si se conoce la varianza, por cuanto que es la raíz cuadrada positiva
de esta. A la desviación se le representa por la letra minúscula griega "sigma" ( δ ) ó por la letra
S mayúscula, según otros analistas.
Ejemplo:
Del calculo de la varianza de las edades de cinco estudiantes universitarios de primer año se
obtuvo δ2=27.44, como la desviación estándar es la raíz cuadrada positiva, entonces δ = √27.44
= 5.29 años.
Igual procedimiento se aplica para encontrar le desviación estándar de las cuentas por cobrar de
la Tienda Cabrera’s y Asociados, recordemos que la varianza obtenida fue de 721.645, luego
entonces la desviación estándar es igual a δ =√721.645 = 26.86 balboas.
A su vez la desviación estándar, también tiene una serie de propiedades que se deducen
fácilmente de las de la varianza (ya que la desviación típica es la raíz cuadrada positiva de la
varianza):
UNIVERSIDAD DE PANAMÁ
FACULTAD DE ECONOMÍA
3.3.1.1.Tipos de asimetría
La asimetría presenta las siguientes formas:
Asimetría Negativa o a la Izquierda.- Se da cuando en una distribución la minoría de los datos
está en la parte izquierda de la media. Este tipo de distribución presenta un alargamiento o sesgo
hacia la izquierda, es decir, la distribución de los datos tiene a la izquierda una cola más larga
que a la derecha. También se dice que una distribución es simétrica a la izquierda o tiene sesgo
negativo cuando el valor de la media aritmética es menor que la mediana y éste valor de la
mediana a su vez es menor que la moda, en símbolos Nota: Sesgo es el grado de
asimetría de una distribución, es decir, cuánto se aparta de la simetría.
Donde:
= media aritmética.
Md = Mediana.
s = desviación típica o estándar.
Nota:
El Coeficiente de Pearson varía entre -3 y 3
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Donde:
= Cuartil uno; = Cuartil dos = Mediana; = Cuartil tres.
Nota:
La Medida de Bowley varía entre -1 y 1
Si As < 0 ? la distribución será asimétrica negativa.
Si As = 0 ? la distribución será simétrica.
Si As > 0 ? la distribución será asimétrica positiva.
Medida de Fisher
Donde:
= cada uno de los valores; n = número de datos; = media aritmética; f = frecuencia absoluta
= cubo de la desviación estándar poblacional; xm = marca de clase
Nota:
Si As < 0 ?Indica que existe presencia de la minoría de datos en la parte izquierda de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica negativa
Si As = 0 ? la distribución será simétrica
Si As > 0 ? Indica que existe presencia de la minoría de datos en la parte derecha de la media,
aunque en algunos casos no necesariamente indicará que la distribución sea asimétrica positiva
Ejemplo ilustrativo:
Calcular el Coeficiente de Pearson, Medida Cuartílica y la Medida de Fisher dada la siguiente
distribución: 6, 9, 9, 12, 12, 12, 15 y 17
Solución:
6 9 9 12 12 12 15 17
Datos
6 -166,375
9 -15,625
9 -15,625
12 0,125
12 0,125
12 0,125
15 42,875
17 166,375
Total 12
3.3.2. Curtosis o apuntamiento
La curtosis mide el grado de agudeza o achatamiento de una distribución con relación a la
distribución normal, es decir, mide cuán puntiaguda es una distribución.
3.3.2.1.Tipos de curtosis
La curtosis determina el grado de concentración que presentan los valores en la región central de
la distribución. Así puede ser:
3.3.2.2.Medidas de curtosis
Medida de Fisher
Nota:
Si a < 3 ? la distribución es platicútica
Si a = 3 ? la distribución es normal o mesocúrtica
Si a > 3 ? la distribución es leptocúrtica
Nota:
Si < 0,263 ? la distribución es platicúrtica
Si = 0,263 ? la distribución es normal o mesocúrtica
Si > 0,263 ? la distribución es leptocúrtica
Esta medida no es muy utilizada.
Ejemplo ilustrativo: Determinar qué tipo de curtosis tiene la siguiente distribución: 6, 9, 9, 12,
12, 12, 15 y 17. Emplear la medida de Fisher y el coeficiente percentil de curtosis.
Datos
6 915,0625
9 39,0625
9 39,0625
12 0,0625
12 0,0625
12 0,0625
15 150,0625
17 915,0625
Total 2058,5
Para calcular los cuartiles y percentiles se ordena los datos de menor a mayor:
6 9 9 12 12 12 15 17
REFERENCIAS BIBLIOGRÁFICAS
BENALCÁZAR, Marco, (2002), Unidades para Producir Medios Instruccionales en Educación,
SUÁREZ, Mario Ed. Graficolor, Ibarra, Ecuador.
DAZA, Jorge, (2006), Estadística Aplicada con Microsoft Excel, Grupo Editorial Megabyte,
Lima, Perú.
Ibarra, Ecuador.
Autor:
4.1.Tabla de contingencia
valor e el valor ,
toma el valor ,
el efectivo marginal de : es el número de individuos para los cuales
toma el valor .
Se representan estos valores en una tabla de doble entrada, llamada tabla de contingencia:
Cada fila y cada columna corresponden a una submuestra particular. La fila de índice es la
carácter toma el valor . Dividiendo las filas y las columnas por sus sumas, obtenemos en
cada una, distribuciones empíricas formadas por frecuencias condicionales. Para
y , las denotaremos:
y
http://ljk.imag.fr/membres/Bernard.Ycart/emel/cours/sd/node17.html