Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
1.2 ESTADÍTICA.
Es la ciencia, pura y aplicada, que, crea, desarrolla y aplica técnicas de
modo que pueda evaluase la incertidumbre de inferencias inductivas.
MÉTODOS DE INVESTIGACIÓN.
Método Científico
Conjunto de pasos ordenados y sistematizados que conducen con mayor
certeza a la elaboración de la ciencia.
2
3.- Planteamiento del problema para definir claramente lo que vamos a
investigar y para qué.
9.- Enunciado de una teoría que explica el porqué del fenómeno, pero
conciertas limitaciones que no permiten hacer una generalización para todos los
casos similares a nuestro fenómeno en estudio.
3
4) Interpretación de resultados experimentales biológicos y
agropecuarios en donde se comparen poblaciones o muestras
sometidas a diferentes tratamientos o pertenecientes a diferentes
variedades o razas.
5) Aplicación de métodos para reducir las fuentes de error en la
recolección de los datos.
6) Determinación de la relación que existe entre dos o más variables
(Correlación y Regresión).
7) En poblaciones segregantes, evaluar la variación atribuible a la acción
de genes y aquélla atribuible a la acción del medio.
8) Estudiar la concordancia entre teórico esperado y lo observado
experimentalmente.
9) Para la preparación de gráficas, histogramas o tablas para la
descripción de la naturaleza del fenómeno estudiado.
1.3 Población
Desde el punto de vista estadístico, una población o universo es el conjunto
formado por todas las medidas o contadas que se hacen sobre un conjunto de
seres vivos u objetos, que poseen una característica común especifica.
El concepto de población no se refiere a los entes bajo estudio, si no a las
cantidades que se obtienen al hacer una medición de ellos en una o más
características en estudio.
En la práctica las poblaciones suelen ser muy numerosas o hipotéticas, por
lo que en cuanto al número de observaciones se refiere éstas pueden ser:
4
Las características bajo estudio de una población pueden ser: rasgos,
atributos, cualidades, forma, color o función de un órgano o tejido, se consideran:
a) Caracteres cuantitativos: se distinguen por pequeñas diferencias, las
que son necesarias medir o contar para poder distinguir a los
individuos de la población bajo estudio.
b) Caracteres cualitativos: son aquéllos atributos que se diferencian
notablemente entre los individuos de la población
5
establecida o por contadas, se puede formar una serie consecutiva, partiendo de
los individuos que exhiben una intensidad mínima y que gradualmente se llega
hasta los individuos que manifiestan una intensidad máxima.
1.4 La Muestra
Cuando se hace el estudio práctico de una población se tiene el problema que
en algunas ocasiones éstas son muy numeroso o de tal naturaleza que para su
estudio es necesario la utilización de un pequeño subconjunto de la población y
con los elementos escogidos hacer inferencias o caracterizar a la población, por
lo tanto se tiene que:
6
1) El principio de la aleatoriedad en su extracción.
La muestra bajo estudio sea obtenida de tal forma que cada elemento tiene la
misma posibilidad de pertenecer a la muestra y su presencia no afecta a los
demás individuos. La aleatoriedad es el resultado de un proceso mecánico para
asegurar que los sesgos individuales conocidos o desconocidos en su naturaleza no
influyan en la selección de las observaciones de la muestra.
APLICACIÓN DE LA
Inferir Formulación
BIOESTADÍSTICA
de Hipótesis
EN EL
MÉTODO CIENTÍFICO
Verificación
Conclusiones Interpretación Análisis
Estadístico
7
Por lo que entre más grande sea la muestra, mayor confiabilidad se tendrá
en sus resultados y menor probabilidad de error al hacer inferencias relativas a
la población muestreada.
1.4.2. Formas de muestreo
Al proceso de elegir ó tomar los elementos que van a componer una muestra
se le llama muestreo. Existen diversas formas de practicar este procedimiento,
éstas son:
8
Dentro de la estadística se tienen ciertas medidas que son obtenidas de las
características invariables de una población; así como para las muestras que son
extraídas de las poblaciones de las poblaciones; estas son medidas son:
PARÁMETRO
Estimada Valorada
9
representar al número de individuos que viven en una unidad dada; x al número de
carros que pasan por un cruce en un día; y al número de ranchos agrícolas del
Soconusco que cultivan mango.
10
Al realizar una acción determinada sobre algún objeto, el resultado puede
surgir con más probabilidad de efecto, entonces ingresamos al terreno de las
probabilidades por lo que definimos los siguientes conceptos:
11
2. DISTRIBUCION DE FRECUENCIAS Y SUS MEDIDAS DESCRIPTIVAS.
2.1 Introducción.
Cuando se desea tener un conocimiento general de un fenómeno, de un
concepto o de una opinión, se recurre a la fuente representativa de la
información. En la mayoría de los casos no es fácil conseguir la información sobre
una determinada característica de una población y debe recurrirse al censo o al
muestreo, dependiendo de la disponibilidad de presupuesto, tiempo y grado de
precisión deseado.
12
4
0
A B G E D F C
TRATAMIENTOS
Fig. 3. Producción de jicama de agua dulce en ton.ha -1. Estudio de distanciamiento
de siembra. Huehuetán, Chiapas. 1983.
2.3.1 Frecuencia
13
La Frecuencia es el número de veces que se presenta una observación en el
análisis de una muestra o población; si se toma en consideración a la clase, es el
número de veces que se presenta la observación en una clase dada, las cuales
tienen una delimitación definida.
1.5 1.9 2.2 2.5 2.7 3.0 3.2 3.4 3.6 3.8 4.0 4.2 4.4 4.8 5.1
1.5 1.9 2.2 2.5 2.8 3.0 3.2 3.4 3.7 3.8 4.0 4.2 4.4 4.8 5.2
1.6 1.9 2.2 2.5 2.8 3.0 3.3 3.4 3.7 3.8 4.1 4.2 4.4 4.8 5.2
1.6 2.0 2.3 2.6 2.8 3.1 3.3 3.5 3.7 3.9 4.1 4.3 4.5 5.0 5.3
1.7 2.0 2.3 2.6 2.9 3.1 3.3 3.5 3.7 3.9 4.1 4.3 4.5 5.0 5.4
1.7 2.0 2.4 2.6 2.9 3.1 3.3 3.5 3.7 3.9 4.1 4.3 4.5 5.0 5.4
1.8 2.1 2.4 2.7 2.9 3.2 3.3 3.6 3.8 4.0 4.2 4.3 4.6 5.1 5.6
1.8 2.1 2.5 2.7 2.9 3.2 3.3 3.6 3.8 4.0 4.2 4.3 4.8 5.1 5.6
El Cuadro 3, se observa de inmediato que los valores extremos son 1.5
y 5.6, éstos permiten conocer el rango de variación de los datos en la
característica bajo estudio.
14
Para el caso del cuadro 3, tenemos:
Om = 1.5
OM = 5.6 R = 5.6 – 1.5 R = 4.1 ton.ha-1.
Indica que la longitud del intervalo donde se encuentran distribuidos los
120 valores del rendimiento promedio de maíz, es de 4.1 ton/ha.
2.3.4 Clases
La Clase es un grupo de valores numéricos que se encuentran localizados
dentro de un cierto intervalo. La determinación de las clases en gran parte es
arbitraria. El número de clases, el intervalo de clase, los límites y sus puntos
medios son aspectos que se deben de tomar en cuenta, la determinación de cada
uno se realiza de la manera siguiente:
15
K = 1 + 6.86136 K = 8.2745
K = 7 .86136 K8
K≈8
Para el cuadro 3, en lo que resta del capítulo K = 9, trabajaremos con 9
clases.
b) Intervalo de Clase: es el ancho de la clase. Todas las clases deben de tener
la misma anchura, para evitar que la información sea seccionada o si las
diferencias de las frecuencias de las clases se deban principalmente a
diferencias en la concentración de los valores o a diferencias de la amplitud
de las clases.
K = Número de clase
a = Intervalo de clase
AT = Amplitud del cuadro
Se deberá cumplir AT ≥ R. En nuestro ejemplo tenemos:
K=9
16
a = 0.5 ton.ha-1
AT = ?
R = 4.1 ton.ha-1 AT = (9) (0.5) AT = 4.5 ton.ha-1 AT R
L2 = l2 + a = l3
L3 = l3 + a = l4
. .
. .
. .
Siguiendo con el cuadro 2 tenemos que los límites de las clases serán:
Om = 1.5 4.5 – 4.1
AT = 4.5 l1 = 1.5 l1 = 1.3
R =4.1 2
Por lo que:
17
l 5 = L4 = 3.3 L5 = 3.3 + 0.5 = 3.8 (3.3,3.8)
l 6 = L5 = 3.8 L6 = 3.8 + 0.5 = 4.3 (3.8,4.3)
l 7 = L6 = 4.3 L7 = 4.3 + 0.5 = 4.8 (4.3,4.8)
l 8 = L7 = 4.8 L8 = 4.8 + 0.5 = 5.3 (4.8,5.3)
l 9 = L8 = 5.3 L9 = 5.3 + 0.5 = 5.8 (5.3,5.8)
Los intervalos de clases obtenidos dificultan la decisión de establecer a
qué clase pertenecerán los valores que se encuentran en sus límites, esto es, a
qué clase corresponderá el valor de 1.8, si a la primera clase o a la segunda, igual
a los demás valores que presentan está particularidad; se evita incrementando un
decimal más a cada límite de clase:
d) Puntos Medios de Clase: son los valores promedios de los límites de las
clases. Los cálculos a partir de una distribución de frecuencias utilizan éste
valor, ya es considerado como el valor común para todos los datos que
integran a cada clase. Se calculan por medio de:
18
Al estudiar un fenómeno se podrá observar una gran variación de las
frecuencias de las clases a establecerse, siendo conveniente, para la
interpretación y predicción de la naturaleza del fenómeno, tener varias formas
de registrarlas; así como, poder hacer la gráfica correspondiente. Se tienen
diferentes tipos para denotar las frecuencias; las más comunes son:
1. Frecuencia Absoluta: es la frecuencia que corresponde a cada clase, tomando
los valores que la integran a la muestra en el intervalo correspondiente. Se
denota por Fi.
2. Frecuencia Relativa: es la proporción de la frecuencia absoluta de una clase
dada en relación al total de observaciones se denota, por f i; se obtiene por
medio de;
22
F
R A 20
E B 18
C S
U 16
O
E L 14
N
C
U 12
T
I A 10
A
S
S 08
06
04
02
1.35 1.85 2.35 2.85 3.35 3.85 4.35 4.85 5.35 5.85
INTERVALOS DE CLASE
Fig. 4. Histograma de la distribución de frecuencias de ciento veinte rendimientos
promedios de maíz en ton.ha-1. Soconusco, Chiapas. 2001.
20
Si se desea comparar una distribución observada con una distribución
teórica, se puede superponer la distribución teórica sobre el histograma y
apreciar las diferencias existentes.
b) Polígono de Frecuencias: es un gráfico de línea, trazado sobre el valor de clase;
se construye localizando el punto medio de clase y marcando un punto a la altura
de la frecuencia correspondiente a la clase. Estos puntos se unen con líneas
rectas. El polígono de frecuencia tiende a sugerir la curva de la población de
donde se extrajo la muestra. Esto puede ser:
1. Para Frecuencias Absolutas: también llamado polígono de johansen, por ser el
primero que los utilizó en estudios de mediciones biométricas; se puede construir
sobre el histograma respectivo, uniendo los puntos medios de la clase a las
frecuencias absolutas establecidas. Para el caso del cuadro 4, el polígono lo
representa la figura 5.
22
F
20
R A
E 18
B
C S 16
U O 14
E L 12
N U 10
C T
I 08
A
A S 06
S 04
02
1.35 1.85 2.35 2.85 3.35 3.85 4.35 4.85 5.35 5.85
INTERVALOS DE CLASE
Fig. 5. Polígono de frecuencias absolutas para ciento veinte rendimientos promedios de maíz en
ton.ha-1. Soconusco, Chiapas. 2001.
ii) Un polígono con mucha base y poca altura, denotará igualdad de frecuencias en
las clases y por lo tanto habrá mayor variación. La figura 8, lo representa.
iii) Un polígono muy irregular, con más de un vértice pronunciados, denotará una
gran variación y por lo tanto la población es mezclada o heterogénea. La figura 9,
lo representa.
22
Fig. 9. Población mezclada o heterogénea.
23
b) Por el Grado de Agrupamiento: relacionado a la forma en que se distribuyen
los datos en toda la amplitud del recorrido; se dividen en dos tipos:
3 2 2 3
fig. 13. Curva Normal de Probabilidades.
24
Fig.14 Curva asimétrica positiva fig.15 Curva asimétrica negativa
Los conjuntos que son objeto de nuestro interés, están integrados por
mediciones de algunas características que desean estudiar, las cuales están
representadas por una variable, denotada por letras tales como x,y o z.
xi = x1 + x2 + x3 + x4 + x5
1=1
10
xi = x1 + x2 + x3 + x4 + x5 + x6 + x7 + x8 + x9 + x10.
1=1
1000
25
Si se tienen n observaciones, la suma se representa por:
n
I 1 2 3 4 5 6 7 8
X 2 0 3 1 4 2 -1 3
Y 1 3 -1 0 1 4 5 3
xi = x3 + x4 + x5 + x6 + x7 = 3+1+4+2+(-1) = 9
i=3
yi = y2 + y3 + y4 + x5 + x6 + x7 = 3+(-1)+0+1+4+5 = 12
i=2
Propiedades de la sumatoria:
26
Las demostraciones de estas propiedades son muy sencillas, no se
demuestran aquí ya que no es la finalidad de este curso.
Ejemplo del cuadro 1, tenemos que la media para los 120 promedios es:
xi 4.3+2.9+2.8+...+3.6+2.4+3.3
x= x=
n 120
416
= = 3.46
27
120
CLASES i Fi iFi
1.35-1.85 1.6 8 12.8
1.85-2.35 2.1 15 31.5
2.35-2.85 2.6 15 39.0
2.85-3.35 3.1 20 62.0
3.35-3.85 3.6 19 68.4
3.85-4.35 4.1 21 86.1
4.35-4.85 4.6 11 50.6
4.85-5.35 5.1 9 45.9
5.35-5.85 5.6 4 22.4
F=120 iFi = 418.7
La media es:
28
i Fi 418.7
x= = = 3.49
Fi 120
Por ser la medida de tendencia central de mayor uso tiene las siguientes
ventajas
1. Es fácil de calcularse.
2. Considera todos los valores obtenidos en una muestra o población.
3. Tiene gran validez en el muestreo.
29
4. Si se sacan dos muestras de una población, las medias de esas muestras
tendrán concordancia.
Hay que tener en cuenta que la media está influenciada por valores extremos,
y su principal función es la de balancear la suma de todas las observaciones, esto
es funge como punto de equilibrio.
2.7.2 Mediana
En distribuciones con una asimetría muy marcada, la media no es una buena
medida de tendencia central, por lo que es conveniente definir otro medida que
permita centralizar la distribución, y esta es la Mediana; se define como; “dado
un conjunto de n observaciones en forma ordenada y creciente, la mediana es el
valor colocado en el centro del arreglo”; esto es, el valor que divide en dos grupos
iguales a un conjunto ordenado.
Med = xn+1
2
3.7,3.9,3.5,4.2,3.8,2.7,1.3,3.7,3.6
Primero se ordenan, los datos.
1.3,2.7,3.5,3.6,3.7,3.7,3.8,3.9,4.2; se tiene que n = 9
30
Med =
2
Ejemplo: del cuadro 3, la mediana para los 120 rendimientos promedio de maíz es:
xn + xn +1 x120 + x120 +1
2 2 2 2
x60 + x60+1 3.5+3.5
Med = = = = = 3.5
2 2 2 2
[(n/2) – Fai]
Med = lm + (a) en donde:
Fi
lm = Límite inferior de la clase mediana
Fai = Frecuencia acumulada anterior a la clase mediana
Fai = Frecuencia absoluta de la clase mediana
n = Número de datos en la distribución. a = intervalo de clase
31
Med =3.35 + (0.21)(0.5)
Med =3.455
2.7.3 Moda
Otra medida de tendencia central utilizada, aunque no frecuentemente, es
la Moda, que se define como “el valor que mayor número de veces se presenta en
un conjunto de números”. En algunas distribuciones se observa que no se presenta
la moda y en otras puede existir más de una.
Ejemplo: del cuadro 3, se observa que los datos ya están dados de forma
ordenada, que los valores 3.3,3.7,3.8,4.3,4.3 se presentan 6,5,5,5,5 veces
respectivamente, por lo tanto la moda es 3.3 por ser el de más frecuencia que es
6.
32
Cuadro 8. Cálculo de la moda para los 120 rendimientos promedio de maíz.
CLASES
i Fi Fai
1.35 – 1.85 1.6 8 8 En el cuadro 8 podemos observar que la
1.85 – 2.35 2.1 13 21
2.35 – 2.85 2.6 15 36 mayor frecuencia absoluta es 21, corresponde
2.85 – 3.35 3.1 20 56 a la clase cuyo intervalo es (3.85 – 4.35), por
3.35 – 3.85 3.6 19 75
lo que ésta es la clase modal; 4.1 es el punto
3.85 – 4.35 4.1 21 96
4.35 – 4.85 4.6 11 107 modal y viene siendo el valor modal para ésta
4.85 – 5.35 5.1 9 116 distribución de frecuencias.
5.35 – 5.85 5.6 4 120
Se puede ver que éste valor (4.1) difiere del valor modal obtenido en el
cuadro 3; con esto se confirma la inestabilidad de la moda como una medida de
tendencia central.
2.8 Medidas de Dispersión
33
A pesar de que la amplitud es de fácil cómputo es el estadígrafo más
inestable y difícil de interpretar, debido a que únicamente depende de los valores
extremos del conjunto de datos, por lo que se considera una desventaja al no
señalar si la agrupación de los datos están bastantes cercanos unos a otros.
xi - x di
D.M.= =
n n
El valor absoluto significa que se deben considerar los alejamientos de los
datos, tanto a la izquierda como a la derecha de la media para incrementar la
desviación promedio. Actualmente no se emplea esta medida, ya que la función
valor absoluta no es fácil de manejar algebraicamente; además su cálculo es muy
laborioso y carece de ventajas teóricas que poseen otras medidas. La desviación
media se puede calcular para dos grupos de datos.
Indica que todos los datos se desvían, en promedio, de la media en 6.4 unidades.
b) Datos en una Distribución de Frecuencias: en una distribución de frecuencias
con valores de clase ,2,3,...,r, y F1,F2,F3,... Fr las frecuencias respectivas de las
clases, el cálculo de la desviación media se realiza con la siguiente formula
xi - x Fi di Fi
D.M. = =
Fi Fi
Cuadro 10. Cálculo de la desviación media para los ciento veinte rendimientos
promedio de maíz.
2.8.3 Varianza
35
La mejor medida de variación y la más generalizada es la Varianza o su raíz
cuadrada denominada Desviación Estándar. Medida que se fundamenta en la 3ª
propiedad de la media que dice “la suma de los cuadrados de las desviaciones de
un conjunto de valores con respecto a su media es un mínimo”; si esa suma se
divide entre el número de observaciones, entonces tendremos el valor de la
Varianza o también llamado cuadro medio; representada por 2 para la población
s2 para la muestra. Se da en las unidades originales al cuadro; esta medida se da
en términos de desviaciones al cuadrado, su cálculo es por medio de:
xi xi – x di2
61 - 0.7 0.49 La media es:
57 - 4.7 22.09 Xi 617
X= = = 61.7
78 16.3 265.69 n 10
73 11.3 127.69
60 - 1.7 2.89
49 -12.7 161.29 La varianza es:
56 - 5.7 32.49 ( di ) 2 868.10
S2 = = = 96.45
68 6.3 39.69 n 1 9
67 5.3 28.09
48 -13.7 187.69
xi = 617 di = 868.10
36
(Xi ) 2
Xi 2
S2 = n
n 1
xi xi2
(Xi ) 2
61 3721 Xi 2
57 3249 S2 = n
78 6084 n 1
73 5329
60 3600 (617) 2
49 2401 38,937 38.937 38,068.9
56 3136
S2 = 10 =
9
68 4624 10 1
67 4489
48 2304 S2 = 96.45
2
xi = 617 di = 38,937
c) Datos en una distribución de Frecuencias: Al igual que para datos no
agrupados, cuando se tiene una distribución de frecuencias, el calculo de la
varianza se puede realizar por varios métodos, pero el más práctico es “por
medio de un factor de corrección”; el procedimiento es similar que para datos
no agrupados, se utiliza la ecuación:
2 (ni Fi ) 2
ni Fi
S2 = Fi
Fi 1
Ejemplo: Calcular la varianza de los 120 rendimientos promedios de maíz, del
siguiente cuadro.
La varianza es:
37
2 (ni Fi ) 2 ( 414.5) 2
n i Fi 1562. 5 1562.5 1431.752
S2 = Fi = 120 = =
119
Fi 1 120 1
S2 = 1.1016 (ton/ha)2.
( Xi X ) 2
S2 = n 1
( Xi X ) 2
Al término se le conoce como “Suma de Cuadrados (SC), esto es a SC
( Xi X ) 2
= , se le llama fórmula de definición de la cuadrados y se puede
reducir , para el efecto de facilitar sus cálculos, a la siguiente fórmula:
(X i) 2
SC = Xi2 -
n
( Xi X ) 2 ( Xi ) 2
S= =
n N
Ya que la desviación estandar es la raíz cuadrada de la varianza, también se
puede calcular para datos no agrupados y para datos en una distribución de
frecuencias.
Ejemplo: Calcular la desviación estándar para los datos del Cuadro 11.
S = S2 S = 96.45 S = 9.82
Ejemplo: Calcular la desviación estándar para los datos del cuadro 4.
39
3 2 2 3
3S 2S S X S 2S 3S
Muestral Poblacional
40
S
CV = 100 CV = 100
X
Es una cantidad usada por los experimentadores para evaluar los
resultados de diferentes experimentos en que intervienen la misma
carácteristica y probablemente llevadso a cabo por diferentes personas.
En general, el valor del CV informa sobre la variación o uniformidad de las
poblaciones o muestras. Como es la razón de dos promedios, el CV es
independiente de la unidad de medida usada,esto es, da igual que se usen yardas o
metros para medir longitud o kilogramos o libras para la unidad de masa.
X = 61.70
S 9.82
S = 09.82 CV = 100 CV = 100 CV = 15.91%
X 61.7
X = 3.45
S 1.04957
S = 1.04975 CV = 100 CV = 100 CV = 30.42%
X 3.45
41
Una Variable Aleatoria Discreta si “Los valores que asume se pueden
contar”, es decir son valores enteros. Estos valores provienen de un Espacio
Muestral Numerable Finito o Infinito. Las distribuciones de variables aleatorias
discretas reciben también el nombre de Distribución de Conteo.
n
px (1-p)nx si x = 0, 1, 2, ......., n.
Fx (x) = x
O de otra forman n!
Con 0 p 1 y =
X x!(n –x)!
X ~ Bin (n, p)
42
Para calcular las probabilidades del número de éxitos de un experimento
se puede utilizar tablas ya elaboradas para ello, o en su defecto a través de la
función de probabilidades; estos pueden ser tanto individuales como acumulativas.
Entonces:
6
6.5.4.3.2.1
Fx (2) = ( ½ )2 ( ½ )6-2 = (1/4)2 ( ½ )4
2.1.4.3.2
2
5! 5!
FX(0) = 0!(5 0)! (0.7)0(0.3)5-0 = (0.3)5 = 0.00243
5!
43
5! 5!
FX(1) = 1!(5 1)! (0.7)1(0.3)5-1 = (0.7)(0.3)4 = 0.02835
4!
5! 5!
FX(2) = 2!(5 2)! (0.7)2(0.3)5-2 = (0.7)2(0.3)3 = 0.1323
2!3!
5! 5!
FX(3) = 3!(5 3)! (0.7)3(0.3)5-3 = (0.7)3(0.3)2 = 0.3087
3!2!
5! 5!
FX(4) = 4!(5 4)! (0.7)4(0.3)5-4 = (0.7)4(0.0)5 = 0.36015
4!
5! 5!
FX(5) = 5!(5 5)! (0.7)5(0.3)5-5 = (0.7)5 = 0.16807
5!
X=x 0 1 2 3 4 5
Fx(X) .00243 0.02835 0.1323 0.3087 0.36015 0.16807
Fx(X) .00243 0.03078 0.16308 .047178 0.83193 1.00000
44
3) El numero de ocurrencias de un evento de cualquier intervalo es independiente
del numero de ocurrencias en otros intervalos.
Por lo que si X representa una variable aleatoria, cuya distribución se
aproxima a la distribución de probabilidad Poisson, entonces su función de
probabilidad viene dada por:
e x
si x = 0, 1, 2, ........
x!
Fx(x) =
O de otra forma con e = 2.71828 y desconocido 0
300
entonces: FX(4) = P (X = 4) = (0.02)4(0.98)296
4
esta operación es muy complicada. Entonces Fx (4) podemos determinarlo
mediante una distribución de Poisson en donde:
e x
= 300(0.02) = 6 x=4 F(X) =
x!
45
6 4 e 6
F(4) = 0.135
4!
46
1 ( X )2
con - < X <
2 e 2 2
FX(Xi) =
0 de otra forma
FX(X)
X
1 ( X )2
2 e 2 2
dx = 1
3.- Tiene como parámetro a M y I, los cuales son puntos de inflexión de la curva
que representa la distribución. Por ello, una curva se simboliza como:
X ~ (, σ2)
47
Se lee como: La variable aleatoria X se distribuye de acuerdo a la Normal N con
parámetros y σ2. Por lo que existe una distribución normal diferente para cada
combinación de y σ2 esto se muestra en la siguiente figura:
FX(X)
1 Dirección de la
2 varianza
creciente
3
σ σ σ
1 2 3
σ1 = 1
σ2 = 2
σ3 = 3
Con lo anterior se tiene que la distribución normal pertenece a una fanilia
de distribuciones.
5.- El área delimitada por la curva de distribución y el eje de las X es iogual a la
unidad, esto es para cualquier y σ. Ahora bien, el área delimitada por la curva, el
48
eje X y dos rectas perpendiculares al eje X, que son valores de la variable
aleatoria X, representa la probabilidad de ocurrencia de los valores de la variable
X comprendidos entre los dos valores de X, esto es según la siguiente figura:
X1 X2
2σ
3σ
49
Para disminuir el problema del cálculo de probabilidades de una variable X,
es necesario transformar las probabilidades de la Distribución Normal a
probabilidades de un miembro particular de la familia Normal de Densidades.
Esta distribución es la Distribución Normal Estándar.
X3 ~ N(3 σ32 )
ESTANDARIZACION Z ~ N(O, 1)
Xn ~ N(n σn2 )
=1
50
P(X>a)ESTANDARIZADO
P(x>a)
X
T : Z=
X
Si X ~ N(, 2) Z= ~ N(0, 1).
1 z2
e 2 con - < Z <
2
FZ(Z) =
0 de otra forma
1 z2
(Z) = 2
e 2 dz = 1
51
Debidoa que no es fácil calcular esta integral, los valores que se utilizan en
el cálculo de probabilidades se obtiene de las Tablas correspondientes.
La importancia de está distribución estriba en que la probabilidad de que
un valor particular de la variable aleatoria X esté contenida en un intervalo P(a
≤X ≤b) es igual al área bajo la curva en ese intervalo en la función de
densidad.
a b
P(a ≤ X ≤ b) = P( ≤Z≤ ) Además se considera que
P(Z) = P(-Z)
Para los siguientes ejemplos, las tablas que se emplean para el cálculo de
probabilidades es la que se considera áreas bajo la curva normal tipificada de 0 a
Zo.
Propiedades:
1).- El origen de la función está en el punto cero.
2).- La función es asintótica en X en su cola derecha.
3).- La función es integrable y como es la normal, el área total bajo la curva
integra a 1, estos también se traduce como valores de probabilística.
52
Distribución obtenida por William Sealy Grosset, de mayor uso en el
análisis de datos. Es una distribución simétrica con = 0 y de forma muy
semejante a la normal estándar. Se define con el estadígrafo como:
Y Y
t= s y S2
n
Ejemplo: Encontrar to tal que P(t ≥ to) = 0.025 para 8 grados de libertad; P(t ≥ to)
= 0.01 para 15 grados de libertad; P(t ≥ to) = 0.01 para 15 grados de libertad; P(t ≥
53
to) = 0.10 para 12 grados de libertad; P(- to ≤ t ≤ to) = 0.80 para 22 grados de
libertad.
Ejemplo: Encontrar P(t ≥ 2.6) para 8grados de libertad; P(t ≤ 1.7) para 15 grados
de libertad; P(t ≤ 1.1) para 18 grados de libertad; P(- 1.1 ≤ t ≤ 2.1) para 5 grados
de libertad; P(t ≥ 1.8) para 6 grados de libertad.
Yi )
Zi
2
X2 = Ç ( i 2
i
i
i
Es más general de lo que necesitamos actualmente, pues estamos viendo el
muestreo de una sola población con σ constante. Al muestrear una distribución
normal, la cantidad SC = (n – 1)s 2 consiste en la suma de los cuadrados de (n – 1)
desviaciones independientes, se puede demostrar que tales desviaciones tienen
medias cero; la división por la σ común asegura que tenga varianza unitarias.
(n 1) S 2
X2
2
2 gl
4 gl
6 gl
54
Obviamente X2 no puede ser negativa, ya que es una suma de números al
cuadrado. Se ve que mientras los máximos se desfasan hacia la izquierda de los
grados de libertad, las curvas tienden a ser más simétricas, al aumentar los
grados de libertad. La media y la varianza de una distribución X2 son los grados de
libertad y dos veces los grados de libertad respectivamente.
Se acostumbra tabular solamente unos cuantos valores de cada una de
muchas curvas. Así, tenemos la tabla A.5, Las probabilidades se dan en la parte
superior de la tabla, los grados de libertad en la columna de la izquierda y los
valores de X2 en el cuerpo de la tabla para las combinaciones dadas de P y gl.
55
elementos; 9 por ejemplo (n = 9). Calcúlense las medias de estas 5 muestras ( X
1...... X 5). Estímese σ mediante el cálculo de s para cada muestra:
2 2
9
( X 1i X ) 2
S12 i 1 S12 S 52
(9 1)
etc., para ...... , Súmense estas estimaciones
;
5 2
i )
( X X
.
S X2 i 1
(5 1)
A partir de S estímese nuevamente σ2, utilizando la relación S n S x .
2 2 2
x
Población Muestra 1 n=9 X1
9
( X 1i X ) 2
S12 i 1
(9 1)
X1 Número de muestras
. obtenidas simultáneamente
. μ =5
.
.
σ2
. Muestra 5 n=9 X5
9 2
1i )
( X X
S 52 i 1
(9 1)
Xn
S12 ........... S 52
S
2
Varianzas media de las 5 muestras
5
56
5 2
(Xi X ) porque S 2x
S2
S2 = n S x =
2
S
2
i 1
n
X
(5 1)
9 S x Varianza obtenida al multiplicar al número de elementos de cada muestra
2
S2
F Numerador: Varianza obtenida al multiplicar al número de elementos
S2
de cada muestra por la varianza media.
Denominador: Varianzas media de las 5 muestras.
5 1 4
gl = 5(9 1) 40 La obtención sucesiva de 5 muestras de n = 9, a partir
de una población de elementos (X1........Xn) normalmente distribuida, genera una
distribución F. Cinco por ciento de los valores de F serán 2.61 o mayores.
5%
1 2.61 F
Calculado a partir de las medias de la muestra
F= Calculado por la combinación de las var ianzas de la muestra
57
determinarse para otros tamaños de muestra, números de muestras y para otros
niveles de probabilidad (2.5%, 1 %, etc).
59
d) Estimador Suficiente.
4.3.- Estimación.
4.3.1.- Estimación puntual.
Una estimación puntual del promedio de la población del ancho de la cápsula
cefálica superior (ACC) de larvas de Chelonus insularis que no emergieron de
larvas de Spodoptera frugiperda con base en los datos de la Tabla 3.1
es ; esto quiere decir que el promedio de la muestra estima el
promedio de la población . La estimación puntual se realiza con un solo valor
obtenido de la muestra, en este caso, el promedio. Cuando se emplea la estimación
puntual es recomendable indicar también el valor de la desviación típica de la
muestra pues de esta manera se tiene una idea de qué tan confiable es el
estimador. Valores bajos de desviación típica indican que los valores muestrales
están distribuidos más cerca del promedio que los de una muestra con desviación
típica más grande.
60
confianza; para establecerlos se emplean las expresiones 3.15 y 3.16,
respectivamente.
La estimación por intervalo de este mismo parámetro, empleando la expresión
3.15 es como se indica a continuación, usando los valores correspondientes: (los
valores de t25 gl se toman de la Tabla 3.4).
.
....................................... (3.19)
.......................................... ..(3.19a)
4.7.- Hipótesis.
4.7.1.- Hipótesis Nula.
Se conoce como Hipótesis planteada o nula y generalmente se representa
como Hp o H0.
4.8.- Error.
4.8.1.- Error Tipo I.
4.8.2.- Error Tipo II.
Al probar un conjunto de tratamientos, el análisis de varianza sirve para probar la
hipótesis nula Ho contra la hipótesis alterna Ha. en donde:
Ho : No hay diferencias entre tratamientos
Ho
Decisión Verdadera Falsa
Rechazar la Hipótesis Correcta Error Tipo I (α )
No rechazar la Error Tipo II ( β ) Correcta
hipótesis
62
aceptar que existe diferencia entre los tratamientos cuando no las hay.
Nivel de significancía = α = p(Error Tipo I)
63
Chelonus insularis que no emergieron de larvas de Spodoptera frugiperda es
mayor que 1,4 mm. (Figura 3.12)
Figura 3.12. Ubicación del valor crítico de t (t) y del valor de tc en la zona
de rechazo de la hipótesis planteada. Prueba de una cola.
64
La variable dependiente se representa usualmente como yi y la variable
independiente como xi. Es claro que para realizar el estudio de la regresión es
necesario disponer y analizar observaciones pareadas de cada una de estas
variables (distribución bivariada normal). El análisis de regresión consta, en
general, de dos partes; la primera se refiere a la estimación del modelo o
ecuación de la recta de regresión y, la segunda, al análisis de varianza de la
regresión, o sea, a verificar la validez o no de la regresión.
.................................................. (3.28)
en donde y son los promedios de las variables dependiente e independiente.
..............(3.29).
65
en kilogramos por hectárea (variable dependiente) en una variedad de fríjol
tolerante a este insecto y etapas del cálculo.
Tabla 3.10 Promedio por hoja de ninfas de Empoasca kraemeri y rendimiento en grano, en
kilogramos por hectárea, de una variedad tolerante al insecto y etapas del cálculo.
No. Ninfas/hoja (kg/ha)
(xi) (yi)
66
De acuerdo con la expresión 3.29, el coeficiente de regresión se calcula como.
.................................................. (3.30)
67
Este modelo permite hallar para una infestación dada de ninfas de E. kraemeri
(dentro del rango de valores de la X) la esperanza del rendimiento promedio de
grano de fríjol, en kilogramos por hectárea.
Para trazar la línea de regresión es necesario determinar con el modelo
encontrado dos valores esperados del rendimiento que correspondan a dos
valores de infestación; para esto, es recomendable emplear los valores extremos
observados de la infestación (0,65 y 5,94 ninfas por hoja). La unión de estos dos
puntos con una recta, en un sistema de coordenadas, corresponde a la línea de
regresión: .
Figura 3.14. Línea de regresión del número promedio de ninfas por hoja sobre el
rendimiento promedio de grano de fríjol, en kilogramos por hectárea.
5.3.2.- Características de la línea de regresión.
La línea de regresión es válida dentro del rango de la variable
independiente.
La línea de regresión pasa por el punto definido por los promedios de las
variables dependiente e independiente
68
La suma algebraica de las desviaciones de y con los puntos de la línea de
regresión es cero.
La línea de regresión está formada por los promedios móviles de los valores
de y, los que varían de acuerdo con x.
........................................................................... (3.31)
.......................................................................... (3.32)
............................................................ (3.33).
69
Tabla 3.11 Análisis teórico de la varianza en la regresión lineal
Fuentes de Grados de Sumas de cuadrados Cuadrados medios Cuadrados medios esperados
Variación libertad (CME)
(SC) (CM)
Regresión 1
Total n-1
Total 24 1380286,5600
70
se puede emplear el modelo de regresión para obtener los correspondientes
valores de y.
El intervalo de confianza para una predicción se establece mediante:
(3.34)
El intervalo de confianza de 0,95 para dicha predicción está definido por los
siguientes límites de confianza (expresión 3.34):
es decir,
Límite inferior (L1)= 2278,98 kg/ha
Límite superior (L2)= 1724,50 kg/ha.
71
entre las variables no necesariamente implica la existencia de una relación casual
entre ellas.
Las relaciones de regresión sólo son válidas dentro del rango de valores
observados de la variable independiente pues la credibilidad del modelo disminuye
a medida que se extrapola, es decir, cuando se trata de estimar valores de y para
valores de x que están por fuera de su recorrido. Los modelos de regresión no son
necesariamente válidos para fines de extrapolación.
Bibliográficas
Cuadros de Chacón, Mary y Vergara Ruiz, Rodrigo. 1993. Estudios básicos sobre la
efectividad insecticida de extractos florales de Calliandra spp (Mimosaceae)
sobre larvas de Spodoptera frugiperda J. E. Smith. Ibagué (Colombia)
Universidad del Tolima, Trabajo de Grado. Escuela de Posgrado. 96 p.
Mario F. Triola. 2004. Estadistica 9ed.. Pearson Educacion de Mexico S.A. de C.V.
ISBN: 9702605199.
Medina, María Claudia y otros. 1988. Ciclo e vida y descripción de Chelonus insularis
Cresson (Hymenoptera: Braconidae), parásito de Spodoptera spp. En: Revista
Colombiana de Entomología. Vol. 14, No. 1, (enero-junio, 1988), p. 13-21.
ISSN-0120-0488.
72
Ortegón E., Jaime y otros. 1988. Estudio sobre longevidad, hábitos, progenie y
evaluación preliminar de Meteorus laphygmae (Viereck), parásito de
Spodoptera spp. En: Revista Colombiana de Entomología. Vol. 14 No. 1,
(enero-junio, 1988). p. 7-12. ISSN-0120-0488
ZAR, Jerrold H. Biostatistical analysis. New Jersey, Prentice-Hall, 1984. 718 p. ISBN-
0-13-077925-3.
73