Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LA VENTA
UNIDAD 1: DISTRIBUCIONES DE
FRECUENCIA
ASIGNATURA:
PROBABILIDAD Y ESTADISTICA
DESCRIPTIVA
PRESENTA:
YAMILET GARCIA OVANDO
DOCENTE:
ING. ANGEL ARMANDO CARRILLO PEREZ
CARRERA:
INGENIERIA EN GESTIN EMPRESARIAL
GRADO Y GRUPO:
3 Q
VILLA LA VENTA TABASCO: SABADO 24 DE
DICIEMBRE DEL 2016
INDICE
INTRODUCCIN .................................................................................................... 3
UNIDAD 1: DISTRIBUCIONES DE FRECUENCIA. ................................................ 4
1.1 CONCEPTOS DE ESTADSTICA Y SU CLASIFICACIN. ........................... 5
ANALISIS.......................................................................................................... 7
1.2 RECOPILACIN DE DATOS. ........................................................................ 8
ANALISIS.......................................................................................................... 9
1.3 DISTRIBUCIN DE FRECUENCIA ............................................................. 10
1.3.1 Polgonos de frecuencia, histogramas y ojivas. ..................................... 11
ANALISIS........................................................................................................ 12
1.4 MEDIDAS DE TENDENCIA CENTRAL. PARA UN CONJUNTO DE DATOS
AGRUPADOS. ................................................................................................... 13
1.4.1 Media, Media Ponderada ....................................................................... 13
1.4.2 Mediana ................................................................................................. 14
1.4.3 Moda ...................................................................................................... 14
1.4.4 Relacin entre media, mediana y moda. ................................................ 15
ANALISIS........................................................................................................ 16
1.5 MEDIDAS DE DISPERSIN PARA UN CONJUNTO DE DATOS Y DATOS
AGRUPADOS. ................................................................................................... 17
1.5.1 Rango. ................................................................................................... 17
1.5.2 Desviacin media................................................................................... 19
1.5.3 Varianza. ................................................................................................ 19
1.5.4 Desviacin estndar. (S ) .................................................................. 22
ANALISIS........................................................................................................ 23
CONCLUSIN ...................................................................................................... 24
INTRODUCCIN
En esta unidad nos aportara informacin para el anlisis, caracterizacin,
interpretacin y prediccin de los distintos fenmenos o devenires de las empresas
actuales en el mundo globalizado que nos ests tocando vivir.
Se abordan los temas bsicos de la estadstica descriptiva con la finalidad de que
se analice y represente grficamente conjuntos de datos tomados de una situacin
real, haciendo una interpretacin de ellos mediante el uso de medidas de tendencia
central lo que le permitir identificar las caractersticas de los fenmenos
poblacionales.
Todo anlisis estadstico se inicia con una primera fase descriptiva de los datos.
sta tiene por objeto sintetizar la informacin mediante la elaboracin de tablas de
frecuencias, representaciones grficas y el clculo de medidas estadsticas (o
estadsticos). Estos procedimientos descriptivos dependen de la naturaleza de la
variable o atributo que se analiza, bsicamente, para sintetizar datos cualitativos o
datos cuantitativos. En la siguiente investigacin se mostrarn puntos por punto de
toda la unidad para tener un concepto ms amplio.
Teora de probabilidad
Estadstica inferencial
ANALISIS
ANALISIS
10
11
ANALISIS
12
Por ejemplo, el tiempo de espera (en minutos) de cinco clientes de un banco es: 3,
2, 4, 1 y 2. El tiempo medio de espera es:
En promedio, un cliente espera 2.4 minutos para ser atendido en el banco.
13
Se obtiene multiplicando cada uno de los datos por su ponderacin (peso) para
luego sumarlos, obteniendo as una suma ponderada; despus se divide esta entre
la suma de los pesos, dando como resultado la media ponderada.
1.4.2 Mediana
Se utiliza la mediana para describir un conjunto entero de observaciones con un
solo valor que representa el centro de los datos. La mitad de las observaciones est
por encima de la mediana y la otra mitad est por debajo de sta. Se determina al
jerarquizar los datos y hallar el nmero de observacin [N + 1] / 2. Si hay un nmero
par de observaciones, la mediana se extrapola como el valor que est justo en el
medio entre el valor de las observaciones N / 2 y [N / 2] + 1.
1.4.3 Moda
La moda es el valor que ocurre con ms frecuencia en un conjunto de
observaciones. Tambin muestra cuntos puntos de los datos son iguales a la
moda. La moda se puede utilizar con la media y la mediana para proporcionar una
caracterizacin general de la distribucin de los datos. Mientras que la media y la
mediana requieren un clculo, la moda se obtiene simplemente contando el nmero
de veces que cada valor ocurre en un conjunto de datos.
El identificar la moda puede ayudar a comprender la distribucin. Una distribucin
con ms de una moda puede indicar que usted en realidad tom la muestra de una
poblacin mixta. Por ejemplo, usted puede haber recogido datos de tiempo de
espera de clientes que desean cobrar cheques y de clientes que desean solicitar
una hipoteca, todos juntos. Para entender mejor sus datos, estos dos casos se
deberan recopilar por separado. Si tiene ms de dos modas, la distribucin es
multimodal.
14
ms cerca de la media).
En distribuciones que presentan cierta inclinacin, es ms aconsejable el uso de
la mediana. Sin embargo, en estudios relacionados con propsitos estadsticos y
de inferencia suele ser ms apta la media.
15
ANALISIS
16
LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda
slo nos revelan una parte de la informacin que necesitamos acerca de las
caractersticas de los datos. Para aumentar nuestro entendimiento del patrn de los
datos, debemos medir tambin su dispersin, extensin o variabilidad.
La dispersin es importante porque:
1.5.1 Rango.
Es el intervalo entre el valor mximo y el valor mnimo; por ello, comparte unidades
con los datos. Permite obtener una idea de la dispersin de los datos, cuanto mayor
es el rango, ms dispersos estn los datos de un conjunto. Es la medida de
variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el rango se define
como la diferencia entre el valor ms alto (Xn Xmax.) y el ms bajo (X1 Xmin)
en un conjunto de datos.
Con datos agrupados no se saben los valores mximos y mnimos. Si no hay
intervalos de clases abiertos podemos aproximar el rango mediante el uso de los
lmites de clases. Se aproxima el rango tomando el lmite superior de la ltima clase
menos el lmite inferior de la primera clase.
17
fa
fa
fra
14.628 10 0.33 10
30
0.33 1.00
P.M.
Xi
fi
fr
fra
0.13 14
20
0.46 0.67
0.17 19
16
0.63 0.54
0.10 22
11
0.73 0.37
0.10 25
0.83 0.27
0.17 30
1.00 0.17
Total
XXX
18
a unos pocos valores en extremo pequeos o grandes. Cuando tal cosa sucede,
entonces el recorrido solamente mide la dispersin con respecto a esos valores
anormales, ignorando a los dems valores de la variable.
La principal desventaja del recorrido es que slo est influenciado por los valores
extremos, puesto que no cuenta con los dems valores de la variable. Por tal razn,
siempre existe el peligro de que el recorrido ofrezca una descripcin distorsionada
de la dispersin.
En el control de la calidad se hace un uso extenso del recorrido cuando la
distribucin a utilizarse no la distorsionan y cuando el ahorro del tiempo al hacer los
clculos es un factor de importancia.
1.5.2 Desviacin media.
En estadstica la desviacin absoluta promedio o, sencillamente desviacin media
o promedio de un conjunto de datos es la media de las desviaciones absolutas y es
un resumen de la dispersin estadstica. Se expresa, de acuerdo a esta frmula:
El valor:
ocurre cuando los datos son exactamente iguales e iguales a la
media aritmtica.
1.5.3 Varianza.
La varianza es una medida de dispersin relativa a algn punto de referencia. Ese
punto de referencia es la media aritmtica de la distribucin. Ms especficamente,
la varianza es una medida de que tan cerca, o que tan lejos estn los diferentes
valores de su propia media aritmtica. Cuando ms lejos estn las Xi de su propia
media aritmtica, mayor es la varianza; cuando ms cerca estn las Xi a su media
menos es la varianza.
19
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de 1er ao, a saber: 18,23,
25, 27, y 34. Al calcular la media aritmtica (promedio de las edades, se obtuvo 25.4
aos, encontrar la varianza de las edades de estos estudiantes:
Para calcular se utiliza una tabla estadstica de trabajo de la siguiente manera:
Xi
( Xi -
( Xi -
)2
18
(18 25.5)=-7.4
(-7.4)2=54.76
23
(23 25.5)=-2.4
(-2.4)2= 5.76
25
(25 25.5)=-0.4
(-0.4)2= 0.16
27
( 1.64)2= 2.16
34
( 8.6)2 =73.96
Total
xxxx
137.20
20
fi
7.420 21.835
14.628
10
213.978
146.280
2,139.780
21.835 36.250
29.043
843,496
116.172
3,373.984
36.250 50.665
43.458
1,888.598
217.270
9,442.990
50.665 65.080
57.873
3,349.284
173.619
10,047.852
65.080 79.495
72.288
5,225.555
216.864
15,676.665
79.495 93.910
86.703
7,533.025
433.965
37,665.125
XXX
30
19,053.936
1,304.190
78,346.396
clases
Total
Xi2
Xifi
X2fi
Propiedades de la varianza:
21
22
ANALISIS
23
CONCLUSIN
Una distribucin de frecuencia es una tabla de resumen en la que los datos se
disponen en agrupamientos o categoras convenientemente establecidas de clases
ordenadas numricamente. En esta forma las caractersticas ms importantes de
los datos se aproximan muy fcilmente, compensando as el hecho de que cuando
los datos se agrupan de ese modo, la informacin inicial referente a las
observaciones individuales de que antes se dispona se pierde a travs del proceso
de agrupamiento o condensacin.
La principal ventaja de usar una de estas tablas de resumen es que las principales
caractersticas de los datos se hacen evidentes inmediatamente para el lector.
La principal desventaja de tal tabla de resumen es que no podemos saber cmo se
distribuyen los valores individuales dentro de un intervalo de clase particular sin
tener acceso a los datos originales. El punto medio de la clase, sin embargo, es el
valor usado para representar todos los datos resumidos en un intervalo particular.
El punto medio de una clase (o marca de clase) es el punto a la mitad de los lmites
de cada clase y es representativo de los datos de esa clase.
La probabilidad es la posibilidad u oportunidad de que suceda un evento particular.
La probabilidad involucrada es una porcin o fraccin cuyo valor vara entre cero y
uno exclusivamente. Observamos un evento que no tiene posibilidad de ocurrir (es
decir, el evento nulo), tiene una probabilidad de cero, mientras que un evento que
seguramente ocurrir (es decir, el evento cierto), tiene una probabilidad de uno.
24