Sei sulla pagina 1di 17

Ao de la Integracin Nacional Universidad Nacional Mayor de San Marcos Facultad de Ingeniera Industrial

Trabajo Estadstica y Probabilidades Ing. Esponda Apellidos: Cuba Flores Nombres: Dagoberto Csar Cdigo: 09170216 Profesor: Ing. William Len Velsquez Ciclo: 2012 1

Conceptos Tericos.
La estadstica es una ciencia formal que estudia la recoleccin, anlisis e interpretacin de datos, ya sea para ayudar en la toma de decisiones o para explicar condiciones regulares o irregulares de algn fenmeno o estudio aplicado, de ocurrencia en forma aleatoria o condicional. Sin embargo estadstica es ms que eso, en otras palabras es el vehculo que permite llevar a cabo el proceso relacionado con la investigacin cientfica. La estadstica se divide en dos grandes reas: Estadstica Descriptiva. Estadstica Inferencial. 1. Terminologa. 1.1 Poblacin: Es la totalidad de individuos o elementos que poseen alguna caracterstica en comn. 1.2 Muestra: Es un subconjunto representativo de la poblacin. 1.3 Variable: Es un nmero o denominacin que podemos asignar a la unidad de anlisis. 1.3.1 Cualitativas: Sus valores corresponden a conceptos, atributos o cualidades, no son medibles. 1.3.2 Cuantitativas: Son medibles, sus valores corresponden a nmeros reales: Discretas y continuas

2. Tabla de Frecuencia.

3. Grficos para variables continuas


Histograma variable notas
9 8 7

frecuencia absoluta

6 5 4 3 2 1 0 3.8 - 4.2 4.2 - 4.6 4.6 - 5.0 5.0 - 5.4 5.4 5.8 intervalos de clase

Ojiva variable notas


30

FRECUENCIA ACUMULADA

25
24

25

20
19

15
14

10 5 0 4,2 4,6 5 5,4 5,8 LIMITE SUPERIOR INTERVALO DE CLASE


6

Grafico Variable Cualitativa

Grafico Variable Discreta

4. Medidas de Tendencia Central La Media. Para datos no agrupados:


El promedio de valores de un conjunto de valores(x1, x2, x3,., xn) es:

Para datos agrupados:

Donde: fi: frecuencia en la clase k esima Xi: Marca de clase en el intervalo k esimo

La Mediana
Es el valor que ocupa la posicin central de un conjunto de observaciones ordenadas. El 50% de las observaciones son mayores que este valor y el otro 50% son menores.

Para datos no agrupados:

Para datos agrupados:

La Moda
Es el valor, clase o categora que ocurre con mayor frecuencia y sus caractersticas son: - Puede no existir o existir ms de una moda - Su valor no se ve afectado por los valores extremos en los datos - Se utiliza para analizar tanto la informacin cualitativa como la cuantitativa - Es una medida inestable cuando en nmero de datos es reducido.

Para datos no agrupados:


Por ejemplo, durante los ltimos 32 das el valor de las compras en peridicos fue: {5.2, 10.2, 7.0, 7.1, 10.2, 8.3, 9.4, 9.2, 6.5, 7.1, 6.6, 7.8, 6.8, 7.1, 8.4, 9.6, 8.5, 5.7, 6.4, 10.1, 8.2, 9.0, 7.8, 8.2, 5.3, 6.2, 9.1, 8.6, 7.0, 7.7, 8.3, 7.5 } Moda = Mo = 7.1; Es el valor ms frecuente, ocurre 3 veces.

Para datos agrupados:

Media Geomtrica
Corresponde al valor representativo central de observaciones secuenciales y estrechamente relacionadas entre s tales como tasas de: inters, inflacin, devaluacin, variacin, crecimiento, disminucin. El promedio geomtrico de los valores: (Xi X2,....,Xf ) es:

Media Armnica
El promedio armnico de los valores: (X1 X2 ..... Xn ) donde ninguno toma el valor cero es:

Este promedio se utiliza para que los valores extremos no afecten al valor del promedio. Los valores extremos s afectan cuando se usa el promedio aritmtico o el promedio geomtrico.

5. Medidas de Variabilidad Varianza


Para datos no agrupados:
La variancia de los datos de esta muestra (x1 x2 x3,...,xn):

Para datos agrupados:


La variancia de los valores: (x1,x2,...,xk) que ocurren con las frecuencias (f1, f2,...,fk ) es:

Desviacin Estndar.
Es una medida de variabilidad que corresponde a la raz cuadrada de la variancia. Este indicador tiene la misma unidad de medida en la que se expresa el promedio.

Coeficiente de Variabilidad.
Es una medida de variabilidad de los datos que se expresa en porcentaje en la cual se compara la desviacin estndar con el respectivo valor del promedio de los datos:

6. Grafico de Cajas.

Problema.
Estadstica de accidentabilidad en las empresas. Fuente: Centro de investigacin y asistencia tcnica Barcelona Datos iniciales:
En la tabla se indican los datos sobre la accidentabilidad registrada de cinco empresas durante un ao.

Solucin: Histograma de nmero de accidentes.


Histogram of numero de accidentes
25

20

Frequency

15

10

4 6 numero de accidentes

10

La mayor cantidad de nmero de accidentes ocurridos en las cinco empresas es de 6. Nos damos cuenta que tiene una distribucin en forma de campana, la desviacin respecto a esta forma puede indicar la existencia de problemas o influencias externas al proceso. Sin embargo la forma de campana no asegura que el proceso funcione de forma satisfactoria.

Pregunta: Que porcentaje del nmero de accidentes es mayor a 8, considerndose ese nmero de accidentes a ms, como muy baja seguridad para el trabajador.

Entonces: 100 83.3171 = 16.6829 El 16.6829% del total del numero de accidentes supera 8 accidentes.

Medidas de centralizacin y dispersin.


Variable nmero de accidentes empresa 1 2 3 4 5 N N* 12 0 12 0 12 0 12 0 12 0 empresa 1 2 3 4 5 Mean StDev Variance CoefVar Minimum 6.833 1.801 3.242 26.35 3.000 6.083 2.021 4.083 33.22 3.000 5.583 3.118 9.720 55.84 1.000 4.833 3.099 9.606 64.12 1.000 5.333 2.015 4.061 37.78 2.000 Median 7.000 6.000 6.000 5.000 5.000 Maximum 9.000 10.000 10.000 11.000 9.000 Mode 7, 8 6 2, 6, 9 6 5 N for Mode 3 4 2 3 3

Variable nmero de accidentes

Como el coeficiente de variacin de todas las empresas es mayor que 20 entonces el nmero de accidentes representativos para cada empresa durante un ao es la mediana, entonces: Nmero de accidentes representativos durante un ao para la empresa 1: 7 Nmero de accidentes representativos durante un ao para la empresa 2: 6 Nmero de accidentes representativos durante un ao para la empresa 3: 6 Nmero de accidentes representativos durante un ao para la empresa 4: 5 Nmero de accidentes representativos durante un ao para la empresa 5: 5 La empresa con mayor variabilidad es la empresa 4, esto se debe por tener el mayor coeficiente de variacin. La empresa con el mayor nmero de accidentes registrado en un mes es la empresa 4 y con el menor nmero de accidentes es la empresa 3 y 4.

Diagrama de Tallos y Hojas


Stem-and-leaf of numero de accidentes N = 60 Leaf Unit = 0.10

3 1 000 8 2 00000 12 3 0000 17 4 00000 27 5 0000000000 (12) 6 000000000000 21 7 00000 16 8 000000 10 9 0000000 3 10 00 1 11 0
La unidad de hoja es 0.1 por ser una variable discreta. Como se puede observar en el diagrama la mediana de la muestra es 6, y hay doce valores que representan esa cantidad de nmero de accidentes y es el valor con mayor cantidad de datos, es decir en este caso la mediana coincide con la moda. Existen 27 datos menores a la mediana y 21 datos mayores a la mediana.

Diagrama de Cajas y Brazos.


Nmero de accidentes vs empresa
Boxplot of numero de accidentes
1

2
fabrica

5 0 2 4 6 8 numero de accidentes 10 12

Se observa una variabilidad muy grande de algunas empresas en cuanto al nmero de accidentes, esto puede ser debido a que en algunos meses las empresas cumplieron muy bien las normas de seguridad y otros meses no lo hicieron como debera. La empresa 1 tuvo mayor nmero de accidentes en un ao puesto que tiene la mediana ms alta y a la vez tiene la menor variabilidad. La empresa 4 tiene la mayor dispersin pues tiene el dato menor y mayor de nmero de accidentes. Las empresas 4 y 5 tuvieron en promedio la menor cantidad de nmero de accidentes puesto que ambos tienen el menor valor de la mediana.

Nmero de accidentes vs mes

Boxplot of numero de accidentes


enero febrero marzo abril mayo
Mes

junio julio agosto septiembre octubre noviembre diciembre 0 2 4 6 8 numero de accidentes 10 12

En este caso a diferencia del grafico anterior, se observa en algunos meses mucha variabilidad del nmero de accidentes mientras que en otros meses no son muy dispersos como es el caso del mes de enero, abril, agosto y hasta diciembre, es decir existe en esos meses una tendencia homognea en el nmero de accidentes. Los dos meses ms dispersos son junio y julio siendo a la vez estos meses consecutivos, se podra decir que en esa temporada del ao (junio y julio) el nmero de accidentes en las cinco empresas fue ms disperso. Notamos tambin que algunos diagramas no tienen brazos o bigotes, como por ejemplo en el mes de agosto el lmite inferior coincide con el Q1 y el lmite superior con el Q3, en este mes se evidencia simetra y poca variabilidad. Se observa tambin que en los meses de enero, junio, octubre y noviembre solo poseen el brazo derecho, esto quiere decir que el lmite inferior en esos meses coincide con el Q1. En promedio los meses con mayor nmero de accidentes en las cinco empresas fueron los meses de marzo y octubre, teniendo ambos el mismo y mayor valor de la mediana.

Potrebbero piacerti anche