Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Estadstica y Probabilidades
Esquema de contenidos
INTRODUCCIN
CONCEPTOS GENERALES - Definicin de estadstica - Estadstca descriptiva - Estadstica inferencial o inductiva - Objetivos de la estadstica - Campos de aplicacin de la estadstica.
TERMINOLOGA USADA EN ESTADSTICA - Poblacin o universo - Muestra - Unidad estadstica o unidad de anlisis - Variable, clases de variables - Dato estadstico u observacin - Parmetro - Estadstica o estadgrafo - Proporcin - Porcentaje
TABLAS UNIDIMENSIONALES DE DISTRIBUCIN DE FRECUENCIAS - Elementos de una tabla - Formas de una tabla de frecuencias - Procedimiento para construir una tabla con intervalos - Tablas unidimensionales incompletas - Ejemplos
GRFICOS ESTADSTICOS - Definicin - Bastones - Polgono de frecuencias - Histograma de frecuencias - Barras verticales y horizontales - Diagrama circular - Ejemplos
Objetivos
Objetivo general Comprender la importancia de construir tablas de distribucin de frecuencias y elaborar los grficos ms conocidos para realizar un anlisis descriptivo de un conjunto de datos.
Objetivos especficos - Conocer la definicin de estadstica. - Conocer las aplicaciones de la estadstica en la Ingeniera de Sistemas. - Diferenciar entre estadstica descriptiva e inferencial. - Reconocer los objetivos de la estadstica. - Manejar en forma correcta la terminologa estadstica. - Construir tablas de frecuencias para variables cualitativas. - Elaborar tablas de frecuencias con y sin intervalos para variables cuantitativas. - Interpretar frecuencias absolutas y relativas, tanto simples como acumuladas. - Reconstruir tablas incompletas. - Construir grficos para variables cualitativas. - Elaborar grficos para variables cuantitativas. - Analizar e interpretar grficos estadsticos.
Estadstica y Probabilidades
Introduccin
Estimado alumno: Con mucho agrado se inicia la Primera Unidad de esta asignatura, en la cual se precisarn los objetivos de la estadstica as como la terminologa estadstica, la elaboracin de cuadros y finalmente la elaboracin de grficos.
Siempre nos encontramos con informacin numrica. Si revisamos los peridicos, revistas de informacin, revistas de negocios, publicaciones de inters general, siempre estaremos bombardeados con informacin estadstica. Entonces: Cmo podremos determinar si las conclusiones presentadas son razonables o no? Para poder ser un consumidor con conocimientos sobre esta informacin necesitamos poder leer los cuadros, los grficos y entender la discusin de la informacin numrica. Ser de gran ayuda entender los conceptos bsicos de la estadstica.
Las buenas decisiones de hoy en da se basan en informacin. En todos los aspectos de nuestras vidas, y ms an en el mundo de la ingeniera, una diversidad asombrosa de datos est disponible para el reconocimiento y la aproximacin analtica. Actualmente, gerentes de negocios, ingenieros y todo tipo de profesionales son ms exigidos a justificar sus decisiones basndose en la informacin proporcionada por los datos.
Las habilidades estadsticas permitirn recolectar, analizar e interpretar en forma adecuada los datos relevantes para la toma de decisiones. En este contexto, los conceptos estadsticos y el razonamiento estadstico ayudarn a solucionar diversos problemas propios de la ingeniera de sistemas.
Contenidos
I UNIDAD DIDCTICA
Definicin de Estadstica Estadstica es la disciplina que provee de mtodos y procedimientos para obtener, describir, analizar e interpretar un conjunto de datos, que permiten, luego, tomar decisiones y predecir fenmenos que puedan expresarse en forma cuantitativa, de acuerdo a ciertos objetivos preestablecidos. Es decir, es la puesta en marcha del mtodo cientfico desde la obtencin de la informacin (datos) hasta las conclusiones, siempre con relacin a los objetivos.
La estadstica es una ciencia auxiliar para todas las ramas del saber; su utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones diarias conllevan cierto grado de incertidumbre y la Estadstica ayuda en la incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un determinado grado de confianza.
Estadstica Descriptiva
Trata de la recoleccin, clasificacin, presentacin y descripcin de los datos. Es decir, slo se ocupa de describir y analizar un grupo de datos, sin sacar conclusiones sobre un grupo mayor. Es lo que piensa la mayor parte de las personas cuando escucha la palabra Estadstica. La Estadstica descriptiva es una parte de la Estadstica cuyo objetivo es examinar a todos los individuos de un conjunto para luego describir e interpretar numricamente la informacin obtenida.
Estadstica y Probabilidades
Proporciona la teora necesaria para afirmar algo acerca de la poblacin o tomar decisiones generales a partir de los datos bajo estudio. Es decir, se pretende inferir conclusiones referentes a la poblacin de donde procede la muestra, estas conclusiones nunca pueden ser totalmente ciertas por lo cual siempre tendrn cierto grado de incertidumbre.
La estadstica descriptiva y la inferencial no son independientes; por el contrario, son complementarias y entre ambas dan la suficiente ilustracin sobre una posible realidad futura, con el fin que quien tenga poder de decisin, tome las medidas necesarias para transformar ese futuro o para mantener las condiciones existentes.
OBJETIVOS DE LA ESTADSTICA
Descripcin Los datos que estn expresados en su forma natural se clasifican y se presentan en cuadros o tablas. Esta etapa preliminar consiste generalmente en la recopilacin, organizacin, tabulacin y representacin grfica de los datos y en la determinacin de los estadgrafos que proporcionan en forma resumida una descripcin cuantitativa del fenmeno estudiado.
Anlisis Toda investigacin estadstica incluye un problema de anlisis con el objeto de formarse un concepto de una poblacin y adoptar decisiones; mediante el anlisis se infiere propiedades para una poblacin sobre la base de resultados muestrales conocidos. La tarea principal del anlisis es producir la decisin que dio origen a la investigacin. Sin embargo se considera que el anlisis estadstico no est completo sin una estimacin del grado de confianza que sea justificado atribuir a esa decisin.
Prediccin Es la estimacin de resultados en el futuro. Esta estimacin depender del grado de conocimiento del comportamiento pasado y presente de las variables en estudio. 9
Permite hacer conjeturas bien informadas acerca de observaciones que an no se han obtenido.
Las ciencias que necesitan de la Estadstica se clasifican en: Las que obligatoriamente necesitan de la estadstica, lo que implica que muchas veces se confunden con ella. Ejemplo: la Demografa. Las que necesitan de la estadstica para estudiar fenmenos cuantitativos y cualitativos. Ejemplo: Ingeniera, Economa, Sociologa, Psicologa, Biologa, Ciencias de la Educacin. Las que necesitan obtener sus resultados con mxima exactitud, lo cual lo logra a travs de la estadstica. Ejemplo: Astronoma, Meteorologa, Fsica, Medicina. Ingeniera.Existen pocas reas donde el impacto del desarrollo reciente de la
estadstica se haga sentir ms que en la Ingeniera y en la administracin industrial. La estadstica facilita resolver problemas de produccin, de uso eficiente de materiales y fuerza de trabajo y de investigacin bsica y desarrollo de nuevos productos. El ingeniero industrial, que no puede examinar cada ampolleta o fsforo fabricados sin incurrir en la destruccin del producto, controla su calidad mediante muestras tomadas al azar. La estadstica permite al ingeniero comprender fenmenos sujetos a variaciones y predecirlos o controlarlos eficazmente.
Sociologa. Las tcnicas estadsticas se emplean en los estudios comparativos de diferentes grupos socioeconmicos y culturales, y en el estudio del comportamiento y las actitudes de grupo. El socilogo trata de auscultar la opinin pblica mediante encuestas, para determinar su preferencia por un candidato preferencial o su posicin frente a determinados problemas econmicos, polticos y sociales.
Educacin. La educacin es campo inagotable de investigacin y demanda estadsticas que permiten resumir los resultados en forma significativa y conveniente, llegar a conclusiones generales y elaborar predicciones. Los problemas educacionales que para su solucin demandan base estadstica son de dos clases: problemas de carcter administrativo y los de orden didctico.
10
Estadstica y Probabilidades
Psicologa. Los psiclogos se valen de los conceptos y tcnicas de la estadstica para medir y comparar la conducta, actitudes, inteligencia y aptitudes del hombre.
Economa. El economista emplea una amplia gama de datos para estudiar los planes de los consumidores y efectuar pronsticos de la tendencia de las actividades econmicas.
Contabilidad. El auditor de una empresa no podra examinar todos los elementos que sta posee sino que mediante mtodos adecuados selecciona algunas muestras de los inventarios, mquinas o documentos en cobro.
Medicina.
medicinas impartidas en distintos lugares tienen mejor aceptacin en personas de mediana edad, por ejemplo, o tambin para proporcionar mejores mtodos para controlar las enfermedades.
La estadstica en Medicina es imprescindible, al permitir el anlisis de las pruebas de nuevos tratamientos en grupos de pacientes, o bien facilitando la obtencin de conclusiones sobre ciertas enfermedades luego de observar durante un tiempo un grupo de pacientes (saber si para el tratamiento de cierto tipo de cncer es ms efectiva la ciruga, la radioterapia o la quimioterapia, sin ms que observar un grupo de pacientes tratados con cada una de estas tcnicas).
Biologa. Se emplea para estudiar las reacciones de las plantas y los animales ante diferentes presiones ambientales, para investigar la herencia, etc.
Derecho. La estadstica se ha aplicado a una amplia variedad de proyectos de investigacin que implican el estudio de individuos o grupos. Los medios de comunicacin hablan de las estadsticas de criminalidad, de violencia familiar, de suicidios, de divorcios, intervenciones realizadas por la polica, etc.
Agricultura. Las tcnicas estadsticas se emplean en actividades como experimentos sobre la produccin de plantas y animales, diferenciar tierras de cultivo, estudios de la
11
bondad relativa de diversos fertilizantes, insecticidas, etc. y estudios de mtodos para aumentar el rendimiento de las cosechas.
12
Estadstica y Probabilidades
Poblacin o Universo. Es la totalidad de individuos o elementos que poseen alguna caracterstica comn susceptible de ser estudiada. Es la totalidad de las unidades de anlisis. El estudio de la poblacin completa se llama censo y es con frecuencia costoso, lleva mucho tiempo y no es prctico. Ejemplos: - Todos los alumnos de la UAP. - Todos los meses comprendidos durante el periodo 2000-2007
Poblacin Finita. Cuando es posible enumerar todos sus elementos de tal manera que haya un primer y un ltimo elemento. Al nmero de elementos de una poblacin finita se le denota por N.
Poblacin Infinita. Cuando sus elementos no se pueden enumerar. En la prctica toda poblacin extremadamente grande se trata como una poblacin infinita.
Muestra. Es un subconjunto representativo de la poblacin que se asla para su anlisis estadstico. Se toman muestras cuando es difcil o costoso observar todos los elementos de la poblacin. El nmero de elementos de la muestra se denota por n, y al proceso de obtener la muestra se llama muestreo. Ejemplos: Los alumnos de Ingeniera de Sistemas de la UAP. 13
Para que una muestra sea representativa, y por lo tanto til, debe reflejar las similitudes y diferencias encontradas en la poblacin y ejemplificar las caractersticas de la misma. Cuando decimos que una muestra es representativa indicamos que rene aproximadamente las caractersticas de la poblacin que son importantes para la investigacin.
Si una muestra es representativa de una poblacin, es posible inferir importantes conclusiones sobre las poblaciones a partir del anlisis de la muestra. Ya que dicha inferencia no es del todo exacta, el lenguaje de las probabilidades aparecer al establecer nuestras conclusiones.
Unidad estadstica o unidad de anlisis. Es el objeto o elemento indivisible que ser estudiado en una poblacin sobre el cual se va a obtener datos. La unidad estadstica genera el fenmeno que se desea estudiar y proporciona datos concretos. Es cualquier elemento que aporte informacin sobre el fenmeno que se estudia.
Variable. Es una caracterstica de la poblacin que interesa al investigador. Es observable y susceptible de tomar distintos valores o ser expresada en diferentes categoras. A las variables se les denotan con las letras: x, y, z. Las variables pueden ser cualitativas o cuantitativas. Variables Cualitativas. Cuando se refieren a caractersticas, atributos o actitudes. Son variables cuyos valores consisten en categoras de clasificacin, es decir se refieren a la cualidad que presenta la poblacin. Sus resultados no son numricos.
Ejemplos: - Estado Civil - Marca de PC - Clase social - Color favorito - Lugar de Procedencia - Ciclo de estudios.
14
Estadstica y Probabilidades
Variable cualitativa nominal. No implica ningn orden jerrquico entre las diferentes categoras.
Ejemplos: - Color de ojos - Sexo - Curso favorito - Profesin - Tipo de Software - Estado Civil - Partido poltico - Nacionalidad - Estado Civil
Variable cualitativa ordinal. Implica un orden jerrquico entre sus categoras. Ejemplos:
Variables cuantitativas. Cuando expresan dimensiones o capacidades. Son variables que se obtienen como resultado de mediciones o conteos.
Variables cuantitativas discretas. Cuando asumen valores numricos aislados y no pueden tomar ningn valor entre dos consecutivos. Son contables. Se asocian con los nmeros naturales.
Ejemplos: - Nmero de hijos. - Nmero de cursos aprobados. - Nmero de computadoras en reparacin. - Nmero de autos vendidos.
Variable cuantitativa continua. Cuando puede tomar cualquier valor, dependiendo ste de la precisin con que se trabaje. Es decir, puede tomar infinitos valores entre dos
15
nmeros por muy prximos que estn. Es aquella que puede sufrir cualquier grado de subdivisin. Son medibles y se asocian con los nmeros reales. Ejemplos: - Edad - Sueldo - Presin arterial - N Horas de Estudio - Estatura - Velocidad
Dato estadstico u observacin. Es el valor o respuesta que adquiere la variable en cada unidad de anlisis. En conjunto, son nmeros o medidas que han sido recopilados como resultado de observaciones, que pueden ser comparados, analizados e interpretados. Los datos son la materia prima de la estadstica y su caracterstica principal es que los valores cambian de un individuo a otro.
Ejemplos: Variable Peso Lugar de procedencia N de cursos reprobados Nivel socioeconmico Datos 50, 55, 70, 62, 56, 74, Lima, Ica, Huancayo, Trujillo, Arequipa, 0, 3, 2, 1, 1, 0, 2, 4, Alto, Medio, Alto, Bajo, Alto, Bajo, Medio,
Parmetro. Es un valor obtenido para describir en forma resumida las caractersticas ms importantes de una poblacin. Son las medidas de resumen de una poblacin, sta puede tener muchas caractersticas y por lo tanto muchos parmetros. Para determinar su valor es necesario utilizar la informacin de la poblacin completa, y por lo tanto, las decisiones que se tomen basndose en un parmetro sern con certidumbre total.
Estadstica o estadgrafo. Es una medida usada para describir alguna caracterstica de la muestra. La toma de decisiones basada en un estadgrafo contiene cierto grado 16
Estadstica y Probabilidades
de incertidumbre debido al error de muestreo. La estadstica puede usarse para hacer inferencias acerca de los parmetros de la poblacin.
Varianza:
S2
Proporcin:
Ejemplo:
Proporcin. Es la fraccin de la poblacin que posee una determinada propiedad. Es el parmetro que ms se utiliza en la descripcin de una poblacin de atributos. Es la relacin que existe entre el nmero de casos observados con una caracterstica y el total de objetos que poseen la caracterstica. Indica el tanto por 1.
Ejemplo: Se tiene una poblacin de 1200 ingenieros de sistemas compuesta por 300 mujeres y 900 hombres, entonces la proporcin de hombres ser: P=
900 3 = = 0,75 1200 4
Porcentaje. Es la proporcin multiplicada por 100. Permite comparar dos o ms series estadsticas cuyos totales son diferentes, pues quedan expresados en funcin al tanto por ciento.
Ejemplo: Se tiene una poblacin de 1600 ingenieros compuesta por 600 mujeres y 1000 hombres, entonces el porcentaje de mujeres ser: P% =
600 100 = 37,5% 1600
17
Las tablas de distribucin de frecuencias son un mtodo apropiado para sintetizar informacin que es numerosa. La idea fundamental en la creacin de tablas de frecuencia es que las variables se arreglan en categoras o clases y se calculan frecuencias para cada clase. Una distribucin de frecuencias ofrece una lista de todos los valores posibles de la variable y del nmero de veces que se presenta cada uno de los mismos, tanto en valores absolutos como en relativos.
Su propsito es organizar el conjunto de datos recopilados, ya sean stos cualitativos o cuantitativos, en una forma adecuada para su comprensin y anlisis.
Una tabla que presenta la clasificacin de una sola variable se llama Tabla Unidimensional de Distribucin de Frecuencias.
1.
Valor de la variable: Xi Cuando la variable toma pocos valores diferentes, en la primera columna de la tabla se menciona a cada uno de ellos.
Edad Xi 18 19 21 22
18
Estadstica y Probabilidades
2.
Intervalo de Clase: Ii
Cuando la variable toma muchos valores diferentes, no pueden mencionarse a todos los valores; por lo tanto debern construirse intervalos, los cuales debern ser semiabiertos en el caso de variable continua y cerrados cuando la variable sea discreta. Ii : I1 , I2 , I3 , ... , Ik k es el nmero de intervalos. Edad Ii : [ Li ; L s [ 15 20 20 25 25 30 30 35
3.
Marca de Clase: Xi
Es el valor representativo de cada intervalo de clase, se calcula hallando la semisuma de los lmites inferior y superior de cada intervalo.
Li + L s 2
Xi =
Ejemplo: Edad Ii : [ Li ; L s [ 15-20 20-25 25-30 30-35 Edad Promedio Xi 17.5 22.5 27.5 32.5
19
4.
Es el nmero de unidades estadsticas que presentan cada uno de los valores diferentes que toma la variable o que pertenecen a cada intervalo. fi : f1 , f2 , f3 , .... , fk Se debe cumplir: 0 fi n
fi = n
i=1
Ejemplos:
Edad Xi 18 19 21 23 Total
N de personas fi 6 2
10
4 n = 22
Edad
N personas
Ii : [ Li ; L s [
15-20 20-25 25-30 30-35 Total
fi
4
9
3 12 n = 28
20
Estadstica y Probabilidades
5.
Es la proporcin o porcentaje de unidades estadsticas que presentan los diferentes valores de la variable o que pertenecen a los diferentes intervalos de confianza.
Proporcin: hi
f hi = i n
Porcentaje: hi %
hi % = hi 100
i=1
hi = 1
hi% = 100
i=1
Ejemplo:
Edad
N de personas
Proporc. personas
% de personas
Xi
18 19 21 23 Total
fi
6 2 10 4 n = 22
hi
0,27
hi %
27 9
46
18 100
h1 = 0,27 h3 % = 46%
Las personas que tienen 18 aos son el 0.27 del total. El 46% de las personas tienen 21 aos.
21
6.
Es el nmero de unidades estadsticas que presentan hasta determinado valor de la variable o hasta cierto intervalo de clase. Se obtienen acumulando sucesivamente las frecuencias absolutas simples ( fi ).
F1
f1
F2
F3
f1 + f2
f1 + f2 + f3
F4
f1 + f2 + f3 + f4
f1 + f2 + f3 + f4 ... + fk = n
Fk
Se debe cumplir: f1 Fi n Fk = n
Ejemplo:
Edad
N de Personas
Prop.
Porc.
N de personas Fi 6 8
18
Xi
18 19 21 23 Total
fi
6 2 10 4 n = 22
hi
hi %
22 -
F3 = 18
22
Estadstica y Probabilidades
7.
Es la proporcin o el porcentaje de unidades estadsticas que se presentan hasta determinado valor de la variable. Se obtienen acumulando sucesivamente las frecuencias relativas simples ( hi o h i % ).
H1
H2 H3
h1
h1 + h2 h1 + h2 + h3 h1 + h2 + h3 + h4 ... + hk = 1
Hk
Se debe cumplir:
h1 Hi 1
h1 % Hi % 100
Proporcin: F Hi = i n Ejemplo:
Porcentaje: Hi % = Hi 100
Edad Xi 18 19 21 23 Total
N Pers. fi 6 2 10 4 n = 22
N Pers. acum.
hi
0.27 0.09 0.46 0.18 1.00
hi %
27 9 46 18 100
Fi 6 8 18 22 -
Hi % 27
36
82 100 -
1.00 -
H3 = 0.82
23
1.-
Cuando la variable es cualitativa nominal, la tabla presenta nicamente a la variable ( Xi ), las frecuencias absolutas simples ( fi ) y las frecuencias relativas simples ( hi y h i % ).
Xi X1
fi f1
hi h1
hi % h1 %
X2
.....
f2
..
h2
..
h2 %
..
Xk
Total
fk
hk
hk %
i=1
fi = n
i=1
hi = 1
hi% = 100
i=1
Ejemplo:
Color favorito
% de personas
Xi
Azul Rojo Negro Blanco Total
fi
6
hi
0.23 0.38
0.08
hi %
23
38
10 2 8 n = 26
8 31 100
0.31 1.00
f1 = 6 h3 = 0,08
Seis personas prefieren el color azul. La proporcin de personas que prefieren el color negro es 0.08. El 38% de personas prefieren el color rojo.
h2% = 38%
24
Estadstica y Probabilidades
2.
Cuando la variable es cualitativa ordinal o cuantitativa (Discreta o Continua) y toma pocos valores diferentes, la tabla presenta frecuencias absolutas y relativas simples as como frecuencias absolutas y relativas acumuladas.
Xi X1 X2 ..... Xk Total
fi f1 f2 .. fk
hi h1 h2 .. hk
hi % h1 % h2 % .. hk %
Fi F1 F2 .. Fk -
Hi H1 H2 .. Hk -
Hi % H1 % H2 % .. Hk % -
i=1
fi = n
i=1
hi = 1
hi% = 100
i=1
Ejemplo:
Grado de Instruccin
N de Mujeres
Xi
Inicial Primaria Secundaria Superior Total
fi
2 8
6
hi
0.1 0.4 0.3
0.2
hi %
10
Fi
2 10
16
40 30 20 100
0.8 1.0 -
4 n = 20
20 -
1.0
f3 = 6 h4 = 0.2
Seis mujeres tienen grado de instruccin secundaria. 0.2 es la proporcin de mujeres con grado de instruccin superior.
El 10% de las mujeres tienen grado de instruccin inicial. Diecisis mujeres tienen como mximo secundaria. Las mujeres que tienen como mximo educacin primaria estn en una proporcin de 0.5 del total.
25
3.
Cuando la variable toma muchos valores diferentes, la tabla presenta intervalos, marcas de clase, frecuencias absolutas y relativas simples, frecuencias absolutas y relativas acumuladas.
1.-
Se calcula el rango o recorrido de la variable, hallando la diferencia entre el valor mximo y mnimo que toma la variable:
2.-
3.4.-
Se calcula la amplitud de cada intervalo de clase. Se construyen los intervalos de la siguiente manera:
Si
20 - 30
A = 10
k = 4
30 - 40 40 - 50 50 - 60 5.Se ubica cada uno de los datos en el intervalo correspondiente. El nmero de datos de cada intervalo constituye las frecuencias absolutas simples fi .
26
Estadstica y Probabilidades
Ejemplo:
1.-
Se aplic una encuesta a 27 trabajadores de la empresa Alfa y se les pregunt su edad, los datos obtenidos fueron: 30 36 27 Poblacin Muestra Unidad Estadstica Variable Tipo de Variable 26
39
29 30 19
27 21
17
31 36 23
22 26 29
29 18 30
17 31 24
21 23 29
29
Para construir una tabla de distribucin de frecuencias. R = 39 - 17 = 22 k 1 + 3,3 log (27) = 5,7 A = 22/6 = 3,7 A=4 k=6
TABLA 1 Trabajadores de la empresa Alfa clasificados segn edad. Edad Ii : [ Li ; L s [ 17-21 21-25 25-29 29-33 33-37 37-41 TOTAL Fuente: Datos ficticios. Edad Promedio N de Trabaj. Prop.de Trabaj. % de Trabaj. N de Trabaj. Prop.de Trabaj. % de Trabaj.
Xi
19 23 27 31 35 39
fi
4
6
hi
0.15 0.22
0.15
hi %
15
Fi
4 10 14
24
Hi
0.15 0.37
0.52
Hi %
15 37 52 89 96 100 -
22 15 37 7 4 100
4 10 2 1 27
26 27 -
27
GRFICOS ESTADSTICOS
Los grficos estadsticos son representaciones visuales de los datos contenidos en tablas de frecuencias; generalmente presentan formas geomtricas que muestran el comportamiento de las variables tratadas.
La utilidad de los grficos es doble, ya que pueden servir no slo como sustituto a las tablas, sino que tambin constituyen por s mismos una poderosa herramienta para el anlisis de los datos, siendo en ocasiones el medio ms efectivo no slo para describir y resumir la informacin, sino tambin para analizarla.
Ttulo
Expresa el contenido del grfico y, por lo general, es igual o parecido al ttulo del cuadro estadstico que sirvi de referencia. Debe ser claro y conciso, que responda a las preguntas: Qu relaciona? y Cundo y dnde se hicieron las observaciones?
Escalas
Las escalas vienen a ser la graduacin de ambos ejes, segn la naturaleza de las variables y frecuencias correspondientes.
Cuerpo
Es el grfico en s y constituye la representacin en dibujo de los datos. Debe considerar el o los tipos variables a relacionar y el diseo artstico del grfico.
Fuente
28
Estadstica y Probabilidades
TIPOS DE GRFICOS
1.
Bastones
Se utiliza cuando la variable es cuantitativa discreta y toma pocos valores diferentes. Nro. de Hijos Nro. de Personas : : 1 4 2 12 3 2 4 6 5 8
Grfico Nro. 1
Personas clasificadas segn nmero de hijos 14 12 N de Personas 10 8 6 4 2 0 1 2
4 2 6 8 12
3 N de Hijos
2.
Polgono de Frecuencias
Se utiliza para variable discreta. Es especialmente til para comparar la distribucin de dos variables numricas a la misma vez. intervalos, en el eje X se colocan las marcas de clase. Cuando se tiene
: :
1 4
2 12
3 2
4 6
5 8
29
Grfico Nro. 2
Personas clasificadas segn nmero de hijos 12 10 N de Personas 8 6 4 2 0
3 N de Hijos
3.
Histograma de frecuencias
El histograma se construye dibujando barras contiguas que tienen como base la amplitud de cada intervalo y como alturas las frecuencias respectivas.
: :
15-25 3
25-35 12
35-45 7
45-55 4
Grfico Nro. 3
Personas clasificadas segn edad 14 12 Nmero de Personas 10 8 6 4 2 0 20 30 Edad Fuente: Datos Ficticios 40 50 4 3 7 12
30
Estadstica y Probabilidades
4.
El grfico de barras est constituido por barras rectangulares de igual ancho que pueden ser verticales u horizontales. Conservan la misma distancia de separacin entre s. Se utiliza bsicamente para mostrar y comparar frecuencias de variables cualitativas o comportamientos en el tiempo, cuando el nmero de valores es reducido. Tipos de Redes % de personas : NOVEL : 4 UNIX 7 AS 400 Microsoft 26 50 Otros 13
Grfico Nro. 4
Empresas clasifidadas segn el Tipo de Red 50 50% 40 % de Empresas
13%
Grfico Nro. 5
Empresas clasifidadas segn el Tipo de Red NOVEL 4%
7%
AS 400
26%
MICROSOFT
50%
13%
10
20 30 % de Empresas
40
50
31
5.
Se usa para representar variables cualitativas en porcentajes o cifras absolutas. Para su construccin se procede de la siguiente forma: La circunferencia tiene en su interior 360 grados, los cuales hacemos corresponder al total de la informacin, es decir al 100%. Para determinar el nmero de grados correspondiente a cada componente se utiliza la siguiente frmula:
f Xio = i 360 n Luego, con la ayuda de un transportador se procede a trazar cada una de las porciones del diagrama.
Ejemplo:
N personas 12 20 8 4
Grfico Nro. 6
Personas clasificadas segn Estado Civil Viudos 9.1% Divorciados 18.2% Casados 27.3%
Category Casados Solteros Div orciados Viudos
Solteros 45.5%
Fuente: Datos ficticios
Resumen
32
Estadstica y Probabilidades
En la presente unidad se dan a conocer los conceptos fundamentales en forma sencilla pero destacando lo esencial e importante de cada uno de ellos.
En esta parte vi0mos el ordenamiento y tratamiento mecnico de la informacin para su presentacin por medio de tablas y de representaciones grficas.
Enfrentarse con datos de muy diversa ndole es cosa de todos los das. Sin embargo, no siempre se comprende el real alcance de lo que dicen. Como parte de una base cultural necesaria para desempearse en forma eficiente en el mundo de hoy, en el campo de la ingeniera de sistemas, es requisito desarrollar una capacidad personal para extraer y describir informacin presente en un conjunto de datos.
La estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. La estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin.
33
Actividad 1
I.-
a)
Gastos en insumos efectuados para el buen funcionamiento de un Laboratorio de Cmputo. Variable Tipo de variable : : ..................................................................... .....................................................................
b)
c)
Estado socioeconmico de las personas de una comunidad. Variable Tipo de variable : : ..................................................................... .....................................................................
d)
El tiempo de reaccin de un conductor de automvil cuando se enfrenta a un peligro inminente. Variable Tipo de variable : : ..................................................................... .....................................................................
e)
El nmero de errores de tipeo observados en un trabajo escrito en Word. Variable Tipo de variable : : ..................................................................... .....................................................................
34
Estadstica y Probabilidades
II.-
En cada uno de los siguientes problemas identificar: Poblacin, muestra, unidad estadstica, variable, tipo de variable.
1.-
Con la finalidad de realizar un estudio acerca del N de cursos reprobados durante el semestre anterior por los alumnos de ingeniera de sistemas de la UAP, se recopilaron los datos correspondientes a 62 alumnos elegidos en forma aleatoria. Poblacin Muestra : : ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................
2.-
Se desea hacer un estudio acerca del nmero de virus informticos que han ingresado en las PC de la empresa Alfa S.A. durante el ao pasado, con tal objetivo se han recogido en forma aleatoria 45 datos. Poblacin Muestra : : ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................
3.-
Se desea hacer un estudio acerca del tiempo que los alumnos de la UAP usan Internet. Para tal efecto se eligi en forma aleatoria a un grupo de 58 estudiantes correspondientes a las diferentes facultades a quienes se les pregunt cuntas horas usaron Internet durante la semana anterior a la entrevista. Poblacin Muestra : : ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................ ............................................................................................
35
III.-
Para cada uno de los siguientes conjuntos de datos, indicar si son cuantitativos o cualitativos.
a)
Tipos de software para computadora utilizados en un sistema de gestin de base de datos. ............................................
b)
c)
Nmero de caracteres impresos por lnea de salida de computadora en 20 impresoras de inyeccin de tinta. ............................................
d)
e)
El tiempo que tarda un examinador de tomografa computarizada en proyectar una imagen. ............................................
IV.-
Considere las siguientes variables relacionadas con la ejecucin de un trabajo de cmputo. Clasifique cada una de las variables como cuantitativa o cualitativa.
a)
d)
b)
e)
c)
f)
36
Estadstica y Probabilidades
Autoevaluacin
a) b)
Identificar: poblacin, muestra, unidad estadstica, variable y tipo de variable. Clasificar los datos en una tabla de distribucin de frecuencias, usar el criterio de Sturges cuando sea necesario.
c)
Interpretar: f2 , h3 , h1% , F4 , H3 , H2% Una empresa que vende microcomputadoras ha llevado a cabo un estudio para analizar el nmero de microcomputadoras que existen en empresas pequeas del distrito A. Para el efecto toma una muestra aleatoria de 40 empresas encontrando los siguientes resultados: 5 8 6 7 5 7 4 4 9 8 4 8 7 4 6 7 6 4 7 7 8 5 8 5 4 5 7 5 8 6 4 6 8 7 9 4 9 5 9 6 8 8 9 6 8 7 4 6 8
1.-
2.- Se tienen los siguientes datos correspondientes al grado de instruccin de un grupo de personas entrevistadas al azar al momento de ingresar a un cine. 1: Primaria 2: Secundaria 3: Superior
1 3 2 1 2
3 2 3 3 3
2 1 3 3 2
3 2 2 2 3
1 3 2 3 2
3 2 2 3 3
3 3 1 1 3
2 3 1 2 2
3 3 3 2 1
3 1 3 2 3
37
3.-
La confiabilidad de un sistema de cmputo se mide en trminos de la vida de un componente de hardware especfico (por ejemplo, la unidad de disco). Se prueba un conjunto de componentes de computadora hasta que fallen y se registra su vida (en meses). 12 7 0 2 8 18 35 22 32 20 5 18 21 37 15 2 14 17 40 6 8 3 20 28 4 24 9 36 36 12 17 15 28 35 16 5 20 23 39 9 24 12 12 15 27 11 19
4.-
El tiempo de respuesta de computadora se define como el tiempo que un usuario debe esperar mientras la computadora accede a informacin en el disco. Se observaron aleatoriamente un grupo de 48 computadoras del Laboratorio de Ingeniera de Sistemas y se obtuvo los siguientes resultados (en milisegundos):
59 33 60 65 60
92 61 44 68 50
54 71 39 70 90
48 38 34 47 84
73 47 75 40 72
60 53 86 36 88
73 63 72 70 49
75 48 50 38 40
74 41 47 40
84 68 52 52
5-
Se desea hacer un estudio acerca del tiempo que los alumnos de la UAP usan Internet. Para tal efecto se eligi en forma aleatoria a un grupo de estudiantes correspondientes a las diferentes facultades a quienes se les pegunt cuntas horas usaron Internet durante la semana anterior a la entrevista. Los datos obtenidos fueron los siguientes:
20 18 20 19 12
16 20 14 22 13
26 16 9 25 19
15 21 18 20
16 23 17 10
7 26 12 17
13 22 10 12
22 25 12 26
30 24 25 21
26 17 28 18
38
Estadstica y Probabilidades
B.
1.-
Xi hi
: :
1 c
2 2c
3 3c
4 c
2
5 2c
6 2c
2
7 7c +c
2
n=200
Xi: N de hijos
u.e.: seoras
2.-
f i = 24
i=1
3.-
X i : Temperatura hi :
L1 = 5 2a 3 a 0 .1 n = 100 a 3
L5 = 45
3a
5a 2
u.e..: 1 mes
4.-
X i : Peso
F5 = Fmx f3 = 20 f2 = f4
f1 = f5 = 4 f2 - f5 = 2 u.e.: alumnas
X1 = 37.5 X5 = 57.5
5.-
f2+f5 = 62 f1 = 8 H6 = 0,96
39
GRFICOS ESTADSTICOS
1.-
El histograma siguiente muestra la frecuencia relativa de las puntuaciones de 500 estudiantes en una prueba de estadstica. Observe cuidadosamente y luego conteste a las preguntas que se formulan.
10-20
20-30
30-40
40-50
50-60
Puntuaciones
a)
Qu porcentaje de los estudiantes obtuvo puntuaciones: entre 20 y 29? menores de 30? mayores o iguales a 30? mayores de 39?
b)
Cuntos estudiantes obtuvieron puntuaciones: entre 40 y 49? menores de 50? mayores o iguales a 10?
40
60-70
0-10
Estadstica y Probabilidades
2.-
El siguiente grfico corresponde a la distribucin del peso de un grupo de profesores de la UAP. Analice cuidadosamente y luego responda a las siguientes preguntas:
Nmero de Profesores
50-55
55-60
60-65
65-70
70-75
Peso a) Qu porcentaje de los profesores pesan: Entre 65 y menos de 70 kilos Menos de 60 kilos Al menos 70 kilos Como mnimo 55 kilos pero menos de 75.
b) Cuntos estudiantes obtuvieron puntuaciones: Entre 55 y menos de 70 kilos Menos de 65 kilos No menos de 70 kilos.
c) Cul es la frecuencia acumulada relativa del intervalo 60-65? d) Cul es la frecuencia acumulada absoluta del intervalo 65-70?
75-80
41
Solucionario de la autoevaluacin
1.
Reemplazando en la propiedad:
i =1
hi = 1
Luego, se reemplaza el valor de c para obtener las hi , obtenindose la siguiente tabla. Cuadro 1 Seoras clasificadas segn nmero de hijos N de Hijos Nde Sras. Prop.de Sras. % de Sras. N Acum. Prop.Ac % Acum Sras. Sras. Sras
Xi
1 2 3 4 5 6 7 Total
fi
20 40 60 2 40 4 34
200
hi
0.10 0.20 0.30 0.01 0.20 0.02 0.17 1.00
hi %
10 20 30 1 20 2 17 100
Fi
20 60 120 122 162 166 200 -
Hi
0.10 0.30 0.60 0.61 0.81 0.83 1.00 -
Hi %
10 30 60 61 81 83 100 -
42
Estadstica y Probabilidades
2.-
El ancho de cada intervalo es 3 y la marca de clase es el punto medio de cada intervalo; es decir la marca de clase divide a la amplitud 3 en dos partes iguales de 1.5 cada una. Por lo tanto, a la marca de clase se le sumar 1.5 para obtener el lmite superior y se le restar 1.5 para obtener el lmite inferior.
Cuadro 2 Alumnos clasificados segn horas de estudio. Horas de Estudio H.E. Nde Prop.de % de N Acum. Prop.Ac % Acum alumnos alumnos alumnos
Ii : [ Li ; L s [
7.5 10.5 10.5 13.5 13.5 16.5 16.5 19.5 19.5 22.5 Total
Xi
9 12
15
fi
2 6 9 4 3 24
hi
0.083 0.250 0.375 0.167 0.125 1.000
hi %
8.3 25.0 37.5 16.7
12.5
Fi
2 8 17 21 24 -
Hi
0.083 0.333 0.708 0.875 1.000 -
Hi %
8.3 33.3 70.8 87.5 100.0 -
18 21
100
3.-
Reemplazando en la propiedad:
i =1
hi = 1
= 1 = 0.90 = 5.4 = 0.12
43
TABLA 3 Temperatura registrada durante 100 meses. Temperat Ii : [ Li ; L s [ -5- 5 5-15 15-25 25-35 35-45 45-55 TOTAL Fuente: Datos ficticios. Temperat Promedio Xi 0 10 20 30 40 50 Nde Meses fi 36 30 8 12 10 4 100 Prop.de Meses hi 0.36 0.30 0.08 0.12 0.10 0.04 1.00 % de Meses hi % 36 30 8 12 10 4 100 N Acum. Prop.Ac % Acum Meses Fi 36 66 74 86 96 100 Meses Hi 0.36 0.66 0.74 0.86 0.96 1.00 Meses Hi % 36 66 74 86 96 100 -
4.-
TABLA 4 Alumnas clasificadas de acuerdo a su peso Peso Peso Nde Prop.de % de N Acum alumnas Fi 4 10 30 36 Prop.Ac. alumnas Hi 0.10 0.25 0.75 0.90 % Acum alumnas Hi % 10 25 75 90 Ii : [ Li ; L s [ promedio alumnas alumnas alumnas Xi fi hi hi % 35-40 40-45 45-50 37,5 42,5 47,5 52,5 50-55 55-60 57,5 4 40 0.10 1.00 10 100 40 1.00 100 4 6 20 6 0.10 0.15 0.50 0.15 10 15 50 15
Estadstica y Probabilidades
5.-
f2 = f6
f3 = f5
H6 + h7 = 1 0.96 + h7 = 1 h7 = 0.04
f2 + f5 = 62 f2 + 42 = 62 f2 = 20
X3 f3 = 1260 X3 42 = 1260 X3 = 30
TABLA 5 Personas clasificadas segn edad Edad Edad Nde Pers. fi 8 20 42 60 42 20 8 200 Prop.de Pers. hi 0.04 0.10 0.21 0.30 0.21 0.10 0.04 1.00 % de Pers. hi % 4 10 21 30 21 10 4 100 N Acum Pers. Fi 8 28 70 130 172 192 200 Prop.Ac. Pers. Hi 0.04 0.14 0.35 0.65 0.86 0.96 1.00 % Acum Pers. Hi % 4 14 35 65 86 96 100 Ii : [ Li ; L s [ promedio Xi 5 15 15 25 25 35 35 45 45 55 55 65 65 75 TOTAL Fuente: Datos ficticios 10 20 30 40 50 60 70
45
GRFICOS ESTADSTICOS
1.-
El tamao de la muestra es 500 (n=500). Porcentaje de estudiantes que obtuvo puntuaciones: entre 20 y 29 . menores de 30 .. mayores o iguales a 30 .. mayores de 39 . 15% 40% 60% 60%
Nmero de estudiantes obtuvieron puntuaciones: entre 40 y 49 menores de 30 mayores o iguales a 40 . 125 200 250
2.-
Al sumar las frecuencias absolutas simples de la parte superior de las barras, se obtiene el tamao de la muestra: n = 40 Nmero de estudiantes que obtuvieron puntuaciones: Entre 55 y menos de 70 kilos Menos de 65 kilos No menos de 70 kilos. . 28 12 10
Porcentaje de profesores que pesan: Entre 65 y menos de 70 kilos Menos de 60 kilos Al menos 55 kilos . Como mnimo 55 kilos pero menos de 75.. 45.0% 12.5% 95.0% 87.5%
46