Sei sulla pagina 1di 117

Universidad Nacional

Federico Villarreal

GUA ACADMICA

ESTADSTICA

CONTABILIDAD IV CICLO

HILDEBRANDO CHAVEZ CAPCHA

Euded
Escuela Universitaria

Educacin a distancia
INDICE

PRESENTACIN 04
INTRODUCCIN A LA ASIGNATURA 05
ORIENTACIONES GENERALES DE ESTUDIO 06
TUTORAS 07
CRONOGRAMA 07
EVALUACIN 08
MEDIOS Y RECURSOS DIDCTICOS 09
OBJETIVOS GENERALES 10

UNIDAD 1: CONCEPTOS BASICOS Y ORGANIZACIN DE DATOS 11

TEMA1: CONCEPTOS BASICOS DE ESTADISTICA 12


1.1. LA ESTADSTICA 12
1.2. CLASIFICACION DE LA ESTADISTICA 12
1.3. POBLACION 13
1.4. MUESTRA 13
1.5. PARAMETRO Y ESTADGRAFO 14
1.6. VARIABLE ESTADISTICA 14
1.7. ETAPAS DEL MTODO ESTADSTICO 16
1.8. SUMATORIAS 17

TEMA2: ORGANIZACIN DE DATOS EN TABLAS DE FRECUENCIA 18


2.1. TABLA DE DISTRIBUCIN DE FRECUENCIAS 18
2.2. TABLA DE DISTRIBUCIN DE FRECUENCIAS DE UNA VARIABLE CUALITATIVA 19
2.3. TABLA DE FRECUENCIAS DE VARIABLES CUANTITATIVAS DISCRETAS 20
2.4. TABLA DE FRECUENCIAS DE VARIABLES CUANTITATIVAS CONTINUAS 21

TEMA3: GRAFICOS ESTADISTICOS 23


3.1. REPRESENTACIONES GRAFICAS 23
3.2. PARTES DE UN GRFICO 23
3.3. CLASES DE GRFICOS 23

ACTIVIDADES 27
AUTOEVALUACIN N1 29

UNIDAD 2: MEDIDAS DE TENDENCIA CENTRAL Y DE DISPERSION 30

TEMA4: MEDIDAS DE TENDENCIA CENTRAL 31


4.1. DEFINICIN 31
4.2. MEDIA ARITMTICA 31
4.3. MODA 32
4.4. MEDIANA 34

TEMA5: MEDIDAS DE DISPERSION O VARIABILIDAD 37


5.1 DEFINICIN 37
5.2. RANGO O RECORRIDO 37
5.3. VARIANZA Y DESVIACIN ESTNDAR 38
5.4. COEFICIENTE DE VARIACIN 40

ACTIVIDADES 41
AUTOEVALUACIN N2 43
UNIDAD 3: ANALISIS DE CORRELACION Y REGRESION E INTRODUCCIN A LAS 44
PROBABILIDADES

TEMA6: ANLISIS DE CORRELACIN Y REGRESIN 45


6.1. ANALISIS DE CORRELACIN 45
6.2. ANALISIS DE REGRESIN 48

TEMA7: INTRODUCCIN A LAS PROBABILIDADES 53


7.1. PROBABILIDAD Y EVENTOS 53
7.2. EXPERIMENTO 53
7.3. EXPERIMENTO ALEATORIO 54
7.4. ESPACIO MUESTRAL Y EVENTOS 55
7.5. TECNICAS DE CONTEO 56
7.6. CONCEPTO CLSICO DE PROBABILIDAD 58
7.7. PROBABILIDAD CONDICIONAL 59
7.8. TEOREMA DE BAYES 61

ACTIVIDADES 62
AUTOEVALUACIN N3 64

UNIDAD 4: VARIABLE ALEATORIA Y PRINCIPALES DISTRIBUCIONES ESTADISTICAS 65

TEMA8: VARIABLE ALEATORIA 66


8.1. DEFINICIN 66
8.2. VARIABLE ALEATORIA DISCRETA 67
8.3. VARIABLE ALEATORIA CONTINUA 70

TEMA9: DISTRIBUCIONES ESTADISTICAS PRINCIPALES 72


9.1. DISTRIBUCIN BINOMIAL 72
9.2. DISTRIBUCIN POISSON 75
9.3. DISTRIBUCIN HIPERGEOMTRICA 77
9.4 DISTRIBUCIN NORMAL 79

ACTIVIDADES 82
AUTOEVALUACIN 4 84

SOLUCIONARIO DE AUTOEVALUACIONES 85
ANEXOS 89
INTRODUCCIN A LA ASIGNATURA

En nuestros das, la estadstica se ha convertido en mtodo efectivo para describir con exactitud
los valores de datos econmicos, polticos, sociales, psicolgicos, biolgicos y fsicos, y sirve
como herramienta para relacionar y analizar dichos datos. El objetivo que se persigue es ya no
slo reunir y tabular los datos, sino sobre todo conocer el proceso de interpretacin de esa
informacin

La estadstica es una palabra de uso comn; se emplea en peridicos, noticieros de radio y


televisin, y por personas de diversas ocupaciones. Los comentaristas deportivos hablan de las
estadsticas del juego de futbol. Los noticiarios hablan de las estadsticas de criminalidad, de
produccin, o de educacin. La palabra se encuentra arraigada en la cultura popular por lo cual
toda persona independientemente de su profesin, debera tener conocimientos de estadstica.

La creciente complejidad de las actividades de los negocios en aos recientes, ha incrementado


definitivamente el uso de la estadstica para tomar decisiones en cualquier nivel de la
administracin. Los hombres de negocios utilizando la estadstica pueden producir los volmenes
de ventas, medir las reacciones de los consumidores ante nuevos productos, tomar decisiones de
cmo invertir el presupuesto para publicidad, determinar el mejor mtodo para utilizar las
habilidades y aptitudes de sus empleados. El hombre de negocios utiliza encuestas estadsticas
para determinar la reaccin del pblico a sus nuevos productos.

Para un mejor aprovechamiento se ha dividido la presente gua en 4 unidades: Unidad I trata


sobre Conceptos Bsicos y Organizacin de datos, en la Unidad II se calculan Medidas de
Tendencia Central y Dispersin ms utilizadas, en la Unidad III se Analiza la correlacin y
regresin entre dos variables as como introduccin a las probabilidades y en la Unidad IV se
desarrolla el concepto de Variable aleatoria y principales distribuciones de probabilidad discretas y
continuas.

Teniendo en cuenta lo manifestado anteriormente es necesaria la estadstica por su base


cientfica al tomar decisiones. La Estadstica puede dar respuesta a muchas de las necesidades
que la sociedad actual nos plantea. Su tarea fundamental es la reduccin de datos, con el objetivo
de representar la realidad y transformarla, predecir su futuro o simplemente conocerla.

Ing. Hildebrando Rommel Chvez Capcha


ORIENTACIONES GENERALES DE ESTUDIO

Estimados participantes:

La razn de ser de los cursos virtuales es facilitar el acceso a los programas educativos de
aquellos estudiantes cuyos horarios o situacin geogrfica no son compatibles con la formacin
presencial, sin embargo, su objetivo es muy claro: ofrecer una calidad acadmica igual o superior
a la que se brinda en los programas presenciales. Por ello, los programas virtuales se apoyan en
la ms moderna tecnologa informtica y de comunicaciones (aulas virtuales) que permiten un alto
grado de interaccin y orientacin del profesor y una elevada interrelacin entre los estudiantes.

En las aulas virtuales de la Escuela Universitaria de Educacin a Distancia, nuestros


estudiantes encontrarn, adems de la informacin detallada del programa, los materiales de
estudio, la agenda de actividades propuestas por los profesores y todas las herramientas de
comunicacin que permitirn el desarrollo dinmico del curso. Para comprender y asimilar
adecuadamente el material didctico del curso, se recomienda lo siguiente:

Leer, estudiar y trabajar el material didctico diariamente. Es preferible una hora diaria
durante siete das consecutivos, que 10 horas en un solo da. Las claves del xito son
continuidad y constancia.
Organizar el tiempo de estudio segn las propias condiciones, dificultades y necesidades de
trabajo; en caso contrario el plan de estudios no se cumplir.
Leer varias veces el material y despus comenzar con el resaltado de las ideas principales
para organizar el material de estudio (resmenes, cuadros sinpticos, etc.
Trabajar el material en el mismo orden en que se entrega. No olvide de realizar las actividades
que tiene en su Texto como en su Gua Acadmica.
Estudiar en un lugar donde se sienta cmodo para realizar las lecturas y hacer sus tareas. En
lo posible un lugar con claridad y libre de ruido.
TUTORAS

Las tutoras se desarrollarn mediante la programacin de un calendario de tutoras. La tutora


ser presencial y virtual.

CRONOGRAMA

CANTIDAD DE HORAS ACADMICAS


TUTORAS PRESENCIALES
Y VIRTUALES HORAS HORAS
PRESENCIALES VIRTUALES
Semana 1 2 2
Semana 2 2 2
PRIMER MES
Semana 3 2 2
Semana 4 2 2
Semana 5 2 2
Semana 6 2 2
SEGUNDO MES
Semana 7 2 2
Semana 8 2 2
Semana 9 2 2
Semana 10 2 2
TERCER MES
Semana 11 2 2
Semana 12 2 2
Semana 13 2 2
Semana 14 2 2
CUARTO MES
Semana 15 2 2
Semana 16 2 2
32 32
TOTAL
64 HORAS ACADMICAS
EVALUACIN

El promedio final de la asignatura de Estadstica en la Modalidad Presencial Virtual se


obtiene aplicando los siguientes pasos porcentuales:
Evaluacin de trabajos acadmicos presenciales (TA): (40%)
Evaluacin de participacin en interaccin virtual (IV): (20%).
Evaluacin final (EF): (40%).

PF = TA (0,4) + IV (0,2) + EF (0,4)

El promedio final en la Modalidad Virtual se obtiene aplicando la siguiente ponderacin


porcentual:

Evaluacin de trabajos acadmicos virtuales (TA): (40%)


Evaluacin de participacin en interaccin virtual (IV): (20%)
Evaluacin final en lnea (EF): (40%)

El estudiante que abandona la asignatura tendr promedio 00 (cero) en el acta final,


debiendo registrar nuevamente su matrcula.

Se consideran como parte de criterios de evaluacin la aplicacin de un examen parcial


virtual en la 8 semana del ciclo, un examen final presencial y la presentacin de un
trabajo monogrfico en la 16 semana del ciclo.
MEDIOS Y RECURSOS DIDCTICOS

(Unidad I,II) Consultar los siguientes textos y enlaces:


CORDOVA, Manuel. Estadstica Aplicada Bsica , Editorial San
Marcos Per - 2010

WACKERLY. Estadstica para Administracin, Thomson Editores.


Mxico 2010

DIAZ. Estadstica Aplicada a la Administracin y la Economa.


Editorial Mcgraw-Hill Mxico 2010

HERNANDEZ,Agustn. Curso Elemental de Estadstica


Descriptiva. Editorial Pirmide. Espaa 2008

Referencias electrnicas
http://estadisticaparaadministracion.blogspot.com/
http://www.dm.uba.ar/materias/estadistica_Q/2011/1/modulo%
20descriptiva.pdf
http://www.fuenterrebollo.com/Economicas2013/unidime
nsional-ejercicios.pdf

(Unidad III-IV) CASTILLO. Estadstica Descriptiva y Clculo de Probabilidades.


Editorial Pearson. Espaa 2009

MOYA, Rufino. Probabilidades e Inferencia Estadstica. Editorial


San Marcos. Per 2012

Referencias electrnicas:
http://www.youtube.com/watch?v=lpUkW6xxWog&feature=shar
e&list=PLqEro_vpDCG5DJsnzJDiYQ-0jhGsYcVYA
http://youtu.be/_mbO-ndr740

Textos
complementarios VISAUTA. Anlisis Estadstico con SPSS 17. EstadsticaBsica.
Editorial Mcgraw-Hill 2010

CARRASCAL, Urcisino. Estadstica descriptiva con Microsoft


Excel.Editorial Alfaomega. Espaa 2010

Plataforma
virtual Herramientas a emplearse en plataforma virtual:
Foros,tareas, chat
Enlaces, videos, examen, pginas entre otros
OBJETIVOS

GENERALES

Determinar e identificar los instrumentos para el estudio de la Estadstica.

Interpretar, sistematizar, analizar graficar y utilizar adecuadamente la informacin

Estadstica.

Aplicar y Analizar adecuadamente los conceptos de probabilidad de sucesos o

eventos bajo condiciones de incertidumbre y aplicar correctamente las tcnicas

correspondientes en la administracin.

Conocer las funciones asociadas a una variable aleatoria distinguiendo entre

discretas y continuas as como distribuciones de probabilidad discretas.


UNIDAD 1

CONCEPTOS BASICOS Y ORGANIZACIN DE


DATOS

En esta primera unidad se definir y explicar los conceptos bsicos de Estadstica y la


representacin y resumen de datos cualitativos y cuantitativos unidimensionales realizando un
anlisis crtico descriptivo e interpretativo de los resultados.

OBJETIVOS ESPECFICOS

Conocer y analizar los conceptos de poblacin y muestra para su aplicacin en la solucin de


problemas as como diferenciar entre variables cualitativas y cuantitativas.
Conocer cmo se realiza una ordenacin tabular de datos a travs de los diversos elementos
que se utilizan en la distribucin de frecuencias, para datos no agrupados y datos agrupados.
Presentar y analizar adecuadamente un conjunto de datos por medio de representaciones
grficas usando modelos estadsticos.

CONTENIDO TEMTICO

Tema I: Conceptos bsicos de estadstica


Tema II: Organizacin de datos en tablas de frecuencia
Tema III: Grficos estadsticos
TEMA CONCEPTOS BASICOS DE ESTADISTICA
I

1.1. LA ESTADSTICA

La Estadstica es una ciencia aplicada que nos proporciona un conjunto de mtodos para:
recopilar, organizar (clasificar, agrupar), presentar y analizar datos, con el fin de describirlos
solamente o realizar generalizaciones vlidas, asumiendo un margen de certeza en los resultados.
Por ello, las probabilidades desempean un rol importante en el proceso de toma de decisiones.

1.2. CLASIFICACION DE LA ESTADISTICA

La Estadstica se clasifica en:

ESTADISTICA DESCRIPTIVA. Es la que nos proporciona la metodologa para la


recoleccin, clasificacin, presentacin y simplificacin de los datos, sea para una muestra o
para una poblacin.
ESTADSTICA INFERENCIAL. Es la que nos
proporciona la teora necesaria para inferir o estimar las
leyes de una poblacin, partiendo de los resultados o
conclusiones de una muestra.
1.3. POBLACION

Se define tradicionalmente la poblacin como el conjunto de todos los individuos (objetos,


personas, eventos, etc.) en las que se desea estudiar el fenmeno. stos deben reunir las
caractersticas de lo que es objeto de estudio. (Latorre, Rincn y Arnal, 2003).
Segn el nmero de elementos, la poblacin puede ser finita o infinita. Cuando el nmero de
elementos que integra la poblacin es muy grande, se puede considerar a esta como una
poblacin infinita.
Ejemplos
Peruanos que estaban en su pas el 1-1-2013
Conjunto de los 100.000 primeros nmeros naturales.
Peridicos que se editaban en Per el 2-1-2010.

1.4. MUESTRA

El Diccionario de la Lengua Esaola (RAE,


2001) define la muestra, como parte o
porcin extrada de la poblacin por
mtodos que permiten considerarla como
representativa de la poblacin.
Las razones para trabajar con muestras
son: Ahorro de tiempo, ahorro de dinero,
facilidades operativas.
Ejemplos:
Nivel de contaminacin ambiental producido por las empresas del distrito de los Olivos.
320 alumnos del colegio Pamer en el distrito de Comas
15 empresas del sector industrial de Per escogidas al azar.

DATO. Son nmeros que representan las modalidades de las variables. Por ejemplo, el 1
puede representar la modalidad "Mujer", el 6.3 representa una de las magnitudes que
podemos registrar en la variable "grado de conocimiento de las tcnicas estadsticas". Los
datos pueden ser clasificados segn diferentes criterios, uno de los cuales se basa en las
modalidades que presentan: Se dir que son datos dicotmicos los que provienen de
variables que solo admiten dos modalidades (por ejemplo la variable "gnero"), son datos
separados aquellos que presentan dos categoras pero provienen de variables con ms de
dos modalidades (por ejemplo datos con valores 1 y 0 que representan aprobado y
suspenso).
UNIDAD ESTADSTICA. Es un valor numrico que se obtiene a partir de datos muestrales.
Describe alguna caracterstica de la muestra, y la toma de decisiones respecto a la poblacin
contiene cierto grado de incertidumbre.

1.5. PARAMETRO Y ESTADGRAFO

PARMETRO. Una vez obtenido todos los valores de las variables a estudiar podramos
describir este conjunto de valores usando solo una determinada caracterstica o medida. Por
ejemplo: el promedio de todos los valores obtenidos, el porcentaje de cada una de las
categoras, etc. Estos indicadores cuando se toman datos poblacionales se conocen como
Parmetro.
ESTADSTICO O ESTADIGRAFO. Es un valor numrico que se obtiene a partir de datos
muestrales. Describe alguna caracterstica de la muestra, y la toma de decisiones respecto a
la poblacin contiene cierto grado de incertidumbre.
1.6. VARIABLE ESTADISTICA

Una variable estadstica es el conjunto de valores que puede tomar cierta caracterstica
de la poblacin sobre la que se realiza el estudio estadstico. Estas variables pueden ser:
la edad, el peso, las notas de un examen, etc.

CLASIFICACION DE LAS VARIABLES

A. SEGN SUNATURALEZA:

A1. Variables Cualitativas.Las observaciones se miden de manera no numrica. No


se pueden hacer operaciones algebraicas con ellas.

Ejemplo: la carrera que seguimos, el gnero de nuestros compaeros de clase, el


distrito en que residimos.
Las variables cualitativas pueden clasificarse
en:

Variables cualitativas Nominales. Es


cuando no existe una jerarqua u orden
en las modalidadesEjemplo: Gnero,
marca de celulares, colorpreferido, etc.
Variables cualitativas Ordinales. Es
cuando s existe una jerarqua u orden en las modalidades. Ejemplo:Grado en
las Fuerzas Armadas, edad, etc..

A2. Variables Cuantitativas.Las observaciones se expresan numricamente. Tiene


sentido hacer operaciones algebraicas con ellas. Es el caso del tiempo de
bsqueda que emplea un algoritmo, el ingreso familiar, cantidad de kilos de
residuos slidos por viviendas, el tiempo que dura que dura en ejecutarse un
proyecto. Las variables cuantitativas se clasifican a su vez en:
Variables cuantitativas discretas. Son aquellas que se expresan en nmeros
enteros.
Ejemplo: Nmero de archivos localizados en un tiempo requerido por un
algoritmo, nmero de empresas que no cumplen con las normas de
saneamiento ambiental en Lima Metropolitana, nmero de pruebas necesarias
de un sistema de informacin para ponerlo operativo, etc.
Variables cuantitativas continuas. Son aquellas que
toman infinitos valores en un intervalo dado, de modo
que se puede ubicar en la recta numrica. En este tipo
de variable, los valores que pueden tomar, pueden ser
decimales o fracciones.
Ejemplo: talla, peso, presin sangunea,
temperatura,etc.

B. SEGN SU POSICIN EN UNA RELACIN CAUSAL

B1. Variable Independiente.Es aquella caracterstica o propiedad que se supone es


la causa del fenmeno estudiado. En investigacin experimental se llama as, a la
variable que el investigador manipula.
B2. Variable Dependiente.Hayman (1974:69) la define como propiedad o
caracterstica que se trata de cambiar mediante la manipulacin de la variable
independiente La variable dependiente es el factor que es observado y medido
para determinar el efecto de la variable independiente.
Ejemplos:
Si uno fuera a medir la influencia de diversas cantidades de fertilizantes en
crecimiento vegetal.
Variable independiente: Cantidad de fertilizante usada.
Variable dependiente: Crecimiento en altura y/o la masa de la planta.
En un estudio de cmo diferentes dosis de droga afecta la severidad de sntomas,
un investigador podra comparar la frecuencia y la intensidad y la intensidad de los
sntomas cuando se administran diversas dosis. Identifica:
Variable independiente: ______________________________________
Variable dependiente: _______________________________________

1.7 ETAPAS DEL MTODO ESTADSTICO


Las etapas del mtodo estadstico de manera general en una investigacin son:

A. PLANIFICACIN DEL ESTUDIO. En esta etapa se disea la investigacin de todos sus


aspectos:
Formulacin del problema de investigacin.
Se fijan los objetivos.
Se plantean las hiptesis.
Definicin de trminos y variables.
Se define la metodologa de estudio: tipo de estudio, poblacin de estudio, diseo
muestral, tcnicas de procesamiento y anlisis de datos.
Se define el cronograma, presupuesto y financiamiento de estudio.

B. RECOLECCIN DE LA INFORMACIN. Implica:


La recoleccin de informacin se refiere a los mtodos usados para obtener informacin
pertinente de las unidades elementales introducidas en una muestra o en una poblacin.
A esta etapa tambin se le conoce como Recopilacin de informacin.
C. ORGANIZACIN O CLASIFICACIN DE LOS DATOS RECOGIDOS. Despus de haber
reunido toda la informacin pertinente, se necesita la depuracin de los datos recogidos.
Para hacer la crtica de una informacin, es fundamental el conocimiento de la poblacin
para poder detectar falsedades en las respuestas, incomprensin a las preguntas,
respuestas al margen, adems de todas las posibles causas de nulidad de todo un
cuestionario.
Separado el material de desecho con la informacin depurada se procede a establecer
las clasificaciones respectivas y con la ayuda de hojas de trabajo, en las que se establecen
los cruces necesarios entre las preguntas, se ordenan respuestas y se preparan los
modelos de tabulacin de las diferentes variables que intervienen en la investigacin. El
avance tecnolgico hace que estas tareas, manualmente dispendiosas, puedan ser
realizadas en corto tiempo con ayuda de las computadoras.
Una informacin estadstica adquiere ms claridad cuando se presenta en la forma
adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se debe tener cuidado
con las variables que se van a presentar y la forma de hacerlo. No es aconsejable saturar
un informe con tabla o grfico para mostrar los resultad, debe hacerse no solo en funcin
de las variables que relaciona, sino del lector a quien va dirigido el informe.

D. ANLISIS E INTERPRETACIN DE LOS RESULTADOS. La tcnica estadstica ofrece


mtodos y procedimientos objetivos que convierten las especulaciones de primera mano
en aseveraciones, cuya confiabilidad puede ser evaluada y ofrecer una premisa medible en
la toma de una decisin.
En el anlisis se cristaliza la investigacin; esta es la etapa de la determinacin de los
parmetros y estadsticos mustrales para las estimaciones e inferencias respecto a la
poblacin, el ajuste de modelos y las pruebas de las hiptesis planteadas, con el fin de
establecer y redactar las conclusiones definitivas.
Toda conclusin es digna de ser comunicada a un auditorio. Es ms hay estudiosos del
mismo problema a quienes se les puede aportar informacin, conocimientos y otros puntos
de vista acerca de l.

1.8. SUMATORIAS

La suma de los valores de la variable X : x1 , x2 ,........., xn se define mediante la notacin


que indica que han de sumarse los elementos de la sucesin desde el subndice
i 1 hasta el subndice i n , esto es:
n

x
i 1
i x1 x2 ......... xn

Ejemplo:
4
* 2i 3 2(1) 3 2(2) 3 2(3) 3 2(4) 3 5 7 9 11 32
i 1

PROPIEDADES
n n
a) cxi c xi , para todo constante c
i 1 i 1
n n n
b) x i yi x i yi
i 1 i 1 i 1
n n n
c) x i yi x i yi
i 1 i 1 i 1
TEMA ORGANIZACIN DE DATOS EN TABLAS DE
II FRECUENCIA

2.1. TABLA DE DISTRIBUCIN DE FRECUENCIAS

Despus de recoger toda la informacin que necesitamos, es decir, al agotar todo el trabajo de
campo, existe un cmulo de datos y cifras desordenadas que, al ser tomados como
observaciones individuales, dicen muy poco sobre la poblacin estudiada, es entonces, tarea
del investigador , comenzando por la clasificacin y ordenacin, consignando la informacin en
tablas inteligibles que denominamos distribuciones de frecuencias (Guarn, 2002).

La distribucin de frecuencias es una herramienta estadstica que ayuda a resumir y presentar


los datos de la muestra (o de la poblacin). Es la representacin estructurada, en forma de
tabla, de toda la informacin que se ha recogido sobre la variable que se estudia. Los datos se
agrupan en clases o categoras mutuamente excluyentes; toda variable tiene asociada una
distribucin de frecuencias, que implica una correspondencia biunvoca entre dos conjuntos.
Por un lado, tenemos el conjunto formado por los valores que toma la variable y por el otro el
de las frecuencias relacionadas con ellos. La asociacin existe en ambos sentidos, pues a cada
valor de la variable, denominado clase, le corresponde una frecuencia y a su vez cada
frecuencia se identifica con una clase de variables. Una distribucin de frecuencias es un
arreglo de los valores observados x1 , x2 ,.....,xk de la variable x con sus respectivas
frecuencias, en una tabla de la forma:

Tabla 1
Valor de x fi Fi hi Hi

x1 f1 F1 h1 H1

x2 f2 F2 h2 H2

xk fk Fk n hk Hk
TOTAL k k


i 1
fi n h
i 1
i 1

Frecuencia Absoluta Simple ( f i ), Es el nmero de veces que se observa en un mismo

tem o la cantidad de datos que caen en un mismo intervalo. xi , y se cumple que:

f1 f 2 f 3 ....... f k n
k
En notacin sigma: f
i 1
i n

Frecuencia Absoluta Acumulada ( Fi ), esta frecuencia tiene sentido calcularla para

variables cuantitativas o cualitativas ordenables, en los dems casos no tiene mucho sentido
el clculo de esta frecuencia. La frecuencia absoluta acumulada es el nmero de veces
que ha aparecido en la muestra un valor menor o igual que el de la variable., as tenemos:
F1 f1
F2 f1 f 2
F3 f1 f 2 f 3

Fi f1 f 2 f 3 .... f i , i 1, 2, 3, ....., n
Frecuencia Relativa Simple ( hi ), Es el cociente entre la frecuencia absoluta y el nmero de

observaciones realizadas ( n ). Sus valores son nmeros reales que oscilan entre 0 y 1. La
suma de todas las frecuencia relativas es igual a 1. Se denota por:
fi
hi ; 0 hi 1
n

Frecuencia Relativa Acumulada ( H i ), es igual al cociente entre la frecuencia absoluta

acumulada y el nmero de observaciones realizadas ( n ), o tambin es la que resulta de


sumar sucesivamente las frecuencias relativas. Se denota por:
H 1 h1
i
H 2 h1 h2
F
f
j 1
j

H 3 h1 h2 h3 Hi i
n n

H i h1 h2 h3 .... hi
2.2. TABLA DE DISTRIBUCIN DE FRECUENCIAS DE UNA VARIABLE CUALITATIVA

Se usa para clasificar variables cualitativas.

Ejemplo: Se estudia cul fue el impacto que produjo las


nuevas polticas de marketing en la venta del jabn ZOTE,
para esto se realiz una consulta a un grupo de Amas de
casa de la Ciudad de Arequipa por su preferencia deljabn,
respondiendo SI en caso que siempre utilice el detergente,
AV si a veces lo utiliza y NO si nunca utiliza el jabn, los
resultados fueron:
SI AV NO AV SI NO AV SI SI SI
Utiliza:
NO NO SI SI SI AV SI SI SI AV
Si (siempre)
A veces NO NO AV NO NO SI SI NO AV NO
No (Nunca) SI SI SI SI SI SI NO NO SI SI
AV NO NO NO SI NO AV SI SI NO

Organice los datos en una tabla de distribucin de frecuencias:


Tabla 2
TABLA DE FRECUENCIAS SOBRE LA PREFERENCIA DE LAS AMAS DE CASA
POR EL JABN ZOTE EN LA CIUDAD DE AREQUIPA

Preferencia fi Fi hi Hi
Siempre 24 24 0.48 0.48
A veces 9 33 0.18 0.66
Nunca 17 50 0.34 1
Total 50 1

Interpretacin:
f2: 9 amas de casa a veces utilizan el jabn
F2: 33 amas de casa siempre utilizan el jabn o a veces
h3: 34% de amas de casa nunca utilizan el jabn
H2: 66% amas de casa siempre utilizan el jabn o a veces

2.3.TABLA DE FRECUENCIAS DE VARIABLES CUANTITATIVAS DISCRETAS

Son aquellas que se utilizan para agrupar datos cuantitativos de acuerdo a los diferentes
valores que toman las variables.

Ejemplo: Los siguientes corresponden al nmero de viajes que realizan por da un grupo de
vendedores entrevistados a azar en la empresa SPORTX

4 2 6 3 5 5 3 4 3 3
3 4 4 4 3 5 4 5 5 4
3 2 2 3 5 3 6 5 2 4
3 3 6 4 3 3 2 2 4 3
4 3 3 4 5 4 2 4 3 5
Tabla 3
TABLA DE FRECUENCIAS SOBRE EL NMERO DE VIAJES DE LOS
VENDEDORES

N Viajes fi Fi hi Hi
2 viajes 7 7 0.14 0.14
3 viajes 17 24 0.34 0.48
4 viajes 14 38 0.28 0.76
5 viajes 9 47 0.18 0.94
6 viajes 3 50 0.06 1.00
Total 50 1.00

Interpretacin:
f3:14 vendedores de SPORTX realizaron 4 viajes
F2: 24 vendedores realizaron menos 4 viajes (mximo 3)
H3: 76% de vendedores realizaron menos 5 viajes (mximo 4)

2.4. TABLA DE FRECUENCIAS DE VARIABLES CUANTITATIVAS CONTINUAS.


Una variable cuantitativa continua puede tomar todos los valores reales comprendidos entre
un valor inicial y un final. Estos valores los vamos a agrupar en intervalos de la forma

( l i , l i+1 ]. Diremos que x pertenece al intervalo ( l i , l i+1 ] si , como se puede


observar el intervalo que hemos tomado es semicerrado por la derecha, normalmente los
intervalos suelen ser semicerrados para tomar todos los valores posibles y evitar que un
mismo valor pueda entrar en dos intervalos distintos.
Llamaremos amplitud de un intervalo ( ai ) a la distancia existente entre sus extremos, es
decir, ai = l i+1 - l i. Para el clculo de medidas de centralizacin y dispersin ser necesario
usar un representante de cada intervalo, a ese representante lo llamaremos marca de clase y

ser el punto medio del intervalo, esto es, . Para construir la tabla con intervalos
de clase se debe seguir los siguientes pasos:

Paso1: Rango (R). Llamado tambin recorrido de los datos, es la diferencia entre el valor
mximo y el valor mnimo de la variable. Consideremos las siguientes variables
y1 , y2 , y3 , ......, yn , entonces: R Ymax Ymin

Paso2: Nmero de intervalos de clase ( m ). Consiste en dividir el rango en un nmero


conveniente de intervalos de clase. El nmero de intervalos depende principalmente del
nmero de observaciones, sin embargo es recomendable que no sea menor que 5 ni mayor
de 15 intervalos. Para determinar el nmero de intervalos usaremos la frmula de Sturges:
m 1 3.32 L og n
Cuando los resultados para obtener m son nmeros decimales, entonces se redondear al
entero inmediato.
Ejemplo: Si n 40 entonces m 1 3.32 L og 40 6.32 , redondeando m 7

Si n 100 entonces m 1 3.32 L og100 7.64 , redondeando m 8

Paso3: Amplitud de Clase ( c ). Es el tamao o longitud que deben tener los intervalos; se
recomienda tener intervalos del mismo tamao. Se calcula mediante la frmula:
R
c
m

Marca de clase ( yi ). Es una medida ponderativa que va a representar al intervalo de datos.

Es la semisuma entre el lmite superior y el lmite inferior del intervalo de clase. Sea el
LI LS
intervalo LI LS entonces yi
2
Ejemplo: Los siguientes datos indican el nmero de minutos que ocuparon sus asientos 50
clientes en una cafetera:
73 65 82 70 45 50 70 54 32 75
75 67 65 60 75 87 83 40 72 64
58 75 89 70 73 55 61 78 89 93
43 51 59 38 65 71 75 85 65 85
49 47 55 60 76 75 69 35 45 63

Construye una tabla de frecuencias adecuada para esta informacin e interprete.


Pasos:
Vmin= 32 Vmax=93
Rango : R = 93 32 =61
N de intervalos : m= 1+3.32*log(50)= 6.64= 7
Amplitud de intervalo: c= 61/7=8.71 = 9
Se construir a continuacin una tabla de frecuencias con 7 intervalos y amplitud constante de 9.
Tabla 3
TABLA DE FRECUENCIAS SOBRE EL NMERO DE MINUTOS EN LA CAFETERIA

Li Ls Yi fi Fi hi Hi
32 41 36.5 4 4 0.08 0.08
41 50 45.5 5 9 0.1 0.18
50 59 54.5 6 15 0.12 0.3
59 68 63.5 11 26 0.22 0.52
68 77 72.5 15 41 0.3 0.82
77 86 81.5 5 46 0.1 0.92
86 95] 90.5 4 50 0.08 1
50 1

Interpretacin:
f3: 4 clientes ocuparon sus asientos como mnimo 32 minutos pero menos de 41
F4: 26 clientes estuvieron sentados menos de 68 minutos
h5: 30% clientes se sentaron al menos 68 minutos pero menos de 77
H3: ___________________________________________________________________
TEMA GRAFICOS ESTADISTICOS
III

3.1. REPRESENTACIONES GRAFICAS

Un grfico estadstico es una representacin visual de una serie de datos estadsticos. Es


una herramienta muy eficaz, ya que un buen grfico:
Capta la atencin del lector.
.Presenta la informacin de forma sencilla, clara y precisa.
No induce a error.
Facilita la comparacin de datos y destaca las tendencias y las diferencias.
Ilustra el mensaje, tema o trama del texto al que acompaa.

3.2. PARTES DE UN GRFICO

Al igual que las tablas estadsticas, los grficos estadsticos deben tener un ttulo y una
explicacin de QUE, DONDE y CUANDO se obtuvo la informacin. Tiene las siguientes
partes:
El ttulo principal
Ttulo secundario o subttulo
El grfico propiamente dicho
Fuente
Las notas explicativas
Interpretacin

Interpretacin: Segn el grfico, en el ao de 2000 la exportacin de alcachofas era


menor a 5,000.000kg y para el ao 201140,0000.00kg alcachofas, es decir existe un
aumento de las exportacin lo largo de los aos.

3.3. CLASES DE GRFICOS

Grfico de Barras Histogramas


Grfico Circular Polgono de frecuencias
Grfico de Lneas Grfico de Ojivas
3.3.1. GRAFICO DE BARRAS. Un grfico de barras es una representacin grfica en un eje
cartesiano de las frecuencias de una variable cualitativa o discreta. En uno de los ejes se
posicionan las distintas categoras o modalidades de la variable cualitativa o discreta y el valor o
frecuencia de cada categora en una determinada escala.
La orientacin de un grfico puede ser:
Vertical: las distintas categoras estn situadas en el eje horizontal y las barras de
frecuencia crecen verticalmente.
Horizontal: Las categoras se sitan en el eje vertical y las barras crecen
horizontalmente Suelen usarse cuando hay muchas categoras o sus nombres son
demasiado largos.

Ejemplo: Representa mediante un grfico de barrasla cantidad de nios que ven


diversos programas de televisin

Programa
# Nios
Televisivo

Caricaturas 13 nios
Concursos 10 nios
Deportes 7 nios
Aventuras 8 nios
Telenovelas 10 nios
Documentales 4 nios
Lucha libre 13 nios

Interpretacin: Los programas televisivos ms vistos


por nios son las caricaturas y lucha libre.

3.3.2GRAFICO CIRCULAR. Es una representacin circular de frecuencias relativas de una


variable cualitativa o discreta que permite, de una manera sencilla y rpida, su
comparacin. El crculo representa la totalidad que se quiere observar y cada porcin de
cada categora respecto al total. Suele expresarse en porcentaje.Ejemplo: Haz un
diagrama de sectores para la siguiente tabla:

Comunidad Amplitud de
autnoma de Nmero de cada sector
nacimiento alumnos (fi) (360 - hi)
Andaluca 19 64%
Extremadura 7 23%
Catalua 2 7%
Asturias 1 3%
Galicia 1 3%
Total 30 100.00%
Interpretacin: La mayora de alumnos (64%)
proceden de Andaluca, el 3% proceden de Asturias
y Galicia

3.3.3 GRAFICO DE LINEAS.Los Grficos de lneas representan los valores de los datos en
dos ejes cartesianos ortogonales entre s. Pueden utilizarse para ms de una serie de
datos. Se utilizan para representar valores con grandes incrementos entre s.

Mes Precios
Jul-09 106.3
Ago-09 106.7
Sep-09 106.4
Oct-09 107.2
Nov-09 107.8
Dic-09 107.8
Ene-10 106.7
Feb-10 106.5
Mar-10 107.3
Abr-10 108.4
May-10 108.7
Jun-10 108.9
Jul-10 108.4

3.3.4 HISTOGRAMAS.
Un histograma es una representacin grfica de una variable en forma de barras, donde
la superficie de cada barra es proporcional a la frecuencia de los valores representados.
En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las
variables, normalmente sealando las marcas de clase, es decir, la mitad del intervalo
en el que estn agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de
la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores
continuos. En los casos en los que los datos son cualitativos (no-numricos), como
sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que
en ciencias naturales y exactas. Y permite la comparacin de los resultados de un
proceso.
Su grfica se realiza entre: (Intervalos vs fi) e (Intervalos vs hi)
Ejemplo: Se realiza un estudio a 50 restaurantes de la ciudad a los cuales se les consult los
precios de sus platos.

Li Ls fi
14 21 1
21 28 5
28 35 7
35 42 16
42 49 10
49 56 9
56 63 1
63 70 1
50

Interpretacin: 16 restaurantes tienen precios


mayores a 35 pero menores a 42.

3.3.5 POLIGONOS DE FRECUENCIAS. Polgono de frecuencia es el nombre que recibe


una clase de grfico que se crea a partir de un histograma de frecuencia. Estos
histogramas emplean columnas verticales para reflejar frecuencias): el polgono de
frecuencia es realizado uniendo los puntos de mayor altura de estas columnas.

Es decir, por tanto, podramos establecer que un polgono de frecuencia es aquel que se
forma a partir de la unin de los distintos puntos medios de las cimas de las columnas
que configuran lo que es un histograma de frecuencia. Este se caracteriza porque utiliza
siempre lo que son columnas de tipo vertical y porque nunca debe haber espacios entre
lo que son unas y otras.
Ejemplo: Del ejemplo anterior construir el polgono de frecuencia

3.3.6 POLIGONO DE FRECUENCIAS ACUMULADAS U OJIVAS.

Es un grfico de lnea que se disea utilizando en el eje horizontal las fronteras


superiores de una distribucin de frecuencias. La informacin se obtiene de la columna
de frecuencias acumuladas (absoluta o relativa).

Ejemplo: En el ejemplo anterior sobre los ingresos de 40 ingenieros, construir un grfico de


ojivas.

Li Ls fi Fi

14 21 1 1
21 28 5 6
28 35 7 13
35 42 16 29
42 49 10 39
49 56 9 48
56 63 1 49
63 70 1 50
50
ACTIVIDADES

EJERCICIOS DE APLICACIN DE UNIDAD 1


PROPUESTOS

1. Se realiza un muestreo de opinin para determinar si los clientes de un Supermercado, prefieren un


Celular con servicio de la compaa A con respecto a otras compaas. Con este fin se entrevistan a
1600 clientes y entre ellos 1200 prefieren la compaa A. Responda lo siguiente:
a) Cul es la poblacin cul es la muestra?
b) Cual es la variable analizada y su tipo
c) Identifique la estadstica y proporcione su valor.
c) Identifique el parmetro de inters e indique su valor

2. Clasificar adecuadamente las diversas variables con un aspa (X):

N VARIABLE CUALITATIVA CUANTITATIVA


NOMINAL ORDINAL CONTINUA DISCRETA
1 Satisfaccin de los clientes por la atencin
2 El rea de las habitaciones de un edificio.
3 Rentabilidad anual de un activo financiero
4 El nmero de piezas defectuosas en un lote
5 Nmero de Inscritos a un Examen de Admisin
6 Calidad de un producto
7 Volumen de agua de un reservorio
8 Nmero de hijos de 50 familias
9 Los tipos de fallas de una impresora
10 Situacin laboral de un individuo

3. Los siguientes corresponden a los delitos econmicos registrados por la polica nacional durante el ao
2012, se cuenta con 40 registros elegidos aleatoriamente.

B A B C A C A B A A
Utiliza:
D C A B D B A B D A A: Adulteracin
A B C A A C A A B A B: Acaparamiento
A A B C A D B A A B C: Especulacin
D: Piratera

a) Organice los datos en una tabla de distribucin de frecuencias de acuerdo a los delitos econmicos.
b) Interprete las siguientes frecuencias: f 3 ; F2 ; h4 ; H 3

4. Los siguientes datos pertenecen a la distribucin de la produccin de papas (en toneladas) en 40 zonas
del pas:
y1 20 ; f 2 f 5 2 ; y5 100 ; f1 4 ; f 3 20

Si se sabe que la distribucin es simtrica y presenta 5 intervalos de clase con amplitud constante.
Construya una tabla de frecuencias.
5. En una clase de Estadstica hemos medido la altura de los 25 alumnos. Sus medidas, en cm, son:

167 159 164 170 164


151 168 174 158 163
160 178 150 172 169
159 158 153 157 156
175 165 164 158 163

a) Construir la correspondiente tabla de distribucin de frecuencias por intervalos.


b) Interpretar: f3 ; F4 ; h6 ; H5
c) c) Qu porcentaje de alumnos miden ms de 164 cm?

6. El nmero de empleados de 140 empresastextiles se da en la tabla adjunta:

N de empleados
LI LS yi fi Fi hi Hi
[ 82 12
[ 90 44
[
[ 30
[ ] 17
TOTAL 1.00

a) Completar la tabla de frecuencias b) Interpretar: f3 ; H 3

7. El cociente intelectual de los 200 alumnos de un centro de bachillerato est representado en el siguiente
grfico.

a) Qu tipo de grfico es el representado anteriormente


que tipo de variable es la que se analiza?
b) Construir la tabla de frecuencias, que se corresponde
con el grfico anterior

8. El siguiente grfico representa un total de 600 elementos. Cul es la frecuencia de cada categora?
AUTOEVALUACIN N 1
1. El Gerente de Personal de una gran empresa manufacturera que cuenta con 1850 trabajadores, desea
conocer la experiencia promedio de un trabajador en el puesto que actualmente ocupa. Para ello
selecciona al azar 20 trabajadores de cada uno de los 6 departamentos que constituyen la empresa. Uno
de los trabajadores manifest que tiene una experiencia de 6 aos y medio. En esta condicin identifique
a) Objetivo del problema ______________________________________________________________
b) Variable y tipo ____________________________________________________________________
c) Poblacin ________________________________________________________________________
d) Muestra _________________________________________________________________________
e) Parmetro _______________________________________________________________________

2. Marca un aspa (X) identificando el tipo de variable


N VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Monto vendido al mes
2 N de facturas ingresadas
3 Impuestos por pagar anual
4 Eficiencia de un contador
5 Tipo de proveedor

3. Se ha realizado un estudio de las rentas de alquiler de 390 viviendas (donde la renta viene dada en miles
de soles), en una poblacin de tamao medio, obtenindose:

Rentas de N de viviendas
alquiler yi fi Fi hi Hi
[ 400 - 450 20
[ - 140
[ - 180
[ - 40
[ - ]
Total
a) Completa la tabla de frecuencias e interprete f3 y F2
b) Qu porcentaje de viviendas tienen alquileres de al menos a S/.500?
c) Construya un polgono de frecuencias

4. Interpreta el siguiente grfico estadstico:


______________________________________________________________________________________

______________________________________________________________________________________

________________________________________________________________________________

UNIDAD 2

MEDIDAS DE TENDENCIA CENTRAL Y DE


DISPERSION

En esta unidad el alumno determinara las medidas de tendencia central y dispersin mediante
tcnicas descriptivas y ser capaz de resolver problemas, as como la aplicacin de las leyes de
tendencia central y de variabilidad.

OBJETIVOS ESPECFICOS

Conocer los diferentes tipos de medidas de tendencia central para su aplicacin en distintos
problemas segn los datos que pueden ser no agrupados y agrupados.
Identificar las medidas de dispersin que ms se utilizan y su aplicacin en problemas de
distribucin de frecuencia y en datos, as como diferenciar estas con las medidas de
centralizacin.

CONTENIDO TEMTICO

Tema IV : Medidas de Tendencia central


Tema V : Medidas de Dispersin o Variabilidad
TEMA MEDIDAS DE TENDENCIA CENTRAL
IV

4.1. DEFINICIN

Las Medidas de Tendencia Central o Medidas de Posicin son aquellos valores que
representan un conjunto de datos y que generalmente estn ubicados en la parte de la
distribucin central de la distribucin. Los conocimientos de estas medidas es de gran utilidad,
tanto en los niveles de decisin como de ejecucin.Las ms comunes son:
Media Aritmtica
Mediana
Moda

4.2. MEDIA ARITMTICA

La Media Aritmtica o simplemente media es el estadgrafo de tendencia central ms


importante y comnmente se le conoce como Promedio.La Media Aritmtica se define como
el cociente de la suma de los valores de una variable entre el nmero de observaciones o
valores. Simblicamente:
N


i 1
Xi
X1 X 2 ........... X N
X
N N

4.1.1 CALCULO DE LA MEDIA PARA DATOS NO AGRUPADOS


Podemos diferenciar la frmula del promedio simple para datos poblaciones y muestrales:
Observe que la variacin de ambas frmulas radica en el tamao de los datos (N identifica el
tamao de la poblacin, mientras que n el de la muestra).

Ejemplo1: Sea las edades en aos de 5 nios son 8, 3, 5, 12 y 10. Entonces la Media
Aritmtica de las edades de stos nios es:
8 3 5 12 10 38
X 7.6
5 5

Ejemplo2:Calcule la media aritmtica del nmero de televisores vendidos por 10


empleados durante una campaa. 73, 68, 59, 40, 81, 72, 40, 70, 59 y 72
x
x i

73 68 59 ... 59 72
63
n 10
Interpretacin: Los empleados vendieron un promedio de 63 televisores.
4.1.2 CALCULO DE LA MEDIA PARA DATOS AGRUPADOS
Se Utilizar cuando los datos estn distribuidos en una tabla de frecuencias. Luego se
calcula la media aritmtica aplicando la frmula:
n

fy i i
x i 1
; donde n es igual al nmero total de datos.
n

Ejemplo: Calcule la media de la siguiente distribucin de frecuencia correspondiente la


inversin anual (en miles de dlares) de 40 empresas.

Inversiones
LI LS yi fi fi yi
[4 10 7 1 7
[10 16 13 3 39
[16 22 19 6 114
[22 28 25 12 300
[28 34 31 11 341
[34 40 37 5 185
[40 46 43 2 86
TOTAL n =40 1072

Aplicando la formula se tiene: x


fy i i

1072
26.8
n 40
Interpretacin: La Inversin media anual del grupo de empresas fue de $26800.

4.3. MODA

La moda es el valor que se presenta con ms frecuencia en un conjunto de observaciones.


Puede ser:
4.3.1 CALCULO DE LA MODA PARA DATOS NO AGRUPADOS
Se ordenan los datos en forma creciente o decreciente y se ubica los valores que ms se
repiten.

Ejemplo1: 18, 23,25, 20, 25, 21, 20, 25


Ordenando: 18, 20, 20, 21, 23, 25, 25, 25 ; Mo= 25

Ejemplo2: 18, 23, 25, 20, 23, 25, 21, 22


Ordenando: 18, 20, 21, 22, 23, 23, 25, 25; Mo= 23 Mo= 25

Ejemplo3: 18, 19, 20, 21, 22, 23; Mo = No tiene

4.3.2 CALCULO DE LA MODA PARA DATOS AGRUPADOS


Se Utilizar cuando los datos estn distribuidos en una tabla de frecuencias. Luego se
calcula la Moda aplicando la frmula:

1
M o LI c j
2 1

Donde:

LI : Lmite inferior de la clase modal


c j : Amplitud del intervalo de la clase modal
1 f j f j 1
2 f j f j 1
f j : Frecuencia absoluta modal
f j 1 :Frecuencia absoluta anterior a la frecuencia modal
f j 1 :Frecuencia absoluta posterior a la frecuencia modal
Observaciones:
La moda se puede determinar en todos los dos tipos de variables cualitativas y
cuantitativas.
La moda tiene la ventaja de no ser afectada por valores extremos
En muchas series de datos no hay moda porque ningn valor aparece ms de una
vez.

Ejemplo: Calcule la moda de la siguiente distribucin de frecuencia correspondiente la


inversin anual (en miles de dlares) de 40 empresas.

Inversiones
LI LS yi fi
[4 10 7 1
[10 16 13 3
[16 22 19 6
[22 28 25 12
[28 34 31 11
[34 40 37 5
[40 46 43 2
TOTAL n =40

Pasos:
Ubicamos primero la mayor frecuencia: f j 12

Luego la moda se encuentra en la clase 22 - 28, por lo tanto


LI 22 ; f j 12 ; f j 1 6 ; f j 1 11 c j 6

1 12 6 6 ; 2 12 11 1

6
Mo 22 6 28.857
6 1
Interpretacin: El monto de inversin que ms se repite es $28857 lo que significa que
la mayora de las empresas invierte esa cantidad.

4.4. MEDIANA

La Mediana es la medida que divide en dos grupos iguales a la distribucin de datos, previa
ordenacin en forma ascendente o descendente. En otras palabras, es el valor que ocupa el
lugar central.
4.4.1 MEDIANA DE DATOS NO AGRUPADOS
Para determinar la Mediana de n observaciones x1 , x2 ,........., xn primero se ordenan

dichas observaciones descendentemente ascendentemente luego se ubica o se calcula


la mediana dependiendo de la cantidad de datos n si es par o impar:

Ejemplo1. (Cuando el n de datos es impar)


17, 24, 20, 18, 22, 21, 24; Ordenando: 17, 18, 20, 21, 22, 24, 24 (n=7 impar)
7 1
Posicion 4 Me 21
2

Ejemplo2. (Cuando el n de datos es par)


13 , 14, 7, 11, 15, 16, 12, 9 ; ordenando: 7, 9, 11, 12, 13, 14, 15, 16 (n=8 par)
12 13
Me 12.5
2

4.4.2 CALCULO DE LA MEDIANA PARA DATOS AGRUPADOS


Cuando se trabajan con tablas de frecuencias de intervalos, la frmula para calcular la
mediana es:

n
2 F j 1
Me LI c j
F j F j 1

Donde:
LI : Lmite inferior de la clase mediana

c J : Amplitud del intervalo de la clase mediana


n : nmero total de observaciones o datos
F j : Frecuencia acumulada de la clase mediana
F j 1 :Frecuencia acumulada anterior de la clase mediana.

Observacin:
Se denomina clase mediana al intervalo de clase que contiene a la mediana en una
tabla de distribucin de frecuencias

Ejemplo: Calcule la mediana de la siguiente distribucin de frecuencia correspondiente


la inversin anual (en miles de dlares) de 40 empresas.

Inversiones
LI LS yi fi Fi
[4 10 7 1 1
[10 16 13 3 4
[16 22 19 6 10
[22 28 25 12 22
[28 34 31 11 33
[34 40 37 5 38
[40 46 43 2 40
TOTAL n =40

Pasos:
n 40
i) Calcular 20 y ubicar en los Fi
2 2
ii) Luego la mediana se encuentra en la clase [22 28 , por lo tanto:

LI 22 ; Fj 22 ; F j 1 10 ; ; c j =6

20 10 10
Me 22 6 22 6 27
22 10 12

Interpretacin: El 50% de las empresas invierten anualmente un monto menor o igual


a $27000.
PROBLEMAS DESARROLLADOS
1). Sea una distribucin estadstica que viene dada por la siguiente tabla:

xi 61 64 67 70 73

fi 5 18 42 27 8
Calcular:

1 La moda, mediana y media.

2 El rango, desviacin media, varianza y desviacin tpica .

xi fi Fi xi fi |x x | |x x | fi xi2 fi

61 5 5 305 6.45 32.25 18 605

64 18 23 1152 3.45 62.10 73 728

67 42 65 2814 0.45 18.90 188 538

71 27 92 1890 2.55 68.85 132 300

73 8 100 584 5.55 44.40 42 632

100 6745 226.50 455 803

Moda

Mo = 67

Mediana

100/2 = 50 Me = 67

Media

Desviacin media

Rango
r = 73 61 = 12

Varianza

Desviacin tpica

2). El tiempo que tardan las cajeras de un supermercado en cobrar a los clientes
sigue una ley normal con media desconocida y desviacin tpica 0,5 minutos. Para
una m uestra aleatoria de 25 clientes se obtuvo un tiem po medio de 5,2 m inutos.
1. Calcula el intervalo de confianza al nivel del 95% para el tiem po m edio que se
tarda en cobrar a los clientes .

Solucin:

2. Indica el tamao muestral necesario para estim ar dicho tiem po medio con
un el error de 0,5 minutos y un nivel de confianza del 95%.
Solucin:

n 4

3). La empresa Purina los implementados nuevos bonos quincenales en dlares encontrando los
siguientes resultados de 40 empleados:
63 82 36 49 56 64 59 35
43 51 70 57 62 43 68 62
64 72 52 51 62 60 71 26
59 60 67 57 67 61 67 51
50 64 76 44 73 56 62 63
a) Construya una tabla de distribucin de frecuencias con su respectivo ttulo, para determinar el
nmero de intervalos utilice la Ley de Surges.
b)
Tabla de Frecuencias sobre los nuevos bonos quincenales en dlares de los empleados

DISTRIBUCION DE FRECUENCIAS
63 82 36 49 56 64 59 35 43 51
70 57 62 43 68 62 64 72 52 51
62 60 71 26 59 60 67 57 67 61
67 51 50 64 76 44 73 56 62 63

N DE DATOS 40
V MAX 82
V MIN 26
RANGO( R ) 56
N DE INETRVALOS( K ) 7 1.60 5.32 6.32
AMPLITUD DE CLASE ( A ) 8 8.00

INTERVALOS
L.I L.S M f h p% F2 H2 P%2
[26 34> 30 1 0.03 3% 1 0.03 3%
[34 42> 38 2 0.05 5% 3 0.08 8%
[42 50> 46 4 0.10 10% 7 0.18 18%
[50 58> 54 9 0.23 23% 16 0.40 40%
[58 66> 62 14 0.35 35% 30 0.75 75%
[66 74> 70 8 0.20 20% 38 0.95 95%
[74 82> 78 2 0.05 5% 40 1 100%

40 1 100%

4). Una encuesta de preferencia aplicada a los clientes de Leydy Tours sobre el pago del ticket de
vuelo a ciudad de Trujillo, en dlares, los clientes respondieron que les gustara que cueste:

67 80 75 66 57 78 56 55 54 50
58 48 50 90 85 65 58 65 50 49

a. Calcular la media e interpretar el resultado:


Es una variable cuantitativa continua, as es necesario hacer una tabla de frecuencias

N DE DATOS 20
V MAX 90
V MIN 48
RANGO( R ) 42
N DE INETRVALOS( K ) 6
AMPLITUD DE CLASE ( A ) 7

L.I L.S YI FI YI*FI


[48 55> 51.5 6 309
[55 62> 58.5 5 292.5
[62 69> 65.5 4 262
[69 76> 72.5 1 72.5
[76 83> 79.5 2 159
[83 90] 86.5 2 173
Total N=20 1268

Para hallar media utilizaremos este medio

1268
= = 63.4
20
Interpretacin: El pago de ticket promedio para el viaje a la ciudad de Trujillo fue de 63.4 dlares.

b. Hallar la mediana e interpretar el resultado:

Li ls Yi fi Fi
[48 55> 51.5 6 6
[55 62> 58.5 5 11
[62 69> 65.5 4 15
[69 76> 72.5 1 16
[76 83> 79.5 2 18
[83 90] 86.5 2 20
Total N=20

Emplearemos esta frmula:

106
Me=55 + 7 ( ) = 60.6
116

Interpretacin: El 50% de los pagos de los tickets de viaje a la ciudad a Trujillo cuestan un monto menor o
igual a 60.6 dlares

c. Determinar la moda e interpretar el resultado (1ptos)

Li ls Yi fi fixyi
[48 55> 51.5 6 309
[55 62> 58.5 5 292.5
[62 69> 65.5 4 262
[69 76> 72.5 1 72.5
[76 83> 79.5 2 159
[83 90] 86.5 2 173
Total N=20 1268

Para poder resolverlo emplearemos esta frmula para encontrar la moda

6
Mo=48 + 7 ( ) = 51.84 52
6+65
Interpretacin: El pago de ticket que ms se repite para el viaje a la ciudad de Trujillo fue de 50 dlares en
donde la mayora de pasajeros compran un ticket a ese costo.

TEMA MEDIDAS DE DISPERSION O VARIABILIDAD


V

5.1 DEFINICIN

Son indicadores estadsticos que representan cuan dispersas se encuentran los datos de la
variable, sealando el grado de concentracin de los mismos con respecto al promedio de la
distribucin. Las ms comunes son:
Recorrido o rango
Varianza
Desviacin Estndar o Tpica
Coeficiente de Variacin

Ejemplo: Sean las distancias de tres viviendas en dos muestras en que muestra las viviendas
estn ms separadas o dispersas?

Segn el grfico: los edificios B


estn ms separados que los
de grupo A. La dispersin en B
es mayor que en A.

5.2. RANGO O RECORRIDO

El rango de una variable es la diferencia entre el valor mximo y valor mnimo. Se define como:
R X max X min

Ejemplo: Observando las edades de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56
Hallar el rango de los datos. R 56 6 50 aos.
5.3. VARIANZA Y DESVIACIN ESTNDAR

La Varianza y la Desviacin Estndar son las medidas de dispersin o variabilidad de los


datos. La varianza se define como las desviaciones al cuadrado con respecto al promedio (2).
As tambin se le conoce como el promedio de la dispersin en la distribucin de una variable.
La desviacin estndar es la raz cuadrada de la varianza y se representa por
5.3.1PARA DATOS NO AGRUPADOS

TIPO VARIANZA DESVIACIN


ESTNDAR

Xi X
N

Xi N X 2 2
POBLACIONAL i 1
V(X )
2
V(X)
N N
n n

x x xi2 nx
2 2
i
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1

5.3.2 PARA DATOS AGRUPADOS

TIPO VARIANZA DESVIACIN


ESTNDAR


N N


2 2
fi X i X fi X i N X 2
POBLACIONAL i 1 i 1
2 V(X ) V(X)
N N
n n

f i xi x fi xi2 nx
2 2
MUESTRAL
s2 V ( x) i 1
i 1
s V ( x)
n 1 n 1

OBSERVACIONES:
A la desviacin estndar tambin se la llama desviacin tpica y es la raz cuadrada
de la varianza. La varianza nunca es negativa.
Cuando la variable toma un nico valor; es decir cuando es constante entonces la
varianza es cero.
Mientras ms se aproxima a cero, ms concentrados estn los valores de la serie
alrededor de la media. Por el contrario, mientras mayor sea la varianza, ms
dispersos estn.

Ejemplo1: (clculo de la varianza y desviacin estndar para datos no agrupados)


El nmero de das necesarios por 10 equipos de trabajadores para terminar 10
instalaciones de iguales caractersticas han sido: 21, 32, 15, 59, 60, 61, 64, 60, 71, y 80
das. Calcule e interprete la Varianza y Desviacin Tpica.

Hallamos primero la media: x 52.3

21 52.3 32 52.3 ....... 80 52.3


2 2 2

Varianza : s 2
475.12
10 1
Desviacin estndar : s 475.12 21.8

Interpretacin: el nmero de das necesarios para terminar el trabajo de los 10


equipos se alejan del promedio en 21.8 das.

Ejemplo2: (Calculo de la varianza y desviacin estndar para datos agrupados)


Sean los impuestos pagados anualmente por 46 empresas organizadas en la siguiente
tabla:

Impuestos (miles) xi fi f i xi f i xi 2
35 41 38 4 152 5776

41 47 44 9 396 17424

47 53 50 14 700 35000

53 59 56 11 616 34496

59 65 62 8 496 30752
TOTAL n=46 2360 123448

fi xi 2360
Determinando la media: x n

46
51.3

123448 46(51.3) 2
La Varianza es: s 53.12
2

46 1

La Desviacin Estndar es s s2 53.12 7.29

Interpretacin: En promedio el monto de impuestos pagado por los contribuyentes se


desvan de su media aritmtica en S/. 7290

5.4. COEFICIENTE DE VARIACIN


Es el grado de desviacin con relacin a la medida. Este coeficiente se usa para comparar las
medias aritmticas o promedio de diferentes muestras. Se calcula mediante la frmula:

S
C .V % 100 (Coeficiente de variacin muestral)
X

OBSERVACIN:
Al realizar comparaciones entre dos variables, el C.V. mas pequeo ser el que tenga
menor dispersin relativa.
Un C.V. mayor a 30% indica un alto grado de dispersin y pequea representatividad de la
media, pero cuanto menor sea a 30% la media ser mas representativa.

Ejemplo: Se ha evaluado a 3 obreros para saber su rapidez en la fabricacin de un artculo,


sus resultados en segundos se presentan en la siguiente tabla. Mediante el C.V. indicar que
obrero tiene el rendimiento ms uniforme:

Obrero1 Obrero2 Obrero3


61.8 60.8 61.4
61.9 60.7 61.2
63.2 62.9 63.3
63.8 62.8 61.0
61.4 62.9 63.2
61.2 62.5 60.8
63.3 62.1 61.4
61.0 61.9 61.2
62.5 62.8 63.2
60.8 63.8 61.8

Medidas Obrero1 Obrero2 Obrero3


x 62.09 62.32 61.85
S 1.06 0.97 0.99
C .V 0.017 0.0156 0.016
C .V % 1.70% 1.56% 1.60%

Conclusin
Comparando los tres coeficientes de variacin se observa que el segundo obrero tiene el
menor coeficiente, por lo tanto dicho obrero tiene rendimiento ms homogneo o uniforme
ACTIVIDADES

EJERCICIOS DE APLICACIN DE UNIDAD2

1. Una compaa de transportes conserva los registros del kilometraje en todo su equipo rodante. A
continuacin se anotan los registros del kilometraje semanal de sus camiones:

810 450 756 789 210 657 589 488 876 689
1450 560 469 890 987 559 788 943 447 775

a) Calcule la media aritmtica de kilmetros que recorre el camin.


b) Calcule la mediana de kilmetros que recorre el camin.
c) Compare a) y b) y explique cul es la mejor medida de tendencia central de los datos

2. Las ventas de cinco vendedores de una empresa son: $8000, $9000, $10500, $9800 y $55000. Calcula el
sueldo medio, la moda y la mediana e indica cul representa mejor a los datos.

3. Los siguientes datos corresponden a la altura de alumnos de un grupo de curso.

Altura en metros N alumnos


1.50 1
1.55 5
1.60 10
1.65 15
1.70 5
1.75 1
1.80 2

Calcular las medidas de tendencia central e interpretar los resultados

4. Los Sueldos de una empresa estn distribuidos de la siguiente manera:

Sueldos yi fi Fi yi fi
200 400 25
400 600 26
600 800 35
800 1000 8
1000 1200 15

Calcular las Medidas de tendencia central e interprete los resultados

5. Los costos de fabricacin, en soles, de diez objetos son los siguientes: 9.35, 9.46, 9.20, 9.80, 9.77, 9.00,
9.99, 9.36, 9.50, 9.60, si el precio de venta de cada objeto es 3 veces su costo de fabricacin menos 5
soles, calcular la utilidad media por objeto.

6. Se desea analizar el precio de las viviendas en el municipio de Surco para ello tras un minucioso estudio
en el registro de la propiedad y una agrupacin de los datos se obtiene que durante los primeros 5
meses del presente ao los precios vienen reflejados en la tabla siguiente y las unidades vienen dadas
en miles de dlares:

[0, 50) [50,100) [100, 150) [150,200) [200, 250)


2 45 95 43 15

Calcula El precio medio, moda y mediana

7. A un congreso asisten seis mujeres fiscales cuyas edades son:


27 34 38 42 33 36
a) Calcula la media y varianza de sus edades.
b) Cinco aos despus coinciden las mismas mujeres. A partir de los clculos anteriores, halla la nueva
media y varianza de sus edades.

8. Dado el siguiente cuadro estadstico sobre el nmero de empleados de un grupo de compaas


azucareras con ancho de clase constante igual a 20. Determine la varianza y desviacin estndar de los
datos e interprete.

Li Ls Yi fi Fi Yi fi
- 880
- 1950
- 35 1800
- 13
- 200
- ] 4 70

9. Un encargado de compras ha obtenido muestras de lmparas fluorescentes de 2 proveedores. En su


laboratorio ha probado las lmparas con respecto a su vida til y encontr los siguientes resultados:

Duracin (horas) Proveedor A Proveedor B


70 90 10
3

90 110 33
42

110 130 9
12

130 150 8 3

a. Qu proveedor proporciona las lmparas que tiene el mayor promedio de vida?


b. Qu proveedor tiene las lmparas cuya duracin tiene menor dispersin (ms confiable)?
c. Qu proveedor debera elegir el encargado de compras?

10. En una fbrica, el personal de planta est dividido en supervisores, operarios calificados y asistentes. Se
cuenta con la siguiente informacin:

Supervisores Operarios calificados Asistentes


Salario promedio 2000 1200 800
Desviacin estndar 300 900 200

Qu grupo de trabajadores tiene los salarios ms homogneos?


AUTOEVALUACIN N 2
1. Los ingresos (en miles) producidos por los 120 clientes que durante un periodo de tiempo han ocupado
un determinado hotel se dan en la siguiente tabla, completa la tabla de frecuencias:

Ingresos yi fi Fi hi Hi
[ - ) 5
[ - ) 10
[ - 25 ) 25
[ - 30 ) 35
[ - ) 22
[ - )

a) Calcule la media, moda, mediana e interprete


a) Calcula La Varianza, desviacin estndar en interpreta
b) Se puede decir que la distribucin de salarios es uniforme? Justifique su respuesta

2. Se clasifica a los contadores de acuerdo al grado de responsabilidad obtenindose los siguientes


resultados:

a) Cul es el gasto total anual para pagar el sueldo de todos los contadores?
b) Qu medida me permite comparar la dispersin de salarios?
c) Qu grupo de contadores tiene los sueldos ms homogneos?

3. Marca la respuesta correcta:

A) Medida que nos da el valor de mayor frecuencia o que ms se repite


a) Media b) Mediana c) Moda d) Desviacin Estndar
B) Medida que nos permite hallar el valor que est en la mitad de los datos
a) Media b) Mediana c) Moda d) Desviacin Estndar
C) Mide que tan alejado se encuentran los datos alrededor de la media aritmtica
a) Media b) Mediana c) Moda d) Desviacin Estndar
D) Para los siguientes datos: 2, 4, 3, 4, 3, 56 Cul sera la medida ms ideal?
a) Media b) Mediana c) Moda d) Desviacin Estndar

4. Se investigaron 8 muestras de un producto alimenticio en cuanto al contenido de vitaminas A. Las


cantidades xi de vitamina A medidos en mg mostraron los siguientes resultados:

x i 187 ; x2
i 5009 ;
Calcule el Coeficiente de Variacin e interprete.
UNIDAD 3

ANALISIS DE CORRELACION Y REGRESION E


INTRODUCCIN A LAS PROBABILIDADES

En esta unidad se analizar la correlacin y regresin lineal existente entre dos variables X,Y.
Adems se conocer y aplicar la teora de la probabilidad en diversos sucesos y eventos.

OBJETIVOS ESPECFICOS

Dominar los mtodos de regresin simple, anlisis de correlacin y coeficiente de


determinacin
Modelar experimentos aleatorios aplicando correctamente la definicin clsica de probabilidad
Calcular probabilidades condicionales de eventos a partir de la definicin de estos conceptos y
de la ley de la probabilidad.
Resolver problemas de probabilidad y de toma de decisiones aplicando el Teorema de Bayes.

CONTENIDO TEMTICO

Tema VI: Anlisis de correlacin y regresin


Tema VII: Introduccin a las probabilidades
TEMA ANLISIS DE CORRELACIN Y REGRESIN
VI

6.1. ANALISIS DE CORRELACIN

Es frecuente que estudiemos sobre una misma poblacin los valores de dos variables
estadsticas X e Y distintas, con el fin de ver si existe alguna relacin entre ellas. El anlisis de
este relacionamiento presenta dos aspectos diferentes.
Unas veces nuestro inters est en conocer si las dos variables estn asociadas y medir
hasta qu punto los cambios en una pueden explicarse por los cambios que ocurren en la
otra. En tal caso tenemos un problema de correlacin y la medida que cuantifica es el llamado
Coeficiente de Correlacin.
Otras veces, cuando estamos seguros que existe un alto grado de asociacin entre las dos
variables, el anlisis se encamina a cuantificar la relacin existente con el fin de predecir
cules sern los valores de la variable respuesta, en este caso tenemos un problema de
Regresin.

6.1.1 DEFINICIN. El anlisis de correlacin tiene como objetivo medir la fuerza de una
relacin entre variables cuantitativas y/o cualitativas, esta es medida a travs del
coeficiente de correlacin, para variables cuantitativas que tienen distribucin normal se
utilizar la correlacin momento-producto de Pearson y para variables que no tienen
distribucin normal o cualitativas la correlacin de rango de Tau de Kendall o Spearman.
Esta relacin que es analizada puede estar dada de manera lineal, la cual nos dice que
los datos se ajustaran a una lnea recta o tambin estara de una forma no lineal en este
caso los datos se ajustaran ms a una curva. Es decir, dos variables pueden estar
perfectamente relacionadas, pero si la relacin no es lineal, el coeficiente de correlacin
de Pearson o de Spearman no ser un estadstico adecuado para medir su asociacin.
Si la relacin que se busca es solamente entre dos variables, recibe el nombre de
correlacin simple o bivariada.

6.1.2 TIPOS DE CORRELACIN. Atendiendo al relacionamiento entre las variables X e Y


podemos tener:

A. Correlacin Directa o Positiva. Cuando las variables X e Y presentan variaciones en


un mismo sentido, esto es, para mayores valores de X corresponde mayores valores
de Y.
B. Correlacin Inversa o Negativa. Cuando las variaciones de X e Y son en sentidos
contrarios, esto es, para mayores valores de X corresponden menores valores de Y.
C. Sin correlacin. Cuando no existe ningn tipo de relacionamiento entre las variables.
6.1.3 DIAGRAMA DE DISPERSIN. Es una forma de saber si existe o no relacin acentuada
entre dos variables, igualmente qu tipo de relacin es (lineal, parbola, exponencial,
etc).

Correlacin Positiva
(Directa)
Correlacin Negativa
(Inversa)
Sin correlacin

Ejemplo1: Los siguientes datos representan los aos de prctica profesional y el ingreso
anual (en miles de soles) para un conjunto de servidores pblicos. Construir el diagrama de
dispersion e indicar el tipo de correlacin.

Aos de
Practica (X) Ingreso (Y)
5 40
15 40
24 90
16 70
19 60
3 20
6 30
12 30
27 70
13 50
Interpretacin: Observando el grfico podemos decir los aos de
prctica y el ingreso anual tienen una correlacin Directa o Positiva.

Observacin: Si se desea investigar la relacin existente entre dos variables el primer paso
ser trazar el diagrama de dispersin, el cual proporcionar una idea del tipo de relacin
existente entre ambas variables.
6.1.4 COEFICIENTE DE CORRELACIN.
Es un nmero que indica el grado de asociacin entre las variables y se define del
siguiente modo:

n
xi yi nxy
r i 1
n x 2 nx 2 n y2 ny 2
i i
i 1 i 1

Caractersticas:

i) El coeficiente r es un nmero comprendido entre -1 y +1


1 r 1
ii) Si r 0 Existe una correlacin directa o positiva

iii) Si r 0 Existe una correlacin Inversa o negativa

iv) Si r 1 Existe una perfecta asociacin positiva entre las dos variables

v) Si r 1 Existe una perfecta asociacin negativa entre las dos variables

vi) Si r 0 No Existe asociacin entre las dos variables, no existe asociacin lineal.

Ejemplo2: Del ejemplo1 sobre los aos de prctica profesional y el ingreso anual hallar el
coeficiente de correlacin:

N Aos de XY X2 Y2
Practica(X) Ingreso(Y)
1 5 40 200 25 1600
2 15 40 600 225 1600
3 24 90 2160 576 8100
4 16 70 1120 256 4900
5 19 60 1140 361 3600
6 3 20 60 9 400
7 6 30 180 36 900
8 12 30 360 144 900
9 27 70 1890 729 4900
10 13 50 650 169 2500
Total 140 500 8360 2530 29400
X Y XY X2 Y2
n 10 ; x
x 140 14 ; y
500
50
n 10 10
Entonces:

n
xi yi nxy
i 1 8360 10(14)(50)
r 0.859
n x 2 nx 2 n y2 ny 2
i i
2530 10(14)2 29400 10(50) 2
i 1 i 1

Interpretacin: Como r=0.859, existe una correlacin positiva fuerte entre los aos de
prctica y el ingreso.

6.1.5 NIVELES DE CORRELACIN r


Como se observa en los diagramas anteriores, el valor de r se aproxima a +1 cuando la
correlacin tiende a ser lineal directa (mayores valores de X significan mayores valores
de Y), y se aproxima a 1 cuando la correlacin tiende a ser lineal inversa. El siguiente
diagrama resume el anlisis del coeficiente de correlacin entre dos variables:
6.2. ANALISIS DE REGRESIN

Cuando existe relacin lineal, el objetivo se transforma en representar esta relacin mediante una
forma matemtica, o sea utilizando una ecuacin que determine la relacin existente entre las
variables realizas. El procedimiento a seguir es buscar una lnea o curva, que se ajuste ms a los
valores de las variables, en el caso de que sea una lnea recta, se le conoce con el nombre de
Regresin lineal y si la ecuacin resulta una curva, recibe el nombre de Regresin no lineal Si
la ecuacin que se busca es solamente en base a dos variables, se le conoce con el nombre de
Regresin simple. Si el nmero de variables es ms de dos variables, se le conoce con el nombre
de Regresin Mltiple.

6.2.1 REGRESIN LINEAL SIMPLE. Relacin de dos variables a las cuales se ajusta a una
lnea recta. Est definida por la siguiente ecuacin lineal en su forma general:

Y b0 b1 X e

Donde:

Y Es la variable respuesta o valor de la prediccin de la variable Y dado un valor X .

b0 ,b1 Coeficientes de la regresin lineal

b0 Es el valor de Y cuando X = 0, es decir, es el valor de Y cuando la lnea de


regresin cruza el eje de las Y.

b1 Es la pendiente de la lnea, o la variacin promedio en Y por cada variacin de una


unidad en X.

X Es cualquier valor seleccionado de la variable independiente X.

e Es el error de prediccin

6.2.2 METODO DE MINIMOS CUADRADOS PARA ESTIMAR LOS COEFICIENTES DE


REGRESIN. Es un mtodo
para obtener la recta que se
ajuste mejor a los datos, al
graficar los datos sabemos que podemos trazar infinidad de rectas pero este mtodo nos
proporciona la de mejor ajuste.

A ei se le llama desviacin o error que puede ser negativo o positivo, si elevamos las

desviaciones al cuadrado, para obtener la recta ms representativa la suma de los

errores al cuadrado e12 e22 e32 ..... en2 debe ser lo ms pequea posible.

6.2.3RECTA DE MINIMOS CUADRADOS. Para poder obtener la recta de regresin Y en X


utilizaremos la siguiente ecuacin de estimacin:

Y b0 b1 X

Donde los valores de b0 y b1 en la ecuacin de regresin son conocidos como

coeficientes de regresin y las frmulas para calcularlos son:

n
xi yi nxy
b i 1 b yb x
0 1
1 n

x 2
i
nx 2
i 1

Ejemplo1: Una empresa tiene 7 vendedores, y se quiere analizar las ventas mensuales (en miles
de soles) frente a los aos de experiencia. Los datos estn en la siguiente tabla.

N Experiencia (X) Ventas Y (miles)


1 13 26
2 16 33
3 30 36
4 2 16
5 8 26
6 6 19
7 31 38

a) Se trata de una relacin lineal? (analizar el diagrama de dispersin)


b) Si es una ecuacin lineal hallar la ecuacin de regresin determinando los coeficientes
de regresin.
c) Predecir la venta de un empleado con 40 aos de experiencia (Estimar Y para un valor
X=40)
Solucin:
a) Diagrama de dispersin entre los aos de experiencia y las ventas mensuales

Segn el diagrama de dispersin existe una relacin aproximadamente lineal.

b) Hallando la ecuacin de la recta de regresin:

Experiencia Ventas(miles)
N XY X2 Y2
(X) (Y)
1 13 26 338 169 676

2 16 33 528 256 1089

3 30 36 1080 900 1296

4 2 16 32 4 256

5 8 26 208 64 676

6 6 19 114 36 361

7 31 38 1178 961 1444


X= 106 Y=194 XY=3478 X2=2390 Y2=5798

n 7 ; x
x 106 15.14 ; y
194
27.71
n 7 7

n
xi yi nxy
i 1 3478 7(15.14)(27.71)
b 0.688
2390 7(15.14)2
1 n

x 2
i
nx 2

i 1

b0 y b1 x 27.71 ( 0.688 )15.14 17.29


Entonces la ecuacin de regresin estimada ser:

Y 17.29 0.688X
Interpretacin:

b0 17.29 , Son las ventas de un empleado cuando X es cero o cuando no tienen aos

de experiencia. En otras palabras un vendedor tendr en promedio ventas de S/. 17290 si


no tiene aos de experiencia.

b1 0.688 , Es el incremento en 0.688 cuando X aumenta en una unidad. En otras

palabras es el aumento en S/. 688 por cada ao de experiencia que adquiera un empleado.

c) Prediccin para X=40

Y 17.29 0.688( 40 ) 44.826


Un empleado con 40 aos de experiencia en ventas, vender aproximadamente S/.44826
6.2.4 COEFICIENTE DE DETERMINACIN (R2)

Mide el porcentaje de variabilidad en Y que puede explicarse a travs del conocimiento


de la variable independiente X. Se calcula con la siguiente frmula:

( x x )( y y )
2

R
2
r2
xi nx yi ny
2 2 2 2

Caractersticas:

i) Es un valor no negativo ya que se encuentra entre 0 y 1 0 R2 1


ii) Es un valor muy importante en cualquier anlisis de regresin, ya que muestra el
grado hasta el cual estn relacionadas la variabilidad de X e Y

Ejemplo2: Del ejemplo anterior sobre la regresin entre los aos experiencia y las
ventas:

r 0.939 , por lo cual R 0.939 0.883


2 2

Interpretacin: El 88.3% de la variacin de las ventas (Y) son explicados por los aos de
experiencia. Existe adems un (100 -88.3)%=11.7% que no es explicado por los aos de
experiencia.
TEMA INTRODUCCIN A LAS PROBABILIDADES
VII

7.1. PROBABILIDAD Y EVENTOS

El concepto de probabilidad es manejado por mucha gente. Frecuentemente se escuchan


preguntas como las que se mencionan a continuacin:
Cul es la probabilidad de que me saque la Lotera?
Qu posibilidad hay de que me pase un accidente
automovilstico?
Qu posibilidad hay de que hoy llueva? para llevar mi
paraguas o no.
Existe alguna probabilidad de que repruebe el primer
parcial?

Las preguntas anteriores esperan como respuesta una medida de confianza para conocer un
evento futuro, o bien de una forma sencilla interpretar la probabilidad. El estudio de las
probabilidades proporciona las reglas para el estudio de los experimentos aleatorios o de
azar, que constituyen la base para la estadstica inferencial.

7.2. EXPERIMENTO

Es aquel cuyo resultado depende del azar y cumple ciertas caractersticas:


a) Que sea repetible en igualdad de condiciones.
b) Que se pueda describir el conjunto de todos los resultados posibles, aunque no se pueda
asegurar.
c) Si se repite un nmero grande de veces debe aparecer cierta regularidad estadstica.
Ejemplos:
1) Observar el lanzamiento de una moneda.
2) Observar el lanzamiento de un dado.
3) Medir la duracin de un equipo electrnico.
Un experimento puede ser de dos tipos:

A. EXPERIMENTO DETERMINISTICO. Cuando el resultado de la observacin se puede


predecir con exactitud antes de realizar el experimento.
Ejemplos:
De cierta altura se deja caer una piedra sin
que hay obstculo alguno entre ella y el
suelo. Lgicamente la piedra caer al suelo
por la ley de la gravedad y se puede
predecir la distancia que recorrer en un
tiempo dado.
La hora en que se despierta una persona utilizando un reloj despertador.
Observar el color de una bola extrada de una urna que contiene solo bolas negras.
Observar la suma de dos nmeros naturales pares.

B. EXPERIMENTO NO DETERMINISTICO. Cuando los resultados del experimento no


pueden predecirse con exactitud antes de realizar el experimento.
Ejemplos:
Lanzar un dado y observar el nmero que
aparece en la cara superior
Lanzar una moneda 8 veces y observar la
sucesin de caras y sellos.
Extraer bolas de una urna que contienen 3
bolas blancas, 2 negras y 4 rojas.
Elegir un presidente de un grupo de 50 personas.

7.3. EXPERIMENTO ALEATORIO.

Llamado tambin No determinstico y tiene las siguientes


caractersticas:
a) Cada experimento podr ser repetido indefinidamente sin
cambiar esencialmente las condiciones.
b) No se puede determinar un valor A priori, sin embargo
es posible describir de antemano todos sus resultados
posibles.
Ejemplo: Todos los juegos de azar
PROBLEMAS DESARROLLADOS
1). Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de que su
calificacin sea, de hecho, superior a 84?

2). La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin

normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una

muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

3). Si se sabe que la calificacin de un estudiante es mayor que 72 cul es la probabilidad de que su

calificacin sea, de hecho, superior a 84?


4). La variable altura de las alumnas que estudian en una escuela de idiomas sigue una distribucin

normal de media 1,62 m y la desviacin tpica 0,12 m. Cul es la probabilidad de que la media de una

muestra aleatoria de 100 alumnas sea mayor que 1.60 m?

5). Para encontrar una probabilidad es la divisin entre casos a favor y todos los casos posibles, este
ltimo se le conoce como espacio muestral, el espacio muestral para todos los casos es 6 debido a que un
dado tiene 6 posibles nmero.

A -Un nm ero im par

Casos a favor= (1, 3, 5), espacio muestral (1, 2, 3, 4, 5,6) = probabilidad 3/6=1/2 o 50%

B -Un mltiplo de cuatro,

Casos a favor= (4), espacio muestral (1, 2, 3, 4, 5, 6) =


Probabilidad 1/6= 16.67%

C -Mayor que cinco,

Casos a favor= (6), espacio muestral (1, 2, 3, 4, 5, 6) =


Probabilidad 1/6= 16.67%
6). La empresa Kola Real aplic una encuesta de opinin acerca de las preferencias de bebidas gaseosas
por su color a una muestra de 20 consumidores. La informacin se tom de las tiendas de Lima-Norte
durante el ao 2010.

Blanco Negra Negra Blanco Rojo


Rojo Negra Blanco Rojo Blanco
Negra Blanco Negra Blanco Negra
Blanco Negra Blanco Negra Negra
a) A partir de los datos proporcionados construye la tabla de distribucin de frecuencias con su respectivo
ttulo.

VARIABLE f F h p
BLANCO 8 8 0.4 40%
NEGRA 9 17 0.45 45%
ROJA 3 20 0.15 15%
20 1.00 100%

b) Interpretar:
P2 : el 45% de los consumidores prefieren la bebida de color negra.
Prctica 2
Se lanzan tres dados. Encontrar la probabilidad de que:

A) Salga 4 en todos

1 1 1 1
P (414243)= = = 0.0046
6 6 6 216

B) Los puntos obtenidos y multiplicados resulte 10

1x2x5
1x5x2

2x1x5 = = .

2x5x1
5x1x2
5x2x1

C) Los puntos obtenidos sumen 7

1 1 1 1 1 2 2 2 2 3 3 3 4 4
5
1 2 3 4 5 1 2 3 4 1 2 3 1 2
1
5 4 3 2 1 4 3 2 1 3 2 1 2 1
1


() = = =

7.4. ESPACIO MUESTRAL Y EVENTOS

A. ESPACIO MUESTRAL
Es denotado por , es el conjunto de todos los resultados posibles de un experimento.

Ejemplo1: Consideremos el experimento aleatorio de lanzar un dado y observar el


nmero que aparece en la cara superior, entonces su espacio muestral ser:
1, 2, 3,4,5,6
Ejemplo2: Sea el experimento lanzar dos monedas y observar el resultado, entonces su
espacio muestral ser: cc, cs, sc, ss

B. EVENTO O SUCESO
Es cualquier subconjunto de resultados de un espacio muestral y se denota con las
letras maysculas A, B, C, etc.
Ejemplo3: Sea el experimento de lanzar un dado y observar el nmero que aparece en la
cara superior. El espacio muestral asociado a este experimento como ya sabemos es:
1, 2, 3,4,5,6
Para este experimento se pueden definir los siguientes eventos:
A: Observar un nmero impar. A 1, 3,5

B: Observar un nmero menor que 4. B 1, 2, 3

C: Observar un nmero mayor que 2. C 3,4,5,6

Ejemplo4: Sea el experimento lanzar tres monedas y observar el resultado, entonces su


espacio muestral ser: ccc, ccs, csc, scc, css, scs, ssc, sss
Se definir los siguientes eventos:
D: Observar que las tres monedas salgan sello. D sss

E: Observar que al menos 2 monedas sean caras. E ccc, ccs, csc, scc

F: Observar que salgan solo 1 sello en cualquiera de las tres. F ccs, csc, scc

PROBLEMAS DESARROLLADOS

1). S e h a t o m a d o u n a m u e s t r a d e l o s p r e c i o s d e u n m i s m o p r o d u ct o
a l i m e n t i c i o e n 1 6 c o m e r c i o s, e l e g i d o s a l a za r e n u n b a r r i o d e u n a c i u d a d , y
s e h a n e n c on t r a d o lo s s ig u i e n t e s pr e c i os :

95, 108, 97, 112, 99, 106, 105, 100, 99, 98, 104, 110, 107, 111, 103, 110.

Suponiendo que los precios de este producto se distribu yen s egn una ley norm al

de varianza 25 y media desconocida:

1. Cul es la distribucin de la media maestral?

2). En una fbrica de com ponentes electrnicos, la proporcin de


componentes finales defectuosos era del 20%. Tras una serie de operaciones
e inversiones destinadas a m ejorar el rendim iento se analiz una m uestra
aleatoria de 500 componentes, encontrndose que 90 de ellos eran
defectuosos. Qu nivel de confianza debe adoptarse para aceptar que el
rendim iento no ha sufrido variaciones?
p = 0.2 q = 1 - p =0.8 p'= 90/ 500 = 0.18

E = 0.2 - 0.18 = 0.02

P (1 - z/2 <1.12) = 0.86861 - 0.8686 = 0.1314

0.8686 - 0.1314 = 0.737

Nivel de confianza: 73.72

3). En una muestra de 100 pacientes que sufrieron infarto de miocardio se observa que 75 sobrevivieron
ms de 5 aos (xito). Se quiere estudiar su posible asociacin con la realizacin de ejercicio moderado
(factor). La tabla es

F nF

50 25 75
E
10 15 25
NE
60 40 100

PASO 1:
HO: Son independientes
H1: Son dependientes

PASO 2: Calculamos los valores esperados

F nF

60*75/100=45 40*75/100=30
E
60*25/100=15 40*25/100=10
NE
PASO 3: Obsrvese que una vez calculado uno de los valores esperados, los dems vienen dados para
conservar los totales marginales (eso es lo que significa que hay 1 grado de libertad).
PASO 4: A partir de aqu calculamos

PASO 5:
5.56 < 3.84
Rechazamos la H 0 y concluimos que hay asociacin entre el ejercicio y la supervivencia. Obviamente esta
asociacin no es necesariamente causal.

4). La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de

2g/dl.

Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la media

poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.


5). La organizacin del vaso de leche necesita saber la distribucin del peso de los nios de los Centro
Educativo Inicial Miguel ngel. Para el efecto toma una muestra aleatoria de 30 nios encontrando los
siguientes resultados:

12 17 16 15 10 12 14 14 13 17
13 14 16 16 10 17 16 11 10 14
14 14 17 14 13 15 12 15 11 16

c) Construya una tabla de distribucin de frecuencias con su respectivo ttulo, para determinar el
nmero de intervalos utilice la Ley de Surges.

Paso 01: ordenar datos

10 10 10 11 11 12 12 12 13 13
13 14 14 14 14 14 14 14 15 15
15 16 16 16 16 16 17 17 17 17

Paso 02: Hallar el rango

R=17-10 R=7

Paso 03: Hallar el nmero de intervalos

K=1+3,32log(30)
K=5.90 K=6 intervalos

Paso 04: Hallar la amplitud

A=7/6 A=1

Paso 05: hallar los intervalos


Tabla No.2
Peso de los Nios del Centro Educativo Miguel ngel

Intervalos m f h p F H P
[10;11> 10.5 3 0.10 10% 3 0.10 10%
[11;12> 11.5 2 0.07 7% 5 0.17 17%
[12;13> 12.5 3 0.10 10% 8 0.27 27%
[13;14> 13.5 3 0.10 10% 11 0.37 37%
[14;15> 14.5 7 0.23 23% 18 0.60 60%
[15;16> 15.5 3 0.10 10% 21 0.70 70%
[16;17] 16.5 9 0.30 30% 30 1.00 100%
n=30 =1 100%

RANGO

19). A continuacin se presenta el nmero de PUNTAJE obtenido en una evaluacin de currculo de


los profesionales que se presentaron a una plaza de nombramiento para la IE Inmaculada
Concepcin 2011:

31 34 29 28 36 28 33 26 25 19
40 37 12 8 31 10 35 38 36 31
22 34 25 26 33 31 15 35 32 29
1. Construya la tabla de distribucin de frecuencias.
(Muestre todas sus caractersticas: nmero, ttulo, encabezados, cuerpo y fuente).

2. Si el puntaje mnimo requerido de la evaluacin era de 18 puntos, qu porcentaje logr


dicho nivel para ser declarado apto?

Solucin:

Pregunta1: Construya la tabla de distribucin de frecuencias.

Dado que los resultados en este ejercicio son un poco ms dispersos, utilizaremos la Regla de
Sturges para agruparlos y as construir la tabla de frecuencias.

i) Orden de Datos:

8 10 12 15 19 22 25 25 26 26
28 28 29 29 31 31 31 31 32 33
33 34 34 35 35 36 36 37 38 40

ii) Clculo del Rango (R)

R= dato mayor dato menor

R= 40-8

R = 32

iii) Clculo del Nmero de Intervalos (k)

k = 1+ 3.32 log(n)

k = 1+ 3.32 log(30)

k = 5.88

Redondeando por exceso:

k=6

iv) Clculo de la Amplitud (A)

A= R/K

A= 32/6

A= 5.33

Redondeando por exceso:

A= 6

v) Construccin de la Tabla de Frecuencias:


Grfico 2

TABLA DE DISTRIBUCIN DE FRECUENCIAS DE PUNTAJES

Intervalos fi hi pi Fi Hi Pi
[8, 14> 3 0,10 10,00% 3 0,10 10,00%
[14,20> 2 0,07 6,67% 5 0,17 16,67%
[20, 26> 3 0,10 10,00% 8 0,27 26,67%
[26, 32> 10 0,33 33,33% 18 0,60 60,00%
[32, 38> 10 0,33 33,33% 28 0,93 93,33%
[38, 44> 2 0,07 6,67% 30 1,00 100,00%
n = 30 1 100%

vi) Algunas Interpretaciones:

p6: El 6.67 % (2 postulantes) de los currculos se encuentran en la banda de puntaje ms alto


de todos los postulantes considerados, siendo 40 el puntaje ms alto alcanzado en el grupo.

F3: 8 currculos obtuvieron puntaje menor a 26, siendo 8 el puntaje ms bajo alcanzado en el
grupo.

P4:A partir de este valor (60%) se puede deducir por complemento que el 40% (equivalente a
12 postulantes) obtuvieron un puntaje mayor a 32.

vii. Grfico:

Grfico 3

Evaluacin de Currculos de Postulantes al I.E.


"Inmaculada Concepcin"
10
9
8
7 8-14
6 14-20
5
Cantidad de Curriculos

20-26
4
26-32
3
32-38
2
38-44
1
0
8-14 14-20 20-26 26-32 32-38 38-44
Puntaje

Fuente: UNFV Curso de Estadstica


6). Si el puntaje mnimo requerido de la evaluacin era de 18 puntos, qu porcentaje logr dicho
nivel para ser declarado apto?

Para responder esta pregunta, nos basaremos en el Orden de Datos efectuado en la pregunta 1, acpite (i).
Segn dicha tabla, hay 4 puntajes por debajo de 18; por lo tanto, habrn 26 puntajes por encima de 18
(sabiendo que n = 30).
El clculo sera:
Porcentaje encima de 18 = (26 / 30) . 100
Porcentaje encima de 18 = (26 / 30) . 100
Porcentaje encima de 18 = 87%

7.5. TECNICAS DE CONTEO

El principio fundamental en el proceso de contar ofrece un mtodo


general para contar el nmero de posibles arreglos de objetos dentro
de un solo conjunto o entre carios conjuntos. Las tcnicas de conteo
son aquellas que son usadas para enumerar eventos difciles de
cuantificar. Es necesario desarrollar algunas tcnicas de
enumeracin entre las cuales esta: el Anlisis Combinatorio.

7.5.1 ANALISIS COMBINATORIO


El anlisis combinatorio estudia las distintas formas de agrupar y ordenar los elementos
de un conjunto, sin tener en cuenta la naturaleza de estos elementos. Con este fin, nos
apoyaremos en los conceptos permutaciones y combinaciones, los cuales tienen como
base el principio fundamental del conteo.

7.5.2 PERMUTACIONES
Son eventos de tipo multiplicativo, donde el nmero de posibilidades va disminuyendo y si
importa el orden una permutacin es un arreglo de un conjunto de objetos en un orden
definido. El nmero de permutaciones diferentes de estos objetos es; esto se ve
fcilmente si pensamos que para la primera alternativa disponemos de los elementos del
conjunto, cada uno de los cuales puede complementarse con los restantes como
segunda opcin, y as hasta llegar a la ltima eleccin, conformando el producto. El
nmero de permutaciones posibles al tomar objetos del conjunto de elementos ser,
siguiendo el mismo razonamiento.

A. PERMUTACIONES DE n ELEMENTOS
Por el principio fundamental del conteo podemos enunciar que el nmero de
permutaciones de n objetos distintos tomados de n en n, es: Pn = n!
El smbolo ! se lee factorial y es el producto resultante de todos los enteros positivos de 1
a n; es decir, sea n un nmero entero positivo, el producto n (n-1) (n-2)...3 x 2 x 1 se
llama factorial de n.
n! = n (n -1 ) (n -2 )...3 x 2 x 1
5! = 5 x 4 x 3 x 2 x 1 = 120
Por definicin 0! = 1

Ejemplo1: Se quiere conocer el conjunto de todas


las disposiciones posibles de tres personas
sentados en una banca.P3 =3! =6 entonces
={abc, acb, bac, bca, cab, cba}

Ejemplo2: Cinco personas desean nombrar un Comit Directivo compuesto de un


presidente, un vicepresidente, un secretario, un tesorero y un vocal. Cuntas maneras
hay de constituir el comit? P5 =5! =120
Ejemplo3: Hay seis banderas de distintos colores. Cuntas seales diferentes se
pueden enviar usando las seis banderas al mismo tiempo? P6 =6! =720

B. PERMUTACIONES CIRCULARES. Cuando los elementos se encuentran dispuestos en


forma circular tenemos:
n Pc = (n 1)!

Ejemplo 4: De cuntas maneras se


pueden sentar 6 personas alrededor de
una mesa circular?
6 Pc= (6 1)!= 5!= 120

7.5.3 COMBINACIONES
Son eventos similares a las
permutaciones. Pero el orden ya no importa y es necesario eliminar de las permutaciones
aquellas donde los elementos se repiten aunque con distinto orden

Una combinacin es una seleccin de objetos sin importar el orden en que se escojan:
Ejemplo5: Se tienen cinco obreros para un trabajo especial que requiere de tres de ellos.
De cuntas maneras diferentes se puede seleccionar un equipo de tres?

Ejemplo6: De un club de 20 socios, se van a seleccionar 3 para formar la mesa directiva.


De cuntas formas puede constituirse?

7.6. CONCEPTO CLSICO DE PROBABILIDAD

Dado un evento A, asociado a un experimento aleatorio, se llama probabilidad de A, y se


representa por el smbolo P(A), al cociente que se obtiene dividiendo el nmero de resultados
favorables para la ocurrencia del evento, entre el nmero total de posibilidades nmero de
elementos del espacio muestral ( ). Y se denota por:
#( A)
P ( A)
#( )
Ejemplo7: En el experimento de lanzar un dado,
Determinar la probabilidad de que en la cara superior aparezca el nmero 5
1, 2, 3,4,5,6 , 6 resultados posibles

1
Sea el evento A 5 , un resultado favorable P ( A) 0,167
6
Determinar la probabilidad de que se obtenga un nmero par
3 1
Sea el evento B 2, 4, 6 , 3 resultados favorables P ( B ) 0,5
6 2

7.6.1 PROPIEDADES DE LAS PROBABILIDADES


Sean los eventos A y B asociados al espacio muestral . Entonces se cumplen las
siguientes propiedades.
i. 0 P ( A) 1

ii. P ( ) 1 es decir, la probabilidad del suceso seguro , es igual a la unidad.

iii. P 0

iv. P A B P A P B P A B .

v. P ( A B ) P ( A) P ( B ) para todo A y B eventos disjuntos( A B )


Ejemplo8: En cierta ciudad, la probabilidad que una familia tenga televisor es 0.75, un
refrigerador es 0.60 y que tengan ambos es 0.50 Cul es la probabilidad que una familia
tenga un refrigerador o un televisor?
Solucin: P (T ) 0.75 P ( R) 0.60 P (T R) 0.50

P T R 0.75 0.60 0.50 0.85

7.7. PROBABILIDAD CONDICIONAL

Ocurre cuando dos eventos se relacionan de manera tal que la probabilidad de ocurrencia de
uno depende de la ocurrencia del otro.
Definicin: Sean A y B dos eventos tal que P( B ) 0 , la probabilidad condicional de que
ocurra el evento A dado que ha ocurrido B, se denota:

P( A B )
P( A / B )
P( B )

Ejemplo9: En una ciudad el 55% de los habitantes consume arroz, el 30% consume trigo y el
20% consume ambos. Se pide: A= Arroz T= Trigo
a) Cul es la probabilidad de que coma trigo dado que consumi arroz?
P(T A ) 0.20
P(T / A ) 0.364
P( A ) 0.55

b) Sabiendo que un habitante consume trigo, cul es la probabilidad de que consuma arroz?.
P(T A ) 0.20
P( A / T ) 0.667
P(T ) 0.30

Ejemplo10: En una universidad el 70% de los estudiantes son de ciencias y el 30% de letras;
de los estudiantes de ciencias el 60% son varones y los de letras son varones el 40%. Si se
elige aleatoriamente un estudiante, calcular la probabilidad que:
a) Sea un estudiante varn
b) Sea un estudiante varn si es de ciencias
c) Sea un estudiante de ciencias si es varn
d) Sea un estudiante de ciencias y varn

Solucin: Ordenando los datos en una tabla


Esp/Sexo Varones Mujeres Total
Ciencias 0.42 0.28 0.70
Letras 0.12 0.18 0.30
Total 0.54 0.46 1.00

P( C V ) 0.42
a) P(V ) 0.54 c) P( C / V ) 0.778
P(V ) 0.54
P(V C ) 0.42
b) P(V / C ) 0.6 d) P(V C ) 0.42
P( C ) 0.70
7.7.1 REGLA DE MULTIPLICACIN
Se define a partir de la probabilidad condicional:
Definicin: Sean A y B dos eventos cualesquiera, entonces se tiene:
P( A B ) P( A )P( B / A ) P( B )P( A / B )

Ejemplo11: En un sistema de alarma, la probabilidad de que se produzca un peligro es


0.10. Si este se produce, la probabilidad de que la alarma funcione es de 0.95. La
probabilidad que funcione la alarma sin haber habido peligro es 0.03. Determinar la
probabilidad que haya un peligro y la alarma no funcione.
Solucin:

P( P F ) P( P )P( F / P ) 0.10( 0.05 ) 0.005

7.7.2 TEOREMA DE LA PROBABILIDAD TOTAL


Definicin: Sea A1 , A2 , ...., An una particin del espacio muestral tal que: P( Ai ) 0 ,

entonces para cualquier evento B de se tiene:


n
P( B ) P( Ai )P( B / Ai ) P( A1 )P( B / A1 ) P( A2 )P( B / A2 ) ... P( An )P( B / An )
i 1

Ejemplo12: Se conoce que cierta mquina que produce tornillos trabaja correctamente el
90% del tiempo. Si la mquina no est trabajando correctamente, el 5% de los tornillos
producidos son defectuosos. Cuando est trabajando bien solamente el 0.5% de tornillos
son defectuosos. Si se escoge un tornillo aleatoriamente Cul es la probabilidad que
sea defectuoso?

P( D ) P( C )P( D / C ) P( C )P( D / C )
= 0.90( 0.005 ) 0.10( 0.05 ) 0.0095
7.8. TEOREMA DE BAYES
Si los eventos A1 , A2 , ...., An forman una particin del espacio muestral , y B un evento

cualquiera de , entonces:
P( Ai )P( B / Ai )
P( Ai / B ) n

P( A )P( B / A )
i 1
i i

Ejemplo 1: En una lnea de produccin hay dos procesos A y B. En el proceso A hay un 20%
de defectuosos y en B 25%. En una muestra de 300 productos
hay 200 de A y 100 del B.
a) Si se extrae un producto al azar, hallar la probabilidad que
sea defectuoso.
b) Si al extraer el producto result defectuoso, halle la
probabilidad de que sea del proceso A.

Solucin: Sean los siguientes eventos:


A: El producto es del proceso A B: El producto es del proceso B
D: El Producto es defectuoso D : El Producto es no defectuoso

a) Aplicaremos Teorema de la Probabilidad Total:


200 100
P( D ) P( A )P( D / A ) P( B )P( D / B ) = ( 0.20 ) ( 0.25 ) 0.217
300 300
b) Aplicando Teorema de Bayes:
P( A )P( D / A ) ( 2 / 3 )( 0.2 )
P( A / D ) 0.615
P( A )P( D / A ) P( B )P( D / B ) ( 2 / 3 )( 0.2 ) ( 1 / 3 )( 0.25 )
ACTIVIDADES
EJERCICIOS DE APLICACIN DE UNIDAD3
1. La direccin de una empresa quiere estudiar la rentabilidad de su inversin en publicidad. Para ello ha
recogido datos del volumen de ventas y del gasto en publicidad referidos a los aos 2000 - 2009
expresados en millones de soles.
Ao 2000 2001 2002 2003 2004 2005 2006 2007 2008 2009
Ventas 50 100 150 200 200 300 400 500 650 700
Gasto publicidad 10 15 18 20 25 35 50 55 60 65

a) Construya el diagrama de dispersin y calcule el coeficiente de correlacin, la covarianza e interprete.


b) Especifica y estima el modelo lineal que explique las ventas de la empresa en funcin de la inversin
publicitaria. Interpreta los parmetros estimados.
c) En el ao 2010, la empresa va a invertir 85 millones de soles en publicidad. Calcula el volumen de
ventas esperado.

2. Una casa de empanadas realiza promociones a travs de publicidad repartiendo volantes publicitarios. Se
cree que existe relacin entre x cantidad de volantes repartidos por semana en cientos e y ventas en
cientos de pesos. Se tomaron 8 semanas al azar que arrojaron la siguiente informacin:

a) Determine en qu medida la variable cantidad de volantes explica las variaciones de las ventas.
b) Determine la recta de ajuste e interprete los coeficientes.
c) Pronostique el valor las ventas, cuando se reparten 350 volantes.

3. Los siguientes datos corresponden al nmero de policas destacados por da (durante una semana) y al
nmero de asaltos que se produjeron en cierto distrito.

N policas en servicio 20 40 45 60 32 25 28
N de asaltos 54 25 20 12 27 48 42

a) Identifique cual es la variable dependiente y cual la independiente.


b) Construya el diagrama de dispersin y calcule el coeficiente de correlacin e interprete.
c) Estima la ecuacin de regresin lineal e Interpreta los coeficientes estimados.
d) Calcule el Coeficiente de Determinacin e interprete
e) Si se destacan 15 policas para proteccin policial cuntos asaltos se espera que se produzcan?

4. Si se tienen la ecuacin de regresin: X: Gasto de una familia


Y: Ahorro de una familia
y 500 1,7 x r 0,81
a) Interpreta el coeficiente de correlacin y determinacin e interprete
b) Interpreta los coeficientes de la ecuacin regresin
c) Cunto se espera que ahorre una familia cuyo gasto es S/. 280?

5. De cuantas maneras se pueden colocar 12 nios en una fila, de manera que cuatro nios, en particular
queden juntos?
6. Hay dos obras de 3 volmenes y otras de dos volmenes cada una De cuantas maneras pueden
colocarse los diez libros en un estante, si deben quedar de tal manera que no se separen los volmenes
de la misma obra?

7. Al planificar una familia de 4 nios, una pareja est interesada en los siguientes eventos:
A: Todos del mismo sexo B: Exactamente un varn C: Por lo menos dos varones
Liste los elementos de los eventos A, B y C

8. En una caja hay 20 bolas numeradas del 1 al 20. Se extrae al azar una bola Cul es la probabilidad que
el nmero de la bola extrada?
a) No exceda de 20 ; b) Sea el 32 ; c) sea por lo menos 15

9. De una baraja de 52 naipes bien mezclada se sacan 5 naipes. Hallar la probabilidad de que:
a) 4 sean ases; b) 4 sean ases y 1 rey;
c) 3 sean dieces y 2 Jotas ; d) al menos uno sea un as

10. Para obtener licencia para conducir, es necesario aprobar tanto el examen terico como el prctico. Se
sabe que la probabilidad que un alumno apruebe la parte terica es 0,68, la de que apruebe la parte
prctica es 0,72 y la de que haya aprobado alguna de las dos partes es 0,82. Si se elige un alumno al
azar, cul es la probabilidad de que apruebe el examen para obtener licencia?

11. Suponga que se estudia si el color del pelo est asociado al color de los ojos. Se analizaron 300
personas seleccionadas aleatoriamente con los siguientes resultados:

Si se selecciona una de estas personas al azar, encuentre la probabilidad de que:


a) La persona tenga los ojos de color azul
b) La persona tenga pelo color rubio o los ojos de color azul
c) La persona tenga el pelo negro, dado que tiene los ojos de color caf.

12. En un supermercado el 70% de las compras las realizan las mujeres; de las compras realizadas por
estas, el 80% supera los S/. 2000, mientras que de las compras realizadas por hombres slo el 30%
supera esa cantidad. (Construya el diagrama del rbol)
a) Elegido un ticket de compra al azar, cul es la probabilidad de que supere los S/. 2000?
b) Si se sabe que el ticket de compra no supera los S/. 2000. cul es la probabilidad de que la compra
haya sido hecha por una mujer?
AUTOEVALUACIN N 3
1. Un hipermercado ha decidido ampliar el negocio. Decide estudiar de forma exhaustiva el nmero de cajas
registradoras que va a instalar, para evitar grandes colas. Para ello, se obtuvieron los siguientes datos
procedentes de otros establecimientos similares acerca del nmero de cajas registradoras y del tiempo
medio de espera.

N de cajas registradoras 10 12 14 12 18 20

Tiempo medio de espera 59 51 42 32 26 22

a) Identifique cual es la variable dependiente y cual la independiente.


b) Calcule el coeficiente de correlacin y determinacin e interprete
c) Estima la ecuacin de regresin lineal que explique el tiempo medio de espera en funcin del
nmero de cajas registradoras. Interprete los coeficientes b0 y b1.
d) Predecir el tiempo medio de espera de un establecimiento con 25 cajas registradoras.

2. Un estudio de mercado en una ciudad indica que, durante cualquier semana, el 18% de los adultos vieron
un programa de televisin orientado a temas financieros y empresariales, el 12% leen una publicacin
orientada a esta temtica y el 10% realizan ambas actividades.
a) Cul es la probabilidad de que un adulto de esta ciudad vea el programa de televisin o lea la
publicacin mencionada?
b) Cul es la probabilidad de que un adulto de esta ciudad, que lee la publicacin, vea dicho programa
de televisin?

3. El administrador de una obra encargada de la construccin de una autopista, sabe que el terminar a
tiempo puede demorarse por causa de una huelga. Adems sabe que debido al ambiente laborar, la
posibilidad de que exista una huelga es de 60%. Tambin sabe que de no darse la huelga la probabilidad
de acabar a tiempo es de 85%, mientras que si la huelga se da es de 0.35.
a) Cul es la probabilidad de no acabar la obra a tiempo?
b) Cul es la probabilidad de que tras haberse acabado la obra, durante la misma se haya conjurado
una huelga?
c) Cul es la probabilidad de que dado que no se acab la obra a tiempo no se haya conjurado la
huelga?

4. Se hace una encuesta en un grupo de 120 personas, preguntando si les gusta leer y ver la televisin. Los
resultados son:
A 32 personas les gusta leer y ver la tele.
A 92 personas les gusta leer.
A 47 personas les gusta ver la tele.
Si elegimos al azar una de esas personas:
a) Cul es la probabilidad de que no le guste ver la tele?
b) Cul es la probabilidad de que le guste leer, sabiendo que le gusta ver la tele?
c) Cul es la probabilidad de que le guste leer?
UNIDAD 4

VARIABLE ALEATORIA Y PRINCIPALES


DISTRIBUCIONES ESTADISTICAS

En esta ltima unidad se explicara el concepto de variable aleatoria asociada a un funcin de


probabilidad y se conocer las principales distribuciones de probabilidad discretas y continuas.

OBJETIVOS ESPECFICOS

Describir el comportamiento de variables aleatorias a partir de las funciones de distribucin de


probabilidad y densidad de probabilidad.
Describir el comportamiento de variables aleatorias a partir de los conceptos de esperanza y
varianza.
Comprender y diferenciar los diferentes tipos de distribuciones de probabilidad discreta y
continua, aplicando sus diversas funciones.

CONTENIDO TEMTICO

Tema VIII: Variable Aleatoria


Tema IX: Distribuciones Estadsticas Principales
TEMA
VARIABLE ALEATORIA
VIII

Muchas veces se desea resumir con un nmero el resultado de un experimento aleatorio. En


muchos de los ejemplos relativos a experimentos aleatorios que han sido considerados hasta
ahora, el espacio muestral es slo una descripcin de los posibles resultados. En algunos casos
tales descripciones son suficientes, pero en otros se hace til asociar un nmero con cada
resultado del espacio muestral. Es as como se llega a la definicin de variable aleatoria.

8.1. DEFINICIN

Una variable aleatoria Xes un nmero real asociado al resultado de un experimento


aleatorio, es decir a una funcin real en el espacio muestral. El conjunto de los posibles
valores de la variable aleatoria X se denomina rango.

Ejemplo1: Sea el experimento aleatorio Lanzar una moneda 2 veces y observar su


resultado, entonces ss,cs,sc,cc y sea X la variable N de caras obtenidas donde X

es una funcin definida sobre .

ss, cs, sc, cc



x(ss) x(cs) x(sc) x(cc)
0 1 1 2
Entonces X(w) tiene como dominio el espacio muestral y como rango

X: 0, 1, 2
Rx x / x 0,1,2 ; en smbolos
w X(w)

TIPOS DE VARIABLES ALEATORIAS

Variable aleatoria discreta: se dice que una variable aleatoria es discreta si el conjunto de
todos los valores que puede tomar es un conjunto numerable.
Variable aleatoria continua: se dice que una variable aleatoria es continua si el conjunto
de todos los valores que puede tomar no es numerable.
8.2. VARIABLE ALEATORIA DISCRETA

Se llama variable aleatoria discreta si el rango de la variable aleatoria X es un conjunto finito


o infinito numerable.

Rx x1 , x2 , x3 ,......

Ejemplo2: En 100 das de trabajo, los records de los empleados se marcan cada da que
ellos estn ausentes del trabajo. Se selecciona aleatoriamente un record y se observa los
das marcados. Hallar Rx

Rx 0,1,2,3,....,100

8.2.1. FUNCION DE DISTRIBUCIN DE PROBABILIDAD

La distribucin de probabilidad de X ser la descripcin del conjunto de valores posibles


de X (rango de X), junto con la probabilidad asociada con cada uno de estos valores. Se
denota por:

p(x)=p X=x P w

A esta funcin de probabilidad tambin se le conoce como funcin de cuanta de X.


Diremos que la funcin p(x)=P(X=x) que va del conjunto de valores posibles de la
variable aleatoria X al intervalo [0, 1] es la funcin distribucin de probabilidad para X
si y slo si se satisfacen las siguientes propiedades:
0 p(x) 1 x Rx
p(x) 1
xRx

p(x)=0 si x x j j=1,2,3....

8.2.2. REPRESENTACIN TABULAR DE LA FUNCION DE PROBABILIDAD


Se denomina distribucin de probabilidad Al conjunto de pares ( x; p( x )) x Rx

X x1 x2 xk

p(x) p(x1 ) p(x2 ) . p(xk )

Ejemplo 3: En el experimento anterior Lanzar una moneda 2 veces y observar su


resultado y siendo X una V.A. N de caras obtenidas.
a) Describe el dominio de X: ss,cs,sc,cc
b) Hallar el rango de X: Rx 0, 1, 2

c) Hallar la distribucin de probabilidad en forma tabular

X 0 1 2
p(x) 1/4 2/4 1/4

8.2.3 FUNCIN DE DISTRIBUCIN ACUMULADA DE UNA V.A. DISCRETA


Se denota por F(x) , x y es dado por:

F( x ) P X x p( x i )
xi x

Ejemplo 4: En el ejemplo 3 hallar la funcin de Distribucin Acumulada F(x):


Solucin: su funcin de distribucin acumulada ser:

X 0 1 2
p(x) 1/4 2/4 1/4
F(x) 1/4 3/4 1

8.2.4 PROPIEDADES: Para todo a, b se tiene

a) P X>b 1 P X b

b) P X<b P X b P X b

c) P a<X b P X b P X a

d) P a X b P X b P X a

e) P a X b P X b P X a

8.2.5 ESPERANZA MATEMATICA DE UNA V.A. DISCRETA


Tambin se le conoce como promedio o media aritmtica y est definida por:

=E X xi p( xi )
j 1

Propiedades: i) E c c ; donde c es una constante

ii) E ax b aE x b

8.2.6 VARIANZA DE UNA V.A. DISCRETA


n
Var x E x E x 2 E( x ) ; donde E x 2 xi2 p( xi )
2 2 2

i 1

Propiedades: i) Var c 0 ; donde c es una constante


ii) Var ax b a 2Var x

Ejemplo5: Una determinada marca de coches, ante la competencia existente en el


mercado para la venta de coches nuevos, ha decidido rebajar sus precios con el fin de
aumentar las ventas y disminuir sus existencias. El director comercial ha estimado la
siguiente distribucin de probabilidad del nmero total X de coches, que se vendern el
prximo mes despus de rebajar los precios.

X 0 1 2 3 4
P(x) a 0.15 0.35 5a 0,20

a) Calcular el valor de a
b) Hallar su funcin de distribucin acumulada
c) Obtener el promedio y desviacin estndar del nmero de coches que espera vender.
d) Calcular P 1 X 4 ; P X 3 ; P X 2

Solucin:
a) Aplicando la propiedad de que la suma de todas las probabilidades es 1 tenemos que:
6a 0.70 1 entonces a 0.05

b) Hallando F(X)

X 0 1 2 3 4
P(x) 0.05 0.15 0.35 0.25 0,20
F(X) 0.05 0.20 0.55 0.80 1

c) Numero promedio de coches vendidos

E x 0 0.05 1 0.15 2 0.35 3 0.25 4 0.20 2.4

Varianza y desviacin estndar

E x 2 0 2 0.05 12 0.15 2 2 0.35 3 2 0.25 4 2 0.20 7

Var x 7 2.4 2 1.24

Entonces la desviacin estndar Sx 1.24 1.11

d) Calculando segn la tabla:

P 1 X 4 0.15 0.25 0.35 0.75


P X 3 0.05 0.15 0.35 0.55

P X 2 0.35

8.3. VARIABLE ALEATORIA CONTINUA

Una Variable aleatoria X : es llamada continua cuando el rango Rx , es un

intervalo o una coleccin de intervalos sobre la recta real.

Ejemplo 1: Sea X la variable aleatoria N de kilogramos que pierde una persona al seguir
una dieta durante cierto periodo. Su Rx pueden ser todos los puntos de un intervalo como

1;3 .
Ejemplo 2: Sea X: Tiempo de vida de un transistor. Es variable aleatoria continua por que
Rx puede ser 0;+

8.3.1 FUNCIN DE DENSIDAD DE PROBABILIDAD


Sea X una V.A. Continua con rango Rx . La funcin de densidad asociado a la V.A.

es una funcin f(x) integrable que se satisface las siguientes condiciones:

f(x) 0 ; x Rx


Rx
f ( x )dx 1

Para todo a,b Rx con a b se cumple: P a x b f ( x )dx


a

Ejemplo 3: Sea X una V.A. con funcin de densidad:

f ( x) a(3x x 2 ) , Si 0 x 3

0 , En otros caso

a) Encuentre el valor de la constante a


b) Calcular la probabilidad que X est en el intervalo 1, 2

Solucin: Todos los Rx 0,3 entonces:


3
3
3 x2 x3 27 2
a) a( 3 x x )dx a a 9 1 a
2

0 2 3 0 2 9
2
2
x2 2 x3
b) P 1 x 2 3 x x dx
2 13
2

1
9 3 27 1 17

8.3.2 ESPERANZA MATEMTICA DE UNA V.A. CONTINUA

EX x. f ( x )dx
Rx

8.3.3 VARIANZA DE UNA V.A. CONTINUA

Var x E x 2 E( x )
2

Donde: E x x
2 2
. f ( x )dx
Rx

Ejemplo 4: Hallar la Esperanza Matemtica y Varianza en el ejemplo 3


3
3 3
6 x2 2 x3 2 x3 x4
9 9 9 9 18 1.5
2x
a) E X 3 x x 2
dx dx
0 0 0

b) Var x E x 2 E( x ) 2.7 1.5 0.45


2 2

3
2 x2
3 3
6 x3 2 x4 x4 2 x5
E X
2
3 x x dx 9 9 dx 6 45 2.7
2

0 0
0
9
PROBLEMAS DESARROLLADOS
1). Se desea saber si se acepta o no con los siguientes datos:

= 850
n = 46
= 650
S = 460
= 5% = 0.05
1 = 1 5% = 95%
Z = 1.96 (Teora)


Z=

-2.9 -1.96 1.96
650850
Z= 460
46
Z= -2.9

= 850 (No se acepta)

2 ) . D et e r m i n a r e l p or c e n t aj e d e p o b l a c i n q u e o b t e n dr a u n c o ef i c i e n t e e nt r e
95 y 110.

3) Qu intervalo centrado en 100 contiene al 50% de la poblacin?

4). En una poblacin una variable aleatoria sigue una ley normal de media

desconocida y desviacin tpica 2.

1. Observada una muestra de tamao 400, tomada al azar, se ha obtenido una

media muestra al igual a 50. Calcule un in tervalo, con el 97 % de confianza, para

la media de la poblacin.
2. Con el mismo nivel de confianza, qu tamao mnimo debe tener la muestra

para qu la am plitud del intervalo que se obtenga sea, com o m xim o, 1?

n 76

3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o


continuas.

1 La nacionalidad de una persona.

Cualitativa

2 Nmero de litros de agua contenidos en un depsito.

Cuantitativa contina.

3 Nmero de libro en un estante de librera.

Cuantitativa discreta.

4 Suma de puntos tenidos en el lanzamiento de un par de dados.

Cuantitativa discreta.

5 La profesin de una persona.

Cualitativa.
6 El rea de las distintas baldosas de un edificio.

5). En una distribucin normal de m edia 4 y desviacin tpica 2, calcular el


valor de a para que: P (4a x 4+a) = 0.5934

Solucin:

5). Se tiene informacin respecto al rendimiento de los estudiantes de un centro educativo

Nota Global de Frecuencias


cada Alumno
[10 , 12] 250
(12 , 14] 150
(14 , 18] 100
(18, 20] 20
Total

Calcular el coeficiente de variacin.


Interpretar.
Solucin:

i) Clculo de la Media:

fi Marca de
Li Ls Clase (mi) fi . mi
10 12 250 11 2750
12 14 150 13 1950
14 18 100 16 1600
18 20 20 19 380
n = 520 = 6680

.
=

6680
=
520

= 12.85

ii) Clculo de la Varianza:

fi Marca de
Li Ls Clase (m) f.m2
10 12 250 11 30250
12 14 150 13 25350
14 18 100 16 25600
18 20 20 19 7220
n = 520 = 88420

( 2 ) ( 2 )
2 =
1

88420 (520 12.852 )


2 =
520 1

88420 (520 165.12)


2 =
519
88420 85862.4
2 =
519

2557.6
2 =
519

2 = 4.93
iii) Clculo de la Desviacin Estndar:

= 2

= 4.93

= 2.22

iv) Clculo del Coeficiente de Variacin:


. . = 100%

2.22
. . = 100%
12.85

. . = 17.28%

v) Interpretacin:

a. El coeficiente de variacin obtenido se podra usar de diversas formas para obtener conclusiones
sobre las evaluaciones de estos alumnos. Por ejemplo, en caso que estos datos correspondan a
una muestra de alumnos y no a la poblacin completa, una de los usos del C.V. podra ser para
conocer el nivel de confiabilidad que podramos tener al inferir sobre lo que ocurre con la poblacin
total a partir de los resultados de esta muestra. Si ese fuese el caso, un C.V. de 17.27% (que es el
que hemos obtenido en este ejercicio) tal vez podra considerarse muy alto como para considerar
que las conclusiones sobre la poblacin seran precisas. Normalmente, un C.V. alrededor de 5% o
hasta 8% podra considerarse como mediciones precisas, dependiendo de la metodologa. De igual
forma, teniendo un C.V. por encima de 15% podramos estar hablando de una precisin regular, y
con ms de 20% la medicin se tomara como poco precisa. Dado nuestro resultado de 17.27%,
podramos decir que una proyeccin de la distribucin de las evaluaciones sobre la poblacin entera
de estudiantes podra tener una precisin solamente regular.

b. Por otro lado, si los datos corresponden a toda la poblacin, el C.V. podra usarse ms bien para
tener una idea sobre el grado de dispersin de las evaluaciones de los alumnos. Este grado de
dispersin se usara como complemento a la visin que nos proporciona la media. En este ejercicio,
la media es de 12.85. Bajo un anlisis superficial, uno podra pensar que la mayora de los alumnos
tienen una nota alrededor de ese valor. Sin embargo, eso podra no ser correcto, ya que la media
puede ser el resultado simplemente de valores extremos como 07 y 19, y podra ser que nadie
tenga evaluaciones alrededor de 12.85. Para saber si esto es realmente as, es que adems de
mirar la media, tambin consideramos la desviacin estndar y el C.V. En nuestro ejercicio, hemos
obtenido una desviacin estndar de 2.22, que nos indica que probablemente la mayora de los
alumnos tengan evaluaciones ms o menos entre 10.6 y 15. Esto nos da una figura ms clara sobre
cmo estn en su rendimiento la mayora de los alumnos, independientemente de los valores
extremos que puedan existir. En conclusin, una mirada combinada de la media y el C.V. de los
alumnos de este centro educativo nos da una idea ms completa y real del nivel de rendimiento de
la mayora de sus alumnos.

c. Tomando en cuenta lo anterior, dicho anlisis combinado de media y C.V. podra tambin permitir a
las autoridades del centro educativo comparar los resultados de sus alumnos ao tras ao y ver si el
nivel acadmico reflejado por las evaluaciones va mejorando, est estancado y viene decayendo.
Adems, si este centro educativo pudiese acceder a informacin similar de otros centros educativos
de su mismo segmento de relevancia, podra comparar el rendimiento de sus alumnos con los de
estos otros centros, ubicarse en un ranking, y tal vez adoptar mejores prcticas de aquellos centros
que obtienen mejores resultados con sus estudiantes.
6). Los ingresos diarios (en dlares) de 40 trabajadores del Poder Judicial se presentan en la siguiente
tabla:

Tabla No. 3
Ingreso de Trabajadores del Poder Judicial

Ingresos fi mi fixmi fixmi2


[20 40> 6 30 180 5400
[40 60> 14 50 700 35000
[60 80> 12 70 840 58800
[80 100> 2 90 180 16200
[100 120> 6 110 660 72600
Total n=40 =2560 =188000

1. Calcular el coeficiente de variacin.


Paso 01: Media Aritmtica
2560
= = 64 = 64
40

Paso 02: Varianza

188000(40)(64)2
2 = = 619.49 2 = 619.49
39

Paso 03: Desviacin Estndar

= 619.49 = 24.89 = 24.89

Paso 04: Coeficiente de Variacin


24.89
. . = 100% = 38.89% . . = . %
64

Interpretacin:

Nos indica un 38.89% de variacin de datos respecto de la media aritmtica, por lo que podemos decir que
la media aritmtica es poco representativa, no es tan confiable porque hay dispersin de los datos.
TEMA DISTRIBUCIONES ESTADISTICASPRINCIPALES
IX

9.1 DISTRIBUCIN BINOMIAL

Una distribucin binomial es una distribucin de probabilidad ampliamente utilizada de una


variable aleatoria discreta es la distribucin binomial. Esta describe varios procesos de inters
para los administradores.
Describe datos discretos, resultantes de un experimento denominado proceso de Bernoulli en
honor del matemtico suizo Jacob Bernoulli, quien vivi en el siglo XVII.

9.1.1 PROCESO DE BERNOULLI


Definicin: Tiene que ver con el experimento aleatorio que produce en cada ensayo o
prueba uno de dos resultados posibles mutuamente excluyentes: ocurrencia de un criterio
o caracterstica especfico (llamado xito) y no ocurrencia de ste (llamado fracaso). Los
trminos o calificativos de "xito y fracaso" son solo etiqutas y su interpretacin puede
no corresponder con el resultado positivo o negativo de un experimento en la realidad.
Ejemplos
xito podra ser hallar en un ensayo especfico que la unidad es defectuosa al
examinarla. Cada experimento aleatorio consiste en una serie de ensayos o pruebas
repetidas realizadas en idnticas condiciones ( veces), o sea que cada uno de ellos es
independiente de los dems.
Sea la probabilidad de xito cada vez que el experimento se realiza y la
probabilidad de fracaso. Sea X la variable aleatoria que representa el nmero de xitos
en los ensayos o pruebas. El inters se centra en conocer la probabilidad de obtener
exactamente xitos en esos ensayos.
Los resultados en la primera categora se definen como "xito" y los resultados en la
segunda categora se definen como "fracaso".

9.1.2 EXPERIMENTO BINOMIAL


Definicin: Un experimento sigue una Distribucin Binomial si satisface los siguientes
supuestos:
i) El experimento consiste en n ensayos de Bernoulli, donde cada ensayo tiene slo dos
resultados posibles xito y fracaso

ii) La probabilidad de xito de un ensayo es igual a p y es constante para todos los

ensayos. La probabilidad de fracaso es q 1 p

iii) Los ensayos son independientes. Es decir, el resultado (xito o fracaso) de cualquier
ensayo es independiente del resultado de cualquier otro ensayo.
Definimos la variable aleatoria X de la siguiente manera:
X ( w ) : N de xitos en n ensayos de Bernoulli

Con Rx 0,1,2,3,.....n

9.1.3 FUNCION DE DISTRIBUCIN DE PROBABILIDAD

Una V.A. X tiene distribucin binomial con parmetros n y p es decir X b( n, p ) , si


su funcin de probabilidad es dado por:

n x n x
p q ; x 0 ,1,2, ...,n
p( x ) P( X x ) x

0 ; en otro caso
Donde: pq 1

9.1.4 FUNCION DE DISTRIBUCIN DE ACUMULADA

0 ; x<0
x
n k n k
F ( x ) P( X x ) p q ;0 x n
k 0 k
1 ; x n

9.1.5 ESPERANZA MATEMTICA Y VARIANZA

Si X b( n, p ) , entonces:
i) E( X ) np

ii) Var( X ) npq

Ejemplo1: Una factora observa que en promedio, el 20% de las tuercas producidas por una
mquina son defectuosas. Si se toman 10 tuercas al azar, hallar
a) La probabilidad de que exactamente 2 sean defectuosas

b) La probabilidad de que 2 o ms sean defectuosas

c) La probabilidad de que ms de 5 sean defectuosas

d) La probabilidad que ninguna sea defectuosa

e) Hallar el promedio y varianza de tuercas defectuosas en la muestra


Solucin: X b 10,0.2 donde n 10 y p 0.2

10
a) P( X 2 ) 0.2 20.8 8 0.3020
2

b) P( X 2 ) 1 P( X 2 ) 1 P( X 0 ) P( X 1 )

10 10
1 0.20 0.8 10 0.2 10.8 9
0 1
1 0.1074 0.2684 0.6242

c) P( X 5 ) P( X 6 ) P( X 6 ) P( X 7 ) P( X 8 ) P( X 9 ) P( X 10 )

10 10 10 10
0.26 0.8 4 0.27 0.8 3 0.2 8 0.8 2 0.2 9 0.8 1 0.2 10
6 7 8 9
0.00637
(Usar tabla de distribucin binomial que esta dado en P( X x ) )

10
d) P( X 0 ) 0.20 0.8 10 0.1074
0

e) E( X ) 10( 0.2 ) 2

Var( X ) 10( 0.2 )( 0.8 ) 1.6


9.2. DISTRIBUCIN POISSON

Esta distribucin es una de las ms importantes distribuciones de variable discreta. Sus


principales aplicaciones hacen referencia a la modelizacin de situaciones en las que nos
interesa determinar el nmero de hechos de cierto tipo que se pueden producir en un intervalo
de tiempo o de espacio, bajo presupuestos de aleatoriedad y ciertas circunstancias
restrictivas. Otro de sus usos frecuentes es la consideracin lmite de procesos dicotmicos
reiterados un gran nmero de veces si la probabilidad de obtener un xito es muy pequea.
Ejemplos:
a) Nmero de llamadas telefnicas recibidas por la central telefnica durante un intervalo de
tiempo determinado.

b) Nmero de fallas de una computadora en un da de operacin.

c) Nmero de accidentes en una semana.

d) Nmero de clientes que entran a un supermercado en un da dado, etc..

Definimos la variable aleatoria X de la siguiente manera:


X ( w ) : N de ocurrencias de eventos en t unidades de medida

Con Rx 0,1,2,3,.....n

9.2.1 FUNCION DE DISTRIBUCIN DE PROBABILIDAD

Se dice que una v.a. X tiene distribucin de Poisson con parmetro 0 ; X P( ) ,


si su funcin de probabilidad es dado por:

e x
; x 0,1,2,...
p( x ) P( X x ) x!
0 ; en otro caso

Ejemplo1: Cierta oficina de bomberos recibe en promedio 3 llamadas por da. Calcular la
probabilidad de que:
a) Reciba 4 llamadas en un da

b) Reciba 3 o ms llamadas en un da
Solucin:

e 3 3 4
a) 3; P( x 4 ) 0.16803
4!

b) P( x 3 ) 1 P( x 3 ) 1 P( x 0 ) P( x 1 ) P( x 2 ) 1 0.423 0.577

Ejemplo 2: En la EUDED se reciben un promedio de 2 llamadas cada 3 minutos.


Asumiendo un proceso de Poisson:
a) Cul es la probabilidad que ocurran 5 ms llamadas en un periodo de 9
minutos?

b) Cul es la probabilidad que no haya llamadas en el mismo periodo de 9 minutos?

Solucin:
a) Primero analizamos el periodo, en 9 minutos Cuntas llamadas pueden darse?, si 2
llamadas se reciben cada 3 minutos, entonces en 9 minutos recibirn 6 llamadas.
Entonces 6

P( X 5 ) 1 P( X 5 ) 1 P( X 4 ) 1 0.285 0.715 (con tabla)

e 6 6 0
b) P( X 0 ) e 6 0.00248
0!

9.2.2 ESPERANZA MATEMTICA Y VARIANZA


Si X es una v.a. con distribucin de Poisson con parmetro 0 , entonces:
E( X )

Var( X )

9.2.3 APROXIMACIN DE UNA DISTRIBUCIN BINOMIAL A POISSON

En una distribucin Binomial, cuando n es grande (n>50) y p es pequeo ( p 0.1 ), la


distribucin Binomial se aproxima a una distribucin de Poisson con np que
permanece constante.

n e x
p( x ) P X x p x q n x ( se aproxima ) P X x
x x!
Ejemplo3: Supongamos que la proporcin de personas que tienen cierta enfermedad es
0.01. Determine la probabilidad que en un grupo aleatorio de 400 personas, al menos 6
personas tienen la enfermedad.

Solucin: Vemos que X b( 400,0.01 ) , como n =400 es grande y p 0.01 pequeo


podemos aproximar np 400( 0.01 ) 4
P( x 6 ) 1 P( x 6 ) 1 P( x 5 ) (usar tabla)
1 0.785 0.215

9.3. DISTRIBUCIN HIPERGEOMTRICA

Una variable aleatoria X tiene una distribucin hipergeomtrica si se toma una muestra sin
reemplazo de un conjunto de N elementos, de los cuales M son considerados de una categora
en especial (xitos) y los otros N-M son considerados de otra categora (fracasos) y se desea
obtener x aciertos de una muestra de n elementos ensayos. Por ejemplo, un saln de clase
con N estudiantes, de los cuales M estn aprobados y N-M desaprobados.
Definimos la variable aleatoria X de la siguiente manera:
X ( w ) Nmero de xitos en la muestra de tamao n sin reemplazo:

Rx 0,1, 2, 3,....,min( n, M )

9.3.1 FUNCIN DE DISTRIBUCIN DE PROBABILIDAD

Se expresa de la siguiente frmula:

M N M

x n x para x 0,1, 2,....., min(n, M )

P ( x ) h ( x; N , n , M ) N
n


0 en otro caso

9.3.2 FUNCIN DE DISTRIBUCIN ACUMULADA

La funcin de distribucin acumulativa de la variable aleatoria hipergeomtrica es:


0 ; x<0
x
M N-M

k 0 k n-k

F ( x ) P( X x ) ;0 x min( M ,n )
N


n

1 ; x min( M ,n )

9.3.3 ESPERANZA MATEMTICA Y VARIANZA

M
E( X ) n
N

nM M N n
2 Var( X ) 1
N N N 1

Ejemplo1: Una caja contiene 9 bateras de las cuales 4 estn en buen estado y las restantes
defectuosas. Se toma una muestra eligiendo al azar tres bateras. Calcule la probabilidad que
en la muestra se obtengan,
a) Ninguna batera en buen estado
b) Al menos una batera en buen estado
c) No ms de dos bateras en buen estado
Solucin:
Este es un experimento de muestreo sin reemplazo, por lo tanto es un experimento
hipergeomtrico con
N=9 (total de elementos del conjunto)
M=4 (total de elementos considerados xitos)
n=3 (tamao de la muestra)
X: cantidad de bateras en buen estado en la muestra (variable aleatoria discreta)
Entonces la distribucin de probabilidad de X es:

4 9 4

x 3 x
P( x) h( x;9,3, 4) = , x 0,1,2,3
9

3
4 9 4

0 3 0
a) P(X=0) = = 0.119
9

3
b) P(X1) = 1 P(X<1) = 1 - 0.119 = 0.881
c) P(X2) = P(X=0) + P(X=1) + P(X=2)

4 9 4 4 9 4 4 9 4

0 3 0 1 3 1 2 3 2
= + +
9 9 9

3 3 3
= 0.119 + 0.4762 + 0.3571 = 0.9523

Ejemplo 2: Calcule la media y la varianza para el ejemplo anterior

Solucin:
= 3(4/9) = 1.333 (es la cantidad promedio de bateras en buen estado
que se obtienen en la muestra)
3( 4 ) 4 93
2 = (1 )( ) = 0.555
9 9 91

9.4. DISTRIBUCIN NORMAL


Es un modelo matemtico que rige muchos fenmenos. La experiencia demuestra que las
distribuciones de la mayora de las muestras tomadas en el campo de la industria se aproximan
a la distribucin normal si el tamao de la muestra es grande. Esta distribucin queda definida
por dos parmetros: la media m y la desviacin tpica s. Se presenta mediante una curva
simtrica conocida como campana de Gauss. Esta distribucin nos da la probabilidad de que al
elegir un valor, ste tenga una medida contenida en unos intervalos definidos, esto permitir
predecir de forma aproximada, el comportamiento futuro de un proceso, conociendo los datos
del presente.

9.4.1 DEFINICIN
Se dice que una variable aleatoria continua sigue una distribucin normal de media y

desviacin tpica , y se escribe X N , , cuando tiene la funcin de densidad:

1 x 2
1 2
f ( x) e
2

9.4.2 PROPIEDADES DE LA DISTRIBUCIN NORMAL


La distribucin normal tiene forma de campana con distribucin de probabilidad que
tiene media = 0 y desviacin estndar = 1.
El rea bajo la curva o la probabilidad desde menos infinito a ms infinito vale 1.
La distribucin normal es simtrica, es decir cada mitad de curva tiene un rea de 0.5.
La escala horizontal de la curva se mide en desviaciones estndar.
La forma y la posicin de una distribucin normal dependen de los parmetros y ,
en consecuencia hay un nmero infinito de distribuciones normales.
EJEMPLOS

DISTRIBUCIN NORMAL
1). Un investigador cientfico reporta que unos ratones vivirn un promedio de 40 meses
cuando sus dietas se restringen drsticamente y despus se enriquecen con vitaminas y
protenas. Suponga que las vidas de tales ratones se distribuyen normalmente con una
desviacin estndar de 6.3 meses, encuentre la probabilidad de que un ratn dado viva.
40
6,3
x


a) Ms de 32 meses
3240
P (X >32) = 1 P (x<32) = 1 P (Z < )
6.3
1 P (Z < -1.27) = 1 0.10204 = 0.89796

b) Menos de 28 meses
2840
P (X < 28) = P (Z<28) = P (Z< )
6.3
P (Z < -1.90) = 0.02872

c) Entre 37 y 49 meses
3740 4940
P (37< X< 49) = P ( <Z< ) = P ( -0.48 < Z < 1.43 )
6.3 6.3
P (Z < 1.43) P (Z < -0.48)
0.92364 0.31561
0.60803

-0.48 1.43

ESTIMACIN DE PARAMETROS Y PRUEBA DE HIPOTESIS


2). Se desea estimar la proporcin de casas que tienen un televisor malogrado. Una
muestra aleatoria de 150 casas que tienen televisor revela que en 50 casas estn
malogradas.

-0.48
50
P= = 0.33
150
= 150
= 0.05 (se supone)
= 1.96 (95%)
= 0.05 = 5/100 = 5%
1 = 1 5% = 95%
z = 1.96
Solucin:

()
Pe ( P Z )

() ()
LI:( P - Z )LS: ( P + Z )

0.33 (0.67) 0.33 (0.67)
LI: 0.33 1.96 LS: 0.33 + 1.96
150 150
LI = 0.256 =
0.26 LS = 0.405 =
0.41

PRUEBA DE INDEPENDENCIA PARA DOS VARIABLES CUALITATIVAS

3). Se desea saber si se acepta o no con los siguientes datos:


= 850
n = 46
= 650
S = 460
= 5% = 0.05
1 = 1 5% = 95%
Z = 1.96 (Teora)


Z=

-2.9 -1.96 1.96
650850
Z= 460
46

Z= -2.9

= 850 (No se acepta)

9.4.3 DISTRIBUCIN NORMAL ESTANDAR

Es la Distribucin Normal con Media 0 y varianza 2 1 . La funcin de densidad


de la distribucin normal estndar usualmente se denota por el smbolo .

x2
1
( z ) e2
2

( z ) P Z z (u)du , z
z


9.4.4 ESTANDARIZACIN DE UNA VARIABLE ALEATORIA X (Para buscar en tablas)

Si X N( , 2 ) , la estandarizacin o tipificacin consiste en pasar de la v.a. X con


distribucin N(,) a una nueva v.a. Z con distribucin N(0,1) mediante la expresin:

X
Z

La cual tiene distribucin N ( 0,1 ) , esto es la V.A. Z tiene distribucin normal con media
cero y varianza 1. Este tipo de procedimiento se denomina estandarizacin de la V.A. X.

Ejemplo 1. En un examen de matemticas, la calificacin media fue 72 y varianza 225.


Determinar en unidades estndar las puntuaciones de los alumnos que obtuvieron
a) 60 , b)93 y c) 72
Solucin:

X 60 72 93 72 72 72
a) Z 0.8 b) Z 1.4 c) Z 0
15 15 15

Ejemplo 2. El gerente de personal de una gran compaa requiere que los solicitantes a
un puesto efecten cierta prueba y alcancen una calificacin de 500. Si las calificaciones
de la prueba se distribuyen normalmente con media 485 y 30

a) Cul es la probabilidad que los solicitantes pasen la prueba?

X 485 500 485


P( x 500 ) 1 P( X 500 ) 1 P 1 P Z 0.5
30 30
1 0.69146 0.30854
b) Cul es la probabilidad que un solicitante obtenga menos de 550 en la prueba?

520 485
P( x 520 ) P Z P Z 1.17 0.878
30
c) Cul es la probabilidad que un solicitante obtenga entre 450 y 510 en la prueba?
P( 450 x 510 ) P( x 510 ) P( x 450 )
510 485 450 485
PZ PZ P Z 0.83 P Z 1.17
30 30
= 0.79767 - 0.12167=0.676
PROBLEMAS DESARROLLADOS

1). En una poblacin de 2500 individuos cuntos individuos se esperan que


tengan un coeficiente superior a 125?

2). Se realiz un estudio sobre la infraestructura de los centros educativos inicial del distrito de los olivos,
durante el ao 2010.

Muy bueno Bueno Muy bueno Regular Muy bueno Bueno


Muy bueno Bueno Regular Muy bueno Muy bueno Regular
regular Regular Muy bueno Regular Bueno Bueno
Muy bueno Muy bueno Bueno Bueno Regular Muy bueno

c) A partir de los datos proporcionados construye la tabla de distribucin de frecuencias con su


respectivo ttulo.

Tabla No.1
Situacin de Infraestructura de los Centros Educativos Iniciales del Distrito de Los Olivos
variable cualitativa

Variable fi hi pi

Regular 7 0.29 29%

Bueno 7 0.29 29%

Muy Bueno 10 0.42 42%

n=24 =1 100%

d) Interpretar:

P2 = 29%

Significa que el 29% de los Centros Educativos Iniciales del Distrito de Los Olivos, en el ao 2010,
contaban con una infraestructura cuyo estado de conservacin estaba en buenas condiciones.

3). La cantidad de hemoglobina en sangre del hombre sigue una ley normal con una desviacin tpica de

2g/dl.

Calcule el nivel de confianza de una muestra de 12 extracciones de sangre que indique que la

media poblacional de hemoglobina en sangre est entre 13 y 15 g/dl.


ACTIVIDADES
EJERCICIOS DE APLICACIN DE UNIDAD4

1. Sea x una variable aleatoria que expresa el n de personas que habitan en una vivienda elegida al azar.
La distribucin de probabilidad de x es la siguiente:

xi 1 2 3 4 5 6 7
p(x) 0.230 K 0.177 0.155 0.067 0.024 0.025

a) Halla el valor de K
b) Obtener el n medio de personas que habitan en una vivienda y su desviacin estndar
c) Hallar la probabilidad que el n de personas que viven en un hogar sea como mximo cuatro.
d) Calcular la probabilidad de que al menos dos personas vivan en una vivienda.

3. El tiempo T, en minutos, necesarios para que un Psiclogo evale a un empleado sobre sus aptitudes, es
una variable aleatoria con la siguiente distribucin de probabilidad:

T 2 3 4 5 6 7
P(T) 0.15 2a 0.25 0.25 0.20 a

a) Calcula el valor de a y completa la tabla


b) Calcular la esperanza matemtica del tiempo necesario para evaluacin
c) Calcular la probabilidad de que el tiempo de evaluacin sea por lo menos de 5 minutos
d) Calcular la probabilidad de que la evaluacin sea al menos 3,5 min pero menos de 6
e) Calcular la probabilidad de que el tiempo de evaluacin sea a lo mucho de 3 minutos

4. El nmero total de horas, medidas en unidades de 100 horas, que una familia utiliza una aspiradora en un
periodo de un ao es una variable aleatoria continua X que tiene funcin de densidad:

k 0 x2
f ( x) k ( x 1) 2 x4

a) Hallar el valor k
b) Determinar su funcin F(x) y encuentre la probabilidad de que en un periodo de un ao, una familia
utilice la aspiradora por lo menos de 50 horas pero menos 240

Y 5 x 2
2
c) Calcular el promedio de la variable

5. La opinin que tiene la poblacin sobre la gestin de su Ayuntamiento es favorable en el 30% de los
casos y desfavorable en el resto. Elegidas 10 personas al azar, halla:
a) La probabilidad de que dos la consideren favorable.
b) La de que ninguno la considere desfavorable.

6. En una manzana de casas hay 10 aparcamientos. En cada aparcamiento puede encontrarse o no un


automvil, con independencia de lo que ocurra en los otros. Si la probabilidad de que un aparcamiento
est ocupado es de 0,4, se pide:
a) Identifica este modelo de probabilidad.
b) Calcula la probabilidad de que en cierto da se encuentren 8 automviles aparcados.
c) Calcula la probabilidad de que estn los 10 aparcamientos ocupados.

7. Una prisin de mxima seguridad reporta que el nmero de intentos de escape por mes sigue una
distribucin aproximadamente Poisson con una media de 1,5 intentos/mes. Calcule:
a. Probabilidad de tres intentos de escape durante el prximo mes.
b. Probabilidad de al menos un intento de escape el prximo mes.

8. Para evitar que lo descubran en la aduana, un viajero ha colocado 6 tabletas de narctico en una
botella que contiene 9 pldoras de vitamina que son similares en apariencia. Si el oficial de la aduana
selecciona 3 tabletas aleatoriamente para analizarlas,
a) Cul es la probabilidad de que el viajero sea arrestado por posesin de narcticos?,
b) Cul es la probabilidad de que no sea arrestado por posesin de narcticos?

9. Un representante realiza 5 visitas cada da a los comercios de su ramo y por su experiencia anterior
sabe que la probabilidad de que le hagan un pedido en cada visita es del 0.4. Obtener:
a) El nmero medio de pedidos por da y la varianza
b) La probabilidad de que el N de pedidos que realiza durante un da est entre 1 y 3.
c) La probabilidad de que por lo menos realice dos pedidos

10. El nmero medio de automviles que llegan a una gasolinera es de 240 por hora. Si dicha estacin
puede atender a un mximo de 8 automviles por minuto, determine la probabilidad de que, en un minuto
dado, lleguen a la estacin ms automviles de los que puede atender.
11. Un almacn recibi 2000 botellas de agua mineral. La probabilidad de que al transportar una botella
resulte rota es igual a 0.003. Hallar la probabilidad de que el almacn reciba rotas:
a) Exactamente tres botellas
b) Por lo menos 2

12. Entre los 16 aspirantes a obtener un empleo, 10 tienen grado universitario. Si para ser entrevistados se
elige al azar a tres de los solicitantes, cules son las probabilidades de que:
a)Ninguno tenga un grado universitario b) Dos tengan grado universitario

13. Una empresa lleva a cabo una prueba para seleccionar nuevos empleados. Por la experiencia de
pruebas anteriores, se sabe que las puntuaciones siguen una distribucin normal de media 80 y
desviacin estndar 25. Qu porcentaje de candidatos obtendr entre 75 y 100 puntos?

14. Las ventas diarias, en euros, en un determinado comercio siguen una distribucin con media
poblacional de 950 euros y desviacin estndar de 98 euros. Calcula la probabilidad de que las ventas
diarias en ese comercio:
a) Superen los 1200 euros. c) Sean exactamente de 1000 euros
b) Estn entre 700 y 1000 euros. d) Sean al menos1100 euros

15. Gensa es una asociacin internacional de personas con alto coeficiente intelectual. Para pertenecer a
ella, una persona debe tener un coeficiente intelectual de 132 o ms alto (USA today, 13 de febrero de
1992). Si las calificaciones del coeficiente de inteligencia se distribuyen normalmente con promedio de
100 y desviacin estndar de 15, qu porcentaje de personas califican para ser miembros de Gensa?

AUTOEVALUACIN N 4
1. El Gerente de ventas de la Librera Estudia ha determinado que la demanda por semestre del libro
Harry Potter es una variable aleatoria X con distribucin de probabilidad:

X 10 20 30 40 50
P X 0.1 2k 0.2 0.3 3k

a) Hallar el valor de K
b) Cuanto es la demanda esperada de libros
c) Calcula la probabilidad que al demanda sea a lo mucho 30 libros
d) Calcula la probabilidad que al demanda sea al menos 20 libros menos 50

2. Se sabe que el 30% de la poblacin de una determinada ciudad ve un concurso que hay en televisin.
Desde el concurso se llama por telfono a 10 personas de esa ciudad elegidas al azar. Calcula la
probabilidad de que, entre esas 10 personas, estuvieran viendo el programa:
a) Al menos 6 personas pero no ms de 8.
b) Menos de 5 personas
c) Halla la media y la desviacin tpica.

3. En una clase en la que hay 20 estudiantes, 15 estn insatisfechos con el texto que se utiliza. Si se le
pregunta acerca del texto a cuatro estudiantes tomados al azar, determine la probabilidad de que:
a) exactamente tres estn insatisfechos con el texto.;
b) cuando menos tres estn insatisfechos.
4. Desde el ao 1980 el nmero medio de empresas que han presentado suspensin de pagos ha sido de
6,8 por ao y admitimos que el nmero de empresas X que han presentado suspensin de pagos
durante un periodo determinado de tiempo sigue una distribucin de Poisson. Obtener:
a) Probabilidad de que ninguna empresa presente suspensin de pagos durante un trimestre.
b)Probabilidad de que por lo menos dos empresas presente suspensin de pagos durante un
determinado ao.

5. Los depsitos en el banco de Arequipa durante el mes de Mayo ltimo estn normalmente distribuidos,
con media S/.10000 y una desviacin estndar de 1500. Un depsito es seleccionado al azar de los
depsitos referentes al mes de Mayo. Encontrar la probabilidad de que el depsito sea:
a) menor de S/.14000
b) Por lo menos S/.12000
c) Un valor entre S/.12000 y S/.15000

SOLUCIONARIO DE AUTOEVALUACIONES

AUTOEVALUACIN DE UNIDAD I

1. a) Objetivo del problema: Conocer la experiencia promedio del trabajador


b) Variable y tipo: Aos de experiencia (Cuantitativa continua)
c) Poblacin: 1850 Trabajadores
d) Muestra: 120 trabajadores
e) Parmetro: Experiencia promedio de un trabajador
2.
N VARIABLE CUALITATIVA CUANTITATIVA
NOMINAL ORDINAL CONTINUA DISCRETA
1 Monto vendido al mes X
2 N de facturas ingresadas X
3 Impuestos por pagar anual X
4 Eficiencia de un contador X
5 Tipo de proveedor X

3.
Rentas yi fi Fi hi Hi
[ 400 - 450 425 20 20 0.051 0.051
[ 450 - 500 475 140 160 0.359 0.410
[ 500 - 550 525 180 340 0.462 0.872
[ 550 - 600 575 40 380 0.103 0.974
[ 600 - 650 ] 625 10 390 0.026 1.000
Total
a) Interpretacin
f3: 180 viviendas pagan mnimo S/. 500 en rentas pero menos de S/.550
F2: 160 viviendas pagan menos de S/.500 en rentas
b) 58.97%
4. Interpretacin: Segn el grfico las exportaciones son mayores a las importaciones desde el 2000 hasta
el 2003, teniendo un saldo positivo adems el mayor crecimiento de exportaciones fue en el 2002

AUTOEVALUACIN DE UNIDAD 2
1.
Ingresos yi fi Fi hi Hi
10 15 12.5 5 5 0.04 0.04
15 20 17.5 10 15 0.08 0.13
20 25 22.5 25 40 0.21 0.33
25 30 27.5 35 75 0.29 0.63
30 35 32.5 22 97 0.18 0.81
35 40 37.5 23 120 0.19 1.00

a) Promedio = 27.83 Mo= 27.17 Me= 27.86

b) Varianza S 46.95 , Desviacin estndar S


2
6.85
6.85
c) Se calculara el coeficiente de variacin: CV 0.246 , como el C.V. es menor de 0.30 la
27.83
distribucin de salarios es uniforme.

2.
Grado n x S n. x C.V
I 18000 8000 800 144000000 0.100
II 13000 9500 950 123500000 0.100
III 5500 11500 1100 63250000 0.096
330750000

a) Gasto total para pagar el sueldo: 330 750 000


b) El coeficiente de variacin
c) Comparando los tres coeficientes de variacin de la tabla, el grupo 3 tiene los salarios mas
homogneos.

3. A) c B) b C) d D) b

187 5009 8 23.375 2


4. x 23.375 entonces: s 91.125
2

8 7
9.55
s 9.55 C .V 0.409 0.30 La distribucin es heterognea.
23.375

AUTOEVALUACIN DE UNIDAD 3

1. 70
y = -3.2301x + 84.965
60
R = 0.742
Tiempo de espera

50
40
30
20
10
0
a) Var X: N de cajas registradoras Var Y: Tiempo medio de espera
b) r= 0.861 R2= 0.742
c) Y= 84.965 3.2301X
d) Si X=25 entonces Y= 84.965 3.2301(25)=4.21

2. P (T ) 0.18 P ( L) 0.12 P (T L) 0.10

a) P (T L) 0.20
0.10
b) P (T / L) =0.833
0.12

3.

a) P ( A) 0.6 0.65 0.4 0.15 0.45


0.6 0.35
b) P ( H / A) 0.382
0.55
0.4 0.15
c) P ( H / A) 0.133
0.45

4.

Ven tele No ven tele Total


Leen 32 60 92
No leen 15 13 28
Total 47 73 120

73 32 92
a) P (T ) 0.608 b) P ( L / T ) 0.681 c) P ( L) 0.767
120 47 120

AUTOEVALUACIN DE UNIDAD 4

1. Variable aleatoria discreta

X 10 20 30 40 50
P X 0.1 0.16 0.2 0.3 0.24
a) K=0.08
b) Demanda esperada E(X)= 34.2
c) P ( X 30) 0.46

d) P (20 X 50) 0.66

2. Aplicar Distribucin binomial:

p 0.3 q 0.7 n 10
a) P (6 X 8) P ( X 8) P ( X 6) 0.047

b) P ( X 5) 0.8497

c) E ( X ) 10 0.3 3 S( X ) 10 0.3 0.7 1.449

3. Se aplicar la distribucin Hipergeomtrica:

15 5 a) P ( X 3) 0.4695
x 4-x
b) P ( X 3) 0.7512

20
4

4. Se aplicar la distribucin Poisson:

e x
6.8 (por ao) P( X x )
x!

a) En un trimestre 1.7 entonces P( X 0 ) 0.183

b) En un ao 6.8 entonces P( X 2 ) 1 P( X 2 ) 0.9913

5. Se aplicar la distribucin Normal con :

X N( 10000,1500 2 )

a) P ( X 14000) 0.9962

b) P ( X 12000) 0.0912

a) P (12000 X 15000) P ( X 15000) P ( X 12000) 0.09078


ANEXOS
ANEXO 1
LECTURA: ESCOGIMIENTO ENTRE LA MEDIA, MEDIANA Y MODA

De las tres medidas de posicin central, la media aritmtica suele ser ms frecuentemente
utilizado, quiz por la facilidad de su clculo a pesar de que en muchas ocasiones la mediana o al
moda resultan de mayor inters.

a) La media aritmtica como medida de resumen tiene la ventaja de tomar en cuenta la


totalidad de los valores de la serie, aumentando o disminuyendo de acuerdo con ellos, pero
a causa de esta propiedad, puede ser desventajosamente afectado por la existencia de
valores anormalmente altos o anormalmente bajos. Por regla general, sin embargo puede
decirse que cuando la serie es ms o menos simtrica, el promedio debe ser preferido a
cualquier otra medida de resumen.

b) La mediana por su parte debe ser utilizada cuando entre los valores que se estudian, hay
alguno muy diferente entre los otros. Si por ejemplo, los gasto administrativos mensuales
de 5 compaas constructoras del mismo nivel fuera respectivamente 2000, 3000, 4000,
6000 y $30000; el valor ltimo, debido tal vez a que la compaa indemnizo a algn
empleado hace aparecer un incremento muy alto de lo que generalmente es.

2000 3000 4000 6000 30000 45000


El promedio: x $9000 es engaoso, pero
5 5
en cambio, la mediana que es Me 4000 , tienen la ventaja de no tomar en cuenta los
valores extremos, dando una impresin ms acorde con lo usual.
Hay adems ocasiones en que debe usarse la mediana por no ser posible el calculo del
promedio. Tal sucede en aquellas distribuciones en las cuales la primera o la ltima clase
no tienen lmites precisos.
Exceptuando estas aplicaciones, la mediana no tiene ninguna ventaja sobre la media
aritmtica, pues su valor depende solamente del nmero de trminos sin tomar en cuenta
los valores numricos de estos.

c) La moda no es una medida de tendencia central muy usual, pero se emplea cuando el
inters se centra en conocer el valor que se presenta ms frecuentemente. Por ejemplo en
los negocios, sirve para determinar qu tamao del producto es el de mayor demanda.
Similarmente para programar la produccin de un medicamento el fabricante estar
interesado en Cul es la dosis ms comnmente recetada por lo mdicos?
ANEXO 2
TABLA DE DISTRIBUCIN NORMAL ESTANDAR A1

z 0 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0.08 0.09


0 0.5 0.50399 0.50798 0.51197 0.51595 0.51994 0.52392 0.5279 0.53188 0.53586
0.1 0.53983 0.5438 0.54776 0.55172 0.55567 0.55962 0.56356 0.56749 0.57142 0.57535
0.2 0.57926 0.58317 0.58706 0.59095 0.59483 0.59871 0.60257 0.60642 0.61026 0.61409
0.3 0.61791 0.62172 0.62552 0.6293 0.63307 0.63683 0.64058 0.64431 0.64803 0.65173
0.4 0.65542 0.6591 0.66276 0.6664 0.67003 0.67364 0.67724 0.68082 0.68439 0.68793
0.5 0.69146 0.69497 0.69847 0.70194 0.7054 0.70884 0.71226 0.71566 0.71904 0.7224
0.6 0.72575 0.72907 0.73237 0.73565 0.73891 0.74215 0.74537 0.74857 0.75175 0.7549
0.7 0.75804 0.76115 0.76424 0.7673 0.77035 0.77337 0.77637 0.77935 0.7823 0.78524
0.8 0.78814 0.79103 0.79389 0.79673 0.79955 0.80234 0.80511 0.80785 0.81057 0.81327
0.9 0.81594 0.81859 0.82121 0.82381 0.82639 0.82894 0.83147 0.83398 0.83646 0.83891
1 0.84134 0.84375 0.84614 0.84849 0.85083 0.85314 0.85543 0.85769 0.85993 0.86214
1.1 0.86433 0.8665 0.86864 0.87076 0.87286 0.87493 0.87698 0.879 0.881 0.88298
1.2 0.88493 0.88686 0.88877 0.89065 0.89251 0.89435 0.89617 0.89796 0.89973 0.90147
1.3 0.9032 0.9049 0.90658 0.90824 0.90988 0.91149 0.91308 0.91466 0.91621 0.91774
1.4 0.91924 0.92073 0.9222 0.92364 0.92507 0.92647 0.92785 0.92922 0.93056 0.93189
1.5 0.93319 0.93448 0.93574 0.93699 0.93822 0.93943 0.94062 0.94179 0.94295 0.94408
1.6 0.9452 0.9463 0.94738 0.94845 0.9495 0.95053 0.95154 0.95254 0.95352 0.95449
1.7 0.95543 0.95637 0.95728 0.95818 0.95907 0.95994 0.9608 0.96164 0.96246 0.96327
1.8 0.96407 0.96485 0.96562 0.96638 0.96712 0.96784 0.96856 0.96926 0.96995 0.97062
1.9 0.97128 0.97193 0.97257 0.9732 0.97381 0.97441 0.975 0.97558 0.97615 0.9767
2 0.97725 0.97778 0.97831 0.97882 0.97932 0.97982 0.9803 0.98077 0.98124 0.98169
2.1 0.98214 0.98257 0.983 0.98341 0.98382 0.98422 0.98461 0.985 0.98537 0.98574
2.2 0.9861 0.98645 0.98679 0.98713 0.98745 0.98778 0.98809 0.9884 0.9887 0.98899
2.3 0.98928 0.98956 0.98983 0.9901 0.99036 0.99061 0.99086 0.99111 0.99134 0.99158
2.4 0.9918 0.99202 0.99224 0.99245 0.99266 0.99286 0.99305 0.99324 0.99343 0.99361
2.5 0.99379 0.99396 0.99413 0.9943 0.99446 0.99461 0.99477 0.99492 0.99506 0.9952
2.6 0.99534 0.99547 0.9956 0.99573 0.99585 0.99598 0.99609 0.99621 0.99632 0.99643
2.7 0.99653 0.99664 0.99674 0.99683 0.99693 0.99702 0.99711 0.9972 0.99728 0.99736
2.8 0.99744 0.99752 0.9976 0.99767 0.99774 0.99781 0.99788 0.99795 0.99801 0.99807
2.9 0.99813 0.99819 0.99825 0.99831 0.99836 0.99841 0.99846 0.99851 0.99856 0.99861
3 0.99865 0.99869 0.99874 0.99878 0.99882 0.99886 0.99889 0.99893 0.99896 0.999
3.1 0.99903 0.99906 0.9991 0.99913 0.99916 0.99918 0.99921 0.99924 0.99926 0.99929
3.2 0.99931 0.99934 0.99936 0.99938 0.9994 0.99942 0.99944 0.99946 0.99948 0.9995
3.3 0.99952 0.99953 0.99955 0.99957 0.99958 0.9996 0.99961 0.99962 0.99964 0.99965
3.4 0.99966 0.99968 0.99969 0.9997 0.99971 0.99972 0.99973 0.99974 0.99975 0.99976
3.5 0.99977 0.99978 0.99978 0.99979 0.9998 0.99981 0.99981 0.99982 0.99983 0.99983
3.6 0.99984 0.99985 0.99985 0.99986 0.99986 0.99987 0.99987 0.99988 0.99988 0.99989
3.7 0.99989 0.9999 0.9999 0.9999 0.99991 0.99991 0.99992 0.99992 0.99992 0.99992
3.8 0.99993 0.99993 0.99993 0.99994 0.99994 0.99994 0.99994 0.99995 0.99995 0.99995
3.9 0.99995 0.99995 0.99996 0.99996 0.99996 0.99996 0.99996 0.99996 0.99997 0.99997
4 0.99997 0.99997 0.99997 0.99997 0.99997 0.99997 0.99998 0.99998 0.99998 0.99998
TABLA DE DISTRIBUCIN NORMAL ESTANDAR A2

z 0.09 0.08 0.07 0.06 0.05 0.04 0.03 0.02 0.01 0


-4 0.00002 0.00002 0.00002 0.00002 0.00003 0.00003 0.00003 0.00003 0.00003 0.00003
-3.9 0.00003 0.00003 0.00004 0.00004 0.00004 0.00004 0.00004 0.00004 0.00005 0.00005
-3.8 0.00005 0.00005 0.00005 0.00006 0.00006 0.00006 0.00006 0.00007 0.00007 0.00007
-3.7 0.00008 0.00008 0.00008 0.00008 0.00009 0.00009 0.0001 0.0001 0.0001 0.00011
-3.6 0.00011 0.00012 0.00012 0.00013 0.00013 0.00014 0.00014 0.00015 0.00015 0.00016
-3.5 0.00017 0.00017 0.00018 0.00019 0.00019 0.0002 0.00021 0.00022 0.00022 0.00023
-3.4 0.00024 0.00025 0.00026 0.00027 0.00028 0.00029 0.0003 0.00031 0.00032 0.00034
-3.3 0.00035 0.00036 0.00038 0.00039 0.0004 0.00042 0.00043 0.00045 0.00047 0.00048
-3.2 0.0005 0.00052 0.00054 0.00056 0.00058 0.0006 0.00062 0.00064 0.00066 0.00069
-3.1 0.00071 0.00074 0.00076 0.00079 0.00082 0.00084 0.00087 0.0009 0.00094 0.00097
-3 0.001 0.00104 0.00107 0.00111 0.00114 0.00118 0.00122 0.00126 0.00131 0.00135
-2.9 0.00139 0.00144 0.00149 0.00154 0.00159 0.00164 0.00169 0.00175 0.00181 0.00187
-2.8 0.00193 0.00199 0.00205 0.00212 0.00219 0.00226 0.00233 0.0024 0.00248 0.00256
-2.7 0.00264 0.00272 0.0028 0.00289 0.00298 0.00307 0.00317 0.00326 0.00336 0.00347
-2.6 0.00357 0.00368 0.00379 0.00391 0.00402 0.00415 0.00427 0.0044 0.00453 0.00466
-2.5 0.0048 0.00494 0.00508 0.00523 0.00539 0.00554 0.0057 0.00587 0.00604 0.00621
-2.4 0.00639 0.00657 0.00676 0.00695 0.00714 0.00734 0.00755 0.00776 0.00798 0.0082
-2.3 0.00842 0.00866 0.00889 0.00914 0.00939 0.00964 0.0099 0.01017 0.01044 0.01072
-2.2 0.01101 0.0113 0.0116 0.01191 0.01222 0.01255 0.01287 0.01321 0.01355 0.0139
-2.1 0.01426 0.01463 0.015 0.01539 0.01578 0.01618 0.01659 0.017 0.01743 0.01786
-2 0.01831 0.01876 0.01923 0.0197 0.02018 0.02068 0.02118 0.02169 0.02222 0.02275
-1.9 0.0233 0.02385 0.02442 0.025 0.02559 0.02619 0.0268 0.02743 0.02807 0.02872
-1.8 0.02938 0.03005 0.03074 0.03144 0.03216 0.03288 0.03362 0.03438 0.03515 0.03593
-1.7 0.03673 0.03754 0.03836 0.0392 0.04006 0.04093 0.04182 0.04272 0.04363 0.04457
-1.6 0.04551 0.04648 0.04746 0.04846 0.04947 0.0505 0.05155 0.05262 0.0537 0.0548
-1.5 0.05592 0.05705 0.05821 0.05938 0.06057 0.06178 0.06301 0.06426 0.06552 0.06681
-1.4 0.06811 0.06944 0.07078 0.07215 0.07353 0.07493 0.07636 0.0778 0.07927 0.08076
-1.3 0.08226 0.08379 0.08534 0.08692 0.08851 0.09012 0.09176 0.09342 0.0951 0.0968
-1.2 0.09853 0.10027 0.10204 0.10383 0.10565 0.10749 0.10935 0.11123 0.11314 0.11507
-1.1 0.11702 0.119 0.121 0.12302 0.12507 0.12714 0.12924 0.13136 0.1335 0.13567
-1 0.13786 0.14007 0.14231 0.14457 0.14686 0.14917 0.15151 0.15386 0.15625 0.15866
-0.9 0.16109 0.16354 0.16602 0.16853 0.17106 0.17361 0.17619 0.17879 0.18141 0.18406
-0.8 0.18673 0.18943 0.19215 0.19489 0.19766 0.20045 0.20327 0.20611 0.20897 0.21186
-0.7 0.21476 0.2177 0.22065 0.22363 0.22663 0.22965 0.2327 0.23576 0.23885 0.24196
-0.6 0.2451 0.24825 0.25143 0.25463 0.25785 0.26109 0.26435 0.26763 0.27093 0.27425
-0.5 0.2776 0.28096 0.28434 0.28774 0.29116 0.2946 0.29806 0.30153 0.30503 0.30854
-0.4 0.31207 0.31561 0.31918 0.32276 0.32636 0.32997 0.3336 0.33724 0.3409 0.34458
-0.3 0.34827 0.35197 0.35569 0.35942 0.36317 0.36693 0.3707 0.37448 0.37828 0.38209
-0.2 0.38591 0.38974 0.39358 0.39743 0.40129 0.40517 0.40905 0.41294 0.41683 0.42074
-0.1 0.42465 0.42858 0.43251 0.43644 0.44038 0.44433 0.44828 0.45224 0.4562 0.46017
0 0.46414 0.46812 0.4721 0.47608 0.48006 0.48405 0.48803 0.49202 0.49601 0.5
GLOSARIO DE TERMINOS
A
ALEATORIO. Que depende del azar o de la suerte. Se aplica para escoger la muestra dentro de una
poblacin.

B
BERNOULLI. Es un experimento que tiene dos posibles resultados mutuamente excluyentes, generalmente
llamados xitos y fracasos

BINOMIAL. Distribucin de probabilidad discreta que cuenta el nmero de xitos en una secuencia
den ensayos de Bernoulli independientes entre s, con una probabilidad fija p de ocurrencia del xito entre
los ensayos.

C
COEFICIENTE DE VARIACIN. Es una medida relativa de dispersin y se utiliza para comparar el grado
de dispersin de dos distribuciones o muestras distintas. Es la razn entre la desviacin estndar y el
promedio.

COEFICIENTE DE DETERMINACIN (R2). Mide el porcentaje de variabilidad en Y que puede explicarse a


travs del conocimiento de la variable independiente X. Se utiliza dentro del anlisis de regresin.

CORRELACION. Indica la fuerza y la direccin de una relacin lineal y proporcionalidad entre dos variables
estadsticas. Se considera que dos variables cuantitativas estn correlacionadas cuando los valores de una
de ellas varan sistemticamente con respecto a los valores homnimos de la otra: si tenemos dos variables
(A y B) existe correlacin si al aumentar los valores de A lo hacen tambin los de B y viceversa. La
correlacin entre dos variables no implica, por s misma, ninguna relacin de causalidad

D
DESVIACIN ESTNDAR ( ).es una medida de dispersin para variables de razn (variables cuantitativas o
cantidades racionales) y de intervalo. Se define como la raz cuadrada de la varianza de la variable.

DATO. Valor de la variable asociado con un elemento de la poblacin o muestra. Puede ser un nmero, una
palabra o un smbolo.

DIAGRAMA DE DISPERSIN. Es un tipo de diagrama matemtico que utiliza las coordenadas cartesianas para
mostrar los valores de dos variables para un conjunto de datos.

E
ESTADGRAFO O ESTADSTICA. Es toda medida resumen o caracterstica de la muestra. Busca explicar
las correlaciones y dependencias de un fenmeno fsico o natural, de ocurrencia en
forma aleatoria o condicional.

EXPERIMENTO. Es un proceso mediante el cual se obtiene un resultado de una observacin. Ejemplos: Si


un producto lanzado al mercado tiene aceptacin o no, Observar artculos defectuosos en una produccin,
el lanzamiento de un dado y observar su cara superior.

EXPERIMENTO DETERMINISTICO. Cuando el resultado de la observacin se puede predecir con exactitud


antes de realizar el experimento.
EXPERIMENTO NO DETERMINISTICO. Cuando los resultados del experimento no pueden predecirse con
exactitud antes de realizar el experimento.

EXPERIMENTO ALEATORIO. Llamado tambin No determinstico donde cada experimento podr ser
repetido indefinidamente sin cambiar esencialmente las condiciones.

ESPACIO MUESTRAL. Es denotado por , es un conjunto formado por todos los posibles resultados de
un experimento.

EVENTO. Un evento es un subconjunto del espacio muestral y se denota con las letras maysculas A,
B, C, etc. Se cumple: Si A es un evento

ESPERANZA MATEMATICA. Tambin se le conoce como promedio o media aritmtica. Cuando la variable
aleatoria es discreta, la esperanza es igual a la suma de la probabilidad de cada posible suceso
aleatorio multiplicado por el valor de dicho suceso. Por lo tanto, representa la cantidad media que se
"espera" como resultado de un experimento aleatorio cuando la probabilidad de cada suceso se mantiene
constante y el experimento se repite un elevado nmero de veces.

G
GRAFICO ESTADISTICO. El grfico es la representacin de la informacin estadstica, con el fin de obtener
una impresin visual global del material presentado, que facilite su rpida comprensin .

GRAFICO DE BARRAS. Se utilizan para representar la distribucin de frecuencias de variables cualitativas


y discretas. Cada categora de la variable se representa por un rectngulo, cuya altura es proporcional a su
frecuencia.

GRAFICO DE BARRAS. Se utilizan para representar la distribucin de frecuencias de variables cualitativas


y discretas. Cada categora de la variable se representa por un rectngulo, cuya altura es proporcional a su
frecuencia.

GRAFICO CIRCULAR. Sirve para representar, en trminos de porcentaje, las distintas partes de un todo. El
rea de cada sector circular representa el porcentaje sobre el total de cada categora

H
HISTOGRAMA. Es una representacin grfica de una distribucin de frecuencias agrupadas en intervalos
de clase, mediante una serie de rectngulos contiguos.

HIPERGEOMTRICA. Una variable aleatoria X tiene una distribucin hipergeomtrica si se toma una
muestra sin reemplazo de un conjunto de N elementos.

M
MEDIDAS DE DISPERSIN O DE VARIABILIDAD. Son medidas que nos dan el grado de concentracin o
dispersin de las observaciones alrededor de un valor central o de posicin. Las ms comunes son:
Recorrido o rango, Varianza, Desviacin Estndar o Tpica y Coeficiente de Variacin.

MEDIA ARITMETICA. Llamado tambin promedio, se define como el cociente de la suma de los valores de
una variable entre el nmero de observaciones o valores.

MEDIANA. La Mediana es valor que se encuentra en el centro luego de ordenar los datos y divide el
conjunto de datos en dos partes iguales.

MODA. La moda de un conjunto de observaciones es el valor que se presenta con ms frecuencia o el que
ms se repite.
MUESTRA. Parte o porcin extrada de la poblacin por mtodos que permiten considerarla como
representativa de la poblacin

MARCO MUESTRAL. El listado completo de las unidades de muestreo. Nos permite identificar a los
elementos de la poblacin y puede ser una relacin de viviendas, un listado de personas, una relacin de
reactivos qumicos, etc.

MUESTREO.El proceso de seleccionar la muestra se llama muestreo.

P
POBLACIN. Es el conjunto total de individuos, objetos o medidas que poseen algunas caractersticas
comunes observables en un lugar y en un momento determinado.

PARAMETRO. Recibe este nombre toda medida resumen o caracterstica de la poblacin.

PROBABILIDAD DE UN EVENTO. Se representa por el smbolo P(A), es el cociente que se obtiene


dividiendo el nmero de resultados favorables para la ocurrencia del evento, entre el nmero total de
posibilidades nmero de elementos del espacio muestral ( ).

PROBABILIDAD CONDICIONAL. Ocurre cuando dos eventos se relacionan de manera tal que la
probabilidad de ocurrencia de uno depende de la ocurrencia del otro.

POISSON. Es otra distribucin discreta importante y es generalmente utilizada en los problemas en que se
cuentan el nmero de eventos de cierto tipo, que ocurren en un intervalo de tiempo, o en una regin, o en
un volumen.

R
RANGO O RECORRIDO. Es la diferencia entre el valor mayor y menor de una variable. Su frmula es:

Ejemplo: Observando las edades en aos de un grupo de personas: 6, 10, 16, 22, 36, 48 ,56 Hallar el rango
de los datos. aos.

REGRESIN. Es un mtodo que se emplea para encontrar una funcin que se ajusta a una nube de puntos
o diagrama de dispersin, con la finalidad de obtener una prediccin aproximada de una de las variables a
partir de la otra.

REGRESIN LINEAL SIMPLE.Este tipo de regresin se utiliza cuando existe solo una variable
independiente X para una variable dependiente Y. Est definida por la siguiente ecuacin lineal en su forma

general:
T
TABLA DE DISTRIBUCION DE FRECUENCIAS. Una tabla es un esquema para resumir la informacin.

Una distribucin de frecuencias es un arreglo de los valores observados de la variable


con sus respectivas frecuencias
U
UNIDAD ESTADSTICA Y OBSERVACIN. Los individuos u objetos de una poblacin que tienen una
caracterstica medible se denomina unidad estadstica. El trmino observacin se utilizar para indicar
cualquier clase de medida obtenida en la investigacin, es el resultado de observar o medir una unidad
estadstica.

UNIDAD DE MUESTREO.Unidad bsica o elemento de la poblacin seleccionada en la muestra para el


anlisis
V
VARIANZA ( ). La Varianza es una medida de dispersin importante y expresan el promedio del
cuadrado de todas las desviaciones con respecto a la media aritmtica. (Una desviacin de un conjunto de
datos es la resta entre un dato y el promedio global: )

VARIABLES. Es la caracterstica de la muestra o poblacin que se est observando. una variable est
formada por un espacio en el sistema de almacenaje (memoria principal de un ordenador) y un nombre
simblico (un identificador) que est asociado a dicho espacio.

VARIABLES CUALITATIVAS (Categricas). Indican cualidades, categoras o atributos, son etiquetas


alfanumricas (nmeros y/o letras) o nombres.

VARIABLES CUANTITATIVAS (Numricas).Son aquellas que toman valores numricos y se pueden medir
y a su vez se clasifican en discretas o continuas.

VARIABLE INDEPENDIENTE. Es aquella que el investigador desea medir su efecto y est bajo su control.
Por ejemplo, consideremos un experimento diseado para medir la efectividad de dos fertilizantes en la
produccin de trigo, el experimentador tiene bajo su control los fertilizantes, por lo cual el fertilizante se
denomina variable independiente.

VARIABLE DEPENDIENTE. Son todas aquellas variables que son explicadas por el modelo y reflejan el
efecto de las variables independientes. En el ejemplo anterior la produccin de trigo en cada parcela se
denomina variable dependiente.

Potrebbero piacerti anche