Sei sulla pagina 1di 159

INTRODUCCION

Tomar decisiones es una actividad inherente a los gerentes en el contexto actual. El docente en ciencias
administrativas asume la gran responsabilidad de transmitir los conocimientos sustanciales que permita al
estudiante internalizar los conceptos y prcticas ms elementales del conocimiento actualizado, en cada
materia curricular que estudia.

El proceso de toma de decisin cae en dos contextos; decisiones programadas y no programadas, stas a
la vez pueden ser cualitativas y cuantitativas. En caso de la primera se basa en corazonadas, prejuicios,
intuiciones, observaciones, etc. El segundo, requiere procedimientos y tcnicas matemticas, para
recopilar, procesar y analizar los datos para convertirlas en informacin que precisamente constituye
insumo para la toma de decisin.

En este sentido, alcanzamos a ustedes, una compilacin ESTADISTICA PARA LA INVESTIGACIN,


un trabajo que responde al perfil del profesional en administracin en los tiempos de globalizacin del
mundo del negocio.

De antemano agradecemos las observaciones y sugerencias que nos hagan llegar a nuestro correo
electrnico zeusore@hotmail.com las cuales sern tomadas en cuenta para ir mejorando las prximas
publicaciones.

El autor.

INDICE
INTRODUCCIN
INDICE

UNIDAD I: ESTADSTICA
Definicin
Tipos de estadstica
Estadstica descriptiva
Estadstica inferencial
Estadstica y la Investigacin Cientfica
Variables
Poblacin
Muestra
Muesttreo
Mtodos de recoleccin y tabulacin de datos
Observacin
Encuesta
Entrevista
Cuestionario
Prueba de Hiptesis
Prueba de hiptesis
Establecimiento de hiptesis nula y alterna
Errores tipo I y tipo II
Prueba unilateral sobre la media de una poblacin: muestra grande
Prueba Bilateral sobre la media de una poblacin: muestra grande
Pruebas sobre media de una poblacin: caso n 30
Pruebas sobre la proporcin de una poblacin
Clculo de probabilidad de errores de tipo II
Determinacin de tamao de muestra para una prueba de hiptesis sobre una media poblacin

UNIDAD II: MTODOS ESTADSTICOS PARA LA INVESTIGACIN ADMINISTRATIVA


T-student
Chi- Cuadrada
Anlisis de varianza

Prueba de signos
Prueba de pares iguales de Wilcoxon
Valoracin de Fisher y Shefle
Prueba de Manny y Whitney
Prueba de Krushal y Wallis
Regresin y correlacin
Prueba de Fiedman

UNIDAD III: PROBABILSTICOS


Distribucin discreta de probabilidad
Distribucin de probabilidad binomial
Distribucin de probabilidad hipergoemtrica
Distribucin de probabilidad de Poisson
Distribucin normal
Distribucin continua de probabilidad
Distribucin de probabilidad uniforme
Distribucin de probabilidad exponencial

UNIDAD IV: ESTIMACIONES ESTADSTICAS


Estimacin puntual
Distribuciones
Propiedad de estimadores puntuales
Estimaciones de intervalo de una media de la poblacin: muestra grande
Estimacin de intervalo de una media de la poblacin: muestra pequea
Determinacin del tamao dela muestra
Estimacin del intervalo de una proporcin

UNIDAD V: INFERENCIA ESTADSTICA


Estimacin de la diferencia entre las medias de dos poblaciones: muestras independientes
Prueba de hiptesis acerca de la diferencia entre las medias de dos poblaciones
Inferencia hacer de la diferencia entre las medias de dos poblaciones: Muestras pareadas
Inferencia hacer de la diferencia entre las proporciones de dos poblaciones

BIBLIOGRAFA

UNIDAD I
ESTADISTICA
1.1

DEFINICIONES
La estadstica es una ciencia que comprende la recopilacin, tabulacin, anlisis e interpretacin de
los datos cuantitativos y cualitativos". Kennedy-Neville.
"La estadstica constituye una disciplina con ilimitadas posibilidades de aplicacin en diversos
campos de la actividad humana". H. B. Christensen.
"Estadstica es un grupo de tcnicas o metodologa que se desarrollaron para la recopilacin,
presentacin y anlisis de los datos y para el uso de tales datos." Neter-Waserman.

"La Estadstica es la ciencia que se ocupa de la recopilacin, tabulacin, anlisis, interpretacin y


presentacin de datos cuantitativos". D. H. Besterfield.

Es la ciencia y tcnica de recolectar, organizar, presentar, analizar e interpretar datos con el


propsito de ayudar a una toma de decisin ms efectiva en la gestin organizacional:
comercializacin, contabilidad, control de calidad, investigacin de mercado, etc.
La estadstica es la parte de la matemtica que se encarga de recolectar, organizar, computar datos
con el objeto de inferir conclusiones sobre ellos.
1.2 TIPOS DE ESTADSTICA
1.2.1 ESTADSTICA DESCRIPTIVA (Medidas de Tendencia Central y de Dispersin).
El trmino estadstica tiene su raz en la palabra Estado. Surge cuando se hace necesario para
sus intereses cuantificar conceptos. En la mayora de los casos esta cuantificacin se har en
funcin de unos fines econmicos o militares. El estado quiere conocer censo de personas, de
infraestructura, de recursos en general, para poder obtener conclusiones de esta informacin.
Actualmente la estadstica es una ciencia. No es ya una cuestin reservada al estado. Podramos
decir que se encuentra en la totalidad del resto de ciencias. La razn es clara: por una parte la
estadstica proporciona tcnicas precisas para obtener informacin, (recogida y descripcin de
datos) y por otra parte proporciona mtodos para el anlisis de esta informacin.
De ah el nombre de estadstica descriptiva, ya que el objetivo es, a partir de una muestra de
datos (recogida segn una tcnica concreta), la descripcin de las caractersticas ms
importantes, entendiendo como caractersticas, aquellas cantidades que nos proporcionen
informacin sobre el tema de inters del cual hacemos el estudio.
Realiza el estudio sobre la poblacin completa, observando una caracterstica de la misma y
calculando unos parmetros que den informacin global de toda la poblacin.
Procedimiento estadstico que emplea mtodos para organizar, resumir y presentar datos de
manera informativa:

Ejemplo 1: Supongamos que contamos con 500 alumnos en la Escuela de Formacin


Profesional de Administracin de Empresas y, queremos hacer un estudio
estadstico sobre su altura.
Un mtodo sera pasar clase por clase y medirlos a todos, esto nos podra llevar un
tiempo considerable pero sera la forma ms exacta de hacer dicho estudio,
aunque es fcil encontrarnos con ausencias y tendramos que volver varios das y
pasar lista para conseguir la estatura de todo el alumnado. Una vez que tengamos
todos los datos en nuestro poder los resultados los obtendramos mediante
Estadstica descriptiva.
Otra posibilidad podra ser pasar clase por clase, decirles a los alumnos y alumnas
que anoten su estatura en un papel y recogerlos todos. Tambin as tendramos un
estudio de Estadstica descriptiva, aunque seguramente menos fiable que con el
mtodo anterior, pues casi con toda seguridad, y lo digo por experiencia, algunos
alumnos escriban su estatura a clculo y otros, con ganas de bromas, muy por
encima o muy por debajo de la realidad.
Ejemplo 2: Sondeo de opinin sobre las preferencias electorales encontr que, de 1,000
electores encuestados; 22% votarn por el candidato A, 19% por candidato B y
11% por el candidato C.
La estadstica 22%, 19% y 11% describen el nmero de cada 1,000
electores votarn por A, B y el C.
Ejemplo 3: Sondeo de opinin arroja que 25% de una poblacin de 2,000 consumidores de un
producto de una empresa, saben sobre la calidad y las bondades alimenticias del
producto que consumen.
La estadstica 25% describe el nmero de cada 2,000 consumidores saben sobre
la calidad del producto que consumen.
Ejemplo 4: Segn el Rector de la UNSCH, los decanos de las Facultades reportan 9 problemas
por cada 300 estudiantes relacionados con la deficiencia en el rendimiento
acadmico de los estudiantes.
La estadstica 9 describe el nmero de problemas por cada 500 estudiantes.
Ejemplo 5: El Sr. Numrico Buena Vista, jefe de control de calidad de la empresa
embotelladora de aguas gaseosas El Sabrosito, reporta 5 botellas defectuosas de
cada 1,000 durante el ao 20...
La estadstica 5 describe el nmero de botellas defectuosas por cada 1,000
botellas.
1.2.2 ESTADSTICA INFERENCIAL.
Realiza el estudio descriptivo sobre un subconjunto de la poblacin llamado muestra y,
posteriormente, extiende los resultados obtenidos a toda la poblacin.
Mtodo de deducir o extraer una consecuencia, una decisin, estimacin, prediccin o
generalizacin sobre una poblacin, con base en una muestra.

Una poblacin es un conjunto de todos los posibles individuos, objetos o medidas de inters
que se selecciona para una toma de decisin. Una muestra es una porcin, o parte de la
poblacin de inters para contrastar una hiptesis.
Ejemplo 1: Supongamos que contamos con 500 alumnos en la Escuela de Formacin
Profesional de Administracin de Empresas y, queremos hacer un estudio
estadstico sobre su altura.
Otra posibilidad sera escoger una muestra, es decir un grupo de por ejemplo 50
personas, hacer el estudio descriptivo sobre ellas y despus generalizarlo a toda la
Escuela de Formacin Profesional de Administracin con Estadstica inferencial.
En este caso, comprobaramos por una parte que cuanto mayor sea la muestra ms
trabajo tendremos, pero ms fiable ser el resultado final y por otra, que la
eleccin de la muestra debe hacerse de manera que permita tambin fiarnos del
resultado obtenido.
Ejemplo 2: Dos empresas radiales de la Ciudad de Ayacucho monitorean su popularidad de sus
programas, contratando a una empresa encuestadora para que muestreen las
preferencias de sus radios oyentes.
Ejemplo 3: El jefe de control de calidad de una empresa elegir una muestra (parte) de los
productos para verificar la calidad de todos los productos.
Ejemplo 4: Un gerente de Marketing recaba opiniones, a partir de una muestra de clientes, para
verificar el nivel de satisfaccin, con respecto a la calidad y precio del producto.
Ejemplo 5: El gerente de la Cooperativa Santa Mara Magdalena recaba opinin de una muestra
de los socios que acuden a las ventanillas de atencin, para obtener informacin
sobre la calidad del servicio y atencin de los trabajadores que atienden en este
servicio.
1.3 ESTADISTICA E INVESTIGACIN CIENTFICA
En el desarrollo de la ciencia en general y en especial en el de las ciencias empresariales, el
conocimiento de la metodologa estadstica es un arma imprescindible para la obtencin, anlisis e
interpretacin de todos los datos que proceden de las observaciones sistemticas o de
experimentaciones proyectadas especficamente para conocer los efectos de uno o barios factores que
intervienen en los fenmenos bajo estudio. La estadstica permite probar hiptesis planteadas por el
experimentador, determina procedimientos prcticos para estimar parmetros que intervienen en
modelos matemticos y as construir frmulas empricas, etc.
No existe investigacin, proceso o trabajo encaminado a obtener informacin cuantitativa en general,
en la que la estadstica no tenga una aplicacin. La estadstica no puede ser ignorada por ningn
investigador, an cuando no tenga ocasin de emplear la Estadstica Aplicada en todos sus detalles y
ramificaciones. Es una caracterstica comn en los experimentos, en muy diversos campos de la
investigacin, que los efectos de los tratamientos experimentales varan de un ensayo a otro, cuando
se repiten. Esta variacin introduce ciertos grados de incertidumbres en cualquiera de las
conclusiones que se obtienen de los resultados.
La estadstica ha ayudado al investigador en proyectos muy variados en el campo empresarial. La
Estadstica cuando se usa adecuadamente, hace ms eficientes las investigaciones, es aconsejable que
todos los investigadores se familiaricen con las tcnicas y conceptos bsicos de esta ciencia tan til.

El papel de la estadstica en la investigacin es, entonces, funcionar como una herramienta en el


diseo de investigaciones, en el anlisis de datos, y en la extraccin de conclusiones a partir de ellos.
Escasamente podr preverse un papel mayor y ms importante. De utilidad en las investigaciones, la
Estadstica nicamente va precedida por las Matemticas y el sentido comn, de los cuales se deriva.
Indicadores estadsticos compilados permiten elaborar ndices relativos importantes para evaluar y
orientar la gestin de las empresas e instituciones del pas. A sus efectos, la compilacin de datos
provenientes de sistemas estadsticos provee a los administradores y especialistas de toda una serie de
elementos a tener en cuenta en la toma de decisiones, permite un monitoreo constante de la actividad,
la posibilidad de establecer comparaciones sobre el desempeo de tal o ms cual sistema o unidad de
informacin especfica a travs de series cronolgicas, etc. Indudablemente, la computacin ha
venido a jugar un papel muy importante, tanto en la recopilacin como en el procesamiento de los
datos estadsticos, encontrndose lo suficientemente extendida en los sistemas de informacin
existentes, lo que ha permitido darle un vuelco cualitativo a estas actividades, fundamentalmente en
la prestacin de servicios sobre la labor estadstica y en la preparacin de productos.
1.4 VARIABLES
Es la caracterstica que estamos midiendo.
Existen dos categoras o tipo de variables:
1.4.1 Variable cualitativa: Son aquellas que toman un nmero limitado de modalidades. A cada
modalidad corresponde una categora de individuos; estas categoras forman una particin de la
poblacin. Este tipo de variables representan una cualidad, caracterstica o atributo que clasifica
a cada caso en una de varias categoras. La situacin ms sencilla es aquella en la que se
clasifica cada caso en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador).
Son datos dicotmicos o binarios. Como resulta obvio, en muchas ocasiones este tipo de
clasificacin no es suficiente y se requiere de un mayor nmero de categoras (color de los ojos,
grupo sanguneo, profesin, etc.).
En el proceso de medicin de estas variables, se pueden utilizar dos escalas:
Escalas nominales o categricas: sta es una forma de observar o medir en la que los datos
se ajustan por categoras que no mantienen una relacin de orden entre s (color de los ojos,
estado civil sexo, rubio, morenos, profesin, presencia o ausencia de un factor de riesgo o
enfermedad, etc.).
Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarqua entre las
categoras (grado de educacin, grado acadmico, niveles laborales, tiempo de experiencia,
modalidad laboral, etc.).
1.4.2 Variable cuantitativa: Son las variables que pueden medirse, cuantificarse o expresarse
numricamente: edad, peso, ingreso, rendimiento, n. de hijos, etc. Esta a su vez la podemos
subdividir en:
a) Variable discreta, una variable que tericamente puede tomar cualquier valor entre dos
valores dados se denomina variable discreta. Es decir, cuando slo toma valores que
corresponden con los nmeros naturales, pero no adopta los comprendidos entre dos de
ellos. Se obtiene a travs de una operacin de conteo y no admite seccionamiento (decimal),

ya que representa solo cantidades exactas. No admiten todos los valores intermedios en un
rango. Suelen tomar solamente valores enteros.
Ejemplos:
- Nmero de participantes en una capacitacin
- Nmero de trabajadores
- Cantidad de productos
- Cantidad de oficinas
- Cantidad de empresas
- Cantidad de instituciones
- Cantidad de alumnos
- Cantidad de consumidores o clientes
- Cantidad de proveedores
- Cantidad de maquinarias
- La cantidad de socios de una Cooperativa
- El nmero de habitantes en la ciudad de Ayacucho
- Cantidad de clientes que acuden diariamente a un Banco
- Resultados de una encuesta, con opcin de respuesta de Si, No.
b) Variable contina, se presenta cuando se puede tomar cualquier valor real entre un
intervalo, es decir; son aquellas variables que toman todos los valores comprendidos entre
dos de ellos. Se reconoce cuando elegidos dos valores cualquiera, existe una cantidad
infinita de valores posibles ubicados entre ellos, por ms cercanos que sean, que puede
tomar la variable. la que puede tomar los infinitos valores de un intervalo. En muchas
ocasiones la diferencia es ms terica que prctica, ya que los aparatos de medida dificultan
que puedan existir todos los valores del intervalo.
Ejemplos:
- Peso, estatura, distancias, calificaciones
- El intervalo de tiempo en que acuden los socios de la Cooperativa
- El tiempo que dura una publicidad no gravada
- El tiempo de llamadas telefnicas que recibe una recepcionista de una oficina.
- El tiempo de atencin en caja de una entidad financiera
- El volumen de agua que consume diariamente la Ciudad de Ayacucho.
1.4.3 Variable Independiente: Es aquella que es controlada en forma sistemtica por el
investigador. En la mayor parte de los experimentos, el cientfico est interesado en determinar
el efecto que tiene una variable A sobre alguna o ms variables, el experimentador controla los
niveles de la variable A y mide los efectos que posee sobre las dems variables. Su
manipulacin puede realizarse en dos o ms grados: Presencia ausencia de la variable
independiente. Ejemplo: Calidad de alimentacin de los alumnos.
1.4.4 Variable Dependiente: A diferencia de la variable independiente, sta no se manipula, sino
que es medida por el investigador para determinar el efecto o la influencia de la variable
independiente sobre ella. Por ejemplo: Rendimiento acadmico de los alumnos.
1.4.5 Variable Interviniente: Son los factores que pueden afectar la relacin entre variables y la
investigacin. Por ejemplo: El horario de clases, el nivel econmico, el dominio del tema por

parte del profesor, la capacidad de concentracin de los alumnos, los recursos didcticos, entre
otras.
1.5 POBLACIN
El concepto de poblacin en estadstica va ms all de lo que comnmente se conoce como tal. Una
poblacin se precisa como un conjunto finito o infinito de personas u objetos que presentan
caractersticas comunes.
"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
"Una poblacin es un conjunto de elementos que presentan una caracterstica comn". Cadenas
(1974).
Ejemplo:
Los miembros del Colegio de Licenciados en Administracin, las Instituciones pblicas de
Ayacucho, los trabajadores de la UNSCH, cantidad de productos en un lote de produccin, cantidad
de libros en una biblioteca, etc.
El tamao que tiene una poblacin es un factor de suma importancia en el proceso de investigacin
estadstica, y este tamao vienen dado por el nmero de elementos que constituyen la poblacin,
segn el nmero de elementos la poblacin puede ser finita o infinita. Cuando el nmero de
elementos que integra la poblacin es muy grande, se puede considerar a esta como una poblacin
infinita, por ejemplo; el conjunto de todos los nmeros positivos. Una poblacin finita es aquella que
est formada por un limitado nmero de elementos, por ejemplo; el nmero de estudiante de la
Escuela de Formacin Profesional de Administracin, cantidad de docentes de la EFPAE, etc.
Cuando la poblacin es muy grande, es obvio que la observacin de todos los elementos se dificulte
en cuanto al trabajo, tiempo y costos necesarios para hacerlo. Para solucionar este inconveniente se
utiliza una muestra estadstica.
Es a menudo imposible o poco prctico observar la totalidad de los individuos, sobre todos si estos
son muchos. En lugar de examinar el grupo entero llamado poblacin o universo, se examina una
pequea parte del grupo llamada muestra.
1.6 MUESTRA
"Se llama muestra a una parte de la poblacin a estudiar qu sirve para representarla". Murria R.
Spiegel (1991).
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin &
Rubin (1996).
"Una muestra debe ser definida en base de la poblacin determinada, y las conclusiones que se
obtengan de dicha muestra solo podrn referirse a la poblacin en referencia", Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Licenciados en Administracin de Ayacucho.
El estudio de muestras es ms sencillo que el estudio de la poblacin completa; cuesta menos y lleva
menos tiempo. Por ltimo se aprobado que el examen de una poblacin entera todava permite la
aceptacin de elementos defectuosos, por tanto, en algunos casos, el muestreo puede elevar el nivel
de calidad.
Una muestra representativa contiene las caractersticas relevantes de la poblacin en las mismas
proporciones que estn incluidas en tal poblacin.

Los expertos en estadstica recogen datos de una muestra. Utilizan esta informacin para hacer
referencias sobre la poblacin que est representada por la muestra. En consecuencia muestra y
poblacin son conceptos relativos. Una poblacin es un todo y una muestra es una fraccin o
segmento de ese todo.

1.7 MUESTREO
GENERALIDADES.- Una empresa cualquiera, sin importar su tamao y naturaleza, enfrenta una
serie de situaciones de decisin como las siguientes:
-

Control de calidad de sus productos


Necesidad de la poblacin relacionado con el producto ofertado
Tasa de crecimiento de la poblacin (histrico, actual y futuro)
Nivel de ingreso de la poblacin (demanda real y demanda potencial)
Tendencias de gasto del segmento de la demanda
Tiempo de consumo del producto (meses, aos)
Ciclo operativo empresarial
Costo mnimo de operacin (capital de trabajo) de la empresa
Etc.

El campo de aplicacin de muestreo es muchsimo, pero de diferentes modalidades: por ejemplo;


elaborar el perfil de todos los estudiantes de la UNSCH, cantidad de preferencias de voto de un
candidato del total de electores registrado en el pas, tiene diferentes formas de estudiar.
As tambin, hacer un estudio de todos los elementos en estos casos (poblacin) es casi imposible
(costo, tiempo, procedimiento, etc.), entonces se requiere sistematizar la informacin para posibilitar
su estudio. La forma de sistematizar es extraer grupos (muestras) representativas de entre todos los
elementos de la poblacin con el objeto de estudiarlas y que los resultados infieran los valores y las
caractersticas de toda la poblacin en forma objetiva y racional.
Esto no es ms que el procedimiento empleado para obtener una o ms muestras de una poblacin; el
muestreo es una tcnica que sirve para obtener una o ms muestras de poblacin.
Este se realiza una vez que se ha establecido un marco muestral representativo de la poblacin, se
procede a la seleccin de los elementos de la muestra aunque hay muchos diseos de la muestra.

n
Xn

estima
(=)

Pn

(=)

PN

E Estimacin

-p,

Pn,

slo estiman los


valores y caractersticas de la
poblacin, porque (n) slo
contiene una parte de la
poblacin.
- Qu tan buenos estimadores
podemos ser, entonces? ...
utilizamos procedimientos
estadsticos.

Al tomar varias muestras de una poblacin, las estadsticas que calculamos para cada muestra no
necesariamente seran iguales, y lo ms probable es que variaran de una muestra a otra.
Ejemplo;
Consideremos como una poblacin a los estudiantes de la Escuela de Formacin Profesional de
Administracin de la UNSCH, determinando por lo menos dos caracteres ser estudiados en dicha
poblacin;

Provenientes de Colegios Estatales


Visin Empresarial.

TIPOS DE MUESTREO:
Existen dos mtodos para seleccionar muestras de poblaciones:
a) MUESTREO NO ALEATORIO O DE JUICIO.- Una muestra seleccionada por muestreo de
juicio se basa en la experiencia de alguien con la poblacin. Algunas veces una muestra de juicio
se usa como gua o muestra tentativa para decidir cmo tomar una muestra aleatoria ms adelante.
Las muestras de juicio evitan el anlisis estadstico necesario para hacer muestras de probabilidad.
Ejemplo: Seleccin de periodistas a personalidades para que expresen su opinin sobre un suceso
general, creyendo que son los ms versados para emitir algn juicio u opinin tcnica
especializada.
a.1) POR CONVENIENCIA (Mtodo de muestreo no probabilstica).- La muestra se
identifica por conveniencia del investigador. Se incorpora elementos en la muestra sin
probabilidades preespecificadas o conocidas de seleccin.
Ejemplo:

a. Seleccionar voluntarios
b. Embarque de frutas (cajas para inspeccionar)
c. Plantas nativas para investigacin.

Ventaja.- Fcil de seleccin y recoleccin de datos.


Desventajas.- Imposibilidad de evaluar la bondad de la muestra en funcin de su
representatividad de la poblacin.
b) EL MUESTREO ALEATORIO O DE PROBABILIDAD.- En este mtodo todos los elementos
de la poblacin tienen la oportunidad de ser escogidos en la muestra.
N=

Poblacin infinita

N=X

Poblacin finita

b.1 MUESTREO ALEATORIO SIMPLE PARA POBLACIONES FINITAS.- Una muestra


aleatoria simple de tamao (n), de una poblacin finita de tamao (N), es una muestra
seleccionada de tal manera que cada muestra posible de tamao (n) tenga la misma

probabilidad de ser seleccionada. Es decir, se selecciona uno por uno los elementos de la
muestra, de tal modo que cada uno de los elementos que quedan en la poblacin tenga la
misma probabilidad de ser seleccionadas.
N=X

Poblacin finita

Ejemplo: Al Director de personal de la Universidad Nacional de San Cristbal de Huamanga


se le ha asignado la tarea de elaborar el perfil de los 640 trabajadores
administrativos. La caracterstica por identificar son las competencias laborales
para iniciar un cambio organizacional.
Definiendo a los 640 trabajadores como la poblacin a estudiar, se puede
determinar el grado de estudio, los programas de capacitacin y los cargos
ocupados para cada trabajador consultando los registros de file personal que tiene la
institucin.
Es este caso, elaborar el perfil general conllevara estudiar a cada uno de los
trabajadores, no imposible pero costoso en tiempo y dinero. Entonces utilizamos el
proceso muestral; en este caso n = 100.
SOLUCION
i)

n = 100 Quines deben constituir n?

ii) Enumerar de 1 a 640 a cada trabajador de acuerdo al mes, ao de ingreso y


orden alfabtico de los apellidos.
iii) Utilizando la tabla de nmeros aleatorios

4352

640 = 3 dgitos
Entonces, si empezramos en la celda (1,1) de la tabla de nmeros
aleatorios, los seleccionados seran: 632 715 998 671 744 511
021 - ... hasta completar a n = 100; pero descartando los valores
mayores a 640.
NOTA 1: La seleccin puede empezarse en cualquier parte de la tabla y en
cualquier direccin.
NOTA 2: En el proceso de seleccin de esta forma, podra darse el caso que
nuevamente aparezca el nmero seleccionado antes de completar (n),
como se trata de seleccionar tan slo una vez, no se vuelven a

considerar. La seleccin de esta forma se llama muestreo sin


reemplazo, mayor y significativamente utilizado en la prctica
empresarial
La cantidad de muestras aleatorias simples, de tamao (n) que se
pueden seleccionar de una poblacin es:

N


n =


N!
n!( N n)!

b.2 MUESTREO ALEATORIO SIMPLE PARA POBLACIONES INFINITAS.- Se considera


poblacin infinita que se estudia, si en ella interviene un proceso dinmico que haga
imposible el listado o el conteo de cada elemento de la poblacin, por lo que es imposible el
uso de la tabla de nmeros aleatorios.
Entonces, como no se puede enumerar los elementos de la poblacin infinita, debemos
emplear un proceso distinto para seleccionar la muestra.
N=

Poblacin infinita
Ejemplo: Se desea estimar el nivel de satisfaccin de los clientes de la pollera Wallpa
Sua, entre las 5 p.m. y 8 p.m. de los das viernes, que es el horario de mayor
concurrencia. La poblacin sera todos los posibles clientes, cuyo listado es
imposible, por lo que es una poblacin infinita.
En este caso, cmo seleccionar (n =?) de (N = )
SOLUCION
Una (n) aleatoria simple de una N = debe satisfacer las siguientes condiciones:
1. Cada elemento seleccionado proviene de la misma poblacin.
2. Cada elemento se selecciona en forma independiente.
3. Tiene que emplearse el criterio del investigador para determinar la cantidad ptima.
c) ALEATORIO ESTRATIFICADO (Mtodo de muestreo probabilstica).- Primero de divide a
los elementos de la poblacin en grupos llamados estratos, de tal manera que cada elemento de la
poblacin pertenece a uno y slo a un estrato.

E. ALTO

S. EDUC.

R. NORTE

E. MEDIO

S. AGRIC.

R. CENT.

Aleatorio simple

S. INDUST

R. SUR

Aleatorio simple

E. BAJO

Aleatorio simple

Dividir: varones y mujeres, sexo, edad


En los estratos se toman una muestra aleatoria simple de cada uno de ellos. El valor del
muestreo aleatorio estratificado depende de cuan homogneas sean los elementos dentro de los
estratos, por tanto, varianzas pequeas.
Ejemplo: Se quiere estudiar los niveles de colesterol srico en personas mayores de 45 aos con
cardiopata isqumica que concurren a determinado centro de salud asistencial. Para ello se
tiene en cuenta la variable sexo como de estratificacin, conociendo que el 70% de dicha
poblacin es de sexo masculino.
Se decide tomar una muestra de 120 personas. Proporcional: 70% masculino (84) y 30%
mujeres (36).
Ventajas:
- Aumento de la precisin sobre el estudio
- Estimacin separada para cada estrato
- Bajos costos de muestreo
Desventajas:
- Es necesario un marco para cada estrato
b) CONGLOMERADO (Mtodo de muestreo probabilstica).- Primero, se divide, los elementos
de la poblacin en conjuntos separados llamados conglomerados. Cada elemento de la
poblacin pertenece a uno y slo a un grupo. Segundo, se toma una muestra aleatoria simple de
conglomerados. Todos los elementos dentro del conglomerados se asemejan entre s, al
muestrear una pequea cantidad de conglomerados se obtendr buenos estimadores de los
parmetros poblacionales.

POBLACION

CONG. 1

CONG. 2

n
Aleatorio simple

CONG. 3

ii) Mejor resultado se obtiene


cuando los conglomerados son
diferenciados.
iii)
Los conglomerados se
pueden muestrear por aleatorio
simple o aleatorio estratificado.
iv) Ejemplo: manzanas urbanas de
una ciudad.

Ventajas:
- Reduce costos
- En caso que no exista una lista de elementos dela poblacin
Desventajas:
- Las inferencias que se hacen en dicho muestreo no son tan confiables comolas del Muestreo
Aleatorios.
- Menor precisin en las estimaciones.
c) SISTEMTICO (Mtodo de muestreo probabilstica).- En algunos casos (poblaciones grandes),
es tardada la seleccin de una muestra aleatoria simple cuando se determina primero un nmero
aleatorio y despus se busca en la lista de elementos de la poblacin hasta encontrar el
elemento correspondiente. Por ejemplo, se desea muestrear (n = 100) de una poblacin de
50,000 personas, podramos muestrear, entonces, un elemento de cada:
N
50,000
i)
= 500 es el intervalo para seleccionar al azar
100
uno de los primeros 100 elementos de la lista de toda
n
50,000

100

la poblacin.
ii) Seleccionar al azar uno de los primeros de los 500
elementos de la lista de la poblacin; por ejemplo, el
(1) entonces el siguiente tendr que ser ...
1 - 500

- 1001 - 1501 .....

iii)
+500, +500, + 500 +500 .......
As, hasta completar los 100 elementos de n.

1.8 DETERMINACIN DE LA MUESTRA


Ahora veremos el asunto que debe tener la muestra para obtener una estimacin de una proporcin
poblacional con determinado nivel de precisin.

P1 P

E Z


Z P1 P

n = 2 2
E

- Para ello es necesario que el investigador precise el margen de error E deseado.


- En la mayora de los casos, E es 0.10 o menor.
- Tambin el usuario especifica el nivel de confianza, y con l el valor correspondiente de Z
2

- Debido a que se desconoce la proporcin poblacional P, la frmula requiere un valor de


planeacin para P. En la prctica, este valor de planeacin se puede elegir mediante uno de los
procedimientos siguientes:
1.- Usar la proporcin muestral de una muestra anterior de las mismas unidades.
2.- Llevar a cabo un estudio piloto para seleccionar una muestra preliminar de unidades. La
proporcin muestral a partir de esta muestra se puede usar como valor de planeacin para P.
3.- Usar el juicio o un estimado mejor del valor de P.
4.- Si no se aplica alguna de las alternativas, usar P = 0.50.

Ejemplo: Tomando los usuarios de ESSALUD Ayacucho. Qu tan grande debe ser la muestra si
el responsable de la encuesta quiere estimar la proporcin poblacional con margen de error
de 0.025 y con nivel de confianza de 95%.
Datos:
n
E
N. C.
P

=?
= 0.025
= 0.85
= 0.48

i) = (1 - .095) = 0.05

= 0.025
2
iii)0.5000 0.025 = 0.475 (buscar en la tabla Z) = 1.96
ii)

iv) n =

1.962 0.481 0.48


0.0252

= 1,534.18 1,534 usuarios

Entonces, el tamao de la muestra mnimo bebera ser de 1,534 usuarios para llenar el requisito de
margen de error.

FRMULA GENERAL PARA DETERMINAR LA MUESTRA


Para poblaciones fintas:
n

Z 2 PQN
( N 1)(e) 2 Z 2 PQ

n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimacin (5%)
N = Tamao de la poblacin
p = Probabilidad que salga variable independiente (0.5 50%)
q = Probabilidad que salga variable independiente (0.5 50%)

Para poblacin infinita:

Z 2 PQ
(e) 2 Z 2 PQ

n = Muestra
Z2 = Varianza (tabla de Gauss 1.96, nivel de confianza = 95%)
E = Error de estimacin (5%)
p = Probabilidad que salga variable independiente (0.5 50%)
q = Probabilidad que salga variable independiente (0.5 50%)

1.9

MTODOS DE RECOLECCIN Y TABULACIN DE DATOS


Es importante destacar que los mtodos de recoleccin de datos, se puede definir como: al medio a
travs del cual el investigador se relaciona con los participantes para obtener la informacin necesaria
que le permita lograr los objetivos de la investigacin.
De modo que para recolectar la informacin hay que tener presente:
a) Seleccionar un instrumento de medicin el cual debe ser vlido y confiable para poder aceptar los
resultados
b) Aplicar dicho instrumento de medicin
c) Organizar las mediciones obtenidas, para poder analizarlos
Dentro de los mtodos para la recoleccin de datos estn:
1.9.1 Observacin:
Es el registro visual de lo ocurre es una situacional real, clasificando y consignando los
acontecimientos pertinentes de acuerdo con algn esquema previsto y segn el problema que se
estudia.
Al igual con los otros mtodos, previamente a la ejecucin de la observacin el investigador
debe definir los objetivos que persigue, determinar su unidad de observacin, las condiciones
en que asumir la observacin y las conductas que debern registrarse.
Cuando se decide utilizarla hay que tomar en cuenta ciertas consideraciones. Como mtodo de
recoleccin de datos, debe ser planificado cuidadosamente para que rena los requisitos de
validez y confiabilidad. Se le debe conducir de manera hbil y sistemtica y tener destreza en el
registro de datos, diferenciando los aspectos significativos de la situacin y los que no tienen
importancia.
Tambin se requiere habilidad para establecer las condiciones de manera tal que los hechos
observables se realicen en la forma ms natural posible y sin influencia del investigador u otros
factores. Cuando se decide usar este mtodo es requisito fundamental la preparacin cuidadosa
de los observadores, asegurndose as la confiabilidad de los datos que se registren y
recolecten.
Posibles errores con el uso del mtodo de observacin. Sobre el uso del mtodo de
observacin, Quinteros comenta que, las condiciones de una investigacin puede ser
seriamente objetables si el diseo de la misma no se ha tomado en cuenta los posibles errores
de observacin
Estos errores estn relacionados con:
Los Observadores
El instrumento utilizado para la observacin
El fenmeno observado
Respecto a los errores relacionados con el observador, estos se asocian al hecho de la
participacin de otras personas, adems del investigador, en el proceso de la observacin de los
hechos o fenmenos en estudio. Esta situacin puede conducir a una falta de consistencia de los
resultados, ya que los observadores pueden diferir en la cuantificacin y registro que se haga de
los aspectos observados. El problema se suscita por la falta de una definicin operacional y

precisa de la manera en que ser medida y observada la variable y el registro de tales


observaciones, siendo necesario tomar precauciones para asegurar no solo que la observacin
sea correcta, sino tambin que el registro de los hechos rena esas condiciones. Conviene que
haya instrucciones escritas y verbales que orienten al observador sobre cmo se llevara a cabo
todo el proceso y que haya demostracin y practica de las observaciones que se realicen.
Tambin se considera que segn el papel que ajusta el observador se puede incurrir en mayores
o menores errores; este papel puede ser el de observador no participante o participante.
La observacin participante implica que el investigador o el responsable de recolectar los datos
se involucren directamente con la actividad objeto de la observacin, lo que puede variar desde
una integracin total del grupo o ser parte de ste durante un periodo. Algunos errores que
suelen cometerse estn relacionados con las emociones del observador, ya que al involucrarse
en la situacin pierde la objetividad en la observacin y en el registro, anlisis e interpretacin
de los hechos o fenmenos.
La observacin no participante ocurre cuando el investigador no tiene ningn tipo de relaciones
con los sujetos que sern observados ni forma parte de la situacin en que se dan los fenmenos
en estudio. En esta modalidad, al no involucrarse el investigador, los datos recogidos pueden
ser ms objetivos, aunque, por otro lado, al no integrarse al grupo puede afectar el
comportamiento de los sujetos en estudio y los datos que se observan podran no ser tan reales
y veraces.
Los errores referentes al instrumento de observacin se relacionan con los desaciertos en que se
incurre en su elaboracin y lo que se desea medir. Esto se evita con una definicin operacional
y libre de ambigedades e imprecisiones de las variables en estudio, especificando en el
instrumento los criterios o indicadores de la medicin de tales variables.
La especificidad de ese instrumento est relacionada con el problema, objetivos y forma en que
se va a hacer la observacin. Una de esas formas es la denominada observacin simple, no
regulada o no controlada, en la que solo se tienen unos lineamientos generales para la
observacin sobre los aspectos del fenmeno que le investigador tienen inters en conocer. La
otra forma es la sistemtica, regulada o controlada, en la que se dispone de un instrumento
estandarizado o estructurado para medir las variables en estudio de una manera uniforme.
El primero se usa mas en estudios exploratorios y el segundo esta dirigido a quienes desean
probar hiptesis en que se debe especificarse claramente qu se observara, cmo se observara y
cmo se har el registro de datos.
Los errores relacionados con el objeto que se observa se dan cuando los aspectos que deben ser
conocidos de las unidades o fenmenos de observacin no se presentan en igualdad de
condiciones para todos ellos, ya sea porque varen las circunstancias en que se observa el
fenmeno o a la propia variabilidad del sujeto en estudio. A manera de ejemplo, se puede citar
que si existe inters en evaluar el desempeo de un agente de salud en las zonas rurales de las
regiones sanitarias, puede ser que la situacin donde labore una gente sea diferente en una u
otra regin, ya sea por carencia o disposicin de equipos y materiales u otros factores. La
variacin de circunstancias de las regiones sanitarias puede conducir a errores de medicin, de
anlisis o interpretacin de los hechos observados. La variabilidad en el sujeto se dara ante la
situacin de que unos agentes de salud tengan mayor experiencia que otros o que hayan
egresado recientemente de un programa educativo; estos ltimos probablemente tendrn menos
destreza en el desempeo de su labor.

Por lo tanto, es necesario buscar mecanismos para que las unidades en estudio estn en
igualdad de condiciones durante esa medicin y que se definan las caractersticas del fenmeno
que se pretende observar, procurando que en la muestra esos elementos renan caractersticas
similares.
En general, el mtodo de observacin es sumamente til en todo tipo de investigacin:
descriptiva, analtica y experimental. En el rea de investigacin educacional, social y
psicolgica, es un mtodo de mucha utilidad, en particular cuando se desea conocer aspectos
del comportamiento: relaciones maestro-alumno, el desempeo de los agentes de salud,
relacin del uso de ciertas tecnologas educativas y grado de aprendizaje cognoscitivo y
prctico del personal de salud.
1.9.2 La entrevista
Es la comunicacin establecida entre el investigador y el sujeto de estudiado a fin de obtener
respuestas verbales a las interrogantes planteadas sobre el problema propuesto.
Se estima que este mtodo es ms eficaz que el cuestionario, ya que permite obtener una
informacin ms completa. A travs de ella el investigador puede explicar el propsito del
estudio y especificar claramente la informacin que necesita, si hay una interpretacin errnea
de la pregunta permite aclararla, asegurando una mejor respuesta. Best afirma es tambin
posible buscar la misma informacin por distintos caminos en diversos estadios de la
entrevista, obtenindose as una comprobacin de la veracidad de las respuestas.
Como tcnica de recoleccin de datos la entrevista tiene muchas ventajas; es aplicable a toda
persona, siendo muy til con los analfabetas, los nios o con aquellos que tienen limitacin
fsica u orgnica que les dificulte proporcionar una respuesta escrita. Tambin se presta para
usarla en aquellas investigaciones sobre aspectos psicolgicos o de otra ndole sonde se desee
profundizar en el tema, segn la respuesta original del consultado, ya que permite explorar o
indagar en la medida que el investigador estime pertinente.
Hay dos tipos de entrevista: la estructurada y la no estructurada, la primera se caracteriza por
estar rgidamente estandarizada, replantean idnticas preguntas y en el mismo orden a cada uno
de los participantes, quienes deben escoger la respuesta en 2, 3 o ms alternativas que se les
ofrecen. Inclusive los comentarios introductorios y finales se formulan de la misma manera en
todas las situaciones. Para orientar mejor la entrevista se elabora un formulario que contenga
todas las preguntas. Sin embrago, al utilizar este tipo de entrevista el investigador tiene limitada
libertad de formular preguntas independientes generadas por la interaccin personal.
Algunas ventajas que presenta este tipo de entrevista son:
La informacin es mas fcil de procesar, simplificando el anlisis comparativo
El entrevistador no necesita ser entrenado arduamente en la tcnica
Hay uniformidad en el tipo de informacin obtenida.
Pero tambin tiene desventajas, tales como:
Es difcil obtener informacin confidencial
Se limita la posibilidad de profundizar en un tema que emerja durante la entrevista.
La entrevista no estructurada es ms flexible y abierta, aunque los objetivos de la investigacin
rigen a las preguntas, su contenido, orden profundidad y formulacin se encuentra por entero en

manos del entrevistador. Si bien el investigador, sobre las bases del problema, los objetivos y
las variables, elabora las preguntas antes de realizar la entrevista, modifica el orden, la forma de
encauzar las preguntas o su formulacin para adaptarlas a las diversas situaciones y
caractersticas particulares de los sujetos de estudio.
Este tipo de entrevista es muy til en los estudios descriptivos y en las fases de exploracin
para el diseo del instrumento de recoleccin de datos.
Las ventajas de este mtodo son:
Es adaptable y susceptible de aplicarse a toda clase de sujetos en situaciones diversas
Permite profundizar en los temas de inters
Orienta a posibles hiptesis y variables cuando se exploran reas nuevas.
Entre las desventajas se cita:
Se requiere ms tiempo
Es ms costosa por la inversin de tiempo con los entrevistadores
Se dificulta la tabulacin de datos
Se requiere de mucha habilidad tcnica para obtener la informacin y mayor conocimiento
del tema.
Aun con esas desventajas y dada la utilidad de la entrevista, en sus dos formas, todo
investigador debe familiarizarse con su uso, ya que es probable que la aplique en cualquier tipo
de investigacin.
1.9.3 Cuestionario
Es el mtodo que utiliza un instrumento o formulario impreso, destinado a obtener repuestas
sobre el problema en estudio y que el investido o consultado llena por s mismo.
El cuestionario puede aplicarse a grupos o individuos estando presente el investigador o el
responsable del recoger la informacin, o puede enviarse por correo a los destinatarios
seleccionados en la muestra.
Debido a su administracin se puede presentar problema relacionados con la cantidad y calidad
de datos que pretende obtener para el estudio. Algunos problemas asociados con el envo de los
cuestionarios podran ser: que no fuese devuelto; los consultados pueden evadir la respuesta a
alguna pregunta o no darle la importancia necesaria a las respuestas proporcionadas. Por ello y
otros factores ms, el instrumento que se use para la recoleccin de datos debe ser objeto de
una cuidadosa elaboracin.
Algunas ventajas del cuestionario son: su costo relativamente bajo, su capacidad para
proporcionar informacin sobre un mayor nmero de personas en un periodo bastante breve y
la facilidad de obtener, cuantificar, analizar e interpretar los datos.
Dentro de las limitaciones de este mtodo figuran las siguientes: es poso flexible, la
informacin no puede variar ni profundizarse, si el cuestionario es enviado por correo se corre
el riesgo de que no llegue al destinatario o no se obtenga respuesta de los encuestados; adems,
resulta difcil obtener una tasa alta de complecin del cuestionario. Debido a esa posible
prdida de informacin se recomienda cuando se use este mtodo una muestra ms grande de
sujetos de estudio.

En general, en el proceso de recoleccin de datos para una investigacin, estos mtodos e


instrumentos y fuentes suelen combinarse; cada una con sus ventajas y desventajas, sus
caractersticas propias y la informacin que se requiera, dan flexibilidad para que el
investigador determine su uso apropiado segn el estudio a realizar.
1.9.4 Experimento
Mtodo en el cual las variables pueden ser manipuladas en condiciones que permiten la reunin
de datos, conociendo los efectos de los estmulos recibidos y creados para su apreciacin. En el
experimento existe un control directo sobre un factor delos que se va analizar. La
experimentacin exige seleccionar grupos pareados de sujetos, someterlos a tratamientos
distintos, controlar las variables y comprobar si las diferencias observadas son significativas.
La finalidad de la investigacin experimental es descubrir las relaciones causales, descartando
para ello las explicaciones alternas de los resultados. El mtodo experimental suministra los
datos ms convincentes si se aplican los controles adecuados. En la medida en que el diseo y
la ejecucin del experimento excluyan otras hiptesis que expliquen los mismos resultados, el
gerente de investigacin y el de mercadotecnia estarn seguros de la veracidad de las
conclusiones.

1.10 PRUEBA DE HIPTESIS


1.10.1 PRUEBA DE HIPTESIS
Es la parte de la Estadstica Inferencial en la que el estadstico toma decisiones
basadas en la probabilidad, elige modelos y verifica hiptesis sobre los modelos seleccionados
o de sus parmetros.
Hiptesis Estadstico, es un supuesto o alguna afirmacin acerca de la poblacin
(modelo de distribucin) o sus parmetros.
Una prueba de hiptesis, es una afirmacin o contrastacin de una hiptesis
estadstico es un procedimiento para decidir si se acepta o se rechaza una hiptesis estadstica.
1.10.2 ESTABLECIMIENTO DE HIPTESIS NULA Y ALTERNA
La Hiptesis Nula, denotada por Ho, es la primera afirmacin la que se va ha
someter a prueba para ser aceptada o rechazada. La Hiptesis Alterna, denotada por HA, es
aquella que se acepta cuando la hiptesis nula es rechazada.
Para aceptar o rechazar una hiptesis nula debemos efectuar una particin adecuada
del dominio de la distribucin muestral, en dos regiones mediante un punto C, denominado
punto crtico: la regin de rechazo ( R ) y la regin de aceptacin (A).

R
C

Reg. de Aceptacin

Regin de Rechazo

A. PRUEBA DE HIPTESIS DE INVESTIGACION


Ejemplo: Supongamos que un grupo de estudiantes de EFPAE-UNSCH, actualmente
reciben las clases con la estrategia didctica tradicional Leccin Magistral
alcanzando un rendimiento acadmico promedio de 12.5. Un grupo de docentes
ha implementado un nuevo sistema de enseanza didctica, con la finalidad de
mejorar el rendimiento acadmico. Para evaluar el nuevo sistema se toman
algunas asignaturas en las que se evaluar y controlar, sometindose a varias
pruebas. El objetivo del nuevo sistema es demostrar que efectivamente aumenta
el rendimiento acadmico mayor a 12.5; esto es >12.5. Una hiptesis de
investigacin como la presente se debe formular y proponer como una hiptesis
alternativa:
Ho : 12.5
HA : 12.5

Investigacin (n)

Conclusin:
i) No se puede rechazar Ho (o = 12.5); el estadstico no
puede decir que el nuevo sistema es mejor
ii) Se puede rechazar H0 (o 12.5) el estadstico puede
inferir que HA: 12.5, es verdadera.

B. PRUEBA DE VALIDEZ DE UNA AFIRMACIN


Ejemplo: Un fabricante de mermeladas manifiesta que sus envasados de un litro contienen
640 mililitros de fresa. Para comprobar la validez de la afirmacin del fabricante
se seleccionan una muestra de envases de un litro para medir su contenido.
SOLUCION
i) La afirmacin del fabricante se supone verdadera, amenos que la prueba
demuestre lo contrario.

ii) La enunciacin de las hiptesis es:


H : 640
HA : 640
iii) Si despus de la contrastacin los resultados son:
n = H, No se puede rechazar, es decir, no se puede dudar de la afirmacin del
fabricante.
n H, Se rechaza, se infiere HA : 640 es verdadera, por tanto, la
afirmacin del fabricante es incorrecta porque los envases se llenan con menor
cantidad a 640 mililitros de fresa. Es necesario tomar acciones correctivas.
En general, una prueba de hiptesis referente a los valores de una media de poblacin
asumir una de las tres formas siguientes:
H :

H :

H :

HA :

HA :

HA :

debe

110.3 ERRORES TIPO Y TIPO II


La hiptesis nula y alternativa son aseveraciones sobre la poblacin que compiten entre s. La
hiptesis nula H es verdadera o lo es la hiptesis alternativa HA, pero no ambas. En el caso
ideal, el procedimiento de prueba de hiptesis debe conducir a la aceptacin de H cuando sea
verdadera y al rechazo de HA cuando HA sea verdadera. Desgraciadamente no siempre son
posibles las conclusiones correctas. Como las pruebas de hiptesis se basan en informacin de
muestras, debemos considerar la posibilidad de errores.
Condicin
poblacin

de

Decisin

Aceptar H
Aceptar HA

la

H
Verdadera

Verdadera

No hay error (Verdadero


positivo)
Error Tipo I
( o falso positivo)

Error Tipo
II ( o falso negativo)
No hay error
(Verdadero negativo)

Ejemplo: Las hiptesis del ndice acadmico:


H = 12.5
HA

12.5

HA

E1 = Rechazar H cuando sta es verdadera. Los decisores digan que el nuevo sistema
mejora el rendimiento acadmico H (
no es mejor que actual.
E2

) cuando en realidad el nuevo sistema

Aceptar H cuando es falsa. El decisor diga o concluya de que el nuevo sistema no


es mejor que el actual ( =
acadmico.

cuando en realidad s mejora el rendimiento

En la prctica, la persona que efecta la prueba de hiptesis especfica la mxima


probabilidad permisible, llamada nivel de significancia para la prueba, de cometer un
error de tipo I. Se acostumbra los valores de 0.05 y 0.01 para el nivel de significancia.

1.10.4 PRUEBA UNILATERAL SOBRE LA MEDIA DE UNA POBLACIN: MUESTRA


GRANDE
Ejemplo: La etiqueta de litro de agua gaseosa dice que ese envase contiene 500 ml. Se
quiere comprobar esa aseveracin mediante una prueba de hiptesis. El inters es
detectar botellas incompletas de lo que afirma el fabricante.
SOLUCION
Paso 1: Estableciendo H y HA apropiadas:
H : 500 ml. la etiqueta es correcta
HA : 500 ml. la etiqueta es incorrecta
i) Si los datos muestrales indican que no se puede rechazar H, no se tomar
ninguna accin contra el fabricante.
ii) Si los datos muestrales indican que se puede rechazar H, el fabricante
tendr pruebas estadsticas para inferir hiptesis alternativa HA : 500 ml.
es cierta.
iii) Suponiendo que se seleccionan n = 50 botellas. Cunto es el intervalo de
variacin de las botellas que pueden contener 500 ml. aceptables?
- Asumiendo
entonces:

= 500 ml. y de acuerdo a los datos histricos

x =
= 500

x =

= 5 ml.,

5
= 0.71
50

Probar:
H : 500 m. l.
HA : 500 m. l
Requiere especificacin de la probabilidad (nivel de significancia = )
mxima permisible de incurrir en el error I, cuando la hiptesis nula es
cierta como una igualdad.
Para el EJEMPLO: El investigador plantea: si = 500 hay una probabilidad
de 99% de no llevar a cabo ninguna accin en contra del fabricante. Si bien
no desea acusarla falsamente de no llenar correctamente su envase, est
dispuesto a conformarse con una probabilidad de 1% de caer en ese error.
Por tanto: = 0.01 mxima permisible de incurrir en un error tipo I.

x =

= 0.01

= 500
Se rechaza H

x =

5
= 0.71
50

No se rechaza H

a) Uso de la Prueba Estadstica de X si est en Regin de Rechazo o Aceptacin

Zc =

x o

Z = Distribucin de probabilidad normal estndar

X = Media muestral

= Desviacin estndar poblacional


n = Tamao de la muestra

Entonces: Z t = 0.5000 0.01 = 0.4900 (buscar en la tabla Z) = - 2.33

= 0.01

Se rechaza H s Z -2.33

= 500

Se rechaza H

Zc =

x o

Nota: Cuando la regin de rechazo est slo

en un lado de distribucin de muestreo,


se dice prueba de hiptesis unilateral.

n
= 0.01
2.33

Se rechaza H

Suponiendo X = 498 m. l. Est el valor de X = 498 en la regin de rechazo?

Zc =

498 500
= - 2.83
5
50

Comparando Z t = - 2.83 (Z calculado) con Z = -2.33 (valor crtico o Z tabla)

La regla es:
Zc > Zt : Se rechaza H : 500 y se acepta HA : 500
Zt > Zc ; Se rechaza HA : 500 y se acepta la H : 500

Entonces: Zc = -2. 83 Zt = - 2.33, por tanto, se rechaza la H : 500 y se acepta


HA : 500, por lo que hay que tomar alguna accin correctiva contra el productor.

Zc = -2.83

-.2.33

Se rechaza H

a) Empleo de los valores P.- Es otro mtodo empleado para llegar a la conclusin de la
prueba de hiptesis, basada en una probabilidad del valor de P. Se supone que la
hiptesis nula es verdadera, el valor de P es la probabilidad de obtener un resultado de
la muestra que sea al menos tan importante como el que se observa.

i) El valor de P es la probabilidad de que Z sea


menor que 2.83.
ii) Por medio de la tabla de distribucin de
probabilidad normal estndar: Z = -2.83 (buscar
en la tabla Z) = 0.4977

Zc = -2.83

-.2.33

Se rechaza H

iii) Por tanto, P = 0.5000 0.4977 = 0.0023


iv) Este valor P indica una probabilidad reducida de obtener una media muestral tan
pequea como X = 498 cuando H es verdadera.
La regla es:
Rechace H si P

Entonces: como (P = 0.0023) ( = 0.01) se rechaza H : 500 y se acepta


HA : 500
NOTA: El mtodo de estadstico de prueba como el del valor de P siempre
producir la misma conclusin de prueba de hiptesis. La seleccin de prueba
depende de la preferencia del estadstico.

Ejemplo: S X = 499
Zc =

x o

Zc =

499 500
= - 1.41 no est en la regin de rechazo
5
50

(Zc = -1.41) (Zt = - 2.33); se acepta HA: 500 y se rechaza HO: 500

La regla es:

Zc Zt : Se rechaza HA y se acepta H
Zc Zt : Se acepta HA y se rechaza H
1.10.5 PRUEBA BILATERAL SOBRE LA MEDIA DE UNA POBLACIN: CASO MUESTRAS
GRANDES.
A) USANDO X
Ejemplo: Con la tecnologa actual Pentium IV el promedio de socios atendidos en la
ventanilla No. 4 de la Cooperativa Santa Mara Magdalena no sobrepasan a ms
de 30 personas. Sabiendo que la nueva tecnologa en computadores ya no es
digital, sino son tecnologa que procesa el dictado, que puede permitir atender
tranquilamente en promedio a 30 personas, que es la exigencia exacta de la
Cooperativa Santa Mara Magdalena.

SOLUCION
i) Planteamos la Hiptesis, suponiendo que la nueva computadora satisfaga la
exigencia de la cooperativa.
H : = 30
HA : 30 : Hay la Probabilidad que sea a 30
Suponiendo:
= 0.01 Por condicin de bilateralidad, la exigencia es exactamente 30, entonces,
a 30, la hiptesis H debe ser rechazada.
n = 50
ii) Regin de rechazo bilateral

0 .0
=
= 0.005, tal como:
2
2

iii) N. C. = 1- = 1 0.01 = 0.99 2 = 0.495 (buscar en la tabla Zt) = 2.57;


valor crtico en los extremos de la cola de la probabilidad de distribucin
normal.


0.01
=
= 0.005
2
2
-.2.57

0.01
=
= 0.005
2
2
0

2.57

Se rechaza H

Se rechaza H
Regla de Rechazo:

Rechace H

s Zc -2.57

Zc 2.57

iii) Suponiendo que con una muestra de 40 computadoras se obtuvo X = 28 socios


atendidos, desviacin estndar S = 5 atencin determinamos el valor estadstico
de prueba de hiptesis:
Zc =

X
=
s
n

Zc =

28 30
= - 2.53
5
40

Conclusin: rechazar H: porque Zc (-2.53) Zt (-2.57), es decir, las


computadoras no cumplen con las exigencias de la Cooperativa Santa Mara
Magdalena.
B) USANDO P
i) X = 28
Z = -2.53 (buscar en la tabla Z) = 0.4945. Entonces, 0.5000 0.4945 = 0.0055 = P
Zt = 2.57
ii) P = ? (qu valor para P?)
P = 0.0055 x 2 = 0.011
Regla:

Aceptar H si P >
2

Rechazar H

Si: = 0.01

= 0.005
2

si P


(0.005), por tanto, no se rechaza la H
2
C) RELACION ENTRE LA ESTIMACIN POR INTERVALO Y LA PRUEBA DE
HIPTESIS
P (0.011)

i) Cuando n 30; Nivel de confianza = 1 - , adems, cuando es conocido

x Z

ii) Cuando no se conoce sino y se estima a partir de S

S
n

x Z
2

iii) La configuracin de la hiptesis acerca del valor de un parmetro poblacional:


H : =

= Media de la poblacin supuesto

HA :
iv) La regin de no rechazo para H comprende todos los valores de la media X que estn
entre los errores estndar - Z y + Z de .
2

Z
2

s
n

REGLA:

Si el intervalo contiene el valor , no rechace


H. En caso contrario rechace H
Ejemplo:
Datos:

H : = 30

i) = 1 0.95 = 0.05 (/2 =0.025 0.5000 0.025 = 0.475)


Buscando en la tabla, Z = 1.96.

HA : 30
N. C. = 95%
n = 40

X = 28

, 2 = 0.95 2 = 0.475 (buscar en la tabla Z)


Z = 1.96
ii)

Z
2

=5

28 1.96

5
40

28 1.55
26.45

29.55

iii) Conclusin = 30 no est comprendido en el


intervalo, por tanto, rechazar la H
1.10.6 PRUEBAS SOBRE LA MEDIA DE UNA POBLACIN: CASO N 30
i) Cuando se conoce
Z=

X o

ii) Cuando se estima a partir de S


t=

X o
S
n

Donde S =

( Xi X ) 2
n 1

Ejemplo: Se ha solicitado a 20 pasajeros de la Empresa de Transportes Molina Unin,


que califiquen la calidad de servicio en los siguientes trminos:
0
0
1
2
3
4

No opina
Psimo
Regular
Bueno
Muy bueno
Excelente

El calificativo que obtenga un promedio de 3 ms se considera servicio superior. Los


indicadores de respuesta son las siguientes: 4, 3, 2, 5, 3, 2, 3, 3, 4, 3, 4, 2, 5, 3, 2, 2, 2,
3, 4 y 2. Determinar si la media de la poblacin de calificacin es mayor a 3.
SOLUCION
i) X =

S=

X I 4 3 ... 2
=
= 3.05
n
20

( X i X ) 2
= 0.99 1.0
n 1

ii) Suponiendo:

= 0.05 (nivel de significancia)


2
iii) Las hiptesis seran:
H : 3

HA : 3

iv) tn 1, = t20 1, 0.05 = t19, 0.05

1.729

REGLA DE RECHAZO:

tc tt. Acepte HA y Rechace H


S: tt tc: Acepte Ho y Rechace HA

S.

Entonces:

tc =

X o
S
n

tc (0.224) tt (1.729)

tc = 3.051 3

= 0.224

20
se acepta H, la calificacin es menor a 3.

PRUEBA BILATERAL.- Un fabricante de mermeladas debe llenar sus recipientes con


un peso medio de = 350 onzas, con el debido cuidado de que no sea ms o menos de
esta medida. Para controlar este proceso se evala peridicamente una muestra aleatoria
de 10 recipientes. Las muestras tienen los siguientes contenidos: 350.02, 350.22, 249.82,
349.92, 350.22, 350.32, 350.12, 349.92, 349.98 y 350.05
SOLUCION
i) H : = 350
HA : 350
ii) X =

X I 350.02 ... 350.05


=
= 350.059
n
10

( X i X ) 2
= 0.16
n 1

iv) = 0.05
,
= 0.025 (nivel de significancia)
2

v) tn 1,
= t9, 0.025 = 2. 262
2
iii) S =

-2.262
Se rechaza H

2.262
Se rechaza H

REGLA DE RECHAZO:
Rechace H

Entonces:

tc =

X o
S
n

s tc , < tt

350
tc = 350.059
16

= 1.17

10

tc (1.17) est en la regin de aceptacin. Por tanto, se acepta la H


1.10.7 PRUEBAS SOBRE LA PROPORCION DE UNA POBLACION
Empleando los smbolos P para indicar la proporcin poblacional y P para representar
determinado valor supuesto de dicha proporcin, las tres formas de una prueba de
hiptesis acerca de una proporcin poblacional son las siguientes:
H: P P
Ha: P P

H: P P
Ha: P P

H: P P
Ha: P P

Prueba unilateral

Prueba bilateral

La prueba de hiptesis respecto a una proporcin de la poblacin se basa en la


diferencia entre la proporcin de la muestra las pruebas se aparecen mucho a los de las
pruebas de hiptesis respecto a una media de poblacin. La nica diferencia es que usan
la proporcin de la muestra y su desviacin estndar p para determinar el estadstico
de prueba.
Ejemplo:
DATOS:
P = 0.35 de productos buenos
n = 120
Despus de una capacitacin
P = 0.38
Se desea saber el efecto de la capacitacin para mejorar la calidad
i) H: P P

ii) p =

Pq
n

Ha: P P
Z=

P1 P0
Pq
n

ii) Si = 0.05 Zt 0.05, 120 Zt = 1.658


0.38 0.35
iii) Zc Zc =
= 0.69
0.0435

.35 x0.65
= 0.0435
120

REGLA DE RECHAZO:
Rechace H

s Zc 1.658

v) Cmo Zc < Zt No se rechaza la H, es decir, despus de capacitacin no aument


la calidad de la proporcin de productos de calidad.
vi) P Z 0.69, 00 (tabla Z) 0.2580 0.5000 0.2580 = 0.2420 = 24.20%

Unilateral Inferior

Unilateral Superior

H: P P
Ha: P P

Bilateral

H: P P
Ha: P P

H: P P
Ha: P P

- Z

Se rechaza H

- Z/2

Se rechaza H

Z/2
Se rechaza H

NOTA: en todos los casos se rechaza H si el valor de P<


1.10.8 CLCULO DE PROBABILIDAD DE ERRORES DE TIPO II
Datos: - Vida til de un producto = 120 horas
- = 12 horas
- n = 36
- = 0.05
Entonces:
i) H: 120
Ha: 120
iii) Z =

ii) Si X = 118

118 120
= -1.0 iv) -1.0 (buscar en la tabla Z) = 0.3413
12
36

iv) 0.5000 0.3413 = 0.1587 = 15.87% es la probabilidad de cometer error de tipo II.
1.10.9 DETERMINACION DE TAMANO DE MUESTRA PARA UNA PRUEBA DE
HIPTESIS SOBRE UNA MEDIA DE POBLACIN.
Si H:
Ha:

La parte superior de la figura, es la distribucin muestral de X cuando H es verdadera y


= . Observe que el nivel de significancia , especificado por el usuario, determina la
regin de rechazo de la prueba. Sea C el valor crtico tal que X < C determina la regin
de rechazo para la prueba. Si Z representa el valor de Z que corresponde a un rea de
en la cola de la distribucin de probabilidad normal estndar, C se calcula mediante la
siguiente ecuacin:
C = - Z

para:

X cuando
H es verdadera y =
Distribucin muestral de

Se rechaza H

P =

X cuando
H es verdadera y a <
Distribucin muestral de

C = a + Z
para la figura anterior
n

Igualando las dos ecuaciones:

= a + Z
n
n

- Z

- a =

Z Z

O a

n=

Z 2
2

O a 2

Leyenda:
Z = Valor de Z que origina un rea de en la cola de una distribucin normal estndar

Z = Valor de Z que origina un rea de en la cola de una distribucin normal estndar


= Desviacin estndar de la poblacin
= Valor de la media de poblacin en la hiptesis nula
a = Valor de la media de poblacin usada para el error de tipo II
NOTA: En una prueba de hiptesis bilateral, use la n con Z/2 en vez de Z
Ejemplo: Considerando el ejemplo del punto anterior:
Datos:
i) H: 120
Ha: 115
ii) Aseveraciones:
1) De error de tipo I: si la vida til promedio del producto es = 120, estoy
dispuesto a aceptar una probabilidad de = 0.05 de rechazar el embarque.
2) De error tipo II: si la vida til promedio del producto es 5 horas menos que la
especificacin ( = 115), estoy dispuesto a arriesgar una probabilidad de = 0.10
de aceptar el embarque.
iv) Z0.05 tabla 1.645 = 0.5000 0.05 = .4500 (buscando en la tabla)
Z0.10 tabla 1.282 = 0.5000 0.10 = .4000 (buscando en la tabla)
v) n =

1.645 1.2822 122


120 1152

= 49

EJERCICIOS DE REPASO
1.- Un artculo reciente indica que la edad media de las computadoras es igual o mayor a 10
aos, con desviacin estndar de 2. Despus de contrastar una muestra de 18
computadoras, la media es de 9,98 aos. Desarrolle la prueba de hiptesis con nivel de
riesgo 0.01.
2.- Con respecto a la informacin del problema anterior, se realiz otra prueba estadstica con
20 muestras arrojando como resultado; media = 8.89 y desviacin estndar 3. Determine la
prueba de hiptesis.
3.- Con los datos del ejercicio 2 determine el valor de P.
4.- Una cadena de tiendas de descuento expide su propia tarjeta de crdito. El gerente de esta
funcin desea averiguar si el saldo insoluto (sin pagar) medio mensual es mayor que $ 400.
El nivel de significancia se fija en 0.05. Una revisin aleatoria de 172 saldos insolutos
revel que la media muestral es $407, y que la desviacin estndar de la muestra vale $ 38.
Debera concluir el funcionamiento de crdito que la media poblacional es mayor que $
400, o bien es razonable suponer que la diferencia de $7 (obtenida de $407 - $400 = $7) se
debe al azar? Cul es el valor de P?
5.- La industria de muebles Arte Moderno produce un conjunto de muebles de madera. La
produccin semanal de juego de comedor, se distribuye normalmente, con una media de

200 y una desviacin estndar de 16. Recientemente, debido a la expansin del mercado,
se han introducido nuevos mtodos de produccin y se han contratado ms empleados. El
promotor quisiera saber si ha habido un cambio total en la produccin semanal de juego de
comedor. Para ello se plantea un nivel de significancia de 0.01, muestra de 50 y una media
de 203.5.
6.- Tomando el ejercicio 5, y si n = 25 y S = 9, cual es la variacin del resultado.
7.- Suponga que en la prxima temporada 2 empresas, para seguir en el mercado, deben
absorber al menos 35% de los consumidores. La empresa A est interesada en evaluar la
oportunidad que tiene de lograr posicionarse, y planea la realizacin de una encuesta que
incluya 2,000 consumidores a nivel regional. Cul es la probabilidad de posicionamiento
de la empresa A, considerando un nivel de riesgo 0.05 y que en una investigacin muestral
760 dijeron ser consumidores de la empresa A? Cul es el varo de P?

UNIDAD II

MTODOS ESTADSTICOS PARA LA INVESTIGACIN


EN CIENCIAS EMPRESARIALES
2.1 T-STUDENTE (Se usa cuando n 30, proveniente de N pequeo)
En probabilidad y estadstica, la distribucin t (de Student) es una distribucin de probabilidad que
surge del problema de estimar la media de una poblacin normalmente distribuida cuando el
tamao de la muestra es pequeo. sta es la base de la popular prueba t de Student para la
determinacin de las diferencias entre dos medias muestrales y para la construccin del intervalo de
confianza para la diferencia entre las medias de dos poblaciones. La distribucin t surge, en la
mayora de los estudios estadsticos prcticos, cuando la desviacin tpica de una poblacin se
desconoce y debe ser estimada a partir de los datos de una muestra.
Esta distribucin tiene la caracterstica de que puede ser usada en aquellos casos en los que el tamao
de muestra esta limitado, debido a las caractersticas del experimento a realizar.
Por ejemplo. En la industria es comn encontrarse con productos que debido a los materiales y/o
proceso son sumamente caros y para realizar la prueba es necesario destruirlos.
En estos casos el tamao de la muestra debe ser pequeo cinco a ocho pares.
Una limitacin en la aplicacin de este estadstico es que la poblacin de la que se toma la muestra
tiene una distribucin normal.
Tcnicamente se puede describir la prueba t de Student como aquella que se utiliza en un modelo en
el que una variable explicativa (var. independiente) dicotmica intenta explicar una variable
respuesta (var. dependiente) dicotmica.
La prueba t de Student como todos los estadsticos de contraste se basa en el clculo de estadsticos
descriptivos previos: el nmero de observaciones, la media y la desviacin tpica en cada grupo. A
travs de estos estadsticos previos se calcula el estadstico de contraste experimental. Con la ayuda
de unas tablas se obtiene a partir de dicho estadstico el p-valor. Si p<0,05 se concluye que hay
diferencia entre los dos tratamientos
Ejemplo:

1) En un trabajo de investigacin, en un programa de salud para nios en edad escolar se considera


que el peso medio neto de la tableta de cierto medicamento debe ser de 30 mg. Para revisar el peso
de las tabletas a utilizarse se pes en forma aleatoria una muestra de 10 tabletas. Las mediciones
fueron: 28, 30, 31, 32, 26, 30, 31, 29, 28 y 39. Con nivel de significancia de 0.01 se puede
concluir que el peso medio por tableta no se mantiene en su valor apropiado?
Solucin
i) Datos:
n = 10

= 30
= 0.01
X

=?
S=?

ii) Clculo de X y S:
ii) X =

X I 28 ... 30
=
= 29.5
10
n

( X i X ) 2
= 1.78
n 1

iv) = 0.01
,
= 0.005 (nivel de significancia)
2
iii) S =

iii) Planteamiento de hiptesis:


H: 1 = 30; El peso de las tabletas se mantiene en su peso normal.
Ha: 1 30; El peso de las tabletas no se mantienen en su peso normal.
iv) Determinacin de tc y tt

tc =

X o
S
n 1

tt = tn-1, /2

tc = 291.5,78 30

= - 0.84

t9, = 0.005
3.25

v) Regla de decisin:

tc > tt : Se rechaza la H y se acepta Ha


tc < tt : Se acepta la H y se rechaza Ha
tc = tt : Se rechaza la H y se acepta Ha
Entonces:
Respuesta al caso:

Como tc (- 0.84) < tt (3.25) Se rechaza la HA y se acepta HO; es decir, que el


peso de las tabletas se mantiene en su peso normal, a un nivel de significancia de
= 0.01.

2) Una Fbrica de aguas gaseosas asegura que la botella tamao personal contiene 500ml. Los
estudiantes de la Escuela de Formacin Profesional de Administracin de Empresas analizan
una muestra de 25 botellas y encuentran un contenido medio de 450 ml. con una desviacin
estndar de 100ml. Rechazara Ud. la afirmacin de la Fbrica de aguas gaseosas? Use un
nivel de significancia de 0.05.

SOLUCIN
i) Datos:
= 500
X = 450
S = 100
n = 25
= 0.05
ii) Planteamiento de hiptesis
H: 1 = 2; Las botellas tamao personal contiene 500ml.
Ha: 1 2; Las botellas tamao personal contiene 450ml
La prueba es de una sola cola, ya que slo interesa determinar aceptar o rechazar la
afirmacin del fabricante. La desigualdad de la hiptesis alternativa hacia la regin de
rechazo en la cola izquierda de la distribucin.

Porque tiene que probarse que X = 450 es < que de la fbrica

iii) Calculando t:

tc =

X o
S
n 1

iv) Determinando t tabla:

tt = tn-1, /2

t24, = 0.025
2.0639

tc = -2.45
= 500
tt = - 1.711

500
tc = 450100
24

= - 2.45

v) Estrategias de decisin:
Cuando:

tc > tt : Se rechaza la H y se acepta Ha


tc < tt : Se acepta la H y se rechaza Ha
tc = tt : Se rechaza la H y se acepta Ha
Respuesta al caso:
Como tc (-2.45) > tt (-1.711) Se rechaza la H y se acepta Ha; es decir, se rechaza la
afirmacin de la fbrica de aguas gaseosas. En otras palabras, las botellas tamao
personal contienen 500 ml. de aguas gaseosas.

3) Se aplicaron test de desempeo laboral a 20 trabajadores en dos instituciones. El promedio de la


institucin A fue de 60 y la desviacin tpica 10; en la institucin B el promedio fue de 68 y la
desviacin tpica 8.
a) Compruebe la hiptesis de que no existe ninguna diferencia entre las medias, con un nivel de
significacin de 0.10.
b) Compruebe la hiptesis de que en la institucin b es mayor el rendimiento promedio, con alfa
0.05.
SOLUCIN
a)
i) Datos:

na = nb = 20
a = 60
b = 68
a = 10
b = 8
a = 0.10
b = 0.05
ii) Planteamiento de hiptesis
H: 1 2;
Ha:

1 = 2;

Existe diferencia de medias de evaluacin de desempeo en las instituciones


investigadas.
No existe ninguna diferencia entre las medias de evaluacin de desempeo
laboral en las instituciones investigadas

La hiptesis alternativa no indica ninguna direccin, por lo que se trata de una prueba
de dos colas.
iii) Calculando tc:

tc =

a b

na

tc =
b

nb

60 68
10 2 8 2

20 20

2.794

iv) Determinando t tabla:

tt = tn-1, /2 , t19, 0,05


1.73

tc = -2.794

tt = 1.73
v) Estrategias de decisin:
Como tc (-2.794 < tt (2.09) se acepta la H y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluacin de desempeo laboral en las
instituciones investigadas.
b)
i) Datos: (Idem)
ii) Planteamiento de hiptesis
1 = 2; No existe ninguna diferencia de desempeo laboral en las dos instituciones
investigadas
Ha: 1 < 2; En la institucin b es mayor el rendimiento laboral promedio.
H:

iii) Calculando tc:

tc =

a b

na
iv) Determinando t tabla:

tt = t n-1, /2

t19, 0.025
2.09

nb

tc =
b

60 68
10 2 8 2

20 20

2.794

tc = -2.794

tt = 2.09
vi) Estrategias de decisin:
Como tc (-2.794) < tt (2.09) se acepta la H y se rechaza la Ha; es decir, que no
existe diferencia entre las medias de evaluacin de desempeo laboral en las
instituciones investigadas.
4) En un programa de capacitacin se encontr que el tiempo medio que necesitaron 18 mujeres
para aprender fue de 25 horas con una desviacin tpica de 3 horas; mientras que el tiempo
medio de aprendizaje para 15 varones fue de 28 horas, con una desviacin tpica de 4 horas.
Compruebe la hiptesis de que las mujeres aprenden ms rpidamente que los varones, con un
nivel de significancia de 0.01.
i) Datos:

n1 = 18
n2 = 15
1 = 25
2 = 28
21 = 3
22 = 4
= 0.01
ii) Planteamiento de hiptesis
H: 1 = 2; El tiempo promedio de aprendizaje entre las mujeres y varones es igual
Ha: 1 < 2; El tiempo promedio de aprendizaje de las mujeres es ms rpido que de los
varones.
iii) Calculando tc:

tc =

a b

na
iv) Determinando

nb

tc =
b

25 28
32 4 2

18 15

2.40

t tabla:

El grado de libertad es igual al nmero total de elementos muestreados menos el nmero de


muestras (18 +15 -2 = 31)

tt = t n-1, /2 , t 31, /2, = 0.005


2.7440

v) Estrategias de decisin:

tc = -2.40
tt = 2.7440

Como tc (-1.915) < tt (2.576) se acepta la H y se rechaza la Ha; es decir, el tiempo


promedio de aprendizaje de las mujeres es ms rpido que de los varones, a un nivel
de significancia de 0.01.

2.2 CHI CUADRADO TABLA DE CONTINGENCIA O INDEPENDENCIA ( )

La prueba chi-cuadrado es una forma de contrastes de hiptesis que sirve para comprobar
afirmaciones acerca de las funciones de probabilidad (o densidad) de una o dos variables aleatorias.
Esta prueba no pertenece propiamente a la estadstica paramtrica pues no establecen suposiciones
restrictivas en cuanto al tipo de variables que admiten, ni en lo que refiere a su distribucin de
probabilidad ni en los valores y/o el conocimiento de sus parmetros.
Se aplica bsicamente cuando queremos averiguar si dos variables (o dos vas de clasificacin) son
independientes estadsticamente o cuando queremos comprobar la independencia de frecuencias entre
dos variables aleatorias, X e Y.
Las hiptesis contrastadas en la prueba son:
Hiptesis nula: X e Y son dependientes o influyentes.
Hiptesis alternativa: X e Y no son dependientes o influyentes

El estadstico de prueba se basa en las diferencias entre la Oi y Ei y se define como:

Grados de libertad = (f 1) (c -1) = al nmero de filas de la tabla de contingencias menos 1 por el


nmero de columnas de la tabla de contingencias menos 1.

La regla de decisin:
S: C2 Calculada es > que t2 Tabla, se acepta la A o se rechaza la O
S: C2 Calculada es < que t2 Tabla, se acepta la O o se rechaza la A
Ejemplo:
1) En un test de desempeo laboral, con opciones de respuesta, de
falso o verdadero, un trabajador contest correctamente 60
preguntas de un total de 100. Si se desea probar que el trabajador
conoca la materia examinada. Cmo se planteara las hiptesis?
El trabajador habra contestado sin saber la materia? Tomar la
decisin usando un nivel de significancia de 0.05.
SOLUCIN
a) Sin aplicar la correccin:
i) Planteamiento de hiptesis
Ha: El trabajador contest sin saber la materia
Ho: El trabajador respondi sabiendo la materia
O

(O - E)

(O - E)

(O - E)/E

Correctas

60

50

10

100

incorrectas

40

50

-10

100

2
4

=4
2
C

ii) Calculando t2 (tabla); t2

221 ,0.05

12 ,0.05

t2 (tabla)

0.05

3.841

iii) Estrategias de decisin:


Cuando:

C2 = t2 , Se acepta la Ha
C2 < t2 , Se rechaza la Ha
C2 > t2 , Se acepta la Ha

Respuesta al caso:

2n1 ,

Como: C2 > t2 , Se acepta la Ha, y se rechaza la Ho, es decir, el trabajador


contest sin saber la materia, a un nivel de significancia de
0.05.
b) Aplicando la correccin:

((O - E) - 0.05) ((O - E)- 0.05) /E

(O - E)

Correctas

60

50

10

90.5

1.81

incorrectas

40

50

-10

90.5

1.81
3.62

= 3.62
2
C

i) Calculando t2 (tabla); t2

221 ,0.05

2n1 ,

12 ,0.05

t2 (tabla)

0.05

3.841

ii) Estrategias de decisin:


Como: C2 (3.62) < t2 (3.841), se acepta la Ho, y se rechaza la Ha, es decir, el
trabajador respondi sabiendo la materia, a un nivel de significancia de 0.05.

2) En una investigacin, cuya diseo fuera:


MOTIVACIN INTRINSECA Y LA REMUNERACIN, DE LOS TRABAJADORES DE
LA UNIVERSIDAD NACIONAL SAN CRISTBAL DE UAMANGA
a) Formulacin del problema
Existe relacin de dependencia entre la motivacin intrnseca y la remuneracin, en el
nivel de desempeo laboral de los trabajadores de la Universidad Nacional de San
Cristbal de Huamanga?
b) Objetivo
Demostrar la relacin de dependencia entre la motivacin intrnseca y la remuneracin, en
el nivel de desempeo laboral de los trabajadores de la Universidad Nacional de San
Cristbal de Huamanga.
c) Hiptesis
Existe una relacin de dependencia entre la motivacin intrnseca y la remuneracin, en el
nivel de desempeo laboral de los trabajadores de la Universidad Nacional de San
Cristbal de Huamanga.

d) El tem principal podra haber sido de la siguiente forma:


En su opinin, Existe relacin de dependencia entre la motivacin intrnseca y la remuneracin
para buen desempeo laboral de los trabajadores de la Universidad Nacional de San Cristbal de
Huamanga?
MA

ED

MD

Hay dependencia (HD)


No hay dependencia (NHD)

LEYENDA:
HD
=
NHD =
MA
=
A
=
I
=
ED
=
MD
=

Hay dependencia
No hay dependencia
Muy de acuerdo
Acuerdo
Indiferente
En desacuerdo
Muy en desacuerdo

SOLUCIN

a) Planteamiento de hiptesis
= Existe relacin independiente entre la motivacin intrnseca y la remuneracin, para
buen desempeo laboral de los trabajadores de la Universidad Nacional de San Cristbal de
Huamanga.

= Existe una relacin de dependencia entre la motivacin intrnseca y la


remuneracin, para buen desempeo laboral de los trabajadores de la Universidad
Nacional de San Cristbal de Huamanga.
Tabulacin de respuestas: n = 240 trabajadores

MA

ED

Hay
dependencia

IIIIIIIIII

IIIIIIIIII
IIIIIIIIII

IIIIIIIIII

-.-

No hay
dependencia

IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII

IIIIIIIIII

IIIIIIIIII
IIIIIIIIII
IIIIIIIIII

IIIIIIIIII

MD
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII
IIIIIIIIII

b) Consolidacin de cantidades o datos observados:


Hay dependencia
No hay dependencia
TOTAL

c) Clculo de valores esperados:

MA
10
40
50

A
20
10
30

I
10
10
20

ED
-.30
30

MD
40
70
110

TOTAL
80
160
240

MA
16.67
33.33

Hay dependencia
No hay dependencia

A
10
20

I
6.67
13.3

ED
10
20

MD
36.67
73.3

PRIMERA FILA:
Celda (1,1) =

50 x80
16.67 ,
240

Celda (1.3) =

20 x80
6.67 ,
240

Celda (1.5) =

110 x80
36.67
240

Celda (1,2) =

Celda (1.4) =

30 x80
10
240

30 x80
10
240

SEGUNDA FILA:
Celda (2,1) =

50 x160
33.33 ,
240

Celda (2,2) =

30 x160
20
240

Celda (2.3) =

20 x160
13.33 ,
240

Celda (2.4) =

30 x160
20
240

Celda (2.5) =

110 x160
73.33
240

d) Tabulacin de datos observados (o) y esperados (e) para determinar ( C2 ):


O

(O - E)

(O - E)

(O - E)/E

HD MA

10

16.67

-6.67

44.49

2.67

HD A

20

10

10

100

10

HD I

10

6.67

3.33

11.09

1.66

HD ED

10

-10

100

10

HD MD

40

36.67

3.33

11.09

0.30

NHD MA

40

33.33

6.67

44.49

1.33

NHD A

10

20

-10

100

NHD I

10

13.33

-3.33

11.09

0.90

NHD ED

30

20

10

100

NHD MD

70

73.33

-3.33

11.09

0.15
37.01

C2 = 37.01
CALCULANDO t2 (tabla)

Grado de libertad:

(Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

t2 = 24 , 0.05 = 9.488
e) Resultado y decisin:

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

Regin de rechazo

9.488

37.01

Cmo ( C2 CALCULADO = 37.01) > ( t2 TABLA = 9.488)


Se acepta la hiptesis A y se rechaza la O ; Es decir, existe una relacin
dependiente entre la motivacin intrnseca y la remuneracin, para buen
desempeo laboral de los trabajadores de la Universidad Nacional de San
Cristbal de Huamanga, al nivel de significancia de 0.05.

3) En una investigacin, cuya diseo fuera:

ANEXO N 03
MATRIZ DE CONSISTENCIA
INFLUENCIA DE CLIMA LABORAL EN LA INTELIGENCIA EMOCIONAL DE LOS TRABAJADORES EN LAS INSTITUCIONES PBLICAS DE AYACUCHO
Tipo de Investigacin: Aplicada Nivel de Investigacin: Descriptivo Correlacional
Diseo de Investigacin: Descriptivo
PROBLEMA

OBJETIVOS

HIPTESIS

PROBLEMA GENERAL

GENERAL

HIPOTESIS GENERAL

Cmo influye el clima


laboral en la inteligencia
emocional
de
los
trabajadores nombrados y
contratados por servicios
personales
en
las
instituciones pblicas de la
Ciudad de Ayacucho?

Sistematizar
los
aspectos
relevantes del clima laboral que
influyen en la
inteligencia
emocional de los trabajadores
nombrados y contratados por
servicios personales en las
Instituciones Pblicas de la
ciudad de Ayacucho

El
clima
laboral
influye
significativamente en la inteligencia
emocional de los trabajadores
nombrados y contratados por
servicios
personales
en
las
instituciones pblicas de la ciudad
de Ayacucho.

a)

De qu manera la
cualidad directiva influye
en
la
integridad
aplicada?

ESPECFICOS
a) Analizar la influencia de la
cualidad directiva en la
integridad aplicada.
b) Explicar la influencia de las
polticas
profesional

b)

c)

d)

De qu modo las
polticas
de
carrera
profesional influye en el
conocimiento
emocional?
En qu medida el
trabajo en equipo influye
en la aptitud emocional?
De qu forma las
caractersticas de los
recursos
tangibles
influye en la profundidad
emocional?

e) En qu medida las
polticas de prestaciones
sociales influye en la
alquimia emocional?

de
en

profesional
influye
evidentemente
en
el
conocimiento emocional.

el

conocimiento emocional.
c) Determinar la influencia de
trabajo en equipo en la
aptitud emocional.
d) Establecer la influencia de
las caractersticas de los
recursos tangibles en la
profundidad emocional.
e) Verificar la influencia de las
polticas de prestaciones
sociales en la alquimia
emocional.

CLIMA LABORAL
CATEGORAS
Desarrollo

INDICADORES:

a) La cualidad directiva influye Cualidad directiva


explcitamente en la integridad Carrera profesional
Trabajo en equipo
aplicada.
Recursos tangibles
Prestaciones
sociales
b) Las polticas de carrera

carrera

c) El trabajo en equipo influye


positivamente en la aptitud
emocional.
d)

MARCO
TERICO

METODOLOGA

UNIVERSO Y MUESTRA

UNIVERSO
VAR. INDEPENDIENTE
(X)

organizacional

HIPOTESIS ESPECIFICOS
PROBLEMAS
ESPECFICOS

VARIABLES,
CATEGORAS E
INDICADORES

VAR. DEPENDIENTE
(Y)
INTELIGENCIA
EMOCIONAL
CATEGORAS
Competencia laboral

Las caractersticas de los


INDICADORES:
recursos
tangibles
influye
efectivamente en la profundidad Integridad aplicada
emocional.
Conocimiento
emocional
e) Las polticas de prestaciones Aptitud emocional
sociales influye manifiestamente Profundidad
en la alquimia emocional.
emocional
Alquimia emocional

CLIMA LABORAL

Conjunto
de
percepciones
globales (constructo personal y
psicolgico) que el individuo
tiene de la organizacin, reflejo
de la interaccin entre ambos;
lo importante es cmo percibe
un sujeto su entorno, sin tener
en cuenta cmo lo percibe
otros; por tanto, es ms una
dimensin del individuo que de
la organizacin.
INTELIGENCIA EMOCIONAL

La inteligencia emocional es la
capacidad
de
comprender
emociones y conducirlas, de tal
manera que podamos utilizarlas
para guiar nuestra conducta y
nuestros
procesos
de
pensamiento, para producir
mejores resultados. Incluye las
habilidades de: percibir, juzgar
y expresar la emocin con
precisin; contactar con los
sentimientos o generarlos para
facilitar la comprensin de uno
mismo o de otra persona;
entender las emociones y el
conocimiento que de ellas se
deriva y regular las mismas
para promover el propio
crecimiento
emocional
e
intelectual.

METODO DE
INVEST.
Descriptivo
Cuanto cualitativas
Inductivo
Deductivo
Anlisis
Sntesis
DISEO DE
INVEST.

6.000 Trabajadores en las Instituciones Pblicas de Ayacucho.


POBLACIN
4,876 trabajadores entre nombrados y contratados por servicios
personales de las Instituciones Pblicas de Ayacucho
MUESTRA
La muestra de determin aplicando la siguiente frmula:

Descriptivo

PRUEBA DE ESTADSTICA DE CONTRASTE DE HIPTESIS

TC. DE INVEST.
Anlisis documental
Encuesta

(1.96) 2 (0.5)(0.5)(4876)
356
(4876)(0.05) 2 (1.96) 2 (0.5)(0.5)

Aplicacin de

2 cuadrada (Tabla de contingencias con nivel de

confianza de 95% y

= 0.05) cuyo estadgrafo es:

INST. DE
INVESTIG.
Formato de fichas
Bibliogrficas
Cuestionario

Grados de libertad = (r 1) (c -1)


La regla de decisin:
S:

C2

Calculada es < que

t2 Tabla, se acepta la o se rechaza la .

S:

C2

Calculada es > que

t2 Tabla, se acepta la o se rechaza la .

SOLUCIN
CONTRASTACIN Y CONVALIDACIN DE HIPTESIS
Anlisis y aplicaciones de 2 cuadrada (Tabla de contingencias con nivel de
confianza de 95% y = 0.05) cuyo estadgrafo es:
Para establecer si efectivamente la variable: Clima Laboral influye en la Inteligencia
Emocional de los trabajadores nombrados y contratados por servicios personales en las
Instituciones Pblicas de la Ciudad de Ayacucho, hemos procedido de la siguiente
manera:
A) CUALIDAD DIRECTIVA (X 1 ) E INTEGRIDAD APLICADA (Y 1 )

i) PLANTEAMIENTO DE HIPTESIS:
= La cualidad directiva no influye explcitamente en la integridad

aplicada.

= La cualidad directiva influye explcitamente en la integridad aplicada.

ii) TABULACIN Y CONSOLIDACIN DE DATOS OBSERVADOS:


Consolidacin de frecuencias de respuestas sobre la influencia o no del clima
laboral en la inteligencia emocional de los trabajadores:

S
Influye
No influye
TOTAL
LEYENDA:
S
=
CS
=
AV
=
MPV
=
N
=
I
=
NI
=

CS

AV

MPV

16

21

91

103

46

277

17

24

17

13

79

24

38

115

120

59

356

Siempre
Casi siempre
A veces
Muy pocas veces
Nunca
Influye
No Influye

iii) CLCULO DE VALORES ESPERADOS:


PRIMERA FILA:
Celda (1,1) =

24 x 277
18.67 ,
356

TOTAL

Celda (1,2) =

38 x 277
29.57
356

Celda (1.3) =

115 x 277
120 x 277
89.48 , Celda (1.4) =
93.37
356
356

Celda (1.5) =

59 x 277
45.91
356

SEGUNDA FILA:

Celda (2,1) =

24 x79
5.33 ,
356

Celda (2,2) =

38 x79
8.43
356

Celda (2.3) =

115 x79
25.52 ,
356

Celda (2.4) =

120 x79
26.63
356

Celda (2.5) =

59 x79
13.09
356
S

Influye
No influye

CS

AV

MPV

18.67

29.57

89.48

93.37

45.91

5.33

8.43

25.52

26.63

13.09

iv) TABULACIN DE DATOS OBSERVADOS (O) Y ESPERADOS (E)


PARA DETERMINAR ( C2 ):
O

(O - E)

(O - E)

(O - E)/E

SI

16

18.67

-2.67

7.13

0.38

CS I

21

29.57

-8.57

73.44

2.48

AV I

91

89.48

1.52

2.31

0.03

MPV I

103

93.37

9.63

92.74

0.99

NI

46

45.91

0.09

0.01

0.00

S NI

5.33

2.67

7.13

1.34

CS NI

17

8.43

8.57

73.44

8.71

AV NI

24

25.52

-1.52

2.31

0.09

MPV NI

17

26.63

-9.63

92.74

3.48

N NI

13

13.09

-0.09

0.01

0.00
17.51

: Calculada = 17.51
2
C

CALCULANDO t2 (tabla)

a) Grado de libertad:

(Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b) t2 = 24 , 0.05 = 9.488

v) RESULTADO Y DECISIN:

Regin de rechazo

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

9.488

17.51

Cmo ( C2 CALCULADO = 17.51) > ( t2 TABLA = 9.488)


SE ACEPTA LA

; Es decir, la cualidad directiva influye

explcitamente en la integridad aplicada, al nivel de significancia de 0.05.

B) CARRERA PROFESIONAL ((X 2 ) Y CONOCIMIENTO EMOCIONAL


(Y 2 ))
i) PLANTEAMIENTO DE HIPTESIS:
= Las polticas de carrera profesional no influye evidentemente en el

conocimiento emocional.

= Las polticas de carrera profesional influye evidentemente en el


conocimiento emocional

ii) CONSOLIDACIN DE DATOS OBSERVADOS:

CS

AV

MPV

TOTAL

Influye

14

26

84

102

46

272

No influye

19

26

18

15

84

TOTAL

20

45

110

120

61

356

iii) CLCULO DE VALORES ESPERADOS:

S
Influye
No influye

CS

AV

MPV

15.28

34.38

84.04

91.69

46.61

4.72

10.62

25.96

28.31

14.39

iv) TABULACIN DE O Y E:
O

(O - E)

(O - E)

(O - E)/E

SI

14

15.28

-1.28

1.64

0.11

CS I

26

34.38

-8.38

70.22

2.04

AV I

84

84.04

-0.04

0.00

0.00

MPV I

102

91.69

10.31

106.30

1.16

NI

46

46.61

-0.61

0.37

0.01

S NI

4.72

1.28

1.64

0.35

CS NI

19

10.62

8.38

70.22

6.61

AV NI

26

25.96

0.04

0.00

0.00

MPV NI

18

28.31

-10.31

106.30

3.75

N NI

15

14.39

0.61

0.37

0.03
14.06

C2 : Calculada = 14.06

CALCULANDO t2 (tabla)
a) Grado de libertad:

(Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4

b) t2 = 24 , 0.05 = 9.488
v) RESULTADO Y DECISIN:

Regin de rechazo

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

9.488

14.06
7.519
.488

Cmo ( C2 CALCULADO = 14.06) > ( t2 TABLA = 9.488)


SE ACEPTA LA ; Es decir, las polticas de carrera profesional influye
evidentemente en el conocimiento emocional, al nivel de significancia de
0.05.

C) TRABAJO EN EQUIPO (X 3 ) Y APTITUD EMOCIONAL (Y 3 )


i) PLANTEAMIENTO DE HIPTESIS:
= El trabajo en equipo no influye positivamente en la aptitud emocional.

= El trabajo en equipo influye positivamente en la aptitud emocional.


ii) CONSOLIDACIN DE DATOS OBSERVADOS:
S

CS

AV

MPV

Influye

11

18

98

120

22

TOTAL
269

No influye

13

14

19

24

17

87

TOTAL

24

32

117

144

39

356

iii) CLCULO DE VALORES ESPERADOS:

S
Influye
No influye

CS

AV

MPV

18.13

24.18

88.41

108.81

29.47

5.87

7.82

28.59

35.19

9.53

iv) TABULACIN DE O Y E:

(O - E)

(O - E)

(O - E)/E

SI

11

18.13

-7.13

50.84

2.80

CS I

18

24.18

-6.18

38.19

1.58

AV I

98

88.41

9.59

91.97

1.04

MPV I

120

108.81

11.19

125.22

1.15

NI

22

29.47

-7.47

55.80

1.89

S NI

13

5.87

7.13

50.84

8.66

CS NI

14

7.82

6.18

38.19

4.88

AV NI

19

28.59

-9.59

91.97

3.22

MPV NI

24

35.19

-11.19

125.22

3.56

N NI

17

9.53

7.47

55.80

5.86
34.64

C2 : Calculada = 34.64

CALCULANDO t2 (tabla)
a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4
b) t2 = 24 , 0.05 = 9.488

v) RESULTADO Y DECISIN:

Regin de rechazo

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

9.488

Cmo ( C2 CALCULADO = 34.64)

34.64
14.06
>7.519
( 2 TABLA
.488 t

= 9.488)

; Es decir, el trabajo en equipo influye

SE ACEPTA LA

positivamente en la aptitud emocional, al nivel de significancia de 0.05.

D) RECURSOS TANGIBLE (X 4 ) Y PROFUNDIDAD EMOCIONAL (Y 4 )


i) PLANTEAMIENTO DE HIPTESIS:
= Las caractersticas de los recursos tangibles no influye efectivamente en

la profundidad emocional.

= Las caractersticas de los recursos tangibles influye efectivamente en la


profundidad emocional.

ii) CONSOLIDACIN DE DATOS OBSERVADOS:


S

CS

AV

MPV

TOTAL

Influye

25

75

103

14

223

No influye

17

33

29

36

18

133

TOTAL

23

58

104

139

32

356

iii) CLCULO DE VALORES ESPERADOS:

Influye
No influye

CS

AV

MPV

14.41

36.33

65.15

87.07

20.04

8.59

21.67

38.85

51.93

11.96

iv) TABULACIN DE O Y E:
O

(O E)

(O - E)

(O - E)/E

SI

14.41

-8.41

70.73

4.91

CS I

25

36.33

-11.33

128.37

3.53

AV I

75

65.15

9.85

97.02

1.49

MPV I

103

87.07

15.93

253.76

2.91

NI

14

20.04

-6.04

36.48

1.82

S NI

17

8.59

8.41

70.73

8.23

CS NI

33

21.67

11.33

128.37

5.92

AV NI

29

38.85

-9.85

97.02

2.50

MPV NI

36

51.93

-15.93

253.76

4.89

N NI

18

11.96

6.04

36.48

3.05
39.26

C2 : Calculada = 39.26

CALCULANDO t2 (tabla)
a) Grado de libertad: (Qf = 2) (Qc = 5) = (2 - 1) (5- 1) = 4
b) t2 = 24 , 0.005 = 9.488
v) RESULTADO Y DECISIN:

Regin de rechazo

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

9.488

Cmo ( C2 CALCULADO = 39.26) >

39.26
34.64
14.06
2
( t TABLA
7.519 =
.488

9.488)

SE ACEPTA LA ; Es decir, las caractersticas de los recursos tangibles


influye efectivamente en la profundidad emocional, al nivel de significancia
de 0.05.
E) PRESTACIONES SOCIALES (X 5 ) Y ALQUIMIA EMOCIONAL (Y 5 )
i) PLANTEAMIENTO DE HIPTESIS:
= Las polticas de prestaciones sociales no influye manifiestamente en

alquimia emocional.

= Las polticas de prestaciones sociales influye manifiestamente en


alquimia emocional.
ii) CONSOLIDACIN DE DATOS OBSERVADOS:

CS

AV

MPV

TOTAL

Influye

22

29

86

98

18

253

No influye

16

27

23

26

11

103

38

56

109

124

29

356

TOTAL

iii) CLCULO DE VALORES ESPERADOS:


S
Influye
No influye

27.01
10.99

CS

AV

39.80
16.20

77.46
31.54

MPV
88.12
35.88

N
20.61
8.39

iv) TABULACIN DE O Y E:
O

(O - E)

(O - E)

(O - E)/E

22

27.01

-5.01

25.10

0.93

CS I

29

39.8

-10.8

116.64

2.93

AV I

86

77.46

8.54

72.93

0.94

MPV I

98

88.12

9.88

97.61

1.11

NI

18

20.61

-2.61

6.81

0.33

S NI

16

10.99

5.01

25.10

2.28

CS NI

27

16.2

10.8

116.64

7.20

AV NI

23

31.54

-8.54

72.93

2.31

MPV NI

26

35.88

-9.88

97.61

2.72

N NI

11

8.39

2.61

6.81

0.81

SI

21.57

C2 : Calculada = 21.57

CALCULANDO t2 (tabla)
a) Grado de libertad:

(Qf = 2) (Qc = 5) = (2 - 1) (5 - 1) = 4

b) t2 = 24 , 4, 0.005 = 9.488

v) RESULTADO Y DECISIN:

Regin de rechazo

0.05
= 0.025, 4 grados de libertad
2

Regin de aceptacin

9.488

21.57
39.26
34.64
2
2
Cmo ( C CALCULADO = 21.57) > ( t TABLA
14.06= 9.488)
7.519
.488 prestaciones
SE ACEPTA LA ; Es decir, las polticas de

sociales

influye manifiestamente en alquimia emocional, al nivel de significancia


de 0.05.
2.3 ANLISIS DE VARIANZA (ANOVA = ANDEVA = ANVA)
Casi siempre se introduce el tema del anlisis de la varianza como respuesta a la
necesidad de utilizar una tcnica de comparacin de ms de dos grupos, es decir
como un mtodo para comparar ms de dos tratamientos: si disponemos de medidas
cuantitativas continuas, que se puede suponer como procedentes de una distribucin
de probabilidad normal, y queremos comparar dos grupos -dos tratamientos-, la
prueba estadstica que se utiliza es un contraste de medias basado en la t de Student,
y cuando se dispone de ms de dos grupos, la prueba a emplear es el anlisis de la
varianza. Personalmente, aunque el enfoque es adecuado, me parece que refleja solo
una parte del inters de la tcnica, ideada no slo para analizar los datos sino tambin
para planificar los experimentos, y creo ms apropiado hablar de que el anlisis de la
varianza es un procedimiento estadstico que nos permite dividir la variabilidad
observada en componentes independientes que pueden atribuirse a diferentes causas
de inters.
En el planteamiento ms simple de anlisis de la varianza tenemos una variable
numrica cuantitativa (resultado), y queremos determinar en qu medida se puede
atribuir la variabilidad de sta a otra variable cualitativa nominal que vamos a
denominar factor. Estamos hablando por tanto de anlisis de la varianza para un solo
factor, que puede tener 2 o ms categoras o niveles.
Este factor, cuyo posible efecto sobre la variable medida queremos analizar, puede
tener unos niveles fijos, por ejemplo el nivel educativo alcanzado por los sujetos que
intervienen (sin estudios, estudios primarios, secundarios, formacin universitaria), y
hablamos entonces de modelo de efectos fijos; o bien puede tratarse de una muestra
procedente de un conjunto de niveles ms amplio, como puede ser por ejemplo el
caso de un estudio en el que se seleccionan varios hospitales y se analiza las posibles
diferencias entre hospitales. Entonces lo denominamos modelo de efectos

aleatorios. En el anlisis de la varianza de 1 factor es mucho ms frecuente el


modelo de efectos fijos.
Ejemplo 1
Se est aplicndose 5 metodologas diferentes para mejorar el servicio de calidad en
un Banco de la Ciudad de Ayacucho y los puntajes a una misma prueba se reportan
en el siguiente cuadro:
1
37
40
46

2
29
33
34
31

3
49
47

4
40
38
42
39
41

5
50
46
49

Existe alguna evidencia de que alguno de los mtodos es mejor?

SOLUCIN
i) DATOS:

a = Existen 5 tratamientos
N = n1 n2 n3 n4 n5
i) Procedimientos de clculo

t=y

2
ij

: i = 1, 2, 3, 5. Columnas. J = 1, 2, 3,5 filas

y 22 j y32 j y 42 j y 52 j )/n; si los datos son completos, caso contrario


dividir cada columna por la cantidad de n.

A = ( y12j

CF = ( yij ) 2 / n
Leyenda:

t = Tratamiento
A = Total tratamiento
CF = Factor de correccin
a) Sumar las columnas
1
37
40
46

2
29
33
34
31

3
49
47

123

127

96

4
40
38
42
39
41
200

5
50
46
49

145

691

b) Calcular el valor de:

t = ( 37

40 2 46 2 29 2 33 2 34 2 + 49 2 ) = 28,769

A = ( 123

127 2 96 2 200 2 145 2


) = 28,691.58

2
4
5
3

3
2
CF = (691) = 28,087.12
17
c) Planteamiento de hiptesis

: No existe evidencia de que alguno de los mtodos es mejor

: Existe evidencia de que alguno de los mtodos es mejor

d) Fuente de Varianza:

Grado de

Suma de cuadrados

libertad

(S:C)

(G.L.)

tratamientos

Cuadrado

medio

Calculada

(CM)

(Fc)

(a-1)

(A-CF)

604.46/4 =

(5-1) = 4

28691.58 -28087.12 =

151.115

151.115/6.452 =

23.42

604.46
Dentro de

(N-a)

(T A)

77.42/12 =

tratamientos

(17-5) = 12

28769 28691.58 = 77.42

6.452

f C = 23.42
f t (tabla) =
ft =

f ( a 1), ( N a )

f 0.05,(514),(17512)

f t (tabla)

12

4
3.26

a) Estrategia de decisin
Cuando: f C > f t , Se acepta la HA y se rechaza la H
Cuando: f C < f t , Se acepta la H0 y rechaza la HA

RESPUESTA:
Como: f C (23.42) > f t (3.26), Se acepta la HA y se rechaza la H, es
decir, que si existe diferencia en los mtodos de capacitacin y los
puntajes.
Ejemplo 2
Se desea comparar a tres mdicos en relacin con la duracin del internado de sus
pacientes que se sometieron a cierto procedimiento quirrgico menor sin
complicaciones. Se seleccion una muestra de 8 pacientes para cada mdico y se
observaron los tiempos de hospitalizacin despus de la intervencin.
Mdicos
A
4
5
5
4
6
6
4
5

B
4
5
4
3
4
5
3
3

C
5
3
3
3
3
3
4
5

Existe diferencia entre los mdicos, segn el tiempo de permanencia de sus


pacientes? Use 99% de confiabilidad.

SOLUCIN
i) DATOS:
N=8
= 0.01
a=3
ii) Sumatoria de columnas y filas pertinentes

ij

Y ij2

2
(
Y
ij)

A
4
5
5
4
6
6
4
5
39
195
1521

B
4
5
4
3
4
5
3
3
31
125
961

C
5
3
3
3
3
3
4
5
29
111
841

99
431
3323

iii) Planteamiento de hiptesis


: 1 = 2 =

: Existe al menos una diferencia

iv) Fuente de Varianza:


G. L. = (a-1) = (3-1) = 2
a(n a) = 3(8-3) = 15

S.C = T = 431
A = 3323/8 = 415.375
CF = (99)2 /8 x 3 = 408.375

Grado de

Suma de

libertad

cuadrados

(G.L.)

(S:C)

(A-CF) = 7

7/2 = 3.5

21

(T A) = 15.625

15.625/21 = 0.744

Fuente de varianza

tratamientos
Dentro de
tratamientos

Cuadrado medio
(CM)

F
Calculada
(Fc)

3.5/0.744 = 4.704

f C = 4.704

f t (tabla) =
ft =

f ( a1), a ( n1)

f 0.01,(312), 3(8121)

f t (tabla)

15

6.36

v) Estrategia de decisin
Como: f C (4.704) < f t (5.78), Se acepta la H0 y se rechaza la HA, es decir,
no existe diferencia entre la conclusin de los mdicos, como se puede
decir tambin, los 3 mdicos son iguales.

2.4 PRUEBA DE SIGNOS


Dada la muestra aleatoria simple de tamao n, (x1, x2, ..., xn), extrada de una
poblacin con distribucin continua, se quiere contrastar si su mediana es igual a
cierto valor dado de antemano, designado por med.
Es importante insistir en que no se acepta para la realizacin del test otra hiptesis
que no sea la continuidad de la distribucin poblacional. La hiptesis nula que se
contrasta es:
H0: "la mediana de la poblacin es med" frente a la alternativa:
H1: "la mediana de la poblacin es diferente de med".
El estadstico a calcular es:
T = n de casos en los que xi - med > 0, siendo i = 1, 2, ..., n.

Ejemplo 1
Se quiere saber si existe influencia del grupo en el rendimiento de exmenes; primer
examen individual y segundo examen en grupo.

1er. Examen
15.5
9.5
18.0
18.6
16.7
8.8
9.5
14.5
15.2
14.4
11.2
9.5
11.8
12.0
14.0
10.5
8.2
15.0
12.0
13.8
14.8

2do Examen
14.5
15.0
14.5
15.0
14.5
14.5
14.5
14.5
15.0
14.5
15.0
15.0
14.5
15.0
14.5
15.0
14.5
15.0
15.0
15.0
15.0

15.0
17.8
18.5

15.0
15.0
15.0

SOLUCIN
i) Determinacin de signos:
1er. Examen
15.5
9.5
18.0
18.6
16.7
8.8
9.5
14.5
15.2
14.4
11.2
9.5
11.8
12.0
14.0
10.5
8.2
15.0
12.0
13.8
14.8
15.0
17.8
18.5

2do Examen
14.5
15.0
14.5
15.0
14.5
14.5
14.5
14.5
15.0
14.5
15.0
15.0
14.5
15.0
14.5
15.0
14.5
15.0
15.0
15.0
15.0
15.0
15.0
15.0

Prueba de signos
+
+
+
0
+
+
+
+
+
+
+
+
0
+
+
+
0
-

ii) Datos:

n = 24 (3 ceros) = 21
(+) = 14
(-) = 7
Probabilidad que sea (+) o negativo (-):
p = 0.5
q = 0.5
Xi = q de (+) (-0.5) = 14 0.5 = 13.5
iii) Planteamiento de hiptesis:
: No existe influencia del grupo en las calificaciones

: Existe influencia del grupo en las calificaciones

iv) Indicadores a calcular

np

21x0.5 10.5

npq

21x0.5x0.5 2.29

xi

13.5 10.5
1.31
2.29

t (10.0) / 2 0.475 1.96

t (1 ) / 2
v) Estrategia de decisin

Cuando: Z C > Z t , Se acepta la HA y se rechaza la H


Cuando: Z C < Z t , Se acepta la H0 y se rechaza la HA
Rpta para el caso:
Como: Z C (1.31) < Z t (1.96), Se acepta la H0 y se rechaza la HA, es decir,
no existe influencia del grupo en las calificaciones.

Ejemplo 2
Para evaluar dos entidades bancarias de la ciudad de Ayacucho, se seleccionaron al
azar 17 usuarios, a stos se les solicit que califiquen con valores de 1 y 2; 1 si no es
de su preferencia y 2 si es de su preferencia. A continuacin se presentan los
resultados de la opinin de los usuarios en forma de rango:
Usuarios
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Banco A
2
2
1
2
2
1
2
2
1
2
1
1
2
1
2
2
2

Banco B
1
1
2
1
2
2
1
1
2
1
2
2
1
2
1
1
1

a) Probar que la preferencia es la misma para ambos Bancos con un nivel de


significancia de 0.01
b) Probar la hiptesis de que El Banco A es mejor que el Banco B con un nivel de
significancia de 0.01.

SOLUCIN
a. Probar que la preferencia es la misma para ambos Bancos con un nivel de
significancia de 0.01
Usuarios
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Banco A
2
2
1
2
2
1
2
2
1
2
1
1
2
1
2
2
2

Banco B
1
1
2
1
2
2
1
1
2
1
2
2
1
2
1
1
1

i) Datos:
n = 17 (1 cero) = 16
(+) = 6
(-) = 10
p = 0.5
q = 0.5

ii) Planteamiento de hiptesis:


O : La preferencia es distinta para ambos Bancos

A : La preferencia es la misma para ambos Bancos

iii)

Indicadores a calcular

np

16 x0.5 8.0

Signos
+
0
+
+
+
+
+
-

npq
c

16 x0.5x0.5 2.0

xi

t (1 ) / 2

5.5. 8
1.25
2.0

t 0.50.05 0.45 1.65

iv) Estrategia de decisin


Como: Z C (-1.25) < Z t (1.65), Se acepta la H0 y se rechaza la HA, es decir,
la preferencia de los dos Bancos es la misma.

b) Probar la hiptesis de que El Banco A es mejor que el Banco B con un nivel de


significancia de 0.01.
SOLUCIN
i) Prueba de signos:
Usuarios
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17

Banco A
2
2
1
2
2
1
2
2
1
2
1
1
2
1
2
2
2

Banco B
1
1
2
1
2
2
1
1
2
1
2
2
1
2
1
1
1

ii) Planteamiento de hiptesis:


: La preferencia de los 2 Bancos es la misma.

: El Banco A tiene mayor preferencia


ii) Indicadores a calcular

np

16 x0.5 8.0

Signos
+
+
+
0
+
+
+
+
+
+
+

npq
c

xi

t (1 ) / 2

16 x0.5x0.5 2.0
c

9.5. 8
0.75
2.0

t 0.50.01 0.49 2.33

Estrategia de decisin
Como: Z C (0.75) < Z t (2.33), Se acepta la H0 y se rechaza la HA, es decir,
la preferencia es la misma para ambos Bancos.

2.5 LA PRUEBA DE PARES IGUALES DE WILCOXON

Este modelo estadstico corresponde a un equivalente de la prueba t de Student, pero


se aplica en mediciones en escala ordinal para muestras dependientes.
Cuando el tipo de medicin no cumpla con los requisitos que la prueba t de Student
exige, la de Wilcoxon es una alternativa de aceptable eficacia para contrastar
hiptesis. El mtodo es aplicable a muestras pequeas, siempre y cuando sean
mayores que 6 y menores que 25. Las muestras grandes deben ser mayores a 25 y
ste se debe transformar en valor de Z, para conocer la probabilidad de que aquella
sea o no significativa.
Dicha prueba estadstica consiste en sumar los rangos de signo frecuente; por ello, no
se tiene una ecuacin o frmula, como se observa en otras pruebas estadsticas.
Se utiliza cuando:

Trabaja con datos de tipo ordinal.


Establece diferencias de magnitudes (+ y -).
Direccin.

Prueba de dos colas: No se sabe en que direccin se pueden dar las diferencias.
Prueba de una cola: Si sabemos en que direccin estn las diferencias.

Dos muestras apareadas.


Establece las diferencias .
Con muestras grandes (> 25) se intenta lograr la distribucin normal (se utiliza la
prueba Z).

Pasos:
1. Arreglar las observaciones pareadas y obtener las diferencias de cada pareja.
2. Arreglar las diferencias en funcin de rangos como valores absolutos, sin importar
el signo, pero de manera que los rangos conserven el signo correspondiente a la
diferencia.
3. Obtener la sumatoria de los rangos cuyo signo es el menos frecuente, por ejemplo:
si el signo es +, se considerar para efectuar sumatorias; sin embargo, la sumatoria
mencionada finalmente pierde el signo.
4. Si se trata de muestras pequeas, comparar el valor obtenido con los valores
crticos de la tabla de Wilcoxon.
5. Distribuir las muestras mayores que 25 bajo la curva normal y, por tanto, calcular
el valor Z, en referencia al cual se debe consultar la probabilidad de diferir con
respecto al promedio en la tabla de probabilidades asociadas.
6. Decidir si se acepta o rechaza la hiptesis.
Ejemplo 1
Se quiere saber, si existe influencia del grupo en el rendimiento exmenes, con =
0.01
1er. Examen
15.5
9.5
18.0
18.6
16.7
8.8
9.5
14.5
15.2
14.4
11.2
9.5
11.8
12.0
14.0
10.5
8.2
15.0
12.0
13.8
14.8
15.0
17.8
18.5

2do Examen
14.5
15.0
14.5
15.0
14.5
14.5
14.5
14.5
15.0
14.5
15.0
15.0
14.5
15.0
14.5
15.0
14.5
15.0
15.0
15.0
15.0
15.0
15.0
15.0

SOLUCIN

i) Determinacin de signos rango:


1er.
Examen
15.5
9.5
18.0
18.6
16.7
8.8
9.5
14.5
15.2
14.4
11.2
9.5
11.8
12.0
14.0
10.5
8.2
15.0
12.0
13.8
14.8
15.0
17.8
18.5

2do
Examen
14.5
15.0
14.5
15.0
14.5
14.5
14.5
14.5
15.0
14.5
15.0
15.0
14.5
15.0
14.5
15.0
14.5
15.0
15.0
15.0
15.0
15.0
15.0
15.0

Prueba de
Signos
+
+
+
0
+
+
+
+
+
+
+
+
0
+
+
+
0
-

iii)Clculo de de rangos (cantidad de valores en |s|:


0.1 (1) = 1
0.2 (2) = 2+3 = 5/2 = 2.5
0.5 (1) = 4
1.0 (1) = 5
1.2 (1) = 6
2.2 (1) = 7
2.7 (1) = 8
2.8 (1) = 9
3.0 (2) = 10 +11 =21/2 = 10.5
3.5 (2) = 12+13 = 25/2 = 12.5
3.6 (1) = 14
3.8 (1) = 15
4.5 (1) = 16
5.0 (1) = 17

|s|

Rangueo

1
5.5
3.5
3.6
2.2
5.7
5.0
0.0
0.2
0.1
3.8
5.5
2.7
3.0
0.5
4.5
6.3
0.0
3.0
1.2
0.2
0.0
2.8
3.5

-5
18.5
- 12.5
- 14
-7
20
17
-.- 2.5
1
15
18.5
8
10.5
4
16
21
-.10.5
6
2.5
-.-9
- 12.5

5.5 (2) = 18+19 = 37/2 = 18.5


5.7 (1) = 20
6.3 (1) = 21

iv) Planteamiento de hiptesis


: No existe influencia del grupo en las calificaciones

: Existe influencia del grupo en las calificaciones

v) Clculo de indicadores:
n = 21
(-) = 7
(+) = 14
vi) Determinado:

tC

tt

t C = (-) = en la parte de rangueo = 62.5


t t = t , n
tt =

Tabla: valores crticos


de la prueba de rangos
y signos de Wilcoxon

t 0.01, 21

t t (tabla)

21

0.01
43

vii) Estrategia de decisin


Cuando: t C > t t , Se acepta la HA y se rechaza la HO
Cuando: t C < t t , Se rechaza HA y se acepta la HO
Rpta. para el caso:
Como: t C (62.5) > t t (43), Se acepta la HA y se rechaza la HO, es decir,
existe influencia del grupo en el rendimiento de exmenes, con =
0.01.

NOTA: Cuando n > 25 se recurre a la siguiente frmula:

Media: ET =

Gt =

Zc =

n(n 1)
4

ET =

n(n 1)(2n 1)
24

Gt =

t c ET
Gt

Zc =

21(21 1)
115.5
4

21(21 1)(2 * 21 1)
24

= 28.77

62.5 115.5
= - 1.84 = 1.84
28.77

Calculando Zt = Z0.5 = Z0.5 0.01 = 0.49 (buscando el tabla) = 2.33

Decisin:
Como: Z C (1.84) > Z t (2.33), Se acepta la HA y se rechaza la HO, es decir,
existe influencia del grupo en las calificaciones.

Ejemplo 2
Se imparte un curso de redaccin a 22 secretarias, en primera clase se aplic una
prueba de entrada que mide la capacidad para redactar. Despus de 6 semanas de
clase se aplica una segunda prueba. Se quiere saber si el curso ayud a mejorar la
capacidad de redaccin de las secretarias. Use = 0.01.

1er.
Examen
72
70
68
67
73
71
72
70
69
70
68
72
69
66
73
71
70
72

2do
Examen
74
72
69
68
72
73
72
74
68
73
69
70
68
69
74
73
70
74

70
69
72
73

68
71
75
76

SOLUCIN
i) Determinacin de signos rango:
1er.
Examen
72
70
68
67
73
71
72
70
69
70
68
72
69
66
73
71
70
72
70
69
72
73

2do
Examen
74
72
69
68
72
73
72
74
68
73
69
70
68
69
74
73
70
74
68
71
75
76

Prueba de
Signos
+
+
+
+
+
0
+
+
+
+
+
+
0
+
+
+
+

|s|
2
2
1
1
1
2
0
4
1
3
1
2
1
3
1
2
0
2
2
2
3
3

Rangueo
11.5
11.5
4
4
-4
11.5
-.20
-4
17.5
4
-11.5
-4
17.5
4
11.5
-.11.5
-11.5
11.5
17.5
17.5

ii) Clculo de indicadores:


n = 22
(-) = 5
(+) = 20
iii) Planteamiento de hiptesis
: El curso no ayud a mejorar la capacidad de redaccin de las secretarias.

: El curso ayud a mejorar la capacidad de redaccin de las secretarias


iv) Determinado:

tC

tt

t C = (-) = en la parte de rangueo = 35


t t = t , n

tt =

Tabla: valores crticos


de la prueba de rangos
y signos de Wilcoxon

t 0.01, 20

t t (tabla)

20

0.01

38

v) Estrategia de decisin
Como:

t C (35) < t t (38), Se rechaza la HA y se acepta la HO, es decir, el curso


no ayud a mejorar la capacidad de redaccin de las secretarias

2.6 VALORACIN DE FISHER SHEFLE


Esta prueba estadstica se utiliza frecuentemente como alternativa, cuando no se
puede aplicar la ji cuadrada de Pearson. Es un procedimiento ms eficaz en la escala
nominal con dos muestras independientes. La razn de esto se basa en que se calcula
directamente la probabilidad de una serie de arreglos de frecuencias observadas en
una tabla de contingencia de 2 X 2, dada en una distribucin hipergeomtrica.
La ecuacin para calcular la probabilidad exacta de Fischer y Yates es la siguiente:

Pasos.
1. Arreglar las frecuencias observadas en una tabla de contingencia 2 X 2.
+ Muestra I A B
Muestra II C D
2. Obtener los totales de las hileras (A + B) y (C + D) y de las columnas: (A + C) y
(B + D), as como el gran total (GT).
3. Obtener los valores factoriales de los totales de hileras y columnas y despus
multiplicarlos.

4. Calcular los factoriales del gran total y multiplicar ste por todos los factoriales de
cada casilla de la tabla de contingencia.
5. Dividir el primer valor de producto de factoriales entre el segundo. Este resultado
es la probabilidad exacta de Fischer y Yates.
6. Decidir si se acepta o rechaza la hiptesis, en funcin de la probabilidad.
Ejemplo 1
Un investigador rene una muestra de 15 sujetos con problemas de obesidad. Elige al
azar a 7 pacientes para ensayar una nueva tcnica teraputica para bajar de peso, y a
los 8 restantes les aplica una tcnica usada regularmente para el mismo efecto.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Existe mayor frecuencia de perder peso al aplicar la nueva
tcnica teraputica, en comparacin con lo observado al aplicar una tcnica usada
regularmente.
Hiptesis nula (Ho). Las diferencias observadas en las dos tcnicas teraputicas se
deben al azar.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.

Aplicacin de la prueba estadstica.

El valor de probabilidad calculado es menor que el nivel de significacin (0.05).


Decisin.

En virtud de que la probabilidad exacta de Fischer y Yates es menor


que 0.05, cae en el nivel de significacin; por lo tanto, se acepta Ha y
se rechaza Ho.
Interpretacin.
La nueva tcnica teraputica es significativamente efectiva para el tratamiento de la
obesidad, a un nivel de confianza de p = 0.03.
Ejemplo 2
Se desea comparar a tres mdicos en relacin con la duracin del internado de sus
pacientes que se sometieron a cierto procedimiento quirrgico menor sin
complicaciones. Se seleccion una muestra de 8 pacientes para cada mdico y se
observaron los tiempos de hospitalizacin despus de la intervencin.

Mdicos
A
4
5
5
4
6
6
4
5

B
4
5
4
3
4
5
3
3

C
5
3
3
3
3
3
4
5

Existe diferencia entre los mdicos, segn el tiempo de permanencia de sus


pacientes? Use 99% de confiabilidad.

SOLUCIN
vi) DATOS:
N=8
= 0.01
a=3
vii) Sumatoria de columnas y filas pertinentes
A
4
5
5
4
6
6
4
5

B
4
5
4
3
4
5
3
3

C
5
3
3
3
3
3
4
5

39
195
1521

ij

Y ij2

2
(
Y
ij)

31
125
961

29
111
841

99
431
3323

viii) Planteamiento de hiptesis


: 1 = 2 = 3

: Existe al menos una diferencia


ix) Fuente de Varianza:
H. L. = (a-1) = (3-1) = 2
a(n 1) = 3(8-1) = 21
S.C = T = 431
A = 3323/8 = 415.375
CF = (99)2 /8 x 3 = 408.375
Grado de
Fuente de varianza

Suma de cuadrados

Cuadrado medio

(S:C)

(CM)

(A-CF) = 7

7/2 = 3.5

21

(T A) = 15.625

15.625/21 = 0.744

libertad
(G.L.)

tratamientos
Dentro de
tratamientos

F
Calculada
(Fc)

3.5/0.744 = 4.704

f C = 4.704

f t (tabla) =
ft =

f ( a1), a ( n1)

f 0.01,(312), 3(8121)

f t (tabla)

21

5.78

x) Estrategia de decisin
Como: f C (4.704) < f t (5.78), Se acepta la H0 y se rechaza la HA, es decir,
no existe diferencia entre la conclusin de los mdicos, como se puede
decir tambin, los 3 mdicos son iguales.

2.7 PRUEBA DE MANNY Y WHITNEY


Esta prueba estadstica es til cuando las mediciones se pueden ordenar en escala
ordinal (es decir, cuando los valores tienden a una variable continua, pero no tienen
una distribucin normal) y resulta aplicable cuando las muestras son independientes.
Este procedimiento es una buena alternativa cuando no se puede utilizar la prueba t
de Student, en razn de no cumplir con los requisitos que esta prueba exige.
La frmula es la siguiente:
Donde:
U1 y U2 = valores estadsticos de U Mann-Whitney.
n1 = tamao de la muestra del grupo 1.
n2 = tamao de la muestra del grupo 2.
R1 = sumatoria de los rangos del grupo 1.
R2 = sumatoria de los rangos del grupo 2.

Pasos:
1. Determinar el tamao de las muestras (n1 y n2). Si n1 y n2 son menores que 20, se
consideran muestras pequeas, pero si son mayores que 20, se consideran
muestras grandes.
2. Arreglar los datos en rangos del menor al mayor valor. En caso de que existan
ligas o empates de rangos iguales, se debern detectar para un ajuste posterior.
3. Calcular los valores de U1 y U2, de modo que se elija el ms pequeo para
comparar con los crticos de U Mann-Whitney de la tabla de probabilidades
asociadas con valores pequeos como los de U en la prueba de Mann-Whitney.
4. En caso de muestras grandes, calcular el valor Z, pues en estas condiciones se
distribuye normalmente.
5. Decidir si se acepta o rechaza la hiptesis.
Ejemplo 1: Para muestras pequeas:
Despus de un programa de capacitacin a 9 funcionarios de la Municipalidad
Provincial de Huamanga por 2 mtodos diferentes, se obtuve el siguiente resultado:
Mtodo A
Mtodo B

16
16

18
12

5
15

6
4

12
3

15
11

12
8

14
15

11
14

Se quiere saber si existe diferencia de mtodos, aun nivel de significancia de 0.05.


SOLUCIN
i) Planteamiento de hiptesis
Ho: 1

= 2 No hay ninguna diferencia entre los 2 mtodos

Ha: 1

2 Existe diferencia entre los dos mtodos

ii) Ordenando y rangueando los resultados:


Rangueo
3 4
Mtodo B
5 6
Mtodo A 3 4
Rangueo
1 2
Clculo adicional:

6.5 9
11 12
8 11
5 6.5

9 11.5 14 16.5 18 = 91.5


12 14 15 16
18
12 14 15 15
16
9 11.5 14 14 16.5 = 79.5

3 (1) = 1
4 (1) = 2
5 (1) = 3
6 (1) = 4
8 (1) = 5
11 (2) = 6 +7 = 13/2 = 6.5
12 (3) = 8 +9 +10 = 27/3 = 9
14 (2) = 11 + 12 = 23/2 = 11.5
15 (3) = 13 +14 +15 =42/3 = 14
16 (2) = 16+17 = 33/2 = 16.5
18 (1) = 18
iii)Calculando Uc
U1 = n1n2 +

n1 (n1 1)
9(9 1)
R1 = 9*9 +
91.5 = 34.5 (escogido *)
2
2

U1 = n1n2 +

n2 (n2 1)
9(9 1)
79.5 = 46.5
R2 = 9*9 +
2
2

(*Para comparar con Ut se escoge el que arroje menor valor como resultado)
iv) Calculando U,n1, n2 : (Tabla A5iv)
U,n1,n2 = U0.05, 9,9 = 17
v) Estrategia de decisin
Uc U Se acepta la Ha (Para todo valor de probabilidad () igual o menor que 0.05, es
decir, se acepta Ha y se rechaza Ho.

Uc > U Se acepta la Ho (Para todo valor de probabilidad () mayor que 0.05, se


acepta Ho y se rechaza Ha.

Rpta: para el caso:


Como: Uc > U se acepta la Ho es decir no hay ninguna
diferencia entre los dos mtodos.

Ejemplo 2:
Un experimentador utiliza dos mtodos para ensear a leer a un grupo de 10 nios de
6 aos, quienes ingresan por primera vez a la escuela. El experimentador quiere
demostrar que el procedimiento ideado por l es ms efectivo que el tradicional; para
ello, mide el desempeo en la lectura en funcin de la fluidez, comprensin, anlisis
y sntesis.
El plan experimental preliminar consiste en elegir al azar tanto una muestra de 10
nios como el mtodo por utilizar.
Eleccin de la prueba estadstica. El modelo experimental tiene dos muestras
independientes. Las mediciones revelan que no se satisfacen los requisitos para
utilizar una media aritmtica, en razn de que uno de los valores en cada muestra se
aleja demasiado de las dems; por lo tanto, no corresponde a una escala de intervalo,
de manera que se decide usar una escala ordinal.
Planteamiento de la hiptesis.
Ho: Las diferencias observadas entre las calificaciones de ejecucin de lectura
mediante los dos mtodos se deben al azar.
Ha: Las calificaciones de ejecucin de lectura, segn el mtodo de enseanza del
experimentador son ms altas y diferentes que las observadas en el mtodo
tradicional.
Dos mtodos diferentes aplicados en dos grupos de nios.

Aplicacin de la prueba estadstica


De acuerdo con los paso, las observaciones se deben ordenar en rangos del menor al
mayor.
Rangos de lectura de la tabla anterior.

Calculamos la U.

De los dos valores de U calculados, se elge el ms pequeo (4) y se comparan con


los valores crticos de U Mann-Whitney.
En caso de que el valor de U calculado no se localice en las tablas correspondientes,
se transformar en la frmula siguiente:
U = n1n2 - U'
En esta frmula, U' corresponde al valor ms alto.
Decisin.
A la probabilidad del valor U de Mann-Whitney, calculado anteriormente,
corresponde 0.048, el cual es ms pequeo que el nivel de significancia; por lo tanto,
se acepta Ha y se rechaza Ho.
Interpretacin.
Entre las calificaciones de la ejecucin de lectura mediante los dos mtodos de
enseanza existe una diferencia significativa a un nivel de probabilidad de error
menor que 0.05; es decir, aun cuando las muestras son pequeas, las calificaciones
ms altas mediante el mtodo diseado por el experimentador sealan ms
efectividad, con la probabilidad de equivocarse de 0.048 para aceptarlo.
Ejemplo 3: Para muestra
Mtodo A
Mtodo B

pequea donde n1 y n2 son de tamao diferente

15 14 15 15 16 14 17 12 15 12
16 15 15 15 16 14 14

Se quiere saber si existe diferencia de mtodos, aun nivel de significancia de 0.05.


SOLUCIN
i) Planteamiento de hiptesis
Ho: 1

= 2 No hay ninguna diferencia entre los 2 mtodos

Ha: 1

2 Existe diferencia entre los dos mtodos

ii) Ordenando y rangueando los resultados:


Rangueo
Mtodo A
Mtodo B
Rangueo

1.5
12
14
4.5

1.5
12
14
4.5

4.5
14
15
10

4.5
14
15
10

10
15
15
10

10
15
16
15

10
15
16
15

10
15

15
16

= 84

17
17

= 69

Clculo adicional:
12 (2) = 1+2 = 3/2 = 1.5
14 (4) = 3+4+5+6 = 18/4 = 4.5
15 (7) = 7+8+9+10+11+12+13 = 70/7 = 10
16 (3) = 14+15+16 = 45/3 = 15
17 (1) = 17
iii)Calculando Uc

n1 = 7
n2 = 10
U1 = n1n2 +

n1 (n1 1)
10(10 1)
84 = 41
R1 = 10*7 +
2
2

U1 = n1n2 +

n2 (n2 1)
7(7 1)
69 = 29
R2 = 10*7 +
2
2

iv) Calculando U,n1, n2 : (Tabla A5iv)


U,n1,n2 = U0.05,10,7 = 14
v) Estrategia de decisin

Como: Uc (29) > U (14) no hay ninguna influencia entre los


dos mtodos, a nivel de significancia de 0,05.

Ejemplo 4: Para muestra es mayor a 25 y donde n1 y n2 pueden ser iguales o de


un tamao diferente:
El experimentador previo, entusiasmado por las observaciones preliminares, decide
aumentar el tamao de las muestras. En este estudio tiene 10 nios con el mtodo
tradicional y 25 mediante el procedimiento ideado por l. Los datos del nuevo
estudio se muestran en la tabla ms adelante.
Eleccin de la prueba estadstica.
El diseo experimental tiene dos muestras independientes. Las mediciones en esta
condicin quiz no impidan utilizar una prueba paramtrica, sin mebargo, para fines
de aprendizaje, se decide utilizar una escala ordinal y continuar con la prueba de U
de Mann-Whitney.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Las calificaciones aportadas por el mtodo reciente, ideado
por el experimentador, son diferentes y con valores ms altos.

Hiptesis nula (Ho). Las diferencias entre las calificaciones dadas por ambos
mtodos se deben al azar.
Poblacin de nios de 6 aos a los cuales se les aplic dos mtodos de enseanza.

Aplicacin de la prueba estadstica.


Primero ordenamos los rangos de todas las observaciones.
Direccin de las ligas o empates y el tamao de estas.

Calculamos la U.

Tomando en cuanta los pasos, nos menciona que cuando la muestra es mayor que 25,
se distribuye normalmente, por lo cual se determina el valor Z para conocer la
probabilidad. Esto se calcula como sigue:
Donde:
Z = valor estadstico de la curva normal.
U = cualquier valor de U calculado (ya sea U1 o U2).
= valor promedio de U.
U = desviacin estndar de U.
Calculamos el valor promedio de U ( ):

La desviacin estndar de U de determina de la forma siguiente:


Donde:
U = desviacin estndar de U.
n1 y n2 = tamao de la muestra de los
grupos 1 y 2.
N = tamao total de la muestra (la suma de
n1 y n2).
Li = sumatoria de las ligas o empates.
El clculo de Li se realiza de la siguiente manera:

Una vez obtenida la sumatoria de Li, se detemrina la desviacin estndar de U (U)


mediante la expresin siguiente:

Una vez calculados los parmetros necesarios, se obtiene el valor Z conforme la


siguiente frmula:

Para obtener la probabilidad del valor Z de 1.95, se debe consultar la tabla de tamao
de la muestra en funcin de los valores d y buscar la hilera 1.9, en cuya columna 0.05
se localiza el nmero 0.0256, que corresponde a la probabilidad del valor de U con
respecto al promedio. Esto quiere decir que es menor que el nivel de significancia.
Decisin.
A la cifra de Z de 1.95 le corresponde una probabilidad menor que 0.05, por lo cual
se acepta Ha y se rechaza Ho (tabla de probabilidades asociadas en valores extremos
como los de 2 en la distribucin normal).
Interpretacin.
El experimentador, al aumentar su muestra, confirma la investigacin preliminar con
una muestra pequea, con lo cual da a entender que los resultados logrados con el
mtodo ideado por l son diferentes de los obtenidos con el mtodo de enseanza de
lectura tradicional; adems, este ltimo revela calificaciones ms bajas y es menos
efectivo que el otro.
La efectividad del mtodo ideado por el experimentador se traduce en mayor fluidez
de la lectura, mejor comprensin y anlisis y sntesis superior, en razn de que las
calificaciones finales son consecuencia de estas condiciones.

2.8 PRUEBA DE KRUSHAL Y WALLIS


En estadstica, la prueba de Kruskal-Wallis (de William Kruskal y W. Allen
Wallis) es un mtodo no paramtrico para probar si un grupo de datos proviene de la
misma poblacin. Intuitivamente, es idntico al ANOVA con los datos reemplazados
por categoras. Es una extensin de la prueba de la U de Mann-Whitney para 3 o ms
grupos.
Ya que es una prueba no paramtrica, la prueba de Kruskal-Wallis no asume
normalidad en los datos, en oposicin al tradicional ANOVA. Si asume bajo la
hiptesis nula que los datos vienen de la misma distribucin. Una forma comn en
que se viola este supuesto es con datos heterocedsticos.

Mtodo
1. Ordenar todos los datos de la muestra de menor a mayor, y asignar al menor un
rango de 1, al segundo un 2, y as hasta el n-simo. Si existen datos que se repiten,
se asigna el rango promedio a cada uno de ellos (si existen cuatro datos idnticos
que ocupan los rangos 11, 12, 13 y 14, se les asigna un rango de 12,5 a los
cuatro).

2. El estadstico est dado por:, donde:


o ng es el nmero de observaciones en el grupo g

o
o

rij es el rango (entre todas las observaciones) de la observacin j en el


grupo i
N es el nmero total de observaciones entre todos los grupos

es el promedio de rij.

Note que el denominador de la expresin para K es exactamente

Luego la frmula general es:

HC =

Rj
12

3( N 1)
N ( N 1) n j

3. Se puede realizar una correccin para los valores repetidos dividiendo K por:

Donde G es el nmero de grupos de diferentes rangos repetidos, y ti es el nmero


de observaciones repetidas dentro del grupo i que tiene observaciones repetidas
para un determinado valor. Esta correccin hace cambiar a K muy poco al menos
que existan un gran nmero de observaciones repetidas.
4. Finalmente, el p-value es aproximado por
. Si algn ni es
pequeo ( < 5) la distribucin de K puede ser distinta de la chi-cuadrado.

Ejemplo 1
Le empresa maravilla siglo XXI, recluta y contrata personal para su equipo gerencial
en tres universidades diferentes.
Se dispone de las calificaciones de desempeo en muestras independientes de cada
una de las universidades.
Se dispone de calificaciones de 10 aspirantes de la Universidad A, 7 de Universidad
B y 11 de la Universidad de 11.
La calificacin de cada gerente est en escala de 0 a 20. El lmite superior es la
mxima nota.

Universidad A

Copiar la tabla
Universidad B Universidad C

12
12
14
14
15
15
15
15
16
17

14
14
15
15
15
16
16

14
14
15
15
15
16
16
16
17
17
17

Determinar si las tres Universidades son idnticas en cuanto a las evaluaciones


de desempeo.
SOLUCION
i) Planteamiento de hiptesis
: Las tres Universidades no son idnticas en cuanto a las evaluaciones de
desempeo.

: Las tres Universidades son idnticas en cuanto a las evaluaciones de


desempeo.
ii) Ordenando los datos en forma ascendente,, asignado rangos correspondientes
y sumando los rangos de las columnas:
Clculo adicional
12 (2) = 1+2 = 3/2 = 1.5
14 (6) = 3+4+5+6+7+8 = 33/6 = 5.5
15 (10) = 9+10+11+12+13+14+15+16+17+18 = 135/10 = 13.5
16 (6) = 19+20+21+22+23+24 = 129/6 = 21.5
17 (4) = 25+26+27+28 = 106/4 = 26.5

UA
12
12
14
14
15
15
15
15
16
17

RANGUEO

1.5
1.5
5.5
5.5
13.5
13.5
13.5
13.5
21.5
26.5
116

UB
14
14
15
15
15
16
16

RANGUEO

5.5
5.5
13.5
13.5
13.5
21.5
21.5
94.5

UC
14
14
15
15
15
16
16
16
17
17
17

RANGUEO

5.5
5.5
13.5
13.5
13.5
21.5
21.5
21.5
26.5
26.5
26.5
195.5

iii) Calculando Hc

n1 = 10
n2 = 7
n3 = 11
N = 28
2

Hc =

Rj
12

3( N 1)
N ( N 1) n j

Hc =

116 2 94.5 2 195.5 2


12
(

) 3(28 1) 3.09
28(28 1) 10
7
11

iv) Calculando X 2 (Tabla A3):


X 2 = X 02.05,(31) X 02.05, 2 5.99

v) Estrategia de decisin:
Hc < X 2 Se acepta la HO, y se recha la Ha, es decir, que la 1 = 2 = 3 = = i
son iguales

Hc > X 2 Se acepta la HA y se rechaza la Ho, es decir, que las 1 2 3

i no son iguales
Rpta:
Como: Hc (3.09) < X 2 (5.99), Se acepta la HO, y se recha la Ha, es decir, que el
promedio de las notas es igual en las 3 Universidades.

2.9 REGRESION Y CORRELACIN


Cuando tratamos con muestras bivariantes cuantitativas, es decir, con muestras
donde en cada unidad estadstica se observan dos caractersticas cuantitativas de X i
Y; por ejemplo, peso y talla. Se trata de estudiar la asociacin entre las dos variables
conocida tambin como asociacin o correlacin lineal simple.
El anlisis de regresin consiste en emplear mtodos que permitan determinar la
mejor relacin funcional entre dos o ms variables concomitantes (o relacionadas), y
el anlisis de correlacin, el grado de asociacin de las mismas. Es decir; no slo se
busca una funcin matemtica que exprese de que manera se relacionan, sino
tambin con que precisin se puede predecir el valor de una de ellas si se conoce los
valores de las variables asociadas.
La primera forma del estudio de la asociacin entre las variables X i Y es la
REGRESIN, que consiste en determinar una relacin funcional ente ellas, con el

fin de que se pueda predecir el valor de una variable en base a la otra. La variable
que se va predecir se denomina (dependiente) y la variable que es la base de la
prediccin, variable independiente.
La segunda forma del estudio de la asociacin entre las variables X i Y, es
denominada CORRELACIN, que consiste en determinar la variacin conjunta de
las variables, su grado de relacin, y su sentido (positivo o negativo). La medida de
grado de relacin se denomina coeficiente o ndice de correlacin.
X
Causa

Y
Efecto

Variable independiente

Variable dependiente

Cuando la tendencia es creciente, la lnea de regresin es (+) en cuanto a su


pendiente (m = +):
m=+

Cuando la tendencia es decreciente, la lnea de regresin es (-) en cuanto a su


pendiente (m = +):
m=-

ESTRATEGIA DE DECISN:
a. Si r se acerca ms a cero (0), no existe relacin o correlacin en la variable
independiente (X) y la variable dependiente (Y).
b. Si r se acerca ms a uno (1), si existe relacin o correlacin en la variable
independiente (X) y la variable dependiente (Y).

Ejemplo 1:
En un estudio de la relacin entre la publicidad por radio y las ventas de un producto,
durante 10 semanas se han recopilado los tiempos de duracin en minutos de la
publicidad por semana (X), y el nmero de artculos vendidos (Y), resultando:

X
20
30
30
40
50
60
60
60
70
80

a)
b)
c)
d)

Y
50
73
69
87
108
128
135
132
148
170

Trazar el diagrama de dispersin, e indicar la tendencia


Calcular la recta de regresin con el fin de predecir las ventas
Calcular el coeficiente de correlacin
Si en la novena semana se incrementara la publicidad en 5 minutos, determine en
cuanto se estima se incrementen las ventas.

SOLUCIN
a) Trazando el diagrama de dispersin:
1. Buscando el primer punto tcnico de la lnea de regresin:
X
20
30
30
40
50
60
60
60
70
80
X = 500

X
x

Y
x

Y
50
73
69
87
108
128
135
132
148
170
Y = 1100

XY
1000
2190
2070
3480
5400
7680
8100
7920
10360
13600
XY = 61800

X
400
900
900
1600
2500
3600
3600
3600
4900
6400
X = 28400

Y
2500
5329
4761
7569
11664
16384
18225
17424
21904
28900
Y = 134660

X i 20 30 30 40 ... 80 500

10 (para eje X)
n
10
10

Yi 50 73 69 87 ... 170 1100

110 (para eje Y)


n
10
10

2. Buscando el segundo punto tcnico de la lnea de regresin:


Y a bx

nxy (y )(x)
nx 2 (x) 2

x 2 y (x)(xy )
nx 2 (x) 2

(28400)(1100) (500)(61800) 340,000

10
34,000
10(2840) (500) 2

10(61800) (1100)(500) 68000

2
34000
10(28400) (500) 2

Entonces:

Y a bx
110 a 2(50)
110 100 a
a = 10
Y 10 10 x

b) Clculo de la recta de regresin con el fin de predecir las ventas:

Y 10 10 X

180
170
160
150
140
130
120
110

90

80

100

70

60

50
40
30
20
10
10

20

30

40

50

60

70

80

90 100

Existe una relacin positiva entre el nmero de artculos vendidos y el tiempo


de publicidad semanal por radio.
c) Clculo del coeficiente de correlacin:

nx

nxy (x)(y )
2

(x) 2 ny 2 (y) 2

(10)(61,800) (500)(1100)

(10)(28,400) (500) (10)(134,660) (1100)


2

0.998 altamente positivo

Como r 0.5, entonces existe alta correlacin entre las horas de publicidad (X)
y el nmero de artculos vendidos (Y).
d) El valor estimado de las ventas en la novena semana es:

Y 9 10 2(70) 150
Si en la 9na semana se incrementara el tiempo de publicidad en 5 minutos,
entonces, la venta estimada sera:
S Xi incrementa en k, entonces la frmula es: Yi = bk
S Xi incrementa 5, entonces Yi = 2(5) = 10
RPTA: 150 +10 = 160
Ejemplo 2:
Se supone que se puede establecer cierta relacin lineal entre las exportaciones de un
pas y la produccin interna de dicho pas. En el caso del Per, tenemos los datos
anuales (expresados en millones de soles) para tales variables correspondientes al
quinquenio 2005-2009 en la siguiente tabla:
AOS
2005

PRODUCCIN
52.654

EXPORTACIN
10.420

2006
2007
2008
2009

53,972
57.383
61.829
65.381

11.841
14.443
16.732
18.760

a) Hallar el coeficiente de correlacin


b) Calcular el coeficiente de regresin
c) Trazar la lnea de regresin
SOLUCIN
a) Trazando el diagrama de dispersin:
1. Buscando el primer punto tcnico de la lnea de regresin:
X

XY

X2

Y2

52.654

10.420

548.654680

2772.443716

108.576400

53,972

11.841

639.082452

2912.976784

140.209281

57.383

14.443

828.782669

3292.808689

208.600249

61.829

16.732

1034.522828

3822.825241

279.959824

65.381

18.760

1226.547560

4274.675161

351.937600

291.219

72.196

4277.532257

17075.72959

1089283354

X i 52.654 53.972 ... 65.381 291.219

58.2438
x
n
5
5
Y 10.420 11.841 ... 18.760 72.196
Y i

14.4392
x
n
5
5

2. Buscando el segundo punto tcnico de la lnea de regresin:


Y a bx
nxy (y )(x)
b
nx 2 (x) 2

x 2 y (x)(xy )
nx 2 (x) 2
(17075.72959)(72.196) (291.219)(4277.532257)
a
12855974.85
5(17075.70604) (291.219) 2
5(4277.532257) (72.196)(291.219)
b
220726.6767
5(17075.72959) (291.219) 2
a

Entonces:
Y a bx
14.4392 a 220726.6767(58.2438

14.4392 12855960.41 a
a = 12855974.84

Y 12855974.84 220726.6767 x

b) Clculo de la recta de regresin:

Y 12855974.84 220726.6767 X
19
18
17
16
15
14
13
12
11
10
9
8
7
6
5
4
3
2
1
10

20

30

40

50

60

70

80

90 100

Existe una relacin positiva entre la produccin y las exportaciones.


e) Clculo del coeficiente de correlacin:

nx

nxy (x)(y )
2

(x) 2 ny 2 (y) 2

(5)(3639146819) (237.301)(72.196)

(5)(84808.506) (291.219) (5)(1089283354) (72.196)


2

noesposiblecalular

Ejemplo 3:
En un nuevo proceso artesanal de fabricacin de cierto artculo que est implantado,
se ha considerado que era interesante ir anotando peridicamente el tiempo medio
(medido en minutos) que se utiliza para realizar una pieza (variable Y) y el nmero
de das desde que empez dicho proceso de fabricacin (variable X). Con ello, se
pretende analizar cmo los operarios van adaptndose al nuevo proceso, mejorando
paulatinamente su ritmo de produccin conforme van adquiriendo ms experiencia

en l. A partir de las cifras recogidas, que aparecen en la tabla adjunta, se decide


ajustar una funcin exponencial que explique el tiempo de fabricacin en funcin del
nmero de das que se lleva trabajando con ese mtodo.
X
X

10
35

20
28

30
23

40
20

50
18

60
15

70
13

Desde el correspondiente ajuste propuesto, se pide que determine:


a) Hallar el coeficiente de correlacin
b) Calcular el coeficiente de regresin
c) Trazar la lnea de regresin
Ejemplo 4
Proyectar la Oferta de un cierto producto tomando en cuenta los datos obtenidos en el
estudio de mercado, ver cual de los mtodos o curvas de proyeccin se ajusta mejor a la
nube de puntos y determinar la Oferta para los prximos diez aos.
Ao

Tiempo (X)

Oferta (Y)

2000

100,000

2001

120,000

2002

140,000

2003

110,000

2004

170,000

2005

150,000

2006

180,000

2007

200,000

2008

210,000

2009

10

200,000

Se observa un comportamiento exponencial

d) Hallar el coeficiente de correlacin


e) Calcular el coeficiente de regresin
f) Trazar la lnea de regresin.

Ejemplo 5

Una compaa de seguros considera que el nmero de vehculos (y) que circulan por
una determinada autopista a ms de 120 km/h , puede ponerse en funcin del nmero
de accidentes (x) que ocurren en ella. Durante 5 das obtuvo los siguientes
resultados:
Accidentes (Xi)

Nmero de vehculos (Yi)

15

18

10

20

a) Calcula el coeficiente de correlacin lineal.


b) Si ayer se produjeron 6 accidentes, cuntos vehculos podemos suponer que
circulaban por la autopista a ms de 120 km / h?
c) Es buena la prediccin?
SOLUCIN
Construimos una tabla, teniendo en cuenta que la frecuencia absoluta es uno.
Debemos conocer la media aritmtica de las dos variables, las varianzas, las
desviaciones tpicas y la covarianza.

Media aritmtica

Varianza

fi

15

Covarianza
2

x.y

25

225

75

18

49

324

126

10

100

20

64

20

81

400

180

24

71

160

1113

409

2.10 PRUEBA DE FRIEDMAN


En estadstica la prueba de Friedman es una prueba no paramtrica desarrollado
por el economista Milton Friedman. Equivalente a la prueba ANOVA para dos
factores en la versin no paramtrica, el mtodo consiste en ordenar los datos por
filas o bloques, reemplazndolos por su respectivo orden. Al ordenarlos, debemos
considerar la existencia de datos idnticos.
Sea

una tabla de datos Mtodo

1. Donde m son las filas (bloques) y n las columnas (tratamientos). Una vez
calculado el orden de cada dato en su bloque, reemplazamos al tabla original con
otra

donde el valor rij es el orden de xij en cada bloque i.

2. Clculo de las varianzas intra e inter grupo:


o

3. El estadstico viene dado por


4. El criterio de decisin es

Ejemplo 1:
Un investigador desea comparar los niveles de memoria en nios de 4, 6, 8, 10 y 12
aos despus de 3 diferentes tratamientos.
Eleccin de la prueba estadstica
El modelo experimental tiene tres o ms muestras dependientes.
Planteamiento de la hiptesis.

Hiptesis alterna (Ha). Hay diferencia significativa en nios de 4, 6, 8, 10 y 12


aos, despus de aplicar 3 diferentes tipos de tratamiento.
Hiptesis nula (Ho). No hay diferencia significativa en nios de 4, 6, 8, 10 y 12
aos, despus de aplicar 3 diferentes tipos de tratamiento.
Nivel de significacin.
Para todo valor de probabilidad igual o menor que 0.05, se acepta Ha y se rechaza
Ho.
Zona de rechazo.
Para todo valor de probabilidad mayor que 0.05, se acepta Ho y se rechaza Ha.
Escala = 0 - 20

Aplicacin de la prueba estadstica.


Transformamos los valores en rangos de acuerdo con la prueba de Friedman, en
funcin de las hileras. Al valor ms bajo le corresponde el rango 1, respetando el
orden hasta el dato que tiene la cifra ms alta.
Rango1 = 8
Rango2 = 9
Rango3 =13
Calculamos la X2r de Friedman.

Se utiliza la tabla N para pruebas pequeas.


Con tres columnas y cinco hileras se compara el valor calculado de X2r de Friedman
con la tabla correspondiente de distribucin de probabilidad. Las cifras aproximadas
al estadstico calculado 2.8 = 0.367.
Decisin.
Como el valor de X2r calculado es igual a 2.8, la probabilidad es de 0.367, esto indica
que es menor que el nivel de significancia, por lo cual, se acepta Ha y se rechaza Ho.
Interpretacin.
Aceptada Ha, se acepta que entre los tres tratamientos existen distintos grados de
memoria adquirida. Se distingue notoriamente que el tratamiento A es menos eficaz,
con respecto a los otros dos tratamientos. Por otro lado, el tratamiento B ofrece
mayores ventajas para la adquisicin de memoria.

UNIDAD III
MODELOS PROBABILSTICOS IMPORTANTES

3.1 DISTRIBUCIONES DISCRETAS DE PROBABILIDAD


La distribucin de probabilidad de una variable aleatoria describe cmo se
distribuyen las probabilidades de los diferentes valores de la variable aleatoria. Para

una variable discreta X, la distribucin de probabilidad se describe mediante una


funcin de probabilidad, representada por f(x).
La funcin de probabilidad define la probabilidad de cada valor de la variable
aleatoria.
Ejemplo 1: Una industria de muebles desea determinar la cantidad y la probabilidad
de venta en un da cualquiera, a partir de los siguientes datos: durante
90 das de operacin, en 15 das no se vendieron muebles, en 30 se
vendieron 3 muebles; en 8, 1, en 12, 2, en 15, 4, en 10, 6. Determine la
cantidad y la probabilidad que venda en un da cualquiera.
SOLUCION
a) Distribucin de probabilidad
Q muebles X

No. de das de venta

0
1
2
3
4
6

15
8
12
30
15
10

Dist. Disct. de Prob. f(x)


15/90
8/90
12/90
30/90
15/90
10/90

= 0.1667
= 0.0889
= 0.1333
= 0.3333
= 0.1667
= 0.1111
1.0000

Rpta: La mayor cantidad y probabilidad que la tienda venda en un da


cualquiera es de 3 muebles con 33.33% de probabilidad. La
probabilidad que venda 3 muebles un da cualquiera es 33.33%. Lo
mnimo que pueda vender es de 1 mueble con probabilidad de
8.89%. Probabilidad de que venda 3 o ms muebles en un da
cualquiera es 0.6111 (61.11%).
La probabilidad para cualquier variable discreta, debe satisfacer 3
condiciones:
F(x) 0
que puede
f(x) = 1
aleatoria.
f(x) = 1/n
b) Valor esperado y varianza

n = nmero de valores
asumir la variable

b.1) Valor esperado (media).- Es una medida de localizacin central (o


tendencia central) de una variable. La ecuacin matemtica del valor
esperado de una variable aleatoria discreta X es la siguiente:

E(x) = = Xf(x)
X

f(x)

E(x) = = Xf(x)

0
1
2
3
4
6

15/90
8/90
12/90
30/90
15/90
10/90

= 0.1667
= 0.0889
= 0.1333
= 0.3333
= 0.1667
= 0.1111
1.0

0.0000
0.0889
0.2667
0.9999
0.6668
0.6666
2.6889

Rpta:
i) 2.6889 muebles por vender diariamente
ii) 2.6889 x 30 das mes = 80.967 muebles a vender mensualmente
b.2 Varianza.- Es un promedio ponderado de las desviaciones de una
variable aleatoria respecto a su promedio, elevadas al cuadrado, los
factores de ponderacin son las probabilidades. Variabilidad de un
conjunto de datos.
2

= ( x - ) f(x)
(X -

0 2.6889
1 2.6889
2 2.6889
3 2.6889
4 2.6889
6 2.6889

(x-)

= -2.6889
= -1.6889
= -0.6889
= 0.3111
= 1.3111
= 3.3111

7.2302
2.8524
0.4746
0.0968
1.7190
10.9634

( x - ) f(x)
7.2302 x 0.1667 = 1.2053
2.8524 x 0.0889 = 0.2536
0.4746 x 0.1333 = 0.0633
0.0968 x 0.3333 = 0.0323
1.7190 x 0.1667 = 0.2865
10.9634 x 0. 1111= 1.2180
3.059

= 3.059

b.3 Desviacin estndar.-

3.059 = 1.75 en promedio la venta de muebles


difieren de la media en 1,75 ventas..
Ejemplo 2: La ventanilla No. 3 de la Cooperativa Santa Mara
Magdalena atendi durante 30 das del mes de .......... del
ao ......, con la siguiente distribucin de atencin: 5 das
atendi a 16 socios, 8 das a 20 socios, 10 das a 21
socios, 7 das a 25 socios. Cul es la mayor cantidad y
probabilidad que la ventanilla No. 3 atienda cualquier da
del mes? Cul es la menor cantidad y probabilidad de
atencin en un da cualquiera?
S=

SOLUCION

i) Distribucin de probabilidad
Q: socios X
16
20
21
25

das de atencin
5
8
10
7

f(x)
5/30 = 0.1667
8/30 = 0.2667
10/30 = 0.3333
7/30 = 0.2333
1.0000

Rpta:
i) La mayor cantidad de socios que atendera la ventanilla No. 3 es
de 21 socios con una probabilidad de 33.33% en un da
cualquiera.
ii) La menor cantidad de socios que atendera la ventanilla No. 3,
en un da cualquiera del mes es de 16 socios con probabilidad de
16.67%.
ii) Valor esperado = Xf(x)
X
Xf(x)

E(x) = =

f(x)

16
20
21
25

0.1667
0.2667
0.3333
0.2333

2.6672
5.3340
6.9993
5.8325
20.8330

Rpta:
i) 20.8330 socios por atender diariamente
ii) 20.8330 x 30 das mes = 624.99 = 625 socios atendidos
mensualmente
2

iii) Varianza. = ( x - ) f(x)


(X - )
16 20.8330
20 20.8330
21 20.8330
25 20.8330

(x - )
= -4.8330 23.3579
= -0.8330
0.6939
= 0.1670
0.0279
= 4.1670
17.3639

( x - ) f(x)
23.3579 x 0.1667 = 3.8938
0.6939 x 0.2667 = 0.1851
0.0279 x 0.3333 = 0.0093
17.3639 x 0.2333 = 4.0510
8.1392

= 8.1392
2

iv) Desviacin estndar S


S =

8.1392 = 2.85 En promedio, la atencin en la


ventanilla No. 3 difiere de la media
en 2,85 socios.

Ejemplo 3: Los estudiantes de la EFPAE UNSCH, durante los 10


semestres acadmicos de estudio normal aprueban las
asignaturas con la siguiente distribucin: 2 cursos en 2
semestres, 4 cursos en 2 semestres, 5 cursos en 3
semestres, 6 cursos en 2 semestres y 7 cursos en 1
semestre. Se desea saber la cantidad de curos y su
probabilidad que el promedio de estudiantes aprueben en
un semestre cualquiera. Cul es la cantidad y la
probabilidad que aprueben menos de 5 cursos? y 5 o
ms cursos?
SOLUCION
i) Distribucin de probabilidad
Q: socios X
2
4
5
6
7

das de atencin
2
2
3
2
1
10

f(x)
2/10 = 0.2
2/10 = 0.2
3/10 = 0.3
2/10 = 0.2
1/10 = 0.1

Rpta:
i) La mayor cantidad de cursos que aprobara el promedio de los
estudiantes de EFPAE es 5 cursos con probabilidad de 30%.
ii) Que apruebe menos de 5 cursos es de 40%.
iii) Que apruebe 5 o ms es 60%.
ii) Valor esperado = Xf(x)
X
2
4
5
6
7

E(x) = = Xf(x)

f(x)
0.2
0.2
0.3
0.2
0.1

0.4
0.8
1.5
1.2
0.7
4.6

Rpta:
i) 4.6 Cursos aprobados por semestre
ii) 4.6 x 10 = 46 cursos aprobados en los 10 semestres.
2

iii)Varianza. = ( x - ) f(x)
(X - )
2 4.6

(x-)
= -2.6

6.76

( x - ) f(x)
6.76 x 0.2 =

1.352

4 4.6
5 4.6
6 4.6
7 4.6

= -0.6
= 0.4
= 1.4
= 2.4

0.36
0.16
1.96
5.76

0.36 x 0.2 =
0.16 x 0.3 =
1.96 x 0.2 =
5.76 x 0.1=

0.072
0.048
0.392
0.576
2.44

= 2.44

iv) Desviacin estndar S


S=

; S

2.44 = 1.562 En promedio, aprobar los cursos cada


semestre
defiere de la media
en 1.562.

3.2 DISTRIBUCIN DE PROBABILIDAD BINOMIAL


Es una distribucin discreta de probabilidad que tiene muchas aplicaciones. Se
relaciona con un experimento de etapas mltiples que llamamos binomial.

n

x
F(x) = P (1- p)
x


( n x )

n


; =
x


n!
x!(n X )!

a) Propiedades
1.- El experimento consiste en una sucesin de n intentos o ensayos idnticos
2.- En cada intento o ensayo son posibles dos resultados. A uno llamamos xito y
al otro fracaso.
3.- La probabilidad de un xito, representada por P, no cambia de un intento o
ensayo a otro. En consecuencia, la probabilidad de un fracaso, representada
por 1-P, no cambia de un intento a otro.
4.- Los intentos o ensayos son independientes
Ejemplo 1: Un agente vendedor sin experiencia, visitar un da cualquiera de la
prxima semana a 10 hogares para ofrecer un producto. Su preocupacin
es vender en todos los hogares visitados. Supongamos que le interesa la
cantidad de ventas en los 10 hogares. Tiene este experimento las
propiedades de un experimento binomial? Cul es la variable aleatoria
de inters?
SOLUCION
1.- El experimento consiste en 10 intentos (visitas) idnticos, y cada
intento implica ofrecer el producto en un hogar.

2.- Son posibles dos resultados para cada intento: vender o no vender.
Podemos asignar que vender el producto es un xito y no vender el
producto un fracaso.
3.- La probabilidad de vender y probabilidad de no vender son iguales
para cada intento, siendo P = 0.5 y 1-P = 0.5
4.- Los intentos son independientes porque el resultado de cualquier
intento no es afectado por lo que sucede en los dems intentos.
5.- En consecuencia, la variable aleatoria de inters es la cantidad de
ventas en los 10 intentos: 0, 1, 2, ... , 10.
Ejemplo 2: Si consideramos la informacin del ejemplo anterior (1), con el agregado:
de acuerdo con su experiencia el vendedor sabe que la probabilidad que
un hogar visitada compre el producto es de 0.30. Comprobar si se
satisfacen las propiedades de un experimento binomial.
SOLUCION
1. Idem
2. Idem
3. La probabilidad de una compra y no compra son iguales para cada
visita, siendo P = 0.30, 1- P = 0.70.
4. Las visitas son independientes, por que las familias se seleccionan
aleatoriamente.
5. Idem la variable aleatoria.
Ejemplo3: Una tienda que vende muebles est preocupado en la decisin de compra
de las 6 personas que ingresan a la tienda. De acuerdo con su experiencia,
el vendedor de la tienda estima que la probabilidad de que cualquier
persona que ingresa a la tienda compre es de 0.15. Cul es la
probabilidad que 3 de las siguientes 6 personas que ingresen a la tienda
hagan una compra?

F(x) =

n

x
x P (1- p)


( n x )

n


;
x


n!
x!(n x)!

SOLUCION
Ningn cliente haga la compra f(x = 0) =

6!
0!6!

0.15 0.85

Exactamente un cliente haga la compra f(x =1) =

6!
1!5!

= 0.377

0.15 0.85

= 0.399

Exactamente 2 clientes hagan la compra f(x =2) =

2
4
6!
0.15 0.85 = 0.176
2!4!

Exactamente 3 clientes hagan la compra f(x =3) =

6!
3!3!

Exactamente 4 clientes hagan la compra f(x =4) =

6!
0.15 4 0.85
4!2!

Exactamente 5 clientes hagan la compra f(x=5) =

6!
0.155 0.85
5!1!

Exactamente 6 clientes hagan la compra f(x=6) =

6!
0.15 6 0.85 0 = 0.000011
6!0!
1.00000

0.153 0.85

= 0.041

= 0.0055

= 0.0004

El valor esperado y varianza para distribucin de probabilidad binomial:

Valor esperado E(x) = = np


Varianza

2 = np (1 p)

Desviacin estndar =

np(1 p)

np

= 6 x 0.15 = 0.90

2 = 6 x 0.15(1- 0.15) = 0.765


=

6 x0.15(1 0.15) = 0.8746

Ejemplo 4: Un supervisor de control de calidad est preocupado de la cantidad de


unidades defectuosas en un lote de 50 productos. Los datos histricos
arroja que un producto cualquiera resulte defectuosa tiene una
probabilidad de 2%. Cul es la probabilidad que 5 unidades de las 50
que conforman el lote resulten con defecto?
Datos:
n = 50
X=5
P = 2%
(1-P) = 98%
f(x=5) =

50!
0.025 0.9845 = 0.0027 0.27%
5!45!

3.3 DISTRIBUCIN DE PROBABILIDAD HIPERGOEMTRICA


Con la distribucin hipergeomtrica, los intentos no son independientes, ya que la
probabilidad de xito cambia de un intento a otro. Se usa para calcular la
probabilidad de que, en una muestra aleatoria de n artculos, seleccionados sin

reemplazo, obtengamos X
elementos identificados como xito y n X
identificados como fracaso. Para que suceda esto debemos obtener X xitos de los r
en la poblacin, y n X fracasos de los N r de la poblacin.

r N r

x
n

F(x) = --------------------------------N

n
F(x) = Probabilidad de x xitos en n intentos
n = Nmero de intentos
N = Nmero de elementos en la poblacin
r = Nmero de elementos identificados como xito en la poblacin
N

n = Representa la cantidad de formas en que se puede seleccionar una

muestra de tamao n de una poblacin de tamao N.


r

= Representa la cantidad de maneras en que se puede seleccionar X
x
xitos de un total de r xitos de la poblacin
N r

= Representa la cantidad de maneras en que se pueden seleccionar


n x
n x fracasos de un total de N r fracasos en la poblacin.

r
r = Exitos
X = Exitos

N r = Fracasos

n x = Fracasos

Ejemplo 1: La Municipalidad Provincial de Huamanga desea seleccionar 4


funcionarios de los 12 con que cuenta, para que asistan a un curso
de capacitacin a la ciudad de Lima los funcionarios estn
formados de 7 mujeres y 5 varones. El problema consiste
determinar la probabilidad de seleccionar 4 mujeres al azar.
Datos:
n=4
N = 12

r=7
X = 4 mujeres sean seleccionadas.
N =12

n=4

r=7

X=4
n-x = 0

N-r = 5

7 5

4 0
F(4) = ------------- =
12

4

7! 5!

4!3! 5!0!
----------------- = 0.071
12!

4!8!

Ejemplo 2: El Alcalde decide que deben viajar 6 personas manteniendo las 4


mujeres.
Datos:
n=6
N = 12
r=7
X = 4 mujeres sean seleccionadas.

7 5

4 2
F(6) = ------------12

6

7! 5!

4!3! 2!3!
----------------- = 0.38
12!

6!6!

Ejemplo3: A un Hotel de la ciudad de Ayacucho acuden 15 posibles clientes


diariamente, 8 se quedan a alojarse y los 7 restantes no. Cul es la
probabilidad de que en una muestra aleatoria de tamao 5, 3 no se
alojen?
Datos:
n=5
N = 15
r=7
X = 3 no se alojen

7 8

3 2
F(3) = -------------

7! 8!

3!4! 2!6!
----------------- = 0.33

15

5

15!

5!10!

3.4 DISTRIBUCIN DE PROBABILIDAD DE POISSON


Se usa con frecuencia para estimar la cantidad de ocurrencia en determinado intervalo
de tiempo o espacio.
Propiedades:
1. La probabilidad de una ocurrencia es igual en 2 intervalos cualesquiera de igual
longitud
2. La ocurrencia o no ocurrencia en cualquier intervalo es independiente de la
ocurrencia o no en cualquier otro intervalo.

F(x) =

x e
X!

F(x) = probabilidad de x ocurrencias en un


intervalo.
= Valor esperado o cantidad promedio
de ocurrencias en un intervalo
e
= 2.71828
X = 1,2,3, ........ aleatoria discreta.

e = 2.71828

Ejemplo1: El gerente de la Cooperativa Santa Mara Magdalena est interesado en el


nmero de llegadas a las ventanillas de caja, durante un periodo de 60
minutos en las maanas de los das hbiles. El anlisis de datos histricos
arroja que en promedio llegan 18 personas en 1 hora. Desea saber la
probabilidad que lleguen 10 en 60 minutos.
18 e 18
=
10!
10

a) F(10)

b) F(15) =

1815 e 18
15!

= 0.015

= 0.079 7.86%

18 5 e 18
c) F(5) =
= 0.00024 0.024%
5!
La probabilidad que exactamente llegue 10 personas en 60
minutos es de 0.015 1.5%
Ejemplo 2: Un operador de moto taxi est interesado en la cantidad de pasajeros que
suben a su unidad, durante 4 horas de recorrido diario. De acuerdo con
un sondeo emprico suben 15 personas en 1 hora. Desea saber la
probabilidad que exactamente 10 personas ocupen u servicio en 1 hora.
15 e 15
=
10!
10

F(10)

= 0.04861 4.86%

3.5 DISTRIBUCIN NORMAL

Es la probabilidad que exactamente 10


personas ocupen su servicio en una hora.

Permite tener una descripcin de los resultados probables obtenidos mediante el


muestreo. Tiene variedad de aplicaciones prcticas: altura y peso de las personas,
puntuaciones de examen, mediciones cientficas, precipitaciones, etc.

a) Funcin de densidad:
F(x) =

2
2
1
x e ( xu ) / 2
2

99.21%
95.44%
68.26
= media
= desviacin estndar
= 3.14159
e = 2.71828

Desviacin

-3

- 2

-1 +1 +2 +3

Caractersticas:
1. La familia completa de distribuciones de probabilidad normales se diferencia
por su () y su desviacin estndar ()
2. El punto ms alto de la curva normal es la media, que tambin es la mediana y
la moda de la distribucin.
3. La media de la distribucin puede ser cualquier valor numrico: negativo, cero
o positivo.

-10

20

4. La distribucin de probabilidad normal es simtrica, y su forma a la izquierda


de la media es una imagen especular de la forma a la derecha de la media. Las
colas, es decir, los extremos o los lados de la curva se prolongan al infinito en
ambas direcciones y, tericamente, nunca tocan el eje horizontal.
5. La desviacin estndar determina el ancho de la curva. A valores mayores de la
desviacin estndar se tienen curvas ms anchas y bajas, que muestran una
mayor disposicin en los datos. A continuacin vemos dos distribuciones
normales con el mismo promedio, pero con distintas desviaciones estndar.

=5

= 10

6. Las probabilidades para la variable aleatoria normal estn dadas por reas bajo
la curva. El rea total bajo la curva para la distribucin de probabilidad normal
es 1 ( esto se cumple para todas las distribuciones continuas de probabilidad).
Debido a que la distribucin es simtrica, el rea total bajo la curva a la
izquierda de la media es 0,50 y el rea total bajo la curva a la derecha de la
media es 0.50.
7. El porcentaje de valor en algn intervalos de uso comn es:
a. 68.26% de los valores de una variable aleatoria normal estn dentro de ms
o menos una desviacin estndar de su media.
b. 95.44% de los valores de una variable aleatoria normal estn dentro de ms
o menos dos desviaciones estndar de su media.
c. 99.72% de los valores de una variable aleatoria normal estn dentro de ms
o menos tres desviaciones estndar de su media.
2.5.1 Distribucin de Probabilidad Normal Estndar.- Cuando una variable aleatoria
admite una media () cero (0) y desviacin estndar ( = 1). Los clculos de
probabilidad con cualquier distribucin normal se llevan a cabo determinando
las reas bajo la grfica de la funcin de densidad de probabilidad. Para
determinar la probabilidad de que una variable normal est dentro de un
intervalo especfico, debemos calcular el rea bajo la curva normal en ese
intervalo. Para la distribucin de probabilidad normal estndar se han
determinado las reas bajo la curva normal, y se muestran en tablas para
calcular las probabilidades.

Ejemplo 1:

P(0.00 Z 1.00) = ?

P(0.00 Z 1.00) = ?
Z

Utilizando la tabla Z:

1.0

P(0.00 Z 1.00) = 0.3413

0.00

Ejemplo 2:

P(0.00 Z 1.27) = ?

P(0.00 Z 1.27) = ?
Z

1.27

Utilizando la tabla Z:

1.2

Ejemplo 3:

P(0.00 Z 1.27) = 0.3980

0.07
P(- 2.5 Z 2.5) = ?

P(- 2.5 Z 2.5) = ?


Z

-2.5

2.5

Utilizando la tabla Z:
2.5

0.4938; P(-2.5 Z 2.5) = 0.4938 x 2 = 0.9876

0.00
Ejemplo 4:

P(- 2.75 Z 2.75) = ?

P(- 2.75 Z 2.75) = ?


Z

-2.75

2.75

Utilizando la tabla Z:
2.7

0.4970;

P(- 2.75 Z 2.75) = 0.4970 x 2 = 0.9940

0.05
Ejemplo 5:

P(Z 1.49) = ?

P(Z 1.49) = ?
0

0.5

1.49

0.5

1.00
Utilizando la tabla Z:
1.4

P(Z 1.49) = 0.4319

0.09
Entonces:

P(Z 1.49) = 0.5000 0.4319 = 0.0681

Ejemplo 6: P(Z - 0.50) = ?

P(Z - 0.50) = ?
1 0.5 0

Utilizando la tabla Z:

1.49

0.5

P(Z - 0.50) = 0.1915

0.00

Entonces:

P(Z - 0.50) = 0.5000 + 0.1915 = 0.6915

Ejemplo 7: P(1.00 Z 1.58) = ?

P(1.00 Z 1.58) = ?

1 1.58

Utilizando la tabla Z:
1.0

0.3413

0.4429

0.00
1.5
0.08
Entonces:

P(1.00 Z 1.58) = 0.4429 - 0.3413 = 0.1016

Ejemplo 8: Determinar el valor de Z tal que la probabilidad de obtener un


valor mayor slo sea de 0.10. Cul es el valor de Z?

Probabilidad o rea = 0.1000


0

i) 0.5000 0.1000 = 0.4000 (buscar en la tabla).

ii) Utilizando la tabla Z:

1.2
P(Z 1.28)

Valor aproximado a 0.4000 = 0.3997


0.08

Ejemplo 9: Determinar el valor de Z tal que la probabilidad de obtener un


valor menor slo sea de 0.5571.

Probabilidad o rea = 0.5000


0 0.55571

Entonces: 1.000 0.5571 = 0.4429 (buscar en la tabla) P(Z


1.58)

Ejemplo 10: Un Ingeniero mecnico acaba de implementar una planta de


cambio de combustin para motores de vehculos gasolineras a
gas. Como el servicio es nuevo, el ingeniero cree que la garanta de
Km recorridos ser un factor importante en la demanda del
servicio. Entonces, antes de entrar con fuerza a esta poltica de
servicio el ingeniero desea saber acerca de Km que durar el gas de
18 libras.
De acuerdo con otras experiencias se estima que el
promedio de Km recorridos es de 120 Km y su desviacin estndar
50 km. Qu porcentaje de galones de gas se puede esperar que
sobrepasen 150 Km?
SOLUCION
i) Cuando nos encontramos con una distribucin normal con media
() y desviacin estndar (); primero convertimos a una
distribucin normal estndar y luego utilizamos la tabla
correspondiente.
ii) La frmula para cualquier variable aleatoria normal (x) con
media () y desviacin () es:

Z=

iii)

P(X 150) = ?
120

150

a. Cuando X = 150
Z=

150 120
= 0.6
50

b) Buscar 0.6 en la tabla

0.6

0.2257

0.00
P(X 150) = 0.5000 0.2257 = 0.2743 es la probabilidad de
que X sea mayor de 150 km. El 27.43% de los galones durar
ms de 150 Km.

3.6 DISTRIBUCIONES CONTINUAS DE PROBABILIDAD


3.6.1 DISTRIBUCIONES DE PROBABILIDAD UNIFORME.- Siempre que la
probabilidad sea proporcional a la longitud del intervalo, la variable tiene
distribucin uniforme.
Ejemplo: El tiempo de viaje de la Empresa Molina Unin de la Ciudad de
Ayacucho a Lima es en el intervalo de 8 a 12 horas.
P (a X b)

P(x) = ab
A

f(x) =

tiempo (b a )

1
; para a X b
ba

Intervalo

f(x) = (b a)

Aplicando A x H

X b

de

1
; para a
ba

b) Cul es la probabilidad de que el viaje se haga entre 8 y 11


horas?
i) Ancho del intervalo 11 8 = 3
(

Funcin densidad

1
)
12 8

1
1
=
12 8
4

ii) P(8 X 11) = 3 (

1
3
)=
= 0.75
4
4

( 11 8) = 3

Valor esperado:
Ve = =

(a b) (8 11)
=
= 9.5 horas de viaje
2
2

Varianza:

(b a) 2
(11 8) 2
= 2
= 0.75
12
12

Desviacin estndar:

(b a) 2
(11 8) 2

0.866 minutos
12
12

c) Cul es la probabilidad de que el viaje se haga entre 9 y 10


horas?
i) Ancho del intervalo 10 9 = 1
Funcin densidad

1
1
=
12 8
4

ii) P(9 X 10) = 1 (

1
1
)=
= 0.25
4
4

d) Cul es la probabilidad que el viaje se haga entre 10 y 12


horas?
i) Ancho del intervalo 12 10 = 2
1
1
=
12 8
4

Funcin densidad

ii) P(10 X 12) = 2 (

1
2
)=
= 0.5
4
4

e) Cul es la probabilidad que el viaje se haga entre 8 y 9 horas?


i) Ancho del intervalo 9 8 = 1
1
1
Funcin densidad
=
12 8
4

ii) P(8 X 9) = 1 (

3.6.2

1
1
)=
= 0.25
4
4

DISTRIBUCIONES DE PROBABILIDAD EXPONENCIAL.- Una


distribucin continua de probabilidad que es til para describir el tiempo que
se tarda en realizar una actividad es la distribucin de probabilidad
exponencial. Usado para describir cosas tales el tiempo entre llegadas de
clientes de un banco, comercio, restaurantes, hoteles, distancia de defectos en
la carretera, proceso de produccin, etc.
i) Funcin de densidad

f(x) =

(e) ; para X 0, 0

iii) Distribucin exponencial: probabilidades acumuladas


X

P( X X 0 ) = 1- e

Ejemplo: S X = tiempo que demora un cliente en caja de un banco


S el tiempo promedio para la atencin es 2 minutos ()
Entonces: Cul es la probabilidad que la atencin sea de 1.5 minutos o menos.

1 . 5
2

P( X 1.5) = 1= 0.5276 (52.76% 53%) es la


probabilidad que la atencin a un cliente dure 1.5 minutos.

EJERCICIOS DE REPASO

1.- Identifique Ud. los siguientes enunciados si corresponde a Estadstica Descriptiva o


Inferencial:
a. El analista de crdito de la Cooperativa Santa Mara Magdalena determina que de
los 10,000 socios prestatarios el 15% son morosos.
b. Un fabricante de alimentos balanceados muestrea a un grupo de clientes para
recabar informacin sobre la calidad de nutrientes que contiene su producto.
c. De los 75,00 habitantes de la ciudad de Huamanga 51.5% son mujeres, 32%
jvenes de 12 a 20 aos y 12% nios.
d. La direccin de EFPAE determin los factores de bajo rendimiento de los
estudiantes a partir de un estudio del 25% de ellos.
e. De todos los problemas empresariales, el 80% son generados por la alta direccin,
en cualquiera empresa.
f. De una seleccin de 100 productos, de una lote 10,000 unidades, 5% result con
defectos significativos
2.- Un ofertante de terrenos desea vender 5 lotes en forma sucesiva; es decir, una tras
otra. Cuntos resultados experimentales posible tiene el vendedor?
3.- Un supervisor de obras desea optimizar la ejecucin del proyecto. El flujo del
proyecto se divide en 3 etapas: estudio, implementacin y ejecucin. Los tiempos
promedios histricos en actividades similares arrojan la siguiente informacin; la
fase de estudio 2,3 meses, 2da. Etapa 5, 6 meses y la 3era. etapa de ejecucin 11 y
12 meses. Cuntos resultados experimentales admite el problema? Cunto es el
tiempo mximo y mnimo de ejecucin del proyecto?
4.- La EFPAE desea seleccionar 3 estudiantes de 5 que constituyen del tercio superior
en ndice acadmico, para que puedan asistir al CADE 2006. Cuntas formas de
seleccionar existen sin orden alguna?
5.- Si la Direccin de EFPAE tomase la decisin de seleccin basndose en orden de
mrito. Cuntos resultados experimentales existen?
UNIDAD IV
ESTIMACIONES
4.4 ESTIMACIN PUNTUAL.- Es el procedimiento de calcular un parmetro de
poblacin mediante una caracterstica de la muestra, que se denomina estadstico de
la muestra o media poblacional
EJEMPLO: De los 380 alumnos de la EFPAE UNSCH se han seleccionado 10
alumnos, cuyas tallas y aprobacin de ndice acadmico se muestra en
la siguiente tabla:
i)

Xi

I. A.

i)

1.61 1.72 ... 1.80


= 1.71
10
X1 = 1.61
A
X2 = 1.72
D
X3 = 1.79
D
X4 = 1.60
A
X5 = 1.66
D
X6 = 1.69
D
X7 = 1.70
A
X8 = 1.74
D
X9 = 1.79
D
X10 = 1.80
A

ii) S

n 1

0.047
= 0.072
10 1

NOTA: (n -1) Factor de correccin, cercano a 1; cuando la Poblacin es finita grande y se estudia muestra (n) pequeo

Clculo previo:

1.61 1.71 =

0.12
0.012

= 0.01

1.72 1.71 =
= 0.0001
.
.
.
.
.
.
2
1.80 1.71 = 0.09 = 0.0081
0.047
Proporcin poblacional que tiene ndice acadmico aprobado:
A = 4
D = 6
ndice aprobado: p =

4
= 40%
10

ndice desaprobado: p =

6
10

= 60%

NOTA:
X = Promedio muestral estimador puntual de poblacional
S = Desviacin estndar muestral puntual estimador de la desviacin
poblacional
p = Proporcin muestral estimador puntual de la proporcin P
poblacional.

4.1 DISTRIBUCIONES MUESTRALES

10

X = 1.71
X =X
S = 0.072
S =Y
p = 40%
p = Z

Primera
Seleccin

X = 1.69
10

10

S = 0.065

p = 43%

Segunda
Seleccin

n seleccin

A partir de la segunda seleccin no se tiene los mismos elementos que las


anteriores, tampoco iguales estimadores puntuales.

Supongamos que hemos seleccionado 5 veces, entonces:

Muestreo
1
2
3
4
5

S
0.072
0.065
0.060
0.059
0.075

X
1.71
1.69
1.70
1.72
1.69

1.71
1.69
1.70
1.72

Distribucin
Distrib.
Muestral

1
2
1
1
5

Frecuencia
relativa
0.2
0.4
0.2
0.2
1.0

Distribucin
Muestral

Muestral

X
P

P
40%
43%
41%
44%
59%

Las distribuciones muestrales puntuales tienen el comportamiento de


distribucin normal cuando se aplica distribuciones de frecuencia de X a partir de
muestra de tamao (ni), por ejemplo; 10 de los 380 alumnos. Porque los extremos se
alejan del promedio general.

4.2 DISTRIBUCION MUESTRAL DE MEDIA X .- El procedimiento estadstico ms


comn es usar la media de la muestra X para hacer inferencia acerca de una media
de la poblacin. La distribucin de probabilidad de todos los valores posibles de la
media de la muestra X se llama distribucin muestral de la media de la muestra X .
i) Valor esperado( X ).- Distintas muestra aleatorias simples dan como resultado
varios valores de la media de la muestra X .
E X = Valor esperado de X
EX =

= Media de la poblacin

ii) Desviacin estndar de X

X = Desviacin estndar de la distribucin muestral X


= desviacin estndar de la poblacin
n = Tamao de la muestra
N = Tamao de la poblacin
a) Para poblacin finita

X =

N n

N 1 n

b) Para poblacin infinita

X =

N n
= Factor de correccin, cercano a 1; cuando la poblacin es
N 1
finita grande y se estudia muestra (n) pequeo

Usar

para calcular desviacin estndar de X , siempre que:


n

1.- La poblacin sea infinita


2.- La poblacin sea finita y que el tamao de la muestra sea menor o
n
igual que 5% (
0.05) de la poblacin.
N

n
> 0.05) se debe usar
N
finitas en clculo de X .

3.- En caso (

N n

para poblaciones
N 1 n

X Es un error estndar de la muestra

4.3 DISTRIBUCIONES MUESTRALES DE P .- En los aspectos de gestin de negocios


y la economa empresarial se usa la proporcin muestral P para hacer inferencias
estadsticas sobre la proporcin poblacional P. Podemos predecir que en cada
repeticin del proceso obtendremos un valor distinto de la proporcin de una muestra
P . La distribucin de probabilidad para todos los valores posibles de la proporcin
muestral P se llama distribucin muestral de la proporcin muestral P .
i) Valor esperado de P

EP = Valor esperado de P
EP = P

= Proporcin poblacional

ii) Desviacin estndar de P


a) Poblacin finita

b) Poblacin infinita

N n P(1 P)
N 1
n

P =

P =

p(1 P)
n

Si la poblacin es finita y
Si la poblacin es finita y
n
n
> 0.05 usar (a)
0.05 usar (b).
N
N
La distribucin muestral de P se puede aproximar con una distribucin de
probabilidad normal, siempre que el tamao de la muestra sea grande.
Se puede considerar que el tamao de la muestra es grande cuando se
cumplen las dos condiciones siguientes:

np 5
n(1-P) 5
4.4 PROPIEDADES DE LOS ESTIMADORES PUNTUALES
N

X
n

Estadstico de muestra o estimador puntual de (muestra)

Parmetro poblacional de inters

a) INSESGADEZ.- Si el valor esperado del estadstico de muestra es igual al


parmetro poblacional que se estima, se dice que ese estadstico
es un estimador insesgado del parmetro poblacional.

E =
b) EFICIENCIA.- En general, preferiramos usar un estimador puntual con la menor
desviacin estndar, porque tiende a proporcionar estimacin ms
cercana al parmetro poblacional.
c) CONSISTENCIA.- Un estimador puntual es consistente si sus valores tienden a
acercarse al parmetro de poblacin conforme se incrementa
el tamao de la muestra. En otras palabras, un tamao
grande de muestra tiende a proporcionar un mejor estimador
puntual que un tamao pequeo.

UNIDAD IV
ESTIMACIONES ESTADSTICAS

3.1 ESTIMACIONES DE INTERVALO DE UNA MEDIA DE LA POBLACIN:


MUESTRA GRANDE
Cmo usar una muestra aleatoria simple para obtener una estimacin del
intervalo de una media poblacional.

PRIMER CASO: n 30, se conoce poblacional


Olva Currier Ayacucho, es una empresa de servicios de comunicacin
rpida. El servicio al cliente en la forma de recepcin y entrega de mensajes
oportunamente es importante para el xito y garanta operativa de la empresa.
El equipo de control de calidad utiliza una encuesta de servicio al cliente
para medir su satisfaccin respecto a su sistema de servicio. Cada mes, se enva un
cuestionario a una muestra aleatoria de clientes que demandaron su servicio el mes
anterior. A los clientes se les pide que completen un cuestionario que califica el
servicio. Cada respuesta se convierte en una puntuacin de satisfaccin que vara de
0 a 5 (0 = no opina, 1 = muy mala, 2 = mala, 3 = regular, 4 = buena y 5 = muy
buena). Con base en cada encuesta mensual, se calcula una puntuacin muestral
promedio de satisfaccin del cliente. Esta puntuacin se emplea como estimador
puntual de la puntuacin de satisfaccin poblacional promedio para todos los
clientes de Olva Currier. La media muestral da al gerente una medida oportuna de la
calidad de servicio. Si empiezan a surgir bajas puntuaciones de satisfaccin al
cliente, se puede tomar acciones correctivas inmediatas.
Las encuestas mensuales anteriores de servicio mostraron que la
desviacin estndar de las puntuaciones de satisfaccin se estabiliz en un valor =
20. La encuesta ms reciente de satisfaccin fue para una muestra de n = 100, cuya
puntuacin de satisfaccin promedio muestral, es de x = 82 que proporciona una
estimacin puntual de la media poblacional.

SOLUCION
1.- ERROR MUESTRAL.- Siempre que se usa media de muestra para inferir un
estimador puntual de una media poblacional, la pregunta es: Qu tan buena es
la estimacin? x
?
Em = x - .

Valor absoluto

En la prctica no se puede determinar el valor del error muestral, porque


no se conoce exactamente la media de la poblacin (). Sin embargo, la
distribucin de muestreo de ( x ) se puede usar para hacer declaraciones de
probabilidad del error de muestreo.

i) S:
n = 100
= 20

x=

Desviacin estndar de la distribucin muestral

x . Promedio de

variabilidad de los datos con respecto a su media

Cmo

x=

x=

20
=2
100

estn

distribuidos

los

valores de x respecto a , esta


distribucin da informacin
proporciona la base para un
enunciado de probabilidad acerca
del error de muestreo.

ii) Si usamos la tabla de reas de la distribucin de probabilidad normal estndar,


vemos que 95% (coeficiente de confianza) de los valores de una variable
aleatoria con distribucin normal quedan dentro de una distancia igual a
1.96 desviacin estndar de la media.

Dist. Muestral de x

-3,92

95%

x=2

Se queremos los valores de x


con 95% empleamos la tabla de
Z de distribucin normal: 0.95
2 = 0.4750; se busca en el
interior de la tabla Z este valor y
relacionamos la fila y columna
obteniendo el valor 1.96.
Entonces 1.96 x 2 = 3.92

3.92

CONCLUSIN:
1.- Que 95% de las medias muestrales que se pueden obtener mediante un
tamao de muestra n = 100 estarn dentro de 3.92 de la media
poblacional.
2.- Hay una probabilidad de 0.95 de que la media de una muestra origine un
error muestral de 3,92 o menos.
3.- Este enunciado de probabilidad es una declaracin de precisin acerca
del error del muestreo que puede existir para Olva Currier si se usa la
media de una muestra aleatoria simple de n = 100 para estimar la media
poblacional. El valor 3,92, que proporciona un lmite superior del error
de muestreo, se conoce como margen de error.
S: N. C. = 98% = 0.98 2 = 0.49

98%

2.33 x 2 = 4.66

- 4.66

4.66

CASO: CON MUESTRAS GRANDES DONDE SE SUPONE QUE SE CONOCE

( )

Si:
n = 100
= 20
x = 82
i) Cmo se puede usar la declaracin de precisin para construir una estimacin del
valor del intervalo de confianza de una media poblacional.
ii) Una estimacin del intervalo de una media poblacional toma la forma siguiente:

x Margen de error
Con declaraciones de precisin de 0.95 de probabilidad el margen de error es 3.92,
entonces:

x M.e.

Dist. Muestral de x

-3,92

95%

x=2

3.92

82 3.92

Nivel de confianza de 95% da una estimacin del intervalo de la media


poblacional:
82 3.92 = 78.08
lmite inferior
82 + 3.92 = 85.92
lmite superior
78.08

85.92 es el intervalo de la media poblacional.

Suponiendo: n1, n2, n3

98%

3.92

3.92
Posibilidad aceptada

x
Posibilidad no aceptada

El procedimiento general para estimar el intervalo de una media


poblacional siempre que se tenga una muestra grande (n 30) y se supone que se
conoce la desviacin estndar poblacional es el siguiente:
i) (1-Ic )coeficiente de confianza =


x Z

2 n

ii)

Z valor de Z que origina un rea de en



2
2
la cola o extremo superior de la distribucin de
probabilidad normal estndar

Ejemplo:
Nivel de confianza = 95%
= (1 - 0.95) = 0,05

0.05

=
= 0.025*
2
2
1.96
ENTONCES:

* 0.5000 0.025 = 04750; buscar en la tabla z =

x Z
2

82 1.96
82 3.92

20
100

Por tanto:
i) El margen de error es 3.92
ii) El intervalo de confianza es 78.08 85.92
iii) Olva Currier, puede tener una confianza de 95% de que la
puntuacin de satisfaccin promedio de la poblacin est
entre 78.08 y 85.92
S nivel de confianza 90%:
82 1.645

20
100

82 3.29; 3.29 margen de error

78.71 85.29
( ) ESTIMADA MEDIANTE (S).- En la
realidad muchas veces no se conoce la desviacin estndar poblacional (
). En consecuencia, se usa la desviacin estndar de la muestra ( S ) para
estimar ( ). En el caso de muestras grandes (n 30), el teorema del lmite
central y el hecho de que la desviacin estndar de la muestra (S) d una
buena estimacin de ( ), cuando el tamao de la muestra se vuelve grande,
permite usar el procedimiento siguiente, para construir una estimacin del
intervalo de una media poblacional.

CASO: MUESTRAS GRANDES CON

x Z
2

S
n

S = Desviacin estndar de la muestra

Ejemplo: En una fbrica textil se hicieron observaciones en una seccin de 400


telares, en tiempos al azar durante tres periodos del da, durante 20 das
para determinar el nmero de telares trabajando.
365
364
369
374
366
347
371
340
365
359
353
359
366
367

362

352

371

365

361

360

362

364

350

360

374

364

357

365

367

366

355

361

359

362

364

349

359

362

366

356

370

369

362
348
358
354
369
367

353

361

362

366

356

358

366

373

368

366

364

360

Constryase un intervalo de confianza de 95% de la media poblacional


de nmero de telares trabajando.

21708

i)

x = ------------- = 361.8 362


60

ii)

S = 6.870

iii)

0.95 2 = 0.4750 (buscando en la tabla Z ) = 1.96

iv)

362 1.74 Entonces: 1.74 es el margen de error


362 1.74 = 360.26 360 lmite inferior
362 + 1.74 = 363.74 364 lmite superior

360 364
Por consiguiente, podemos tener un nivel de confianza de 95% de que los
telares trabajando estn entre 360 y 363.

3.2 ESTIMACION DE INTERVALO DE UN PROMEDIO POBLACIONAL:


CASO DE MUESTRA PEQUEA.
Cmo determinar una estimacin de intervalo de una media poblacional
para el caso de muestras pequea ( n 30 ). Cuando se tiene una muestra pequea,
la distribucin de muestreo de x depende de la distribucin de la poblacin. Los
procedimientos de estimacin de intervalos que se describen a continuacin se basan
en la suposicin de que la poblacin tenga una distribucin normal. Si esta
suposicin resulta adecuada, la metodologa de esta seccin se puede usar para
calcular una estimacin del intervalo de una media poblacional. Sin embargo, si esta
suposicin no es adecuada, se recomienda aumentar el tamao de muestra a n 30 a
fin de usar los procedimientos para muestras grandes de la seccin anterior.
En el caso de muestras pequeas, empezamos con la situacin donde se
supone que se conoce la desviacin estndar de la poblacin (). Despus
consideramos el caso donde la desviacin estndar de la poblacin () se estima
mediante la desviacin estndar de la muestra S.
a). Caso de muestras pequeas ( n < 30) donde se supone que se conoce el valor
de ().

x Z
2

Ejercicio igual que la anterior

b). Caso de muestras pequeas en que () se estima mediante S


Suponiendo que la poblacin tiene una distribucin normal. Si no existe
una base para suponer que se conoce la desviacin estndar de la poblacin se
utiliza la desviacin estndar de la muestra S, para estimar . En estas
condiciones, procedimiento de estimacin de intervalo se basa en una
distribucin de probabilidad conocida como distribucin t.
La distribucin t es una familia de distribuciones de probabilidad
similares, con una distribucin t se especifica que depende de un parmetro
conocido como grados de libertad. La distribucin t con un grado de libertad
es nica, as como la distribucin t con dos grados de libertad, con tres grados de
libertad, etc. a medida que aumenta la cantidad de grados de libertad, la
diferencia entre la distribucin t y la distribucin de probabilidad normal
estndar se hace muy pequea.

Distribucin normal estndar

Distribucin t con 20 grados de libertad

Distribucin t con 10 grados de libertad

Z, t

Observe que una distribucin t con ms grados de libertad tiene


menos variabilidad y se parece cada vez ms a la distribucin de probabilidad
normal estndar. Tambin observe que el promedio de la distribucin t es cero.
Usamos un subndice en t para indicar el rea en la cola superior de
la distribucin t. As como usamos Z , usaremos t0.025 (con nivel de confianza
2

95%) para indicar un rea de 0.025 en la cola superior de la distribucin t. En


general, usaremos la notacin t para representar un valor de t que define un
2

rea
de la cola superior de la distribucin t.
2


2
0

t
2

NOTA: Utilizar la tabla de la distribucin t para reas de cola superior.


b.1 Estimacin del intervalo de un promedio de poblacin: caso de muestras
pequeas (n < 30) con estimada mediante S.
Suponiendo, que la poblacin tiene una distribucin de probabilidad
normal:
x t
2

s
n

X =

X i
n

S=

X i x
n 1

= Desviacin estndar de la muestra (1- ) = Nivel de


confianza

= Valor de t que da un rea

en el extremo derecho de la

distribucin t

(n 1) = Grados de libertad que tiene que ver con el uso de S


como estimador de la poblacional

Los grados de libertad indican la cantidad de elementos de informacin


2
independientes que intervienen en el clculo de X i X . Esos n
elementos son los siguientes: X 1 X , X 2 X , X 3 X ... X n X . Para
cualquier conjunto de datos X i X = 0. As, slo (n 1) de los valores

de X I X son independientes: esto es, si conocemos n-1 de los valores, el


valor que resta se puede determinar con exactitud por la condicin de que la
suma de los X I X debe ser cero. As (n-1) es la cantidad de grados de
libertad asociada con X i X y, por consiguiente, el nmero de grados
2

de libertad para la distribucin t en la:

x t
2

s
n

Ejemplo: El Director de una escuela de adiestramiento para choferes XY,


desea contar con un programa asistido por computador. Se espera
que con el mtodo se reduzca el tiempo y precisin necesaria para
el adiestramiento. Para evaluarlo el director pide una estimacin
del tiempo promedio de adiestramiento necesario con el programa
asistido por computador. La informacin convencional con que
cuenta es la siguiente:

Aspirante

Das de adiestramiento

01
02
03
04
05
06
07
08
09
10

Aspirante Das de adiestramiento

52
44
55
44
45
59
50
54
62
46

11
12
13
14
15
16
17
18
19
20

54
58
60
62
63
45
46
63
54
59

SOLUCION
i) X =

52 44 55 ... 59 1,075

53.75 54 Estimacin Puntual del


20
20
tiempo promedio de
adiestramiento.

52 54 44 54 55 54 ... 59 54
20 1
das de desviacin estndar muestral

ii) S =

= 6.89 7

iv) Determinado una estimacin del intervalo del promedio poblacional con
95% de confianza (suponiendo que la poblacin de tiempos de
adiestramiento tiene una distribucin de probabilidad normal):
Distribucin t
n 1 20 1 = 19 grados de libertad
Entonces:
= 1 - 0.95 = 0.05 2 = 0.025 (buscar en la tabla t)

0.025
= 2.093
19

t
2

s
n

7
54 2.093

20

54

- 50.474

3.276

57.276

c). El papel de distribucin poblacional: cuando n > 30 y no se conoce la


distribucin poblacional:
Si se conoce:
()

entonces

x Z

(s)

entonces

s
n

x Z
2

3.3. DETERMINACIN DEL TAMAO DE LA MUESTRA


En caso de muestras grandes, donde se supone que se conoce el valor de
(), la estimacin de intervalo de la media poblacional est dada por:

Donde Z
= margen de error
n
n
2
2
Entonces, una vez seleccionada el nivel de confianza (1 - ), y
conociendo el valor de (), podemos determinar el tamao de (n) que se necesita
para cualquier margen de error:
x Z

E = Z

Z
n =

E
2


Z 2

n = 2 2
NOTA: Para usar la frmula anterior, el valor Ede E es el margen de error que el
usuario est dispuesto a aceptar y el valor de Z es consecuencia directa de
2

nivel de confianza que se usa para determinar la estimacin del intervalo.


Aunque se debe tomar en cuenta la preferencia del usuario, lo que se
escoge con ms frecuencia es el 95% de confianza, Z 0.025 = 1.96. Adems
se requiere un valor de la desviacin estndar de la poblacin (). En la
mayora de los casos se desconoce (). Sin embargo, podemos aplicar esa
ecuacin si contamos con el valor preliminar o valor de planeacin de ().
En la prctica se puede optar por uso de los siguientes procedimientos:
1.- Usar la desviacin estndar muestral de una muestra previa de las
mismas unidades, o de otras parecidas.

2.- Usar un estudio piloto para seleccionar una muestra preliminar de


unidades. La desviacin estndar muestral de ella se puede usar como el
valor de planeacin de ().
3.- Usar el juicio de una mejor estimacin del valor de (). Por ejemplo,
podramos comenzar estimando los valores mximos y mnimos de los
datos en la poblacin. La diferencia entre ellos proporciona una
estimacin del rango de los datos. Por ltimo, se sugiere tomar el rango
dividido entre cuatro como una aproximacin de la desviacin estndar
para contar con un valor de planeacin aceptable para ().
Ejemplo:

En un estudio previo un propietario de moto taxis en la ciudad de


Ayacucho, investig el beneficio de la renta de moto taxis y encontr que
el beneficio promedio de renta es S/. 35 por da. El propietario quisiera
otro estudio a fin de estimar el beneficio de la renta promedio para una
nueva flota. Para ello, el propietario propone que el beneficio promedio
poblacional de la renta diaria se debe estimar con un margen de error de
dos (2) y un nivel de confianza de 95% la desviacin estndar para el
beneficio de la renta diaria fue de 10 soles.
Datos:
Me = 2
N. C = 95%
= 1- 0.95 = 0.05 2 = 0.025 = 0.5000 0.0250 = 0.4750 (buscar en la
tabla) = Z 0.025 = 1.96
= 10
2


Z 2

n = 22
E

n =

1.962 102
22

= 96.04 96 elementos muestrales

3.4 ESTIMACION DEL INTERVALO DE UNA PROPORCION.- Una proporcin


muestral (s) es un estimador insesgado de una proporcin poblacional (P), y que para
muestras grandes, la distribucin muestral de P se puede aproximar con una
distribucin de probabilidad normal.

Distribucin muestral

P1 P
n

donde coeficiente de confianza = (1- )

(1-

) = coeficiente de confianza

De P

Z P
2

Z P
2

Estimacin del intervalo de una proporcin de la poblacin:


P1 P
debe conocerse P
P Z

en la cola extremo
2
superior de la distribucin de probabilidad normal estndar.

Z = Valor de Z que origina un rea de


2

Ejemplo: La Gerencia de ESSALUD Ayacucho realiz una encuesta de 1,000


usuarios de esta institucin para conocer cmo consideran el trato que
realizan en los consultorios de parte de los mdicos. En las encuestas se
encontr que 480 usuarios estuvieron satisfechos con el tipo de atencin
en los consultorios mdicos.
Datos:
n

= 480
P
= 480 1,000 = 0.48
N. C. = 95%

i)

= 1 - 0.95 = 0.05 2 = 0.025; 0.5000 0.025 = 0.475 (buscar en


la tabla Z), entonces = 1.96

ii)

P Z
2

P1 P

0.48 = 1.96

0.481 0.48
= 0.033097 3.10%
1,000

margen de error

El margen de error permisible:

- 0.449

0.48

45%

48%

0.511
51%

EJERCICIOS DE REPASO
1.- Se desea conocer el intervalo de confianza al 99%. Los datos provienen de una
distribucin normal con una varianza de 144. Se toma una muestra de 15 sujetos en
los que se obtienen una media de 84.3% Cul es el intervalo de confianza de ?

2.- Se extrajo una muestra aleatoria de 64 estudiantes que sufran gastritis y se determin
para cada uno, la duracin de la hospitalizacin. Se encontr que la duracin media
de hospitalizacin fue de 8.25 das. Si se sabe que la duracin estndar de la
poblacin es de 3 das. Hallar el intervalo de confianza al 90%, 95%, 99% para .
3.- Se condujo una encuesta con el fin de estudiar las prcticas sanitarias dentales de 300
estudiantes entrevistados, 123 dijeron que regularmente se sometieron a una revisin
dental 2 veces al ao. Con 95% de confianza halle el intervalo de confianza para la
proporcin en la poblacin de los alumnos que se sometieron a la revisin dental.
4.- 200 pacientes que sufran cierta enfermedad fueron divididos al azar en dos grupos
iguales. Del primer grupo, quienes recibieron el tratamiento estndar 78 se
recuperaron en un plazo de 3 das. De los otros 100 quienes fueron tratados por medio
de un nuevo mtodo, 90 se recuperaron en 3 das. Los mdicos desearon estimar la
diferencia verdadera entre las proporciones de quienes se recuperaron en 3 das.
Hallar el intervalo de confianza al 90% para P1 P2.
5.- Se ha tomado una muestra aleatoria de n = 18, el valor medio para la caracterstica en
un estudio es 50.15, con desviacin estndar 0.4. Obtener un intervalo de confianza
de 0.99 para .
6.- Se hacen 11 mediciones del dimetro de una esfera y d como media 4.05 y una
desviacin estndar de 0.4. Construir un intervalo del 90% para estimar la media
poblacional.
7.- En una encuesta se dice que el valor de planeacin para la proporcin poblacional P es
de 0.35. De qu tamao se debe tomar la muestra para obtener un intervalo de
confianza de 95% y con margen de error igual a 0.05?
8.- De qu tamao se debe tomar una muestra para tener 95% de confianza de que el
margen de error para la estimacin de una proporcin poblacional sea de 0.03?
Suponga que no dispone de datos histricos para establecer un valor de planeacin
para P.
9.- De qu tamao debe ser la muestra para poder tener 95% en que error muestral es de
0 o menor? Suponga que la desviacin estndar de la poblacin es de 25.

UNIDAD IV
INFERENCIA ESTADSTICA
4.1 ESTIMACION DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS
POBLACIONES: MUESTRAS INDEPENDIENTES.
Consideremos que kola Real en la Ciudad de Ayacucho tiene un conjunto de
la poblacin que consume ente producto (Lamemos P1) y en la Ciudad de Huancayo
de la misma manera (llamemos P2). En cuanto a la preferencia de sabor vara entre
estas dos ciudades, debido a muchos factores: edad, clima, educacin, ingreso, etc.

un investigador de mercado desea analizar la diferencia entre las edades de los


consumidores en cada ciudad, con los siguientes datos:

n1 = 35, 36, 37, 34, 36, 38, 32, 33, 35, 35, 37, 38.
n2 = 39, 32, 31, 33, 34, 29, 28, 32, 33, 35, 34, 33
a) Estimacin puntual

N1 = Ayacucho
=?

N2 = Huancayo
= ?

n1

n1 =

=?
X =?

X =?

i) Se selecciona n1, n1 4n forma aleatoria


ii)

n1

es independiente de n2.

iii) Las n1 y

n2 pueden ser de tamaos diferentes.


E. P. = D1 2 X 1 - X 2

35 36 ... 38
35.50
12

i) X 1 =

1.883

ii) X 2 =

39 32 ... 33
32.75
12

2.8324

iii) D 35.50 32.75 2.75 Aos. La edad promedio de los consumidores


1

de Ayacucho es mayor que de los de


Huancayo.
b) Distribuciones muestrales de X 1 - X 2 .- Estimacin intervlica de la diferencia
entre dos medias poblacionales.
b.1) Valor Esperado
b.2) desviacin Estndar.

V. E.

(X1X 2 )

1 2

1X2

12
n1

22

n2

n1 muestraaleatoriasimpledeP1
n2 muestraaleatoriasimpledeP2

12 desviaciones tan dardeP1


2 2 desviaciones tan dardeP2
c) Estimacin intervlica de 1 2 : caso muestra grande
c.1) Cuando (n1 30 yn2 30) y se conoce 1 y 2
X1 - X 2 Z X

1X2

Usar nivel de confianza a criterio del

investigador.
c.2 Cuando (n1 30 yn2 30) y se conoce 1 y 2 se estiman mediante S1 yS 2
X1 - X 2 Z S X

1X2

Usar nivel de confianza a criterios del

investigador
2

S X1 X 2

S1
S
2
n1
n2

Ejemplo 2:

n1 12
n2 12
S1 1.883
2

S 2 2.8324
2

i) Entonces: S X 1 X 2

(1.883) 2 (2.8324) 2

12
12

= 0.982

ii) S nivel de confianza 95%. Entonces, = 1. N. C. = 1- 0.95 = 0.05


a. Para Z Z 0.05 Z 0.025 0.5000 0.025 0475(buscarenlatabla ) 1.96
2

b. Para Z Z 0.95 0475(buscarenlatabla ) 1.96


2

iii) X - X

Z S X1 X 2
2

35.50 32.75 (1.96) (0.982)


2.75
1.9472

1 2

0.825284

4.67472

d) Estimacin de intervalo de 1 2 : caso Muestra {muestra pequea).- estimacin


del intervalo de la diferencia de las medias de dos poblaciones cuando los tamaos
de una o ambas muestras menores a 30, n 1 y / on2 30
d.1 Cuando:
1. Ambas poblaciones tienen distribuciones normales
2
2. Las varianzas de las poblaciones son iguales ( 1
V. E.

1X2

(X1X 2 )

12
n1

2 )

1 2

22
n2

2(

1 1
);
n1 n2

12 2 2 2

como

necesitamos estimaciones diferentes para 1 y 2


2

no

d.2 Estimador combinado de 2

(n1 1) S1 (n2 1) S2
n1 n2 2
2

S2

d.3 Estimador puntual de X 1 X 2 = 1 2


2

S X1 X 2

S2(

1 1
)
n1 n2

d.4 Estimacin del intervalo con 1 y 2 estimados mediante S1 y S2

X- X

t S X 1 X 2

Grado de libertad = n1 n2 2

Coeficiente de confianza = 1-

Ejemplo 1: Los siguientes datos corresponde a un estudio de muestreo sobre el nivel


de avance en metros al da, que realiz un residente de obras de 2

cuadrillas de obreros que trabajan en un proyecto de apertura de zanja


para una irrigacin, obtenindose los siguientes resultados:
n1 10.00, 9.90, 11.00, 10.50, 9.98, 9.20, 10.01, 10.50, 10.98, 9.99,
11.00, 10.95
n2 11.00, 10.00, 10.45, 10.55, 9.97, 9.99, 10.00, 10.68, 10.45, 11.00
Con estos datos el residente de obras desea determinar un intervalo de
confianza de 90% para la diferencia entre las medias de las muestras de
trabaja.
SOLUCION
i) n1 12
n2 10
X1=

10 9.90 ... 10.95


10.3342
12

S1 0.58
X2=

11 10 ... 11
10.41
10

S2 0.41
ii) Determinacin combinada de

(n 1) S1 (n2 1) S2
;
S 1
n1 n2 2
2

S2

(12 1)(0.58)2 (10 1)(0.41)2


12 10 2

0.261

iii) Estimacin de la desviacin estndar de X 1 X 2

S X1 X 2

S2(

1 1
) ;
n1 n2

1 1
S X 1 X 2 (0.261)( ) 0.22
12 10

iii) Determinando la distribucin t


a) Grado de libertad = n 1 n2 = 12 + 10 2 = 20
b) = 1 0.09 = 0.10
c)

t , 20;
2

t , 20
2

iv) Determinado el intervalo.

X1 - X 2

t S X 1 X 2
2

10.3342 - 10.41 (1.725) (0.22)


- 0.0758 0.795
- 0.4553 a 0.3037

RPTA: La diferencia entre las medias de avance de metrajes de las dos


cuadrillas es de 0.4553 a 0.3037 metros.

NOTA: Cuando la diferencia sea cero, se interpreta como una


indicacin de que no tenemos la evidencia suficiente para
afirmar que la media de las poblaciones es diferente.

Ejemplo 2: Examinemos los resultados que corresponden a dos muestra aleatorias


independientes tomadas de dos poblaciones.

n1 50

n2 35

X 13.6

S1 2.2

S 2 3.0

11.6

a) Cules es la estimacin puntual de la diferencia entre las dos medias


de poblacin?
b) Determine un intervalo de confianza de 90% la diferencia entre las
dos medias poblaciones.
c) Determine un intervalo de confianza de 95% de esa diferencia.

Ejemplo 3: Se cuenta con los datos de la tabla siguiente, que corresponden a dos
muestras aleatorias independientes tomadas de dos poblaciones.
Muestra 1
Muestra 2
10
12
9

7
7
9

8
8
6

7
4
9

a) Calcule las dos medias muestrales


b) Determine las dos desviaciones estndar de las muestras
c) Cul es la estimacin puntual para la diferencia entre las dos medias
de poblacin?
d) Cul es la estimacin combinada de la varianza poblacional?
e) Determine un intervalo de confianza de 95% para la diferencia entre
las dos medias de poblacin.
Ejemplo 4: Una constructora de viviendas Casa Bonita, a nivel nacional, suministra
los datos sobre el costo de los proyectos ms frecuentes de remodelacin

de vivienda. Algunos datos de las muestras de los costos, en miles de


soles, para dos clases de remodelacin son:
Cocina
1.80
2.64
1.97
2.30
1.97
1.69
2.18

Recmara Principal
2.29
2.48
2.69
1.78
2.46
2.10
2.36

a) Determine una estimacin puntual de la diferencia entre las medias


poblacionales de los costos de las dos clases de remodelacin.
b) Determine un intervalo de confianza de 90% para la diferencia entre
las dos medias poblacionales.

7.2 PRUEBAS DE HIPTESIS ACERCA DE LA DIFERENCIA ENTRE LAS


MEDIAS DE DOS POBLACIONES: MUESTRAS INDEPENDIENTES.
A) CUANDO n 1 30, n 2 30: Muestra grande
Ejemplo 1: Como parte de un estudio para evaluar las diferencias en los niveles
educativos entre dos programas de capacitacin, se aplic un examen comn.
Las calificaciones del examen son uno de los factores principales para evaluar
diferencias de la calidad entre los programas. Los resultados obtenidos son las
siguientes:
97
83
91
64
66
91
84
90
84
87
85
83
78
85
94
76
73
72
74
87
85
79
82
92
64
70
93
84
78
85
64
74
82
89
59
87
85
74
93
82
79
62
83
91
88
70
75
84
91
89
72
88
79
78
65
83
76
86
74
79
99
78
80
84
70
73
75
57
66
76

i)

n1

= 30
97 83 91 ... 73
82. 5
30
2 64

X =

8
ii)

n2

= 30
64 66 91 84 ... 76
78 5
40
2 100

X =

10
NOTA: es esta prueba nos interesa determinar si las medias de las dos poblaciones son
distintas.
a) Planteamiento de hiptesis: suponiendo que no hay diferencia entre 1 y 2

H 0 1 2 0

Si la evidencia de la muestra conduce al rechazo de esta hiptesis, la


conclusin sera de que las medias son distintas, lo cual indica que hay una
diferencia en la calidad de los programas, lo que amerita una investigacin
para encontrar las razones de esa diferencia.

H a 1 2 0

b) Prueba Estadstica

( X X ) ( 1 2 )

1 2

1 2
2

ZC

(82.5 78)(0)
82 102

30 40

NOTA: Si se desconoce los valores 1 y 2 podemos usar las desviaciones


estndar muestral S1 yS 2 para calcular el estadstico de prueba.
c) Toma de Decisin.
Valor ZT ?
Si 0.05

0.025 Z 0.025 , entonces, 0.5000 0.025 = 0.475


2

(tabla) = 1.96

R.R = 0.025

R.R. = 0.025

- 1.96

1.96

REGLA:
RECHACE

H 0 S: Z < - 1.96 Z > 1.96

RESPUESTA: Cmo Zc 2.09 Zt 1.96 rechazar H 0 , los


dos programas difieren en calidad.
d) Valor de P
S Z = 2.09 (buscar en la tabla) = 0.4817

V p = 0.5000 0.4817 = 0.0183 V p = 2 (0.0183) = 0.0366


e) Toma de Decisin:
REGLA:
RECHACE

H 0 S: P <

= 0.05
P < = Se rechaza H

P = 0.0366
B) CUANDO n 1

<

30, n 2

<

30: Muestra Pequea

Se emplea: t con n 1 +

n 2 - 2 grados de libertad, 1 2

Ejemplo: Los siguientes datos a un nuevo programa de computo que se ha


desarrollado para ayudar a los analista de sistemas a reducir el
tiempo requerido para disear, desarrollar e implementar un sistema
de informacin. Para evaluar las ventajas del nuevo sistema se
selecciona una muestra aleatoria de 24 analistas de sistema. A cada
analista se le proporciona especificaciones para un sistema hipottico
de informacin, y a 12 de ellos se les pide producir el sistema usando
la tecnologa actual. Alos otros 12 se les capacita primero en el uso
del nuevo paquete y, a continuacin, se les pide usarlo para producir
el sistema de informacin. Los 24 analistas terminan el estudio y
obtienen los resultados siguientes:
Tecnologa actual

Nueva Tecnologa

300
280

276
222

344
385
372
360
288
321
376
290
301
283

310
338
200
302
317
260
320
312
334
265

El investigador a cargo del proyecto de evaluacin del nuevo programa


espera demostrar que el paquete permite un menor tiempo promedio de
terminacin del proyecto.
a) Planteamiento de hiptesis: suponiendo que no hay diferencia entre 1 y 2

H 0 1 2 0
H a 1 2

Se busca evidencia para rechazar H 0


Hiptesis del investigador

b) Calculando el Estimador Combinado 2

i) n 1

= 12
300 280 ... 283
325 5
X =
12
S 2 1,600
S 40

iii) n 2 = 12
276 222 ... 265
288 5
X =
12

S 2 1,936
S 44
c) Calculando el estimador combinado 2 (Se sup one 1 2
2

(n1 1) S1 (n2 1) S2
n1 n2 2
2

S2

d) Prueba Estadstica (tc)

(12 1)(40)2 (12 1)(44)2


1,768
12 12 2

tc

( X 1 X 2 ) ( 1 2 )
1 1
S2( )
n1 2

tC

(325 288) (0)


2.16
1
1
1,768( )
12 12

e) Calculo de t tabla
S: 0.05

0.025 Z 0.025 , entonces, 0.5000 0.025 = 0.475


2

(tabla) = 1.96

Regin de Rechazo

1.96

REGLA:
RECHACE

H 0 S: Tc > 1.96

f) Toma de Decisin
Como: 0.05

0.025 Z 0.025 , entonces, 0.5000 0.025 =


2
2
0.475 (tabla) = 1.96

Por tanto: tc tt serechzalaH o


7.3 INFERENCIAS ACERCA DE LA DIFERENCIA ENTRE LAS MEDIAS DE DOS
POBLACIONES: MUESTRAS PAREADAS.
Ejemplo: Una empresa manufacturera tiene dos mtodos con los que sus obreros
pueden realizar una tarea de produccin. Para maximizar la produccin,
la empresa desea identificar el mtodo con la menor media del tiempo
de terminacin por unidad. Sea 1 la media del tiempo de terminacin
para el mtodo 1 y 2 la correspondiente para el mtodo 2.
La tabla siguiente engloba los datos acerca de los tiempos de
terminacin para seis (06) trabajadores tomados como muestra.
Trabajador

Tiempo terminacin
1 (minuto)

Tiempo trmino
2 (minuto)

1
2
3
4
5
6

6.0
5.0
7.0
6.2
6.0
6.4

5.4
5.2
6.5
5.9
6.0
5.8
SOLCUCION

a) Calculando diferencia de tiempos:


1

6.0
5.0
7.0
6.2
6.0
6.4

5.4
5.2
6.5
5.9
6.0
5.8

Diferencia de
tiempos d i
0.6
- 0.2
0.5
0.3
0.0
0.6

b) Planteamiento de hiptesis: suponiendo que no hay diferencia entre


1 y 2

H 0 : 1 0
H A : 1 2 0
En el diseo con muestras pareadas se prueban los dos mtodos de
produccin bajo condiciones similares ( es decir, con los mismos
obreros): por consiguiente, este diseo conduce con frecuencia, aun
menor muestral que el diseo con muestras independientes.
c) Calculando la media y la desviacin estndar
d =

Sd

d i
n

d =

0.6 (0.2) 0.5 0.3 0.0 0.6


0.30
6

(d1 d ) 2
(0.6 0.30)2 (0.2 0.30)2 ... (0.6 0.30)2
=
= 0.335
n 1
5
d) Prueba Estadstica
Considerando
nivel
de
1 N.C. 1 0.95 0.05 ,

confianza

Grados de libertad: n 1 = 6 1 = 5

95%.

Entonces,

t c t5 ,

tc

tc t50.025 2.571

d d
Sd
n

tc

0.30 0
2.194
0.335
6

e) Toma de Decisin
REGLA:
RECHACE

H 0 S: Tc < - 2.571 > 2.571

R. Rechazo

Regin de Rechazo

- 2.571

2.571

Como: (tc 2.194) (tt 2.571) no se rechaza H o : que los dos


tiempos de terminacin no son distintas.

e) Estimacin intervlica de la diferencia entre las dos medias


poblacionales.

d t (
2

Sd
)
n

0.30 2.571(

0.335
)
6

0.30 0.352
0.052 0.652

- 0.052

0.652

NOTA: S: n 30 usar Z

7.4 INFERENCIAS ACERA DE LA DIFERENCIA ENTRE LAS PROPORCIONES DE


DOS POBLACIONES

Ejemplo: La cooperativa Santa Mara Magdalena esta interesado en compararla


calidad de trabajo que se realizan en las dos agencias principales: Huanta y
Huancayo. Al seleccionar muestras aleatorias de evaluacin de crditos,
elaboradas en cada oficina, y verificar la exactitud de las estimaciones, la
empresa podra estimar la proporcin de evaluaciones con error preparados
en cada oficina.
Las muestras aleatorias simples e independientes de los clculos de
las evaluaciones de crdito en las agencias dieron los siguientes datos:
HUANTA
n 1 = 250
EE 35

HUANCAYO
n 2 = 300
EE 27

SOLUCION
A) CALCULANDO LA ESTIMACIN DE INTERVALO DE p1 p2
a) Calculando las proporciones
P1

35
0.14
250

P2

27
0.09
300

b) Estimacin puntual o valor esperado


. p1 p2 0.14 0.09 0.05 . La Agencia de Huanta tiene una tasa
de error de 0,05 5% mayor que de
Huancayo.
c) Desviacin estndar

P p

P1 (1 P1 ) P2 (1 P2 )

N1
N2

Cuando sec onocelaspr oporciones


poblaciona les

SP p

p1 (1 p1 ) p 2 (1 p 2 )

n1
n2

Cuando sec onoce p1 p 2

S P p

0.24(0.86) 0.09(0.91)

= 0.0275
250
300

d) Coeficiente de confianza
Cc = 1 - = 1 0.95 = 0.05

0.025

e) Intervalo de confianza

p1 p2 ( Z )( S p1 p2 )
2

Para : n1 (1 P1 ) yn2 (1 P 2 ) 5
on1 , n2 30
p1 p2 (t g .l ., )( S p1 p2 )
2

cuandon1 (1 p1 ) y (1 p2 5o
n1 , n2 30
i) Z Z 0.025 0.5000 0.025 0.4750(tabla ) 1.96
12

ii) p1 p 2 ( Z )(S p1 p z )
2

0.14 0.09 (1.96) (.0275)


0.05 0.0539
0.0039 p 0.1039 Es el intervalo de la diferencia
entre tasas de errores en las dos
agencias
B) PRUEBA DE HIPTESIS HACER DE p1 p2
Objetivo: Determinar si las proporciones de errores son distintas entre
las dos agencias.
a) Planteamiento de hiptesis: suponiendo que no hay diferencia entre
1 y 2

H 0 P1 P2 0
H a P1 P2 0

b) Prueba estadstica
Zt ?

1 0.95 0.05

0.025 0.5000 0.025 0.4750(tabla ) 1.96 Z t


2
Zc = ?
Zc

( p1 p 2 ) ( p1 p2 )

p p
1

SP p

p(1 p)(

Zc

( p1 p 2 ) ( p1 p2 )
S p1 p 2

1 1
)
n1 n2

CuandoP1 p2

n1 p1 n2 p 2
n1 n2

250(0.14) 300(0.09)
0.113 (1 p) 0.887
250 300

S P p 0.113(0.887)(

1
1

) 0.02
250 300

(0.14 0.09) (0)


1.845
0.0271
c) Toma de Decisin
Zc

REGLA:
RECHACE

H 0 S: Zc > Zt

Entonces, como (Zc = 1.845) < (Zt = 1.96) se acepta la H 0 : las


proporciones de los errores no son distintas entre las dos agencias.
d) Calculando valor de P
Zc = 1.845 1.85 (buscando en la tabla) = 0.4678
Vp = 0.5000 0.4678 = 0.0322

Vp = 2(0.0322) = 0.0644
REGLA:
RECHACE

H 0 S: Vp <

Entonces: (P = 0.0644) > ( = 0.05) se acepta la H 0 : que no hay


diferencia en las proporciones
de los errores de evaluacin
entre las agencias.

BIBLIOGRAFA

1.
2.
3.
4.
5.
6.

Alea, V.; Maqueda, I.; Muoz, C.; Viladomiu, N. (2001) Estadstica para las
ciencias sociales: cuestiones tipo test, editorial AC, Madrid.
Arnaldos Garca, F. et al. (2003) Estadstica descriptiva para economa y
administracin de empresas, editorial Thomson-Paraninfo, Madrid.
Canavos, G. C. (1995) Probabilidad y Estadstica: Aplicaciones y Mtodos, editorial
Mc Graw-Hill, Madrid.
Carey, P.; Berk, K. N. (2001) Anlisis de Datos con Microsoft Excel, editorial
Thomson Paraninfo, Madrid.
Casas Snchez, J. M. (2000) Estadstica I. Probabilidad y distribuciones, Centro de
Estudios Ramn Areces, Madrid.
Castillo Manrique, M. I.; Guijarro Garvi, M. (2005) Estadstica Descriptiva y clculo
de probabilidades, editorial Pearson Alhambra, Madrid.

7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.

De Groot, M. H. (1988) Probabilidad y Estadstica, editorial Addison-Wesley,


Mxico.
Esteban Garca, J. et al. (2006) Estadstica descriptiva y nociones de probabilidad,
editorial Thomson Paraninfo, Madrid.
Fernndez, H.; Guijarro, M.; Rojo, J.M.; Sanz, J.A. (1994) Clculo de
Probabilidades y Estadstica, editorial Ariel, Barcelona.
Garca Barbancho, A. (1981) Ejercicios de estadstica descriptiva para economistas,
editorial Ariel, Barcelona.
Garido Yserte, R.; de Lucio Fernndez, J.; Maas Alcn, E.; Peinado Gracia, M. L.
(2003) Anlisis del entorno econmico de la empresa, editorial Pirmide, Madrid.
Llorente Galera, F.; Marn Feria, S.; Torra Porras, S. (2000) Mtodos Probabilsticos
para la Empresa, editorial Centro de Estudios Ramn Areces, Madrid.
Lpez Ortega, J. (2003) Problemas y ejercicios de probabilidad, editorial Tbar, Madrid.
Martn-Pliego Lpez, F. J. (1992) Curso prctico de estadstica econmica, editorial
AC, Madrid.
Martn-Pliego Lpez, F. J. (2004) Introduccin a la Estadstica Econmica y
Empresarial, editorial Thomson-Paraninfo, Madrid.
Martn-Pliego Lpez, F. J.; Montero Lorenzo, J. M., Ruiz-Maya Prez, L. (2006)
Problemas de Probabilidad, 2 edicin, editorial Thomson-Paraninfo, Madrid.
Martn-Pliego Lpez, F. J.; Ruiz-Maya Prez, L. (2006) Fundamentos de
Probabilidad, 2 edicin, editorial Thomson-Paraninfo, Madrid.
Martn-Pliego, F. Javier y Ruiz-Maya, Luis: Fundamentos de Probabilidad. Editorial
Martn-Pliego, F. Javier, Ruiz-Maya, Luis y Montero, J. Mara: Problemas de
Probabilidad. Editorial Thomson, 2006.
Martn-Pliego, F. Javier: Introduccin a la estadstica econmica y empresarial.
Teora y prctica. Editorial Thomson, 2004.
Montero Lorenzo, J. M. (2007) Estadstica Descriptiva, editorial ThomsonParaninfo, Madrid.
Montero Lorenzo, J.M. (2007) Problemas resueltos de Estadstica Descriptiva para
Ciencias Sociales, 6 edicin, editorial Paraninfo CENGAGE Learning
Mures Quintana, M. J. (2003) Problemas de estadstica descriptiva aplicada a las
ciencias sociales, editorial Pearson Alambra, Madrid.
Newbold, P. (1997) Estadstica para los negocios y la Economa, 4 Edicin,
editorial Prentice-Hall, Madrid.
Pea, D. (1991) Estadstica. Modelo y Mtodos, editorial Alianza Universidad,
Madrid. Rohatgi,
Pea, D. (2004) Fundamentos de Estadstica, editorial Alianza Universidad, Madrid.
Prez Lpez, C. (2003) Estadstica. Problemas resueltos y aplicaciones, editorial
Pearson - Prentice-Hall, Madrid.
Piole Villar, R.; Moreno Sanz, A.; Caballero Carbonell, A. (2002) Anlisis de datos y
probabilidad: Excel como instrumento de clculo, editorial Civitas, Madrid.
Ruiz-Maya Prez, L. (1989) Problemas de estadstica, editorial AC, Madrid.
Sanz Lara, J. A.; Bedate Centeno, A.; Gonzlez Fernndez, J. (1996) Problemas de
estadstica descriptiva empresarial, editorial Ariel, Barcelona.
Spiegel, M. (2002) Estadstica, 3 edicin, coleccin Schaum, editorial McGraw-Hill,
Madrid.
Thomson, 2006.
Torra Porras, S. (2000) Principios de estadstica descriptiva aplicada a la empresa,
Centro de Estudios Ramn Areces, Madrid.
Ua Jurez, I. (2003) Lecciones de Estadstica Descriptiva, editorial Thomson
Paraninfo, Madrid.

34. Ua Jurez, I.; Tomeo Perucho, V.; San Martn Moreno, J. (2003) Lecciones de
clculo de probabilidades, editorial Thomson-Paraninfo, Madrid.
35. Uriel, E.; Muiz, M. (1993) Estadstica econmica y empresarial. Teora y problemas,
editorial AC, Madrid.

Potrebbero piacerti anche