Sei sulla pagina 1di 58

Escuela de Postgrado

Universidad Nacional de Trujillo

USO DE EXCEL EN LA EDUCACIN


MsC Luis Alberto Rubio Jacobo
INDICE
PARTE 1. CONCEPTOS GENERALES
1.
2.
3.
4.
5.
6.
7.
8.
9.
1 0.
1 1.
1 2.
1 3.

Definicin de Estadstica
Clasificacin de la Estadstica
Universo
Poblacin
Muestra
Muestreo
Unidad de estudio
Observacin
Variable
Parmetro
Estimador
Tcnicas de recoleccin de datos
Instrumentos de recoleccin de datos

PARTE 2. PRESENTACIN DE LA INFORMACIN


1.
2.
3.
4.
5.
6.
7.
8.
9.
1 0.
1 1.

Cuadro de distribucin de frecuencias (CDF)


Partes de un CDF
Elementos para construir un CDF
Propiedades de un CDF
Construccin de CDF
Excel en la construccin de CDF
Grfico estadstico
Partes de un grafico estadstico
Criterios para construir grficos
Tipos de grficos estadsticos
Construccin de grficos estadsticos con MegaStat-EXCEL

PARTE 3. MEDIDAS ESTADSTICAS UNIVARIANTES


1.
2.
3.
4.
5.
6.
7.

Medidas de tendencia central


Medidas de localizacin
Medidas de variabilidad
Medidas de Forma
Formulas para calcular las medidas de tendencia central
Formulas para calcular las medidas de dispersin o variacin
Medidas estadsticas con MegaStat-EXCEL

PARTE 4. ANALISIS DE CORRELACION Y REGRESIN


1.
2.

Anlisis de correlacin
Anlisis de regresin

Curso: Uso de Excel en la Educacin

Pgina - 1 -

Escuela de Postgrado
Universidad Nacional de Trujillo

3.

Anlisis de regresin con MegaStat-EXCEL

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD


1.
2.
3.
4.

La distribucin Binomial
La distribucin Poisson
La distribucin normal
Aplicacin con MegaStat-EXCEL

PARTE 6: ESTIMACION ESTADISTICA


1.
2.
3.

Estimacin puntual
Estimacin intervlica
Aplicacin utilizando MegaStat-EXCEL

PARTE 7: PRUEBA DE HIPOTESIS


1.
2.
3.
4.
5.
6.
7.

Definiciones preliminares
Clases de Hiptesis
Errores que se cometen en una prueba de hiptesis
Tipos de pruebas de hiptesis
Etapas de una prueba de hiptesis
Formulas de algunos estadsticos de prueba
Prueba de Hiptesis con MegaStat-EXCEL

Curso: Uso de Excel en la Educacin

Pgina - 2 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 1: CONCEPTOS GENERALES


1.

DEFINICIN DE ESTADSTICA:
La Estadstica es una ciencia que nos ofrece un conjunto de mtodos y tcnicas
para recopilar, organizar, presentar, analizar e interpretar un conjunto de datos
respecto a variables en estudio de una poblacin, con el fin de obtener conclusiones
y tomar decisiones sobre determinados hechos o fenmenos en estudio.
La estadstica es una rama de la matemtica y es parte del mtodo cientfico. En la
actualidad, para hacer investigacin cientfica se necesita conocer de estadstica.

2.

CLASIFICACION DE LA ESTADSTICA
La Estadstica se clasifica de la siguiente manera:
2.1. Estadstica Descriptiva
Es aquella rea de la Estadstica que describe y analiza una poblacin, sin
pretender sacar conclusiones de tipo general. Es decir, las conclusiones
obtenidas con validas solo para dicha poblacin.
2.2. Estadstica Inferencial
Es aquella rea de la Estadstica, cuyo propsito es inferir o inducir leyes de
comportamiento de una poblacin, a partir del estudio de una muestra. Es
decir las conclusiones obtenidas a partir de una muestra, son validas para
toda la poblacin.

3.

UNIVERSO:
Es el conjunto de individuos, objetos o entes que tienen caractersticas comunes,
definidas en forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de
pacientes, conjunto de clientes, conjunto de proveedores, conjunto de viviendas,
conjunto de establecimientos, conjunto de documentos, etc.; de una determinada
regin o zona en un tiempo determinado.

4.

POBLACIN:
Es un conjunto grande y completo de individuos, elementos o unidades que
presentan como mnimo una caracterstica en comn y observable. Para definir una
poblacin esta debe contener los siguientes elementos: contenido, espacio y
tiempo. Al nmero de elementos de una poblacin de denota por N. Una
poblacin puede clasificarse de la siguiente manera:
A.

Segn su extensin:
Poblacin Finita:
Es aquella que tiene un determinado nmero de elementos.
Poblacin Infinita:
Es aquella cuyos elementos no se pueden contar.

Curso: Uso de Excel en la Educacin

Pgina - 3 -

Escuela de Postgrado
Universidad Nacional de Trujillo

B.

Segn su mbito o naturaleza:


Poblacin Objeto:
Esta dada por los elementos que forman la poblacin.
Poblacin Objetivo: esta dada por la informacin que da la poblacin objeto

Nota: De un universo se pueden desprender muchas poblaciones,


operativamente se pueden hablar indistintamente como poblacin o universo.

5.

pero

MUESTRA
Es una parte o un subconjunto de la poblacin en estudio. Tambin se puede decir
que es una coleccin de unidades de muestreo seleccionados de un marco muestral
o de varios marcos muestrales. Al nmero de elementos de la muestra se denota
por n. Una muestra tiene las siguientes caractersticas:
a. Es representativa.
b. Es adecuada.
Para la determinacin del tamao de muestra se utilizan tcnicas de muestreo
donde dependiendo de esta, se utiliza correctamente las formulas adecuadas.

6.

MUESTREO
Es una tcnica estadstica por la cual se realizan inferencias o generalizaciones para
una poblacin examinando solo una muestra de ella. Es una tcnica empleada para
seleccionar elementos de una poblacin.
Su propsito es proporcionar diferente tipo de informacin estadstica de naturaleza
cuantitativa o cualitativa. Por su gran importancia los investigadores lo utilizan en
los diferentes campos de saber y tambin lo usamos en la vida diaria.

7.

UNIDAD DE ESTUDIO:
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a
dar la informacin. Es el individuo u objeto del cual se toman las mediciones u
observaciones.
Ejemplos:
Un docente, un auxiliar de educacin, un votante, una factura, una empresa, una
botella de cerveza, una universidad, una vaca, una gota de sangre, etc.

8.

OBSERVACIONES:
Estadsticamente son los datos que se recolectan para un estudio. Una observacin
o dato es cuando una variable en si toma un valor especifico.

9.

VARIABLE:
Una variable es una caracterstica de estudio de una poblacin. Una variable es lo
que se quiere evaluar en una investigacin. Las caractersticas toma diferentes
valores que varan de individuo a individuo o de objeto a objeto. Aquellas
caractersticas que permanecen inalterables en las unidades de estudio reciben el
nombre de constantes.

Curso: Uso de Excel en la Educacin

Pgina - 4 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Generalmente, las variables se designan con las ltimas letras maysculas del
abecedario: X, Y, Z; y los valores de las variables se designan con letras
minsculas: xi , yi , etc.
Las variables se clasifican de la siguiente manera:
Por su relacin: Variable dependiente - variable independiente.
Por su escala de medicin: Nominal Ordinal Intervalo Razn.
Por su naturaleza: Cuantitativas - Cualitativas.
Ejemplos:
Unidad de estudio

Variable

Estudiante

Peso, talla, edad, ci, nmero de hermanos, raza, color


de ojos, tipo de sangre, etc.

Empresa

Ganancia,
costos,
produccin,
nmero
trabajadores, numero de computadoras, etc.

PYME

Nmero de trabajadores, aos de funcionamiento,


ganancias, etc.

de

Variable

Cualidad
o
Atributo

Cualitativa

Nominal

No orden
10.

Cantidad
o
Nmero

Cuantitativa

Ordinal

Discreta

Continua

Orden

Conteo

Medicin

PARAMETRO:
Es un valor, una cantidad, un indicador que se obtiene con informacin de la
poblacin. Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporcin poblacional, etc.

11.

ESTIMADOR:
Es un valor, una cantidad, un indicador que se obtiene con informacin de la
muestra. Dentro de estos tenemos:

Curso: Uso de Excel en la Educacin

Pgina - 5 -

Escuela de Postgrado
Universidad Nacional de Trujillo

12.

a.

El promedio muestral.

b.

La varianza muestral.

c.

La proporcin muestral, etc.

TCNICAS DE RECOLECCIN DE DATOS:


Las tcnicas de recoleccin de datos permiten la obtencin sistemtica de
informacin acerca de los objetos de estudio (personas, objetos y fenmenos) y de
su entorno.
Como ya se mencion, la recoleccin de datos tiene que ser sistemtica, ya que, si
los datos se recolectan al azar ser difcil responder las preguntas de investigacin
de una manera concluyente.
Las tcnicas de recoleccin de datos son
1.

Utilizacin de la informacin disponible

2.

Observacin

3.

Entrevista( cara a cara)

4.

Cuestionarios auto administrados

5.

Discusin con grupos focales

6.

Otras

OBSERVACIN:
La observacin es una tcnica que implica seleccionar ver y registrar
sistemticamente, la conducta y caractersticas de seres vivos, objetos o
fenmenos. La observacin de la conducta humana es una tcnica de recoleccin de
datos muy utilizada que puede llevarse a cabo de diferentes formas:
a.

Observacin participativa: El observador participa en la situacin que observa

b.

Observacin no participativa: El observador no participa en la situacin que


observa

Las observaciones pueden servir para diferentes propsitos. Pueden dar


informacin adicional y ms confiable de la conducta de las u.e. que las entrevistas
o los cuestionarios. Los cuestionarios pueden ser incompletos ya que se pueden
olvidar algunas preguntas o porque los entrevistados olvidan o no desean contestar
algunas cosas. Con la observacin se puede, entonces, verificar la informacin
recolectada (especialmente sobre temas como alcoholismo, drogadiccin, sida,)
pero tambin puede ser una fuente primaria de informacin (observacin
sistemtica de los juegos de los nios).
La observacin de la conducta humana puede formar parte de algn estudio, pero
como consume tiempo se usa con mayor frecuencia en estudios de pequea escala.
ENTREVISTA:

Curso: Uso de Excel en la Educacin

Pgina - 6 -

Escuela de Postgrado
Universidad Nacional de Trujillo

La entrevista es una tcnica de recoleccin de datos que involucra el


cuestionamiento oral de los entrevistados ya sea individualmente o en grupo. Las
respuestas a las preguntas durante la entrevista pueden ser registradas por escrito
o grabadas en una cinta. La entrevista puede conducirse con diferentes grados de
flexibilidad.
Las entrevistas utilizan una cdula para asegurar que se discuten todos los puntos,
pero dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador
puede hacer preguntas adicionales para obtener tanta informacin adicional como
sea posible, Las preguntas son abiertas y no hay restricciones para las respuestas.
Este mtodo poco estructurado de hacer las preguntas puede ser til para
entrevistas individuales o grupales con informantes claves.
Un mtodo de entrevista flexible es til si el investigador sabe poco del problema o
de la situacin que esta investigando. Se aplica en estudios exploratorios y en los
estudios de caso.
ENCUESTAS:
Hoy en da la palabra "encuesta" se usa ms frecuentemente para describir un
mtodo de obtener informacin de una muestra de individuos. Esta "muestra" es
usualmente slo una fraccin de la poblacin bajo estudio. Una "encuesta" recoge
informacin de una "muestra." Una "muestra" es usualmente slo una porcin de la
poblacin bajo estudio.
Las encuestas pueden ser clasificadas en muchas maneras. Una dimensin es por
tamao y tipo de muestra. Las encuestas pueden ser usadas para estudiar
poblaciones humanas o no humanas (por ejemplo, objetos animados o inanimados,
animales, terrenos, viviendas). Mientras que muchos de los principios son los
mismos para todas las encuestas, el foco aqu ser en mtodos para hacer
encuestas a individuos. Las encuestas pueden ser clasificadas por su mtodo de
recoleccin de datos. Las encuestas por correo, telefnicas y entrevistas en persona
son las ms comunes. En los mtodos ms nuevos de recoger datos, la informacin
se entra directamente a la computadora ya sea por un entrevistador adiestrado o
an por la misma persona entrevistada. Un ejemplo bien conocido es la medicin
de audiencias de televisin usando aparatos conectados a una muestra de
televisores que graban automticamente los canales que se observan
OTRAS TCNICAS DE RECOLECCION DE DATOS
a.

Tcnica de grupo nominal

b.

Tcnica delphi

c.

Historias de vida

d.

Escalas

e.

Ensayos

f.

Estudios de casos

g.

Mapeo

h.

Tcnicas rpidas de evaluacin de sondeo

i.

Encuestas participativas.

Curso: Uso de Excel en la Educacin

Pgina - 7 -

Escuela de Postgrado
Universidad Nacional de Trujillo

13.

INSTRUMENTOS DE RECOLECCIN DE DATOS:


Si tenemos presente el tema de investigacin por el que nos estarnos guiando se
percibir que, una vez obtenidos los indicadores de los elementos tericos y
definido el diseo de la investigacin, se har necesario estructurar las tcnicas d
recoleccin de datos correspondientes, para as poder construir los instrumentos
que nos permitan obtener tales datos de la realidad.
Un instrumento de recoleccin de datos es, en principio, cualquier recurso de que
pueda valerse el investigador para acercarse a los fenmenos y extraer de ellos
informacin. Ya adelantbamos que dentro de cada instrumento concreto pueden
distinguirse dos aspectos diferentes: una forma y un contenido.
La forma del instrumento se refiere al tipo de aproximacin que establecemos con
lo emprico, a las tcnicas que utilizamos para esta tarea; una exposicin ms
detallada de las principales es la que se ofrece al lector en este mismo captulo. En
cuanto al contenido ste queda expresado en la especificacin de los datos
concretos que necesitamos conseguir; se realiza, por lo tanto, en una serie de
tems que no son otra cosa que los indicadores bajo la forma de preguntas, de
elementos a observar, etc.
De este modo, el instrumento sintetiza en s toda la labor previa de investigacin:
resume los aportes del marco terico al seleccionar datos que corresponden a los
indicadores y, por lo tanto, a las variables o conceptos utilizados; pero tambin
expresa todo lo que tiene de especficamente emprico nuestro objeto de estudio,
pues sintetiza a travs de las tcnicas de recoleccin que emplea, el diseo
concreto escogido para el trabajo.

PRCTICA N 01

Docente: Luis Alberto Rubio Jcobo


Instruccin: En los siguientes casos identificar la unidad de estudio, tipo de variable, la
poblacin y la muestra en los siguientes casos que se presentan.
CASO N 01:

TESIS: Aplicacin del Programa Informtico MATHEMATICA


en el Rendimiento Acadmico en la asignatura de Matemtica
I, en los estudiantes del primer ciclo de la especialidad de
Matemtica de la Carrera Profesional
de Educacin
Secundaria de la Universidad Nacional de Trujillo
Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra

Curso: Uso de Excel en la Educacin

Pgina - 8 -

Escuela de Postgrado
Universidad Nacional de Trujillo

CASO N 02
TESIS: Propuesta

metodolgica basada en Infoescuela en el


desarrollo de habilidades, destrezas y actitudes para el diseo
de programas
computacionales en los alumnos
de
Computacin Aplicada a la Educacin Primaria de la U.N.T.

Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra
CASO N 03

TESIS: PROPUESTA METODOLGICA PROTESIPSI Y EL


DESARROLLO DE HABILIDADES Y ACTITUDES PARA LA
PRODUCCIN DE CUENTOS, FBULAS Y LEYENDAS EN
LOS ALUMNOS DEL 6 GRADO DE LA I. E. 80461 DEL
DISTRITO DE TAURIJA PATAZ.

Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra
CASO N 04

TESIS: Aplicacin del Programa Esquematizando


problemas y su influencia
en
el desarrollo de
capacidades de las alumnas del 5to. Grado de Educacin
Primaria del Colegio Estatal N 81007 Modelo de
Trujillo, en el rea lgico matemtica. Ao 2004

Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra
CASO N 05

TESIS: La implementacin de un Sistema de Gestin Acadmica mejora la


Gestin de los Colegios Estatales de la Ciudad de Trujillo.

Curso: Uso de Excel en la Educacin

Pgina - 9 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra
CASO N 06
TESIS: PROGRAMA DE DESARROLLO DE INTELIGENCIA LINGSTICA Y SU EFECTO
EN LA COMPRENSIN LECTORA, EN LOS ALUMNOS DEL 5 GRADO DE PRIMARIA DE LA
INSTITUCIN EDUCATIVA REPBLICA ARGENTINATRUJILLO.2005.

Unidad de estudio
Variable de estudio

Tipo:

Poblacin
Muestra

Un gran profesional es aquel que no encuentra obstculos sino retos

Curso: Uso de Excel en la Educacin

Pgina - 10 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 2: PRESENTACIN DE LA INFORMACIN


En la Estadstica se trabaja generalmente con una gran cantidad de datos los cuales por
facilidad de anlisis y clculos se organizan en Cuadros de Distribucin de Frecuencias
(CDF) y Grficos Estadsticos (GE).
1.

CUADRO DE DISTRIBUCIN DE FRECUENCIAS (CDF):


Un cuadro de distribucin de frecuencias, es una tabla resumen rectangular de un
conjunto de datos que muestra el comportamiento o distribucin de la variable en
estudio en forma rpida y resumida.
An cuando un cuadro de frecuencias se construye a libre criterio de quien lo
ejecuta, generalmente es comn seguir algunos pasos que de alguna forma
homogenizan criterios y ayudan a los fines didcticos.
Para realizar este anlisis se tienen que tener en cuenta el tipo de variable que se
esta evaluando.

2.

PARTES DE UN CUADRO DE DISTRIBUCION DE FRECUENCIAS:


Las partes de un CDF son las siguientes:

3.

a.

Nmero del cuadro de frecuencias en forma correlativa.

b.

Ttulo: Especificar la variable y la poblacin en estudio

c.

Encabezado o conceptos.

d.

Cuerpo o contenido del cuadro de frecuencias

e.

Nota de pie (no siempre es necesaria)

f.

Fuente

g.

Elaboracin

ELEMENTOS PARA CONSTRUIR UN CDF:


Para construir un cuadro de frecuencias se utilizan los siguientes elementos:
A.

Valores de la variable Xi:


Los valores de la variable o datos se representan por Xi. Ejm: Si se tienen 50
datos sus valores correspondientes no agrupados se representan como X 1, X2,
X3, ..., X50 .

B.

Intervalos de clase:
Los intervalos son subconjuntos de la recta real Ron que estn definidos por
un lmite menor o inferior Li y un lmite mayor o superior Ls.

C.

Frecuencia:
1.

Frecuencia absoluta simple:


Se denotan por fi. Est constituida por el nmero de veces que se repite
un valor. En el caso de intervalos es el nmero de observaciones
comprendidas en dicho intervalo. Estas frecuencias siempre son enteros
positivos y adems la suma de todos ellos es el tamao de la muestra
n.

Curso: Uso de Excel en la Educacin

Pgina - 11 -

Escuela de Postgrado
Universidad Nacional de Trujillo

2.

Frecuencia relativa:
Se denotan por hi. Indica la relacin o proporcin existente entre la
frecuencia absoluta simple y el nmero total de datos. Estas frecuencias
son numeros fraccionarios positivos entre o y 1. Para fines
interpretativos estas frecuencias se expresan en % (hi%) . As:

hi
3.

fi
n

hi(%)

fi
x100
n

Frecuencia absoluta acumulada:


Se denotan por Fi. Resulta de la suma de las frecuencias cuyas marcas
de clase son iguales o menores a la marca de clase del intervalo dado o
considerado, es decir:
F1 = f 1
F2 = f1 + f2
F3 = f1 + f2 + f3
.............................................

Fj = f1 + f2 + f3 + ....... + fi

4.

Frecuencia relativa acumulada:


Se denotan Hi. Resulta de la suma de las frecuencias relativas simples
hasta la frecuencia del intervalo considerado. As:
H4 =

h1 + h2 + h3 + h4

H6 =

h1 + h2 + ....+ h6

Para fines interpretativos estas frecuencias se expresan en % (Hi%)


D.

Marca de clase:
Se denota por Yi. Es el promedio de los valores correspondientes a los
lmites inferior y superior de cada uno de los intervalos determinados.

4.

5.

PROPIEDADES DE UN CDF:
A.

Las fi y Fi son siempre nmeros enteros positivos. Es decir: fi , Fi 0

B.

Las hi y Hi son siempre nmeros fraccionarios positivos comprendidos entre 0


y 1, es decir 0 hi , Hi 1

C.

F1 siempre es igual f1 y H1 siempre es igual a h1.

D.

La suma de todas las fi es igual a n y la suma de las hi es igual a 1.

E.

Fm siempre es igual a n y Hm siempre es igual a 1.

CONSTRUCCIN DE CUADROS DE FRECUENCIAS:

Curso: Uso de Excel en la Educacin

Pgina - 12 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Para la construccin de los CDF hay que tener en cuenta el tipo de variable que se
esta analizando, es decir, si es cuantitativa continua, cuantitativa discreta o
variable cualitativa.
A.

CDF PARA UNA VARIABLE CUANTITATIVA CONTINUA:


Para la construccin de este cuadro hay que realizar los siguientes pasos:
PASO 1. Determinar el Rango del conjunto de datos.
R = Valor mximo - Valor mnimo
PASO 2. Determinar el nmero de intervalos m.
m =

1 + 3.322 log ( n )

Este valor siempre es un nmero entero (Redondeo)


PASO 3. Determinar la amplitud A intervlica (de cada intervalo).
A = R/m
Este valor esta en funcin de la estructura de la base de datos (tomar el
inmediato superior)
PASO 4. Determinar el nuevo rango R2 (Solamente si se tomo un
inmediato superior)
R2 = A * m
A: es la amplitud teniendo en cuenta el inmediato superior.
PASO 5. Determinar los intervalos y finalmente construir el cuadro.

B.

CDF PARA UNA VARIABLE CUANTITATIVA DISCRETA:


Para la construccin de un CDF para una variable cuantitativa discreta
(valores discretos) ya no se utiliza los pasos anteriores solamente colocar en
los intervalos a los diferentes valores discretos.

C.

CDF PARA UNA VARIABLE CUALITATIVA:


Para la construccin de un CDF para una variable cualitativa se sigue los
mismos pasos que para una variable cuantitativa discreta, es decir, solamente
colocar en los en los intervalos a las diferentes categoras de la variable
cualitativa.

6.

CONSTRUCCION DE CDF CON EXCEL:


Si bien es cierto que el EXCEL no es un programa exclusivamente diseado para
anlisis de datos, es muy utilizado dentro del anlisis de estos cuando se realiza
una investigacin cientfica. Una de las ventajas y razones de su uso, est en su
fcil acceso, pues en todas las computadoras est instalado y as se podr explorar
el funcionamiento de las herramientas que se presentan en este programa.

Curso: Uso de Excel en la Educacin

Pgina - 13 -

Escuela de Postgrado
Universidad Nacional de Trujillo

A.

CONSTRUCCION DE CUADROS DE FRECUENCIA UTILIZANDO TABLAS


DINAMICAS:
Para construir cuadros de distribucin de frecuencias a travs de Excel se
utiliza la herramienta TABLAS DINAMICAS ver el uso de este programa
analizaremos la siguiente base de datos respecto a 50 casos y 10 variables de
estudio. (Archivo BASE 01.exe).
Teniendo en cuenta esta base de datos realizar los siguientes pasos:
Hacemos clic en Insertar /tabla dinmica .. aparece la siguiente pantalla:

Luego aparecen las siguientes ventanas de trabajo.activamos (a) lista de


base de datos de Excel y (b) Tabla Dinmica. Luego siguiente
seleccionamos el rango respectivo, luego
siguiente..luego
seleccionamos
la
opcin
diseo.
En la opcin diseo seleccionamos la variable
que vamos a analizar y con el cursor activamos
dicha variable y lo arrastramos hasta la opcin
FILA y luego la misma variable la arrastramos hasta la opcin DATOS.
Finalmente
aceptamos
y
obtenemos
los
resultados.

En funcin a lo que se quiera obtener como


resultados de la variable analizada, se
selecciona
OPCIONES
DE
TABLA
DINMICA para obtener ya sea totales, promedio o frecuencia de dicha
variable. Esta ventana de trabajo es la siguiente:

B.

CONSTRUCCION
MEGASTAT:

DE

CUADROS

DE

FRECUENCIA

UTILIZANDO

Para construir cuadros de distribucin de frecuencias con Megaestat se utiliza


la opcin Complementos/MegaStat Distribucin de Frecuencias. Luego se
debe seleccionar para variables cuantitativas o variables cualitativas.

Curso: Uso de Excel en la Educacin

Pgina - 14 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Si se selecciona variable cuantitativa se aprecia la siguiente ventana, donde


debemos ingresar el rango de los datos de la variable, luego se hace la
seleccin de datos respectiva y activamos algn tipo de grafico. Se puede
realizar algunas modificaciones al CDF dependiendo del investigador como
tamao de intervalos, nmero de intervalos, lmite superior, lmite inferior,
etc.

7.

GRAFICO ESTADSTICO
Un grfico estadstico es una representacin pictrica, cuyo objetivo es
expresar el comportamiento de una variable en estudio.
Los grficos estadsticos son representaciones de informacin real que existe
en nuestro mundo, es una expresin artstica de datos reales y observados.
Un grfico sirve tambin para comparar visualmente el comportamiento de
dos o ms variables similares o relacionadas.

8.

PARTES DE UN GRAFICO ESTADISTICO:


Numeracin.
Titulo: Aqu se seala la poblacin en estudio y la variable de inters.
Diagrama: esta dado por
comportamiento de los datos.

el

propio

dibujo

el

cual

representa

el

Escalas y/o leyendas: Son indicadores donde se precisa la correspondencia


entre los elementos del grfico y la naturaleza de las medidas representadas.
Fuente: Aqu se seala el CDF que permiti obtener el respectivo grfico.
9.

CRITERIOS PARA CONSTRUIR GRAFICOS:

Curso: Uso de Excel en la Educacin

Pgina - 21 -

Escuela de Postgrado
Universidad Nacional de Trujillo

No existe una regla especfica para la construccin de grficos, pero si es


posible considerar algunas recomendaciones o criterios.
Se emplea una diversidad de grficos, cuya estructura o forma depender del
tipo de variable que se est estudiando.
Este grfico debe tener rasgos simples y de fcil comprensin.

10.

TIPOS DE GRAFICOS ESTADISTICOS


Hay varias tipos de grficos, los cuales dependen del tipo de variable que esta
evaluando. Presentaremos aqu los mas importantes:

11.

a.

Grfico de bastones: Se utiliza cuando se tienen datos de una variable


cuantitativa discreta.

b.

Histograma: Se utiliza cuando se tienen datos de una variable cuantitativa


continua.

c.

Grfico de Barras: Se utiliza cuando se tienen datos de una variable


cualitativa.

d.

Grfico Sectorial o Pastel: Se utiliza cuando se tienen informacin de una


variable cualitativa o cuantitativa discreta.

e.

Polgono de frecuencias: Se utiliza para indicar el comportamiento de un


conjunto de datos.

f.

Grfico de series de tiempo: Se utiliza para analizar variables cuantitativas


continuas pero expresadas en el tiempo.

g.

Grafico de Cajas y Bigote: Se utiliza para analizar el comportamiento de una


variable cuantitativa. Se obtiene en base a los cuartiles.

h.

Grafico de la telaraa: Sirve para visualizar el comportamiento de una


variable cuantitativa cuando evala ciertos criterios de evaluacin.

CONSTRUCCIN DE GRAFICOS ESTADISTICOS DE EXCEL:


Excel puede crear grficos a partir de datos previamente seleccionados en una hoja
de clculo. El usuario puede insertar un grfico en una hoja de clculo, o crear el
grfico en una hoja especial para grficos. En cada caso el grfico queda vinculado
a los datos a partir de los cuales fue creado, por lo que si en algn momento los
datos cambian, el grfico se actualizar de forma automtica. Los grficos de Excel
contienen muchos objetos, ttulos, etiquetas en los ejes que pueden ser
seleccionados y modificados individualmente segn las necesidades del usuario.
Para crear un grfico con el Asistente para Grficos, se deben seguir los
siguientes pasos:
1. Seleccionar los datos a representar.
2. Ejecutar el comando Insertar / Grfico o hacer clic en el botn

Curso: Uso de Excel en la Educacin

Pgina - 22 -

Escuela de Postgrado
Universidad Nacional de Trujillo

A continuacin aparece el siguiente cuadro de dilogo del Asistente para


Grfico..que permite elegir el tipo y subtipo de grfico que se va a utilizar entre dos
listas que son estndares y personalizados.

Luego seleccionar el rango de los datos a evaluar, sealando correctamente las


series que estn evaluando.

Luego debemos configurar los aspectos que conciernen a la presentacin del


grfico, aportando una vista preliminar del mismo. As, se determinan el ttulo, las
inscripciones de los ejes, la apariencia de stos, la leyenda, la aparicin o no de
tabla de datos y los rtulos. Las opciones de <Atrs, Siguiente> y Finalizar son
las mismas que en los otros cuadros. Finalmente hacer clic en el botn Finalizar, el
grfico aparece ya en el lugar seleccionado. Si se quiere desplazar a algn otro
lugar sobre la propia hoja en que se encuentra basta seleccionar todo el grfico y
arrastrarlo con el mouse.

Curso: Uso de Excel en la Educacin

Pgina - 23 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 3: MEDIDAS ESTADSTICAS


La estadstica descriptiva es una tcnica que consiste en obtener indicadores que
describen el comportamiento de un conjunto de datos. Dentro de estas medidas
estadsticas tenemos:
A.

Las medidas de Posicin: Dentro de estas tenemos:


a.

Medidas de tendencia central: Media, Moda, Mediana.

b.

Medidas de localizacin: cuartiles, deciles y percentiles.

B.

Las medidas de variacin: rango, varianza, desviacin estndar, coeficiente de


variacin.

C.

Las medidas de deformacin: asimetra y kurtosis.

1.

MEDIDAS DE TENDENCIA CENTRAL


1.1. MEDIA ARITMTICA:
Se denota por

Es la medida estadstica ms fcil de calcular.


La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.
1.2. MEDIANA:
Se denota por Me.
Es un valor que divide al conjunto de datos en dos partes iguales, es
decir, cada segmento tiene el 50% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.
1.3. MODA:
Se denota por Mo.
La moda es el valor que ms se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos

Amodal

b. 1 moda

Unimodal.

c. 2 modas

Bimodal

d. 3 a ms modas

Multimodal

Para calcular la media aritmtica se utilizan las formulas adecuadas ya


sea sin son datos agrupados o datos no agrupados.

2.

MEDIDAS DE LOCALIZACIN:

Curso: Uso de Excel en la Educacin

Pgina - 24 -

Escuela de Postgrado
Universidad Nacional de Trujillo

2.1. CUARTILES:
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es
decir, cada sector tiene el 25% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.
2.2. DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es
decir, cada sector tiene el 10% de los datos.
2.3. PERCENTILES:
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales,
es decir, cada sector tiene el 1% de los datos.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.

3.

MEDIDAS DE VARIABILIDAD:
3.1. RANGO:
Se denota por R y la medida de variabilidad ms fcil de calcular.
Es la diferencia que existe entre el valor mximo y el valor mnimo del
conjunto de datos.
3.2. VARIANZA:
Mide la variabilidad de un conjunto de datos respecto a un valor
central(promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto
es ilgica su interpretacin.
Para calcular la media aritmtica se utilizan las formulas adecuadas ya
sea sin son datos agrupados o datos no agrupados.
3.3. DESVIACIN ESTANDAR:
Mide la variabilidad de un conjunto de datos respecto a su valor central
pero en unidades originales.
Esta es la medida de variabilidad que tiene una interpretacin lgica.
Se obtiene al sacra la raz cuadrada de la varianza.
3.4. COEFICIETE DE VARIACIN:
Se denota por C.V.

Curso: Uso de Excel en la Educacin

Pgina - 25 -

Escuela de Postgrado
Universidad Nacional de Trujillo

El C.V. sirve para determinar si un conjunto de datos tiene un


comportamiento homogneo o heterogneo.
Para llegar a determinar la homogeneidad se compara con un valor
convencional del 33%.
Si el CV 33% el conjunto de datos tiene un comportamiento
homogneo.
Si el CV > 33% el conjunto de datos tiene un comportamiento
heterogneo.

4.

MEDIDAS DE FORMA:
4.1. ASIMETRIA:
La asimetra se entiende como la deformacin horizontal de un conjunto
de datos.
Para conocer esta asimetra se calcula el coeficiente de asimetra As.
En un conjunto de datos pueden presentar los siguientes casos:

As

a.

As= 0, el conjunto de datos es simtrica.

b.

As<0, el conjunto de datos es asimtrica negativa.

c.

As>0, el conjunto de datos es asimtrica positiva.

Mo
S

As

3( X

Me)
S

As

Q3 2Q2 Q1
Q3 Q1

4.2. KURTOSIS:
Se entiende por Kurtosis a la deformacin vertical de un conjunto de
datos, es decir, mide el apuntamiento o achatamiento de un conjunto de
datos.
Para conocer que tipo de asimetra tiene un conjunto de datos, se
utilizan las siguientes formulas:
A.

Kurtosis en funcin de los momentos:


Si K1>3, el conjunto de datos es leptocrtica.
Si K1=3, el conjunto de datos es mesoctica.
Si K1<3, el conjunto de datos es platicrtica.

K1

M4
(M 2 )2

M4: Momento de orden cuatro respecto a la media


M2: Momento de orden dos respecto a la media
Curso: Uso de Excel en la Educacin

Pgina - 26 -

Escuela de Postgrado
Universidad Nacional de Trujillo

B. Kurtosis en funcin de los momentos de orden 4:


Si K2>0, el conjunto de datos es leptocrtica.
Si K2=0, el conjunto de datos es mesoctica.
Si K2<0, el conjunto de datos es platicrtica.

K2

M4
(s) 2

C. Kurtosis en funcin de loscuantiles:


Si K3>0.263, el conjunto de datos es leptocrtica.
Si K3=0.263, el conjunto de datos es mesoctica.
Si K3<0.263, el conjunto de datos es platicrtica.

As
5.

Q3 Q1
2( P90 P10 )

FORMULAS PARA CALCULAR LAS MEDIDAS DE TENDENCIA CENTRAL:


MEDIDAS

PARA DATOS NO AGRUPADOS

PROMEDIO

PARA DATOS AGRUPADOS

xi

i 1

Xi: datos
n = nmero de datos

Yi: Marca de clase o punto medio


fi: frecuencia absoluta simple
n: nmero de datos.

Procedimiento:
Observar la base de datos y determinar
el valor que ms se repite.

Mo

Li

A
1

Li: limite inferior del intervalo modal.


A: amplitud intervlica

MODA

MEDIANA

Yi f i

i i

Procedimiento:
Ordenar
la
serie
ascendente
Cuando n impar:
Me = valor central
Cuando n par:
Me = promedio de
centrales

Curso: Uso de Excel en la Educacin

fj

fj

fj

fj

Me
en

forma

Li

n/2

Fj

fj

Li: limite inferior del intervalo mediano.


A: amplitud intervlica.
los

valores

n / 2 es el elemento determinante
Fj-1: Frecuencia acumulada anterior al
intervalo mediano
fj: Frecuencia abs. simple del intervalo
mediano

Pgina - 27 -

Escuela de Postgrado
Universidad Nacional de Trujillo

QUARTILES

Seguir pasos similares a la mediana.

QK

Li

kn / 4

Fj

fj

CUANTILES

Similar a la Me. Lo nico que cambia es


el elemento determinante.

DECILES

Seguir pasos similares a la mediana.

DK

Li

kn / 10

Fj

fj

Similar a la Me. Lo nico que cambia es


el elemento determinante.

PERCENTILES

Seguir pasos similares a la mediana.

PK

Li

kn / 100

Fj

fj

Similar a la Me. Lo nico que cambia es


el elemento determinante.

6.

FORMULAS PARA CALCULAR LAS MEDIDAS DE DISPERSION O VARIACIN


MEDIDAS

RANGO

PARA DATOS NO AGRUPADOS

R V max

V min

POBLACIONAL

LS

(Xi

u)

LI

Ls: Limite superior


Li: Limite inferior
m

N
2

PARA DATOS AGRUPADOS

2
2

i 1

u)2 * fi

(Yi

i 1

Xi : Datos de la poblacin
u : promedio poblacional
N: Nmero de elementos de la
poblacin

Yi : Marca de clase
u : promedio poblacional
N: Nmero de elementos de la
poblacin
fi: frecuencia absoluta simple

VARIANZA

m
n

s2

MUESTRAL

Formulas
abreviadas

DESVIACION ESTANDAR

COEFIENTE DE
VARIACIN

x)2

( xi

s2

1
n 1

(
xi2

D.E. Poblacional

*100

C.V. Poblacional

Curso: Uso de Excel en la Educacin

xi ) 2

i 1

i 1

C.V .

Xi : Datos de la muestra
x : promedio muestral
n : Nmero de elementos de la
muestra

y)2 * fi

( yi
s2

yi : Marca de clase
y : promedio muestral
n : Nmero de elementos de la
muestra
fi: frecuencia absoluta simple

s2

1
n 1

(
yi2 f i

i 1

i 1

yi f i ) 2

s2

D.E. Muestral

C.V .

s
*100
x

C.V. Muestral

Pgina - 28 -

Escuela de Postgrado
Universidad Nacional de Trujillo

7.

MEDIDAS ESTADSTICAS CON MEGASTAT:


En Excel los pasos a seguir para obtener estas medidas son las siguientes:
a.

Tener una base de datos respecto a variables cuantitativas.

b.

Seleccionar en MegaStat / Estadstica descriptiva/.. aparece la siguiente


ventana, luego hay que ingresar los datos respectivos:

APLICACIN: (Evaluacin de un caso)


RUBIOJA S.A. es una de las firmas consultoras financieras ms importantes del Per.
Ofrece asesora financiera y servicios a firmas particulares y a gobiernos regionales.
Grecia Rubio, acababa de ser encargada del departamento de personal de esta empresa.
En los tres aos pasados, se han agregado otros ayudantes y hace seis semanas, se
sum al departamento un estadstico recin graduado. Damne empez hace poco a
revisar las prcticas de contratacin del departamento. Empez la revisin examinando
el campo ms crtico, las personas en adiestramiento financiero. La firma contrata entre
60 y 130 de estas personas al ao, segn sea el crecimiento de la firma, el movimiento
de empleados y el nmero de perspectivas notables" que encuentre. Prcticamente
todos los que estn en adiestramiento financiero se contratan entre los estudiantes del
ltimo ao de escuelas superiores con especializacin financiera. Damne seleccion al
azar 100 de los 197 candidatos que haban sido contratados hace dos aos y an seguan
trabajando. Cada ficha contena la informacin siguiente (los datos van en el apndice
adjunto):
1. Genero. (0=Femenino y 1=Masculino)
2. Edad al contratarse
3. Promedio ponderado de sus notas universitarias (escala de 0 a 20).
4. Calidad de la universidad de procedencia. (1=Excelente, 2=Muy buena, 3=Buena
y 4=Regular)
5. Nota de la prueba de aptitudes. La prueba produce una puntuacin de 0 (muy
improbable que tenga xito en el trabajo) a 100 (muy probable que tenga xito
en el trabajo).

Curso: Uso de Excel en la Educacin

Pgina - 29 -

Escuela de Postgrado
Universidad Nacional de Trujillo

6. Evaluacin del rendimiento al final del segundo ao. Esta evaluacin produce una
puntuacin numrica desde 0 (muy malo) hasta 100 (excelente).
La Gerencia de RUBIOJA S.A. estn seguros de que la escala es de intervalo y tambin
han decidido, con base en los tres aos de experiencia con dicha escala, que una
puntuacin inferior a 50 es insatisfactoria, 50-69 es satisfactoria, 70-89 por sobre el
promedio, y por encima de 89 es excelente. Grecia llama al estadstico a su oficina y le
dice: "Estoy encantada de tener un estadstico que nos ayude. No estamos an listos a
desarrollar un modelo estadstico acabado de lo que constituye una buena contratacin,
pero es tiempo de empezar a evaluar algunas de las variables de que tenemos
informacin. El gran nmero de personas que contratamos, el alto costo de adiestrarlas
y el hecho de que no podemos evaluar realmente los rendimientos, hasta fines del
segundo ao, significan que cualquier mejora en nuestra eficacia de contratacin tendr
por resultado ahorros sustanciales para la firma. Para comenzar a tratar el tema,
Podras dar respuesta a las siguientes preguntas?
1.

Necesitamos un resumen de la edad del personal al contratarse, del promedio de


calificaciones de grado y de la evaluacin del rendimiento en el segundo ao, para
tener una apreciacin general del grupo en adiestramiento financiero. Cul es el
perfil de este personal?

2.

Es ms alto el puntaje de varones en la nota de la prueba de aptitudes que el de


mujeres? Y en la evaluacin del rendimiento?

3.

Un criterio inicial en RUBIOJA S.A era mantener la calificacin promedio de grado de


los contratados por encima de 14.00. Se sigue manteniendo este criterio?

4.

Otro criterio era mantener por lo menos un tercio de los contratados que provengan
de escuelas de categora 2. Se sigue manteniendo este criterio?

5.

Son diferentes los rendimientos en la prueba de entrada para las diferentes


calidades de escuelas de donde provienen los candidatos? Y en la Evaluacin del
rendimiento del segundo ao?

Si Ud. fuera el analista que conclusiones le dara a Grecia Rubio respecto al


anlisis que realiz. Utilice la siguiente base de datos.
No.

Genero

Edad

Calificacin

Calidad Universitaria

ndice-xito

Rendimiento 2

22

15,41

62

72

26

15,71

60

71

22

12,45

80

66

23

15,69

86

91

25

16,05

86

48

26

16,21

64

95

7
8
9
10
11
12
13
14
15
16
17

0
1
1
1
1
0
0
1
0
1
1

27
23
23
26
24
24
36
27
26
24
26

14,42
12,87
13,08
16,30
15,82
14,85
13,31
16,67
16,35
12,50
12,32

2
3
2
3
4
3
4
4
2
1
1

54
80
62
77
61
67
95
62
50
62
81

82
92
73
81
67
95
96
59
79
88
52

Curso: Uso de Excel en la Educacin

Pgina - 30 -

Escuela de Postgrado
Universidad Nacional de Trujillo

18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46

1
1
1
0
1
1
0
1
0
1
1
1
0
1
1
1
1
1
0
1
0
1
0
1
1
1
1
1
1

23
24
24
25
23
23
26
25
25
24
23
22
30
24
25
23
24
26
23
26
26
26
23
22
26
24
26
25
24

14,72
13,94
16,92
13,14
14,92
13,81
15,53
15,33
12,95
12,24
14,94
12,57
12,92
15,94
13,80
14,42
14,72
12,60
14,53
14,76
13,12
13,35
14,76
15,27
17,00
16,57
14,02
13,08
13,93

2
2
2
3
3
2
3
3
2
4
4
3
3
1
4
3
2
3
3
4
3
4
2
4
2
2
3
1
3

76
87
73
85
57
89
70
65
89
87
89
94
71
63
67
96
73
92
88
82
84
86
72
82
77
66
73
85
58

71
75
75
93
84
90
83
73
97
88
81
74
67
80
64
82
82
81
77
89
95
58
74
89
68
77
67
99
96

47

25

14,17

58

97

48
49

0
1

24
22

14,65
13,92

3
1

79
50

92
95

50
51

1
1

25
25

13,28
12,96

3
2

93
75

67
52

52

23

13,97

82

82

53
54
55

1
1
1

25
24
24

13,92
14,92
16,33

3
3
2

57
67
60

83
87
73

56
57

0
1

23
23

14,25
15,29

4
1

56
94

67
72

58
59

1
1

26
26

15,23
15,73

3
3

92
81

66
95

60
61

23

12,94

73

82

24

15,96

91

84

62

24

16,96

72

98

63

27

12,23

85

93

64

22

15,35

96

87

65

23

16,77

85

57

66

1
0

24
25

16,12
14,34

2
3

89
92

85
81

67
68

24

14,69

66

95

69

22

14,67

85

90

70

23

15,56

54

80

71

22

12,35

85

48

72

24

13,39

65

71

73

26

16,99

76

63

74

28

15,29

63

87

75

26

15,93

89

97

Curso: Uso de Excel en la Educacin

Pgina - 31 -

Escuela de Postgrado
Universidad Nacional de Trujillo

76
77
78
79
80
81
82
83

1
1

25
25

13,41
15,55

3
2

83
57

97
79

25

13,97

96

71

0
1

23
24

12,81
12,99

4
2

72
73

72
89

1
1

25
23

15,67
12,47

2
3

53
86

94
78

24

12,77

64

89

84

24

14,67

80

84

85

25

13,94

77

91

86

24

14,90

52

69

87

23

15,44

70

89

88

23

16,03

90

91

89

29

12,15

74

89

90

0
0
0
0
1

22
26
22
30
25

13,42
12,02
13,04
14,35
13,65

2
4
3
4
2

95
84
68
92
52

94
95
78
84
85

91
92
93
94
95

23

12,66

82

69

96

26

13,22

56

71

97

23

13,43

85

58

98

22

15,54

85

93

99

1
1

26
23

16,51
16,91

3
3

64
61

97
83

100

Curso: Uso de Excel en la Educacin

Pgina - 32 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 4: ANALISIS DE CORRELACION Y REGRESION


1.

ANALISIS DE CORRELACIN:
El anlisis de correlacin es una tcnica estadstica que mide el grado de
asociacin o afinidad entre las variables cuantitativas consideradas en un
estudio.
Se llamar CORRELACION SIMPLE cuando se trata de analizar la relacin
entre dos variables. Se llamar CORRELACION LINEAL O RECTILINEA si la
funcin es una recta, y de CORRELACION NO LINEAL cuando la funcin es una
curva o una funcin de grado superior.
El COEFICIENTE DE CORRELACION DE PEARSON, es el estadgrafo que mide
el grado de asociacin o afinidad entre las variables cuantitativas y se denota
por r la cual se define como:

n
r

X iYi

i 1
n

X i2

i 1

i 1
n

Alta

X i )2

i 1

Interpretacin:
-1
-0.7
Perfecta

Xi

Yi

i 1
n

Yi 2

i 1

-0.4

Regular

i 1

0
Baja

0.4
Baja

NEGATIVA

2.

Y1 ) 2

0.7
Regular

Alta

+1
Perfecta

POSITIVA

ANALISIS DE REGRESION
2.1. ANALISIS DE REGRESION LINEAL SIMPLE:
El anlisis de regresin es una tcnica estadstica que consisten en
determinar la relacin funcional entre dos variables cuantitativas en
estudio.
Esta relacin funcional entre las variables, es una ecuacin matemtica
de la forma Y= A + B X, que recibe el nombre tambin de Funcin de
Regresin o Modelo de Regresin.
A la variable Y se le denomina variable dependiente, a la variable X
independiente y a A,B se les llama parmetros de la ecuacin de
regresin.
La finalidad del Anlisis de Regresin es hacer pronsticos es decir,
hacer estimaciones futuros de la variable dependiente.
PASOS A SEGUIR:
a.
Realizar el diagrama de dispersin y ver el comportamiento de la
variable.

Curso: Uso de Excel en la Educacin

Pgina - 33 -

Escuela de Postgrado
Universidad Nacional de Trujillo

b.

Aplicar el mtodo de los Mnimos Cuadrados Ordinarios para estimar los


parmetros de la ecuacin. Las formulas son las siguientes:
n
B

n
i 1

X i Yi
n

i 1

c.

X i2

n
i 1
n

Xi

i 1

n
i 1

A Y

Yi

BX

X i )2

Para hacer el pronstico o el valor estimado de Y, reemplazar en la


ecuacin matemtica el respectivo valor de Xo, de la siguiente manera:
Y = A + B (Xo)

2.2. REGRESION LINEAL MULTIPLE:


El ARLM es una tcnica estadstica que consiste en determinar el modelo
de regresin linel mltiple de una variable respuesta (Y) y un conjunto
de variables independientes (Xs).
El modelo de regresin lineal mltiple esta dado por la siguiente
ecuacin:

X1

X 2 ...

XK

Para encontrar este modelo, es decir, estimar sus coeficientes tambin


se utiliza el Mtodo de los Mnimos Cuadrados Ordinarios.
Los elementos de este modelo de regresin mltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresin.
En el ARLM se prueban las siguientes Hiptesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables
independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hiptesis se utiliza el anlisis de varianza.
2.3. REGRESION LINEAL CON EXCEL (MEGASTAT):
Para realizar estos ejercicios se deben realizar los siguientes pasos: Hacer clic
en Complementos / MegaStat / y aparece la siguiente ventana.

Curso: Uso de Excel en la Educacin

Pgina - 34 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Luego aparece la ventana de dialogo donde hay que ingresar el rango de Y, el


rango de X, activar rtulos, las opciones de salida y algunas alternativas de
inters para el investigador.

Luego tomar las decisiones respectivas.


APLICACIN 01
LA EMPRESA HIDRANDINA de la ciudad de
Trujillo, esta haciendo un estudio sobre los
consumos de energa (en miles de kilowatts hora) y el nmero de reas de trabajo en un
conjunto de Empresas Privadas Para este
estudio se selecciona una muestra aleatoria
de 10 Empresas Privadas, en la cual se
obtuvo los siguientes resultados:
a. Estimar la ecuacin de regresin lineal.
b. Evale el consumo (en miles de kilowattshora), para una Empresa que tiene 6 reas
de trabajo.

N de
casa

Nmero de
reas de
trabajo

Consumo
de
energa
(miles de
kw)

11

10

18

14

10

Total

SALIDA DEL MEGASTAT:


Regression Analysis

0.857

10

0.926

Std. Error

2.021

Dep. Var.

Source

SS

df

MS

p-value

Regression

196.2333

196.2333

48.06

.0001

Residual

32.6667

4.0833

Total

228.9000

Consumo de energa

(miles de kw)

ANOVA table

Curso: Uso de Excel en la Educacin

Pgina - 35 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Regression output
variables

coefficients

std. error

t (df=8)

p-value

Intercept
Nmero de
reas de
trabajo

-1.8889

1.5763

-1.198

.2651

confidence interval
95%
lower
95% upper
5.5237
1.7460

3.2222

0.4648

6.932

.0001

2.1504

4.2941

APLICACIN 02:
N de
maquina
1
2
3
4
5
6

Tiempo de
antigedad
(aos)
1
1
2
2
3
3

Costo de
mantenimiento.
($)
14
16
20
24
30
28

Total

El Gerente de la UNT est haciendo un estudio entre


el gasto de mantenimiento de sus computadoras y
el ao de antigedad de dichas maquinas. Para esto
recurre a la oficina de Mantenimiento y Contabilidad
obteniendo la siguiente informacin:
a. Estime la ecuacin de regresin lineal.
b. Estime cuanto sera el costo de mantenimiento de
una computadora que tiene 7 aos.
c. Calcule e interprete el valor del coeficiente de
regresin lineal r

APLICACIN 03:
El jefe de personal de una institucin educativa cree que
existe una relacin entre la tardanza al trabajo y la edad
del trabajador. Con el propsito de estudiar el problema
tom en cuenta la edad de diez trabajadores escogidos
al azar y contabiliz los das de tardanza durante todo
un ao. Los resultados fueron como se observa en la
tabla que sigue:
a. Construya el diagrama de dispersin.
b. Obtenga la ecuacin de la recta de regresin
c. Si un docente tiene 38 aos, Cuntos tardanzas se
espera que falte al ao?
d. Si un trabajador tiene 3 tardanzas al ao Qu edad
se puede esperar que tenga este trabajador?
e. Determinar el grado de relacin entre las variables
en estudio

Curso: Uso de Excel en la Educacin

N
1
2
3
4
5
6
7
8
9
10
Total

Edad en
aos
25
50
35
20
45
50
30
40
62
40

N de
Tardanza e
un ao
20
5
10
20
8
2
15
12
1
8

Pgina - 36 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 5: DISTRIBUCIONES DE PROBABILIDAD


1.

LA DISTRIBUCIN BINOMIAL
La Distribucin Binomial es una las distribuciones de probabilidad discretas
ms importantes, la cual tiene muchas aplicaciones en Ingeniera,
Administracin, etc..
Esta distribucin se origina en los Ensayos o Experimentos Bernoulli que
consiste en realizar 1 experimentos que tiene dos resultados posibles,
llamados xito y fracaso.
Ejemplos:
1. Lanzar una moneda
2. Rendir un examen.
Ensayos de Bernoulli
3. Observar el sexo de un recin nacido.
4. Encender una maquina, etc
Experimento Binomial:
Es aquel que consiste en realizar n veces ensayos de Bernoulli, en el cual
se debe cumplir lo siguiente:
a.
Cada ensayo tienen solo dos resultados posibles.
b.
Los ensayos son independientes.
c.
La probabilidad de xito p es constante en cada ensayo.
Esta distribucin tienen las siguientes caractersticas:
1.
Su variable aleatoria esta definida como:
X: Numero de xitos en n ensayos.
2.
Su recorrido o rango es:
Rx = {0,1,2,3,4,5, , n}
3.
Su funcin de probabilidad esta dada por:

f ( x)
4.

P( X

x)

n x n
p q
x

,x

0,1,2,..., n

5.

Sus parmetros son :


n : Numero de veces que se repite el experimento o tamao de
muestra.
p : Probabilidad de xito en cada uno de los ensayos o proporcin de
inters.
Su notacin es : X
B ( n, p )

6.

Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente


A.
B.
C.
D.
E.
F.
G.

Curso: Uso de Excel en la Educacin

P
P
P
P
P
P
P

(
(
(
(
(
(
(

Xa
X>a
Xa
X=a
aX
aX
a<X

) = Usar directamente la tabla


)=1- P(Xa)
)=1- P(Xa-1)
)=P(Xa)-P(Xa-1)
b ) = P ( X b ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a )

Pgina - 37 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN CON MEGASAT:


APLICACIN 01:
En el almacn de la Empresa MAESTROS, hay 12 artculos elctricos de los cuales 3 de
ellos son defectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cual es
la probabilidad de que:
a. Exactamente 1 sea defectuosos.
b. Ninguno sea defectuoso.
c. Menos de 2 sean defectuosos.
d. Ms de 3 sean defectuosos.
SOLUCION:

Binomial distribution
5 n
0.25 p

X
0
1
2
3
4
5

P(X)
0.23730
0.39551
0.26367
0.08789
0.01465
0.00098
1.00000

cumulative
probability
0.23730
0.63281
0.89648
0.98438
0.99902
1.00000

1.250 expected value


0.938 variance
0.968 standard deviation

Curso: Uso de Excel en la Educacin

Pgina - 38 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Binomial distribution (n = 5, p = 0.25)

P(X)

0.60
0.40
0.20
0.00
0

APLICACIN 02:
En la UNT Escuela de Postgrado se est aplicando un nuevo mtodo de enseanza del
aprendizaje del Idioma Portugus. Despus de completar con la aplicacin de este
mtodo se evala que el 1% salio desaprobado. El director acadmico selecciona en
forma aleatoria estudiantes al azar de la Universidad:
a. Cual es la probabilidad de que exista ms de 3 desaprobados.
b. Cual es la probabilidad de que exista menos de 3 desaprobados.
c. Cual es la probabilidad de que haya entre 2 y 4 desaprobados inclusive.
APLICACIN 03:
Segn informacin de Secretara Acadmica de la UNT, el 65% de los estudiantes son del
sexo masculino y el resto mujeres. Para la aplicacin de una encuesta por parte de la
asistenta social, se selecciona aleatoriamente a 10 estudiantes:
a. Cual es la probabilidad de encuestar a menos de 5 hombres.
b. Cual es la probabilidad de encuestar mas de 5 hombres
c. Cual es la probabilidad de encuestar a 3 y 8 hombres inclusive.
d. Cual es la probabilidad de encuestar a ningn hombre.

2. LA DISTRIBUCIN POISSON
La Distribucin de Poisson es otra de las distribuciones de probabilidad discretas
ms importantes por que se aplica en muchos problemas reales.
Esta distribucin se origina en problemas que consiste en observar la ocurrencia
de eventos discretos en un intervalo continuo (unidad de medida).
Ejemplos:
1. Numero de manchas en un metro cuadrado de un esmaltado de un
refrigerador.
2. Numero de vehculos que llegan a una estacin de servicios durante una hora.
3. Numero de llamadas telefnicas en un da.
4. Numero de clientes que llegan a un banco durante las 10 y 12 p.m.
5. Numero de bacterias en un cm3 de agua.
Esta distribucin tienen las siguientes caractersticas:
7. Su variable aleatoria esta definida como:
X: Numero de ocurrencias en 1 unidad de medida (Tiempo, Volumen,
Superficie, etc)
8. Su recorrido o rango es:

Curso: Uso de Excel en la Educacin

Pgina - 39 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Rx = {0,1,2,3,4,5, .}
9. Su funcin de probabilidad esta dada por:

f ( x)

P( X

x)

e ( )x
,
x!

0,1,2,...

10. Su parmetro es : tasa promedio de ocurrencia en 1 unidad de medida.


11.Su notacin es : X
P( )
12. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente
H.
I.
J.
K.
L.
M.
N.

P
P
P
P
P
P
P

(
(
(
(
(
(
(

Xa
X>a
Xa
X=a
aX
aX
a<X

) = Usar directamente la tabla


)=1- P(Xa)
)=1- P(Xa-1)
)=P(Xa)-P(Xa-1)
b ) = P ( X b ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a-1 )
< b ) = P ( X b-1 ) - P ( X a )

APLICACIN CON MEGASTAT


APLICACIN 01:
En un estudio de Satisfaccin del Cliente en la UNT, se determino que las personas llegan
aleatoriamente a la ventanilla de caja, con una tasa promedio de 24 personas por hora,
durante la hora punta comprendida entre 11:00 am y 12:00 am de cierto da. El jefe
administrativo desea calcular las siguientes probabilidades:
a. Cual es la probabilidad de que lleguen exactamente 5 personas durante esa hora?
b. Cual es la probabilidad de que lleguen mas de 5 personas durante esa hora?
c. Cual es la probabilidad de que lleguen menos de 5 personas durante esa hora?
d. Cual es la probabilidad de que lleguen ms de 8 personas durante esa hora?
SOLUCION:

Curso: Uso de Excel en la Educacin

Pgina - 40 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Poisson distribution
mean rate of
24 occurrence

X
0
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

P(X)
0.00000
0.00000
0.00000
0.00000
0.00000
0.00000
0.00001
0.00003
0.00010
0.00027
0.00066
0.00144
0.00288
0.00531
0.00911
0.01457
0.02186
0.03086
0.04115
0.05198
0.06238
0.07129
0.07777
0.08115
0.08115
0.07791
0.07191
0.06392
0.05479
0.04534
0.03628
0.90415

cumulative
probability
0.00000
0.00000
0.00000
0.00000
0.00000
0.00000
0.00001
0.00005
0.00015
0.00043
0.00108
0.00252
0.00540
0.01072
0.01983
0.03440
0.05626
0.08713
0.12828
0.18026
0.24264
0.31393
0.39170
0.47285
0.55400
0.63191
0.70382
0.76774
0.82253
0.86788
0.90415

24.000 expected value


24.000 variance
4.899 standard deviation

Curso: Uso de Excel en la Educacin

Pgina - 41 -

Escuela de Postgrado
Universidad Nacional de Trujillo

Poisson distribution ( = 24)


0.10

P(X)

0.08
0.06
0.04
0.02
0.00
0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30
X

APLICACIN 02:
Si la secretaria de la Escuela de Postgrado de la UNT, recibe un promedio de 2 llamadas
cada 3 minutos por motivos acadmicos. Calcular lo siguiente:
a. Cual es la probabilidad de que reciba ms de 3 llamadas en 3 minutos.
b. Cual es la probabilidad de que reciba menos de 2 llamadas en tres minutos.
c. Cual es la probabilidad de que reciba exactamente 2 llamadas en tres minutos.
d. Cual es la probabilidad de reciba 5 llamadas en 6 minutos.
e. Cual es la probabilidad de que reciba menos de 2 llamadas en un minuto.
APLICACIN 03:
En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha
determinado que en la carretera panamericana con destino a Lima, hay en promedio de
20 accidentes por semana (7 das), calcular las siguientes probabilidades:
a. Cul es la probabilidad de que en una semana no haya ningn accidente.
b. Cual es la probabilidad de que en dos semanas haya 10 accidentes.
c. Cual es la probabilidad de que en 1semana ocurra menos de 15 accidentes.
d. Cual es la probabilidad de que en un da haya tres o menos accidentes.
e. Cual es la probabilidad de que en un da haya tres o ms accidentes.
APLICACIN 04:
En el Centro de impresiones de la UNT se comete dos fallas en las impresiones debido a
causas externas cada vez que imprime 2,500 hojas como promedio. Con esta
informacin determinar:
a. La probabilidad de que en una impresin de 500 hojas, ocurra uno ms errores.
b. La probabilidad de que no ocurrirn errores en una impresin de 50 hojas.
APLICACIN 05:
Los clientes de una empresa llegan a la tienda de venta aleatoriamente a una tasa de
300 personas por hora. Calcular la probabilidad de que:
a. Una persona llegue durante un periodo de 1 minuto
b. Por lo menos dos personas lleguen durante un periodo dado de un minuto.
c. Ninguna persona legue durante un periodo de 1 minuto

Curso: Uso de Excel en la Educacin

Pgina - 42 -

Escuela de Postgrado
Universidad Nacional de Trujillo

3. LA DISTRIBUCIN NORMAL:
La distribucin normal, llamada tambin Curva de Gauss (en recuerdo al
cientfico que lo descubri), es la distribucin de probabilidad ms importancia en
la Estadstica y por ende del Calculo de Probabilidades.
Esta distribucin de probabilidad es importante porque las variables aleatorias
continuas (peso, edad, talla, produccin, gasto en publicidad, temperatura,
ventas, PBI, ganancias, etc) que son variables que ms se evalan en una
investigacin cientfica o investigacin de mercados se aproximan a esta
distribucin de probabilidad.
Tambin es importante porque se utiliza como aproximacin de las distribuciones
discretas tales como: la Binomial, la Poisson, etc.
CARACTERSTICAS
1. Tiene como parmetros a y
2. Su funcin de probabilidad est dada por:

1
2

f ( x)
-

1 X
2

Adems:
<
<+

X
-

>0

3. El promedio
puede tomar valores entre y + mientras que
> 0, entonces
existen infinitas curvas normales.
4. Esta funcin de probabilidad es asinttica con respecto al eje X, (a pesar de tener
recorrido infinito, la curva nunca toca el eje X); adems es unimodal y es
simtrica con respecto a la media .
5. El are bajo esta funcin o curva es 1 100%, de la misma manera se sabe que
las reas comprendidas bajo la curva normal son :
1.
2.
3.

= 68.3%
2

95.5%

99%

5. Para calcular probabilidades en la distribucin normal se necesitaran infinitas


tablas de probabilidad.

Curso: Uso de Excel en la Educacin

Pgina - 43 -

Escuela de Postgrado
Universidad Nacional de Trujillo

4. LA DISTRIBUCIN NORMAL ESTNDAR:


1. Es una distribucin a la cual se le ha modificado la escala original; esta
modificacin se ha logrado restando la media
al valor de la variable original y
dividiendo este resultado por , la nueva variable se denota por Z y recibe el
nombre de variable estandarizada

2. La modificacin de la escala ha permitido elaborar una tabla para el clculo de las


probabilidades; si esto no hubiera sido posible, sera necesario construir una tabla
para cada valor de y .
3. La funcin de densidad de la variable estandarizada es:
1

1
2

f ( z)

e2

z2

4. El promedio (valor esperado) y la varianza de Z son:


E(Z) = 0 , V(Z) = 1
5. Notacin:
Si X es v.a. continua distribuida normalmente con media
y varianza 2 , la
denotamos por : X
N( , 2).
Aplicando esta notacin a la variable normal estandarizada Z, escribimos:
Z
N(0 , 1) , esto se interpreta como, Z tiene distribucin normal con media 0
y varianza 1.
6. La superficie bajo la curva normal Z estandarizada tambin es igual a 1. Por
consiguiente, las probabilidades pueden representarse como reas bajo la curva
normal escandalizada entre dos valores.
7. Debido a que la distribucin normal es simtrica muchas de las tablas disponibles
contienen solo probabilidades para valores positivos de Z.
USO DE TABLA:
Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una
distribucin normal, para calcular las diferentes probabilidades se tiene que
estandarizar la variable. Una vez estandarizada la variable, recin utilizar la tabla de
la distribucin normal estandarizada o tabla Z.
FORMULAS:
a.
b.
c.

P( x
P( x
P( a

a)

P(

a) 1 P( x
x b)

a) 1 P(

P( x b) P( x a)

Curso: Uso de Excel en la Educacin

P( Z
x

P(

)
a
b

) 1 P( Z
) P(

Pgina - 44 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN CON MEGASTAT


APLICACIN 01:
El rendimiento acadmico de los estudiantes de la UNT-Escuela de Postgrado, tiene una
distribucin normal con media igual a 15 y varianza igual a 4. Si se selecciona un
estudiante de esta Universidad, encuentre la probabilidad de que:
a. El rendimiento sea menor que 16
b. El rendimiento sea menor que 14
c. El rendimiento este entre 14 y 18
d. El rendimiento sea mayor 15.5
SOLUCION

Reemplazando valores:

Curso: Uso de Excel en la Educacin

Pgina - 45 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 02:
Los salarios mensuales de los trabajadores administrativos de la UNT tiene un
comportamiento normal cuya media es S/. 2100 y una desviacin estndar de S/. 50.
Cuantos trabajadores tienen salarios:
a. Menores de S/. 2150.
b. Menos de S/. 2200.
c. Mas de S/. 2180.
d. Entre 2080 y 2150 soles.
APLICACIN 03:
El tiempo de duracin de los focos elctrico de los caones proyectores tienen una
distribucin normal con una media de 1000 horas y una desviacin estndar de 250
horas. Determinar la probabilidad de que:
a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento
b. Un foco se que queme entre 980 y 1120 horas de funcionamiento.
c. Un foco dure mas de 998 horas
APLICACIN 04:
NEUMA Per, es una empresa que produce llantas para automviles en nuestro pas. La
vida til de estas llantas se distribuye aproximadamente como una normal con media y
desviacin estndar iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere
exportar estas llantas por lo que empieza a hacer ciertos clculos acerca de la calidad de
estas llantas, para lo cual se hace las siguientes preguntas:
a. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
de 31900 millas.
b. Cual es la probabilidad de una llanta producida por esta empresa tenga una vida til
desde 31000 y 33000 millas.
c. Si las empresa fija una garanta de 30000 millas. Qu porcentaje de esta produccin
necesitar ser reemplazada?

Curso: Uso de Excel en la Educacin

Pgina - 46 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 6: ESTIMACIN ESTADSTICA


ESTIMACIN: Es el proceso mediante el cual se intenta determinar el valor del
parmetro de la poblacin a partir de la informacin de una muestra. Al realizar una
estimacin siempre se va a cometer un error. Existen dos tipos de estimacin:
A. ESTIMACIN PUNTUAL
B. ESTIMACIN INTERVLICA

A. ESTIMACION PUNTUAL:
Es aquel nico valor que se obtiene de la muestra, es decir, que para su clculo se
debe tener informacin muestral. Las formulas para calcular o realizar estas
estimaciones son las siguientes:
PROMEDIO

VARIANZA

PARAMETRO
n

ESTIMACION
PUNTUAL

PROPORCION

i 1

xi
n

( xi

x )2

i 1

n 1

a
n

B. ESTIMACIN INTERVLICA:
Al realizar una estimacin, siempre se va a cometer un error. Entonces, cuando
estimamos un parmetro nunca va a ser exacto, ese valor ser mayor o menor al
verdadero. Entonces se obtendr un intervalo de valores posibles. Ese intervalo se
llama estimacin intervlica. A esa diferencia mayor o menor se llama error de
estimacin, el cual esta en relacin directa con la variabilidad del estimador y el nivel
de confianza determinado por el investigador. La estimacin intervalica para un
parmetro en general, esta dada por:

/2

Error de Estimacin

/2

Error de estimacin

Tambin se puede escribir de la siguiente manera:

/2

Para determinar este intervalo se necesita de:


a. La estimacin puntual
b. La desviacin estndar del estimador.
c. Nivel de confianza, el cual ser repartido para cada lado del intervalo.

Curso: Uso de Excel en la Educacin

Pgina - 47 -

Escuela de Postgrado
Universidad Nacional de Trujillo

FORMULAS DE LOS INTERVALOS DE CONFIANZA


I. INTERVALO DE CONFIANZA PARA EL PROMEDIO POBLACIONAL
A. Si la muestra (n) es mayor de 30 y la varianza poblacional es conocida:

:x

/2

B. Si la muestra (n) es menor o igual a 30 y la varianza poblacional es desconocida:

:x

t(

s
n

/ 2 , n 1)

II. INTERVALO DE CONFIANZA PARA LA PROPORCION POBLACIONAL


A. Si la proporcin poblacional se conoce:

P: p

/2

PQ
n

B. Si la proporcin poblacional No se conoce: (entonces hay que calcularla en la


muestra)

P: p

/2

pq
n

III. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE MEDIAS


A. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas
poblacionales se CONOCEN:

: ( x1

x2 )

/2

2
1

2
2

n1

n2

B. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:
1

: ( x1

x2 ) t(

/ 2 , n1 n 2 2 )

sc2 (

1
n1

1
)
n2

Donde :

sc

(n 1 1)s 12 (n 2 1)s 22
n1 n 2 2

, se llama varianza mancomunada

IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:


A. Si p1 y p2 se determinan a partir de muestras:

P1

P2 : ( p1

p2 )

Curso: Uso de Excel en la Educacin

/2

p1 q1
n1

p2 q2
n2

Pgina - 48 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN UTILIZANDO MEGASTAT


RESPECTO AL PROMEDIO:
APLICACIN 01:
Los estudiantes de Administracin de Empresa de una Universidad realizaron un trabajo
de aplicacin respecto a los sueldos de los trabajadores de la mina YANACOCHA, para lo
cual seleccionaron una muestra aleatoria de 24 trabajadores en el cual se determin que
el sueldo promedio semanal es de $160 y una varianza de 10 dolares 2.
a. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.
SOLUCION:

Curso: Uso de Excel en la Educacin

Pgina - 49 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 02:
La Gerencia de la empresa HAMILTON LIGH esta interesado en conocer el contenido de
nicotina promedio de su marca de cigarrillos. Para lo cual selecciona una muestra de 14
cigarros obteniendo un promedio de 25 miligramos y una varianza de 16 miligramos 2.
a. Calcular un intervalo de confianza para el sueldo promedio con el 99% de confianza.
b. Calcular un intervalo de confianza para el sueldo promedio con el 95% de confianza.
c. Calcular un intervalo de confianza para el sueldo promedio con el 90% de confianza.
APLICACIN 03:
Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de
beneficios mensual promedio por auto vendido est por debajo del promedio nacional de
S/. 700. Para evaluar su margen de beneficio toma informacin (muestra) respecto a 8
meses cuya informacin es la siguiente:
MES
BENEFICIO
a.
b.
c.

800

840

780

850

810

790

805

800

Promedio

Varianza

Calcular un intervalo de confianza para el margen de beneficio promedio con el 99%


de confianza.
Calcular un intervalo de confianza para el margen de beneficio promedio con el 95%
de confianza.
Calcular un intervalo de confianza para el margen de beneficio promedio con el 90%
de confianza.

RESPECTO A LA PROPORCION:
APLICACION 04:
Segn un vendedor de automviles, de todos los vehculos adquiridos por los docentes
universitarios, en ms del 80% de los casos el color es elegido por la mujer. Para
verificar esta hiptesis se toma una muestra de 400 parejas que han comprado autos
nuevos durante el ltimo ao, hallndose que en 310 casos el color fue en efecto elegido
por la dama. Calcular:
a. El intervalo confidencial para la proporcin considerando el 99 % de confianza.
b. El intervalo confidencial para la proporcin considerando el 90% de confianza.
SOLUCION

Curso: Uso de Excel en la Educacin

Pgina - 50 -

Escuela de Postgrado
Universidad Nacional de Trujillo

RESPECTO A LA DIFERENCIA DE PROMEDIOS:


1. La SUNAT esta haciendo auditoria en ciertos grifos gasolineras. Selecciona en forma
aleatoria 05 grifos de 2 empresas diferentes (Texaco y Repsol). Los ingresos en miles
de soles semanales se presentan a continuacin:
TEXACO :
90
85
95
76
80
REPSOL :
84
87
90
92
90
a. Estimar un intervalo de confianza para la diferencia de medias (DIFERENCIA DE
LOS INGRESOS PROMEDIOS) con el 90% de confianza.
b. Estimar un intervalo confidencial para la diferencia de medias (DIFERENCIA DE
LOS INGRESOS PROMEDIO) con el 99% de confianza.
RESPECTO A LA DIFRENCIA DE PROPORCIONES:
1. Se toman muestras independientes para determinar el la proporcin de personas que
esta a favor de un impuesto al combustible. La primera muestra consiste en 100
personas que solamente trabajan en Trujillo y la segunda muestra es de 100
personas del cercado de Trujillo. Se determina que 50 y 60 personas de las
respectivas muestras estn de acuerdo con el aumento.
a. Calcular un intervalo de confianza para la diferencia de proporciones
considerando el 99% de confianza.
b. Calcular un intervalo de confianza para la diferencia de proporciones
considerando el 90% de confianza.

Curso: Uso de Excel en la Educacin

Pgina - 51 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 7: DETERMINACION DEL TAMAO DE MUESTRA


MUESTREO
Es una TCNICA ESTADSTICA por la cual se realizan inferencias a la poblacin
examinando solo una parte de ella, sta parte recibe el nombre de MUESTRA, la cual
debe ser estadsticamente representativa y adecuada.
Ventajas:
Desventajas:
Costo reducido
Presencia del error de muestreo
Mayor rapidez y exactitud
Presencia de gran variabilidad de las obs.
Minimiza los costos.

TCNICAS DE MUESTREO
Existen 2 tipos de tcnicas de muestreo:
A. TECNICAS PROBABILISTICAS:
B. TECNICAS NO PROBABILISTICAS
Muestreo aleatorio simple
El muestreo a criterio o juicio.
Muestreo aleatorio estratificado
El muestreo por cuotas.
Muestreo sistemtico
El muestreo por conveniencia.
Muestreo por conglomerados
etc
Etc.

DETERMINACIN DEL TAMAO DE MUESTRA :


Para determinar el tamao, primeramente hay que identificar la variable a estudiar
(Cuantitativa o cualitativa). Luego depende de cuatro factores o elementos que son los
siguientes:
PARA UNA VARIABLE CUANTITATIVA:
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La desviacin estndar varianza: que son valores que se obtienen por estudios
anteriores, por la muestra piloto o por la distribucin de la poblacin.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.
PARA UNA VARIABLE CUALITATIVA:
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%,
95% o 99% y que origina el valor de Z.
b. El error de estimacin (E): Que tambin es fijado por el investigador
c. La proporcin poblacional (P):
que son valores que se obtienen por estudios
anteriores, por la muestra piloto y si no se conoce asumir p=0.5.
d. El Tamao de la poblacin (N): Que generalmente no se conoce.

Curso: Uso de Excel en la Educacin

Pgina - 52 -

Escuela de Postgrado
Universidad Nacional de Trujillo

FORMULAS PARA DETERMINAR EL TAMAO DE MUESTRA:


Cualitativa
(Proporcin Poblacional)

VARIABLE
POBLACION
INFINITA
(Cuando no se
conoce N)
POBLACION
FINITA
(Cuando se
conoce N)

n0

Cuantitativa
(Promedio Poblacional)

Z 2 P(1 P)
E2

Z 2 P(1 P) N
E 2 ( N 1) Z 2 P(1 P)

n0

Z 2S 2
E2

Z 2S 2N
E 2 ( N 1) Z 2 S 2

Z= es el valor de la distribucin normal estandarizada para un nivel de confianza fijado por el investigador.
S= Desviacin estndar de la variable fundamental del estudio o de inters para el investigador. Obtenida
por estudios anteriores, muestra piloto, criterio de experto o distribucin de la variable de inters.
P= es la proporcin de la poblacin que cumple con la caracterstica de inters.
E= % del estimador o en valor absoluto (unidades). Fijada por el investigador.
N= Tamao de la poblacin.

PASOS A SEGUIR PARA DETERMINAR LA MUESTRA PTIMA:


A.
B.

Identificar eL tipo de variable a analizar.


Asumir que la poblacin es infinita y aplicar la formula respectiva sealadas
anteriormente. Esta muestra se llama muestra previa.

C.

Luego si se conoce el tamao de la poblacin N, obtener la fraccin de muestreo

n0
N
n0
Si
N
Si

n0
N

5% , entonces la muestra definitiva es n0 (muestra previa)


5% , entonces se ajusta la muestra.

D. Para ajustar la muestra se tiene que aplicar la siguiente formula:

n0
n0
1
N

, n es la muestra final.

ESTIMACION DE LOS VALORES A APLICAR EN LAS FORMULAS


A. Valor de Z: es el valor de la abcisa de la distribucin normal estandarizada
teniendo en cuenta el nivel de confianza fijado por el investigador, por lo tanto
este valor se encuentra en las tablas estadstica respectiva. Para hacer el trabajo
menos tedioso, presentamos a continuacin los diferentes valores de Z

Curso: Uso de Excel en la Educacin

Pgina - 53 -

Escuela de Postgrado
Universidad Nacional de Trujillo

TABLA N 01
VALORES DE LA DISTRIBUCIN NORMAL
ESTANDARIZADA(Z)
Nivel de confianza
(1- )
90%
95%
98%
99%

=
=
=
=

0.90
0.95
0.98
0.99

Valor Z

Nivel de significancia
( )

Bilateral
1.64
1.96
2.32
2.57

10% = 0.10
5% = 0.05
2% = 0.02
1% = 0.01

Unilateral
1.28
1.64
2.05
2.32

B. Clculo del Valor de P: Se calcula este valor cuando la variable de estudio es


cualitativa.
TABLA N 02
P
0.05
0.10
0.20
0.30
0.40
0.50
0.60
0.70
0.80
0.90
0.95

COMPORTAMIENTO DE P y Q
Q=1-P
0.95
0.90
0.80
0.70
0.60
0.50
0.40
0.30
0.20
0.10
0.05

PQ
0.0475
0.090
0.160
0.210
0.240
0.250
0.240
0.210
0.160
0.090
0.0475

C. Clculo del Valor de la varianza (Si la variable es CUANTITATIVA): este


valor es obtenida por estudios anteriores, muestra piloto, criterio de experto o
distribucin de la variable de inters.
D. Clculo del error de estimacin: Generalmente se asume 2%, 5%, y 8% de
error. Este valor es fijado por el investigador. Es la diferencia entre el parmetro
(poblacin) y el estimador (Muestra). Es decir: E

o o .Este error puede ser

absoluto o relativo. Si E=0.35 se denomina error absoluto. Si consideramos un


error del 10% de la media, es decir, E=10%( x )=0.10(3.5)=0.35 se denomina
error relativo.

APLICACIN UTILIZANDO MEGASTAT


APLICACIN 01:
Cul ser el tamao de corridas de produccin adecuado si se requiere estimar el tiempo
promedio para efectuar la produccin de un producto qumico con una confianza del
95%. Adems en un estudio piloto se encontr
el investigador asume E = 0.35 horas.

3.5

horas y s = 2.2 horas y adems

APLICANDO MEGASTAT:

Curso: Uso de Excel en la Educacin

Pgina - 54 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 02:
El Director de la seccin de control de la rabia del Dpto. de Salud Pblica de la Ciudad de
Chiclayo desea obtener una muestra de los registros de dicho Dpto. acerca de las
mordidas de perro reportadas durante el ao anterior, para estimar la edad media de las
personas mordidas. El director desea una seguridad del 95%, con un E=2.5 y en base a
estudios anteriores conoce que la desviacin estndar es de 15 aos. De que tamao
debe ser la muestra?
APLICACIN 04:
Se desea estimar el tiempo medio de duracin de artefactos elctricos (focos) producidos
por la empresa PHILIPSS. Se sabe por un estudio piloto de 10 focos que la desviacin
estndar del tiempo de duracin es de 20 meses. De que tamao debe ser la muestra
para estimar el tiempo medio de duracin con un error mximo de 4 meses y con una
confianza del 95%?.
APLICACIN 05:
Por estudios cientficos se sabe que el Coeficiente de Inteligencia promedio para jvenes
segn la escala de Weshler es de 100 puntos con una desviacin estndar de 15 puntos.
Determinar el tamao de muestra para realizar una investigacin sobre niveles de
inteligencia en la UPN, si se admite un error del 2% del promedio y una seguridad del
95%.
APLICACIN 06:
Se desea estimar la proporcin de jvenes de la ciudad de CHICLAYO que hacen uso de
Internet como mnimo una hora diaria con un 95% de confianza. De estudios anteriores
se conoce que P=0.70 y se desea un E = 5%. Cual debe ser el tamao de muestra.

Curso: Uso de Excel en la Educacin

Pgina - 55 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PARTE 8: PRUEBA DE HIPOTESIS


1. DEFINICIONES PRELIMINARES:
a. HIPTESIS: Es una respuesta a priori a un problema.
b. HIPTESIS ESTADSTICA: En un enunciado acerca del valor de un parmetro
poblacional.
c.
PRUEBA DE HIPOTESIS: Es un procedimiento basado en la informacin
muestral y en la teora de probabilidad, para determinar si una hiptesis
estadstica debe ser aceptada o rechazada.
2.

CLASES DE HIPOTESIS:
2.1. HIPOTESIS NULA.
Se denota por Ho.
Es una afirmacin o enunciado tentativo que se realiza acerca del valor de
un parmetro poblacional.
Por lo comn es una afirmacin acerca del parmetro de poblacin cuando
toma un valor especfico.
2.2. HIPOTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmacin o enunciado contraria a la presentada en la hiptesis
nula.

3.

ERRORES QUE SE COMETEN EN UNA PRUEBA DE HIPOTESIS:


Error Tipo I:

Se comete este error cuando se rechaza la hiptesis nula, cuando es verdadera.


Se denota por = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:

Se comete este error cuando se acepta la hiptesis, cuando es falsa.


Se denota por = P(Aceptar Ho/Ho es falsa)

Decisin
posible
Aceptar Ho

Rechazar Ho

Curso: Uso de Excel en la Educacin

Ho Verdadera
Decisin
correcta
Error tipo I

Ho Falsa
Error Tipo II
Decisin
Correcta

Pgina - 56 -

Escuela de Postgrado
Universidad Nacional de Trujillo

4.

TIPOS DE PRUEBAS DE HIPOTESIS:


A. PRUEBA BILATERAL O PRUEBA DE DOS COLAS
Ho:
H1:

= 0
0

/2

/2

B. PRUEBA UNILATERAL O PRUEBA DE UNA SOLA COLA:

Prueba de cola inferior o izquierda


Ho:
H 1:

=
<

0
0

Prueba de cola superior o derecha


Ho:
H 1:

5.

=
>

0
0

ETAPAS DE UNA PRUEBA DE HIPOTESIS:

Curso: Uso de Excel en la Educacin

Pgina - 57 -

Escuela de Postgrado
Universidad Nacional de Trujillo

6.

FORMULAS DE ALGUNOS ESTADSTICOS DE PRUEBA:

FORMULAS DE LOS ESTADISTICOS DE PRUEBA


I. PRUEBA DE HIPOTESIS PARA EL PROMEDIO POBLACIONAL:
C. Si n es mayor de 30 y la varianza poblacional es conocida:
Estadstico de prueba:

Zt

/2

(distribucin normal)

n
D. Si n es menor o igual a 30 y la varianza poblacional es desconocida:
Estadstico de prueba:

tt

s
n

t(

/ 2 , n 1)

(distribucin t de student)

II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL


Estadstico de prueba:

P
PQ
n

Zt

/2

Esta formula es tanto para muestras grandes como para muestras pequeas.
III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
C. Si las muestras son de tamao n1>30 y n2>30 (grandes) y adems las varianzas
poblacionales se CONOCEN:
Estadstico de prueba:

( x1

x2 )

n1

n2

Zt

/2

D. Si las muestras son de tamao n1<30 y n2<30 (pequeas) y adems las varianzas
poblacionales DESCONOCIDAS:

( x1

Sc

x2 )
1
n1

tt

1
n2

t(

/ 2 , n 1)

(distribucin t de student)

Donde :

sc

(n 1 1)s 12 (n 2 1)s 22
n1 n 2 2

, se llama varianza mancomunada

IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES:


B. Si p1 y p2 se determinan a partir de muestras:

( p1
p1 q1
n1

p2 )

p2 q2
n2

Zt

/2

Esta formula es tanto para muestras grandes como para muestras pequeas.

Curso: Uso de Excel en la Educacin

Pgina - 58 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PRUEBA DE HIPOTESIS CON MEGASTAT:

PRUEBA DE HIPOTESIS PARA LA MEDIA:

PRUEBA DE HIPTESIS PARA LA PROPORCION:

Curso: Uso de Excel en la Educacin

Pgina - 59 -

Escuela de Postgrado
Universidad Nacional de Trujillo

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:

PRUEBA T DE STUDENT PARA MUESTRAS INDEPENDIENTES:

PRUEBA Z PARA COMPARAR PROPORCIONES:

Curso: Uso de Excel en la Educacin

Pgina - 60 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN UTILIZANDO MEGASTAT:


APLICACIN 01:
Las ganancias en miles de dlares de 10 centros educativos de nuestro medio han
producido la siguiente informacin:
15.8, 12.7, 13.2 16.9, 10.6, 18.8, 11.1, 14.3, 17.0 y 12.5.
Otro conjunto de centros educativos fueron evaluados tambin respecto a sus ganancias
en miles dlares, obteniendo los siguientes resultados:
24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8 y 22.5
Realizar una prueba de hiptesis para verificar si las ganancias de este ltimo grupo es
superior a las ganancias de las empresas de nuestro medio. Para probar esta hiptesis
utilice un = 0.05.
SOLUCION: (Aqu se utiliza la prueba T para muestras independientes)

Hypothesis Test: Independent Groups (t-test, pooled variance)


T1
14.290
2.738
10

T2
22.088 mean
1.637 std. dev.
8 n
16
-7.7975
5.3911
2.3219
1.1014
0

df
difference (T1 - T2)
pooled variance
pooled std. dev.
standard error of difference
hypothesized difference

-7.08 t
2.61E-06 p-value (two-tailed)

Curso: Uso de Excel en la Educacin

Pgina - 61 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 02::
JORGE MELENDEZ, Administrador deL BCP est interesado en saber si existe diferencia
significativa entre los tiempos de atencin al cliente de los mismos empleados que
trabajan en los dos turnos: maana y tarde. Al respecto, ayer personalmente registr los
tiempos que utilizaron los empleados para atender a sus clientes en ambos turnos. Los
tiempos en minutos que registr fueron los siguientes:
Maana 2.10
4.10
4.70
3.70
6.00
3.90
Tarde
4.00
4.50
3.70
4.00
4.10
3.45
A la luz de estos resultados, A qu conclusin lleg Jorge Melndez?. Utilice un nivel de
confianza del 95%.
SOLUCION: (Aqu se utiliza la prueba T para muestras pareadas)

Hypothesis Test: Paired Observations


0.00000
4.08333
3.95833
0.12500
1.30987
0.53475
6
5

hypothesized value
mean Maana
mean Tarde
mean difference (Maana - Tarde)
std. dev.
std. error
n
df

0.23 t
.8244 p-value (two-tailed)

Curso: Uso de Excel en la Educacin

Pgina - 62 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 03:
Un fabricante de microcircuitos esta interesado en determinar si dos diseos diferentes
producen un flujo de electricidad equivalente. El ingeniero responsable ha obtenido la
siguiente informacin:
Diseo 1
20.3 22.5 23.3 29.1 26.5 22.1 20.8 28.6 23.3 21.5
Diseo 2

23.5

26.5

23.6

21.5

26.4

27.9

22.5

25.5

26.7

23.9

Diseo 3

29.1

26.5

22.1

25.6

23.5

26.5

25.5

26.7

20.3

22.5

Diseo 4

20.3

22.5

25.5

26.7

28.9

17.3

21.5

20.4

27.9

26.5

Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de


electricidad entre los dos diseos.
SOLUCION: (Aqu se utiliza anlisis de varianza)

One factor ANOVA


Mean

Std. Dev

23.80

10

3.163 Diseo 1

24.80

10

2.089 Diseo 2

24.83

10

2.657 Diseo 3

23.75

10

3.865 Diseo 4

24.30

40

2.944 Total

ANOVA table
Source

SS

df

MS

p-value

10.833

3.6110

0.40

0.7558

Error

327.266

36

9.0907

Total

338.099

39

Treatment

Comparison of Groups
30.00
25.00
20.00
15.00
Diseo 1

Curso: Uso de Excel en la Educacin

Diseo 2

Diseo 3

Diseo 4

Pgina - 63 -

Escuela de Postgrado
Universidad Nacional de Trujillo

APLICACIN 04:
Una compaa desea estudiar el efecto que tiene la pausa para el caf, sobre la
productividad de sus obreros. Selecciona 6 obreros y mide su productividad en un da
cualquiera (sin pausa para el caf), y luego mide la productividad de los mismos 6
obreros en un da que se concede la pausa para el caf. Las cifras que miden la
productividad son las que siguen: Con = 0,05. A qu conclusin llegar la compaa?.
TRABAJADOR
1
2
3
4
5
6
Sin pausa
23
35
29
33
43
32
Con pausa
28
38
29
37
42
30

APLICACIN 05:
En fecha reciente fue descubierto un neurotransmisor cerebral endgeno llamado
galanina. Segn parece, ste afecta de manera directa el deseo de ingerir alimentos con
un alto contenido de grasa. Mientras ms alta sea la cantidad de este neurotransmisor de
origen natural en un individuo, mayor ser el apetito que este sienta por la comida con
alto contenido de grasa. Recientemente una compaa farmacutica desarroll una
sustancia experimental que bloquea la galanina sin alterar el apetito por otros alimentos
ms saludables (es decir con menos grasas). Un neurocientfico piensa que esa sustancia
experimental ser muy til para controlar la obesidad. Se realiza un experimento para lo
cual se elige 10 mujeres obesas todas ellas voluntarias y se les administra el
medicamento experimental durante 06 meses. Se registra el peso inicial y el peso final
(despus de 6 meses) de cada persona. Los pesos se presentan en la siguiente tabla.
Probar si el uso del medicamento experimental produce prdida de peso en las personas.
Utilice un nivel de significancia de 0.05.
Persona
PESO INCIAL
PESO FINAL
(libras)
(libras)
1
165
145
2
143
137
3
175
170
4
135
136
5
148
141
6
155
138
7
158
137
8
140
125
9
172
161
10
164
156

Fin
Curso: Uso de Excel en la Educacin

Pgina - 64 -

Potrebbero piacerti anche