Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Sistema de Gestión
de la Investigación
UPN
ESTADÍSTICA
PARA
PROYECTOS DE
INVESTIGACIÓN
Profesor: MsC. Luis Alberto Rubio Jácobo
Este manual pretende ser un material de consulta básica para docentes y estudiantes de
las diferentes carreras profesionales de nuestra universidad, en cuanto al uso adecuado
de la estadística, requerida en diversos momentos del proceso investigativo.
Esperamos que con su uso, el presente manual vaya enriqueciéndose y haciéndose más
familiar para todos los que de una u otra manera estamos involucrados con la
investigación en todas sus expresiones.
LA ESTADÍSTICA .............................................................................................................................. 8
1. DEFINICIÓN. .................................................... 8
2. CLASIFICACIÓN DE LA ESTADÍSTICA ................................ 8
DISEÑOS DE INVESTIGACIÓN ........................................................................................................ 8
I.1. DISEÑOS DE INVESTIGACIÓN EN EL ENFOQUE CUANTITATIVO: ........... 8
I.1.1 DISEÑOS NO EXPERIMENTALES ............................... 9
A. DISEÑOS TRANSECCIONALES O TRANSVERSALES ............. 9
A.1. DISEÑOS EXPLORATORIOS ............................ 9
A2. DISEÑOS DESCRIPTIVOS .............................. 9
A3. DISEÑOS DESCRIPTIVOS ............................. 10
B. DISEÑOS LONGITUDINALES O EVOLUTIVOS .................. 10
B1. DISEÑOS DE TENDENCIA ............................. 10
B2. DISEÑOS DE EVOLUCIÓN DE GRUPO (cohorte) ........... 11
B3. DISEÑOS DE PANEL ................................. 11
I.1.2 DISEÑOS EXPERIMENTALES ................................. 11
A. DISEÑOS PRE-EXPERIMENTALES ........................... 11
A1. DISEÑO DE UN SOLO GRUPO CON UNA SOLA MEDICIÓN: ...... 12
A2. DISEÑO DE PREPRUEBA-POSPRUEBA CON UN SOLO GRUPO 12
B. EXPERIMENTOS PUROS .................................. 12
B1. DISEÑO DE POSPRUEBA ÚNICAMENTE Y GRUPO CONTROL .. 12
B2. DISEÑO CON PREPRUEBA-POSPRUEBA Y GRUPO CONTROL 12
B3. DISEÑO DE CUATRO GRUPOS DE SALOMÓN ............................. 13
B4. DISEÑOS EXPERIMENTALES DE SERIES CRONOLÓGICAS
MÚLTIPLES ....................................................................................... 13
B5. DISEÑOS FACTORIALES ................................................................ 13
C. CUASI-EXPERIMENTOS ................................... 13
C1. DISEÑO DE POSPRUEBA ÚNICAMENTE Y GRUPOS INTACTOS13
C2. DISEÑO CON PREPRUEBA-POSPRUEBA Y GRUPOS INTACTOS
........................................................................................................... 13
DEFINICIONES ESTADÍSTICAS .................................................................................................... 14
1. UNIVERSO. .................................................... 14
2. POBLACIÓN. ................................................... 14
A. SEGÚN SU EXTENSIÓN: ....................................... 14
B. SEGÚN SU ÁMBITO O NATURALEZA: ............................. 14
3. MUESTRA. .................................................... 14
4. UNIDAD DE ESTUDIO. ............................................ 14
5. VARIABLE. .................................................... 14
2. CLASIFICACIÓN DE LA ESTADÍSTICA
La Estadística se clasifica de la siguiente manera:
2.1. Estadística Descriptiva
Es el área de la Estadística que describe y analiza una población, sin pretender sacar
conclusiones de tipo general. Es decir, las conclusiones obtenidas son válidas sólo para
dicha población.
2.2. Estadística Inferencial
Es el área de la Estadística, cuyo propósito es inferir o inducir leyes de comportamiento de
una población, a partir del estudio de una muestra. Es decir, las conclusiones obtenidas a
partir de una muestra, son válidas para toda la población.
PARTE I:
DISEÑOS DE INVESTIGACIÓN
Según Hernández, Fernández y Baptista (2006), una vez que se ha realizado el planteamiento del
problema, se ha definido el alcance de la investigación y se formularon las hipótesis, se debe
visualizar la manera práctica y concreta de responder a las interrogantes de investigación, y
cumplir con los objetivos propuestos.
Para esto se debe seleccionar o desarrollar uno o más diseños de investigación y aplicarlos al
contexto particular de cada estudio.
El diseño se refiere al plan o estrategia concebida para obtener la información que se desea.
En el enfoque cualitativo, el investigador utiliza el diseño o diseños para analizar la
certeza de las hipótesis formuladas en un contexto en particular o para aportar evidencia
respecto a los lineamientos de la investigación.
En el enfoque cuantitativo, la calidad de una investigación se encuentra relacionada con
el grado en que se aplica el diseño tal y como fue preconcebido, aunque en algunos casos
el diseño se debe ajustar ante posibles cambios en la situación.
Recolección de
datos única
Ejemplos:
1. En las encuestas pre-electorales de opinión sobre las tendencias electorales de
la población, su objetivo es describir –en una elección específica- el número de
electores que se inclinan por los diferentes candidatos contendientes, es decir se
centran en la descripción de las preferencias del electorado.
2. En una investigación para evaluar los niveles de satisfacción de los clientes de
CLARO, su propósito es describir la satisfacción, no busca evaluar si las mujeres
están más satisfechas que los hombres, ni asociar el nivel de satisfacción con la
actividad laboral de los usuarios.
A. DISEÑOS PRE-EXPERIMENTALES
B. EXPERIMENTOS PUROS
Los experimentos puros son aquellos que reúnen los dos requisitos para logar el
control y la validez interna: 1) grupos de comparación, y 2) equivalencia de grupos.
C. CUASI-EXPERIMENTOS
En los diseños cuasi-experimentales también se manipulan deliberadamente, al
menos, una variable independiente para analizar su efecto y relación con una o
más variables dependientes. Se diferencian de los experimentos “puros” en el
grado de seguridad o confiabilidad que pueda tenerse sobre la equivalencia inicial
de los grupos. En estos diseños, los sujetos no se asignan al azar a los grupos
ni se emparejan, sino que dichos grupos ya están formados antes del
experimento: son grupos intactos.
DEFINICIONES ESTADÍSTICAS
1. UNIVERSO.
Es el conjunto de individuos, objetos o entes que tienen características comunes, definidas en
forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de de pacientes, conjunto de
clientes, conjunto de proveedores, conjunto de viviendas, conjunto de establecimientos, conjunto de
documentos, etc.; de una determinada región o zona en un tiempo determinado.
2. POBLACIÓN.
Es un conjunto grande y completo de individuos, elementos o unidades que presentan como
mínimo una característica en común y observable. Para definir una población esta debe
contener los siguientes elementos: CONTENIDO, ESPACIO Y TIEMPO.
Al número de elementos de una población de denota por “N”.
Una población puede clasificarse de la siguiente manera:
A. SEGÚN SU EXTENSIÓN:
Población Finita: es aquella que tiene un determinado número de elementos.
Población Infinita: es aquella cuyos elementos no se pueden contar.
3. MUESTRA.
Es una parte o un subconjunto de la población en estudio. También se puede decir que es
una colección de unidades de muestreo seleccionados de un marco muestral o de varios
marcos muestrales. Al número de elementos de la muestra se denota por “n”.
Una muestra tiene las siguientes características:
a. Es representativa.
b. Es adecuada.
c. Homogénea.
4. UNIDAD DE ESTUDIO.
Es el animal persona o cosa de quien se dice algo. Es el elemento quien nos va a dar la
información. Es el individuo u objeto del cual se toman las mediciones u observaciones.
Ejemplos:
Un docente, un auxiliar de educación, un votante, una factura, una empresa, una botella de cerveza,
una universidad, una vaca, una gota de sangre, etc.
5. VARIABLE.
Una variable es una característica de estudio de una población. Una variable es lo que se
quiere evaluar en una investigación. Las características toma diferentes valores que varían de
individuo a individuo o de objeto a objeto. Aquellas características que permanecen
Ejemplos:
Unidad de estudio Variable
Estudiante Peso, talla, edad, ci, número de hermanos,
raza, color de ojos, tipo de sangre, etc.
Empresa Ganancia, costos, producción, número de
trabajadores, numero de computadoras, etc.
PYME Número de trabajadores, años de
funcionamiento, ganancias, etc
Variable
Cualidad Cantidad
O o
Cualitativa Atributo Cuantitativa número
6. PARÁMETRO.
Es un valor, una cantidad, un indicador que se obtiene con información de la población.
Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporción poblacional, etc.
7. ESTIMADOR.
Es un valor, una cantidad, un indicador que se obtiene con información de la muestra. Dentro
de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporción muestral, etc.
OBSERVACIÓN:
La observación es una técnica que implica seleccionar ver y registrar sistemáticamente, la
conducta y características de seres vivos, objetos o fenómenos. La observación de la
conducta humana es una técnica de recolección de datos muy utilizada que puede llevarse
a cabo de diferentes formas:
a. Observación participativa: El observador participa en la situación que observa
b. Observación no participativa: El observador no participa en la situación que observa
Las observaciones pueden servir para diferentes propósitos. Pueden dar información
adicional y más confiable de la conducta de las u.e. que las entrevistas o los cuestionarios.
Los cuestionarios pueden ser incompletos ya que se pueden olvidar algunas preguntas o
porque los entrevistados olvidan o no desean contestar algunas cosas. Con la observación
se puede, entonces, verificar la información recolectada (especialmente sobre temas como
alcoholismo, drogadicción, sida,) pero también puede ser una fuente primaria de
información (observación sistemática de los juegos de los niños).
La observación de la conducta humana puede formar parte de algún estudio, pero como
consume tiempo se usa con mayor frecuencia en estudios de pequeña escala.
ENTREVISTA:
La entrevista es una técnica de recolección de datos que involucra el cuestionamiento oral
de los entrevistados ya sea individualmente o en grupo. Las respuestas a las preguntas
durante la entrevista pueden ser registradas por escrito o grabadas en una cinta. La
entrevista puede conducirse con diferentes grados de flexibilidad.
Las entrevistas utilizan una cédula para asegurar que se discuten todos los puntos, pero
dando suficiente tiempo y permitiendo seguir cualquier orden. El entrevistador puede hacer
preguntas adicionales para obtener tanta información adicional como sea posible, Las
preguntas son abiertas y no hay restricciones para las respuestas.
Este método poco estructurado de hacer las preguntas puede ser útil para entrevistas
individuales o grupales con informantes claves.
Un método de entrevista flexible es útil si el investigador sabe poco del problema o de la
situación que esta investigando. Se aplica en estudios exploratorios y en los estudios de
caso.
ENCUESTAS:
Hoy en día la palabra "encuesta" se usa más frecuentemente para describir un método de
obtener información de una muestra de individuos. Una "encuesta" recoge información de
una "muestra”. Las encuestas pueden ser usadas para estudiar poblaciones humanas o no
humanas (por ejemplo, objetos animados o inanimados, animales, terrenos, viviendas).
Las encuestas pueden ser clasificadas por su método de recolección de datos: las
encuestas por correo, telefónicas y entrevistas en persona son las más comunes. En los
métodos más nuevos de recoger datos, la información se entra directamente a la
computadora ya sea por un entrevistador adiestrado o aún por la misma persona
entrevistada. Un ejemplo bien conocido es la medición de audiencias de televisión usando
aparatos conectados a una muestra de televisores que graban automáticamente los
canales que se observan
PARTE III:
1. DEFINICIÓN DE MUESTREO
Es una herramienta de la investigación científica, su función básica es determinar qué parte
de la realidad en estudio (población o universo) debe de examinarse con la finalidad de hacer
inferencias sobre el TODO de la que procede.
El muestreo estadístico es un enfoque sistemático que se refiere al proceso de selección de
los elementos, sujetos o casos de una población. Para que el muestreo esté bien realizado es
necesario que los elementos escogidos representen bien a toda la población. Si la muestra no
cumple este cometido se dice que la muestra es sesgada o tendenciosa; en el caso
contrario, cuando la muestra ha sido bien seleccionada, se habla de muestra representativa.
B. MARCO MUESTRAL.
Es una lista o registro actualizado de todas las unidades de la población, de manera que
puedan ser ordenadas numéricamente desde el primer elemento hasta el último elemento
(N) de la población. Las diferentes especificaciones que se tenga del marco muestral
definirán su alcance geográfico, periodo de estudio y su fuente. De este marco muestral se
seleccionarán los elementos de la muestra.
Ejemplo:
Base de datos de pacientes atendidos en el Hospital Regional Docente. Año 2000.
Historias Clínicas del Servicio de Pediatría del HRDT.
Directorio de los médicos del Hospital
Plano de viviendas del distrito de Trujillo.
Listado de los alumnos matriculados en la UNT-2004.
Listado de las facturas de las ventas del primer trimestre de una Farmacia.
Listado de todas las farmacias del Departamento de La Libertad.
C. ERROR DE ESTIMACIÓN:
El error de estimación es la diferencia que existe entre el valor de una estimación muestral
y el valor del parámetro obtenido de la población.
Esta clase de error es llamado también error de muestreo.
-E +
E
Ejemplo: x+z s+ -
1 /
2 xst
Generalmente este error es desconocido, por lo tanto el investigador tienen fijar este error
(variación máxima entre el estimador y el parámetro).
Esta diferencia recibe el nombre de Precisión del estimador o error tolerable.
Este error se expresar en valores absolutos: 2 años, 3 años o en términos relativos:
5%, 8 %, 0.002.
D. ERROR NO MUESTRAL:
Estos errores, son llamados también errores ajenos al muestreo o errores de no muestreo.
No se pueden medir fácilmente, y aumentan a medida que aumenta el tamaño de la
muestra. Los tipos de errores no muestrales que suelen presentarse son:
Definición equivocada del problema,
Definición defectuosa de la población;
Marco muestral imperfecto o desactualizado,
La no-respuesta,
El sesgo de respuesta,
Diseño pobre del cuestionario, etc.
Sin embargo, los errores ajenos al muestreo pueden ser controlados mediante una
atención cuidadosa en la definición del problema, en la construcción de los instrumentos
de medición (cuestionario) y en los detalles del trabajo de campo.
Estos errores tienen una presencia fuerte en las encuestas de opinión.
F. NIVEL DE ERROR:
Error Alfa ():
Es la probabilidad de rechazar incorrectamente una Hipótesis cuando es verdadera, a esta
probabilidad se le denomina “VALOR P”. También se le llama error tipo I.
G. POTENCIA (1-):
Es la probabilidad de llegar a la conclusión de que había una diferencia cuando
efectivamente así era.
4. TIPOS DE MUESTREO
A. MUESTREO PROBABILÍSTICO:
Procedimiento de Selección
El procedimiento de selección de una muestra estratificada consiste en:
(i)Dividir la población en L estratos mutuamente excluyentes y colectivamente
exhaustivos, siendo (L>1). Cada estrato de la población tendrá N i unidades, y la
población total consta de:
L
N Ni
i 1
Cualitativa Cuantitativa
VARIABLE
(Proporción Poblacional) (Promedio Poblacional)
Z 2 P (1 P ) Z 2S 2
n0 n0
POBLACIÓN INFINITA
(Cuando no se conoce N)
E2 E2
Z 2 P (1 P ) N Z 2S 2N
POBLACIÓN FINITA n n
(Cuando se conoce N) E 2 ( N 1) Z 2 P (1 P ) E 2 ( N 1) Z 2 S 2
Columna
01-05 06-10 11-15 16-20 21-25 26-30 31-35 36-40 41-45 46-50
Fila
PUNTO DE ARRANQUE:
A (a , b)
PROCEDIMIENTO
El procedimiento de selección de una muestra sistemática consiste en:
Tener el Marco Muestral cuyas unidades deben ser ordenados en magnitud de
acuerdo con algún esquema (población ordenada).
En base al orden se establece la enumeración desde 1 hasta N.
PARTE IV:
Cuando se va a analizar los datos obtenidos a través de diseños descriptivos, las técnicas
estadísticas a utilizar son las siguientes:
1. Cuadros de Distribución de frecuencias
2. Gráficos estadísticos
3. Medidas estadísticas descriptivas
1.1. DEFINICIÓN:
Un cuadro de distribución de frecuencias, es una tabla resumen de un conjunto de
datos que muestra el comportamiento o distribución de la variable en estudio en forma
rápida y resumida.
Aún cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es común seguir algunos pasos que de alguna forma homogenizan
criterios y ayudan a los fines didácticos.
Para realizar este análisis se tienen que tener en cuenta el tipo de variable que se está
evaluando.
b. Intervalos de clase:
Los intervalos son subconjuntos de la recta real Ron que están definidos por un
límite menor o inferior Li y un límite mayor o superior Ls.
c. Frecuencia:
d. Marca de clase:
Se denota por “Yi”. Es el promedio de los valores correspondientes a los límites
inferior y superior de cada uno de los intervalos determinados.
2. GRÁFICOS ESTADÍSTICOS:
2.1 DEFINICIÓN
Excel puede crear gráficos a partir de datos previamente seleccionados en una hoja de
cálculo. El usuario puede “incrustar” un gráfico en una hoja de cálculo, o crear el gráfico
en una hoja especial para gráficos. En cada caso el gráfico queda vinculado a los datos
a partir de los cuales fue creado, por lo que si en algún momento los datos cambian, el
gráfico se actualizará de forma automática. Los gráficos de Excel contienen muchos
objetos, títulos, etiquetas en los ejes que pueden ser seleccionados y modificados
individualmente según las necesidades del usuario.
Para crear un gráfico con el Asistente para Gráficos, se deben seguir los siguientes
pasos:
1. Seleccionar los datos a representar.
2. Ejecutar el comando Insertar / Gráfico o hacer clic en el botón
Luego debemos configurar los aspectos que conciernen a la presentación del gráfico,
aportando una vista preliminar del mismo. Así, se determinan el título, las inscripciones
de los ejes, la apariencia de éstos, la leyenda, la aparición o no de tabla de datos y los
rótulos. Las opciones de <Atrás, Siguiente> y Finalizar son las mismas que en los
otros cuadros.
3. MEDIDAS ESTADÍSTICAS
La estadística descriptiva es una técnica que consiste en obtener indicadores que describen el
comportamiento de un conjunto de datos. Dentro de estas medidas estadísticas tenemos:
A. Las medidas de Posición: Dentro de estas tenemos:
a. Medidas de tendencia central: Media, Moda, Mediana.
b. Medidas de localización: cuartiles, deciles y percentiles.
B. Las medidas de variación: rango, varianza, desviación estándar, coeficiente de variación.
C. Las medidas de deformación: asimetría y kurtosis.
A. MEDIA ARITMÉTICA:
Se denota por x
Es la medida estadística más fácil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B. MEDIANA:
Se denota por Me.
C. MODA:
Se denota por Mo.
La moda es el valor que más se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos Amodal
b. 1 moda Unimodal.
c. 2 modas Bimodal
d. 3 a más modas Multimodal
Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
A. CUARTILES:
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir,
cada sector tiene el 25% de los datos.
Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
B. DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir,
cada sector tiene el 10% de los datos.
C. PERCENTILES:
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, … , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir,
cada sector tiene el 1% de los datos.
Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
A. RANGO:
Se denota por R y la medida de variabilidad más fácil de calcular.
Es la diferencia que existe entre el valor máximo y el valor mínimo del conjunto
de datos.
B. VARIANZA:
Mide la variabilidad de un conjunto de datos respecto a un valor
central(promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es
ilógica su interpretación.
Para calcular la media aritmética se utilizan las formulas adecuadas ya sea sin
son datos agrupados o datos no agrupados.
C. DESVIACIÓN ESTANDAR:
Mide la variabilidad de un conjunto de datos respecto a su valor central pero en
unidades originales.
Esta es la medida de variabilidad que tiene una interpretación lógica.
Se obtiene al sacar la raíz cuadrada de la varianza.
A. ASIMETRIA:
La asimetría se entiende como la deformación horizontal de un conjunto de
datos.
Para conocer esta asimetría se calcula el coeficiente de asimetría As.
En un conjunto de datos pueden presentar los siguientes casos:
a. As= 0, el conjunto de datos es simétrica.
b. As<0, el conjunto de datos es asimétrica negativa.
c. As>0, el conjunto de datos es asimétrica positiva.
X Mo 3( X Me ) Q3 2Q2 Q1
As As As
S S Q3 Q1
B. KURTOSIS:
Se entiende por Kurtosis a la deformación vertical de un conjunto de datos, es
decir, mide el apuntamiento o achatamiento de un conjunto de datos.
Para conocer qué tipo de asimetría tiene un conjunto de datos, se utilizan las
siguientes formulas:
M4
K2 3
(s) 2
1. ANALISIS DE CORRELACIÓN:
n n n
n X iYi X i Yi
r n
i 1
n
i 1
n
i 1
n
n X ( X i )
i
2 2
n Yi ( Y1 ) 2
2
i 1 i 1 i 1 i 1
Interpretación:
NEGATIVA POSITIVA
2. ANÁLISIS DE REGRESIÓN
Esta relación funcional entre las variables, es una ecuación matemática de la forma
Y= A + B X, que recibe el nombre también de Función de Regresión o Modelo de
Regresión.
PASOS A SEGUIR:
b. Aplicar el método de los Mínimos Cuadrados Ordinarios para estimar los parámetros
de la ecuación. Las fórmulas son las siguientes:
n n n
n X i Yi X i Yi
B i 1
n
i 1
n
i 1
A Y BX
n X ( X i )
i
2 2
i 1 i 1
Y = A + B (Xo)
Y 0 1 X 1 2 X 2 ... K X K
Para encontrar este modelo, es decir, estimar sus coeficientes también se utiliza el
Método de los Mínimos Cuadrados Ordinarios.
Los elementos de este modelo de regresión múltiple son los siguientes:
Y es la variable dependiente o variable respuesta.
A las Xs se le llama variables independientes.
Bs se les llama coeficientes de regresión.
En el ARLM se prueban las siguientes Hipótesis:
Ho: Los Bs son iguales a cero (No hay efecto de las variables independientes en Y);
H1: Los Bs son diferentes de cero (Por lo menos un X influye en Y).
Para dar respuesta a esta Hipótesis se utiliza el análisis de varianza.
INFERENCIA ESTADÍSTICA
ESTIMACIÓN ESTADÍSTICA
A. ESTIMACIÓN PUNTUAL:
Es aquel único valor que se obtiene de la muestra, es decir, que para su cálculo se debe tener
información muestral. Las formulas para calcular o realizar estas estimaciones son las
siguientes:
PARÁMETRO 2 P
n n
ESTIMACIÓN x i (x i x )2
Pˆ p
a
PUNTUAL ̂ x i 1
ˆ s
2 2 i 1
n
n n 1
B. ESTIMACIÓN INTERVÁLICA:
Al realizar una estimación, siempre se va a cometer un error. Entonces, cuando estimamos un
parámetro nunca va a ser exacto, ese valor será mayor o menor al verdadero. Entonces se
obtendrá un intervalo de valores posibles. Ese intervalo se llama estimación interválica. A esa
diferencia mayor o menor se llama error de estimación, el cual está en relación directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La
estimación interválica para un parámetro en general, está dada por:
ˆ Z / 2 ˆ Z / 2
Error de Estimación Error de estimación
A. Si las muestras son de tamaño n1>30 y n2>30 (grandes) y además las varianzas
poblacionales se CONOCEN:
12 22
1 2 : ( x1 x 2 ) Z / 2
n1 n2
B. Si las muestras son de tamaño n1<30 y n2<30 (pequeñas) y además las varianzas
poblacionales DESCONOCIDAS:
1 1
1 2 : ( x1 x2 ) t( / 2 , n 1 n2 2) sc2 ( )
n1 n2
Donde :
( n 1 1)s 12 ( n 2 1)s 22
sc
2
, se llama varianza mancomunada
n1 n 2 2
IV. INTERVALO DE CONFIANZA PARA LA DIFERENCIA DE PROPORCIONES:
PRUEBA DE HIPÓTESIS
Para realizar un análisis de pruebas de hipótesis hay que conocer algunas definiciones
preliminares que debemos conocer:
A. DEFINICIONES PRELIMINARES:
a. HIPÓTESIS: Es una respuesta a priori a un problema.
b. HIPÓTESIS ESTADÍSTICA: En un enunciado acerca del valor de un parámetro
poblacional.
c. PRUEBA DE HIPÓTESIS: Es un procedimiento basado en la información muestral y en
la teoría de probabilidad, para determinar si una hipótesis estadística debe ser aceptada
o rechazada.
B. CLASES DE HIPÓTESIS:
a. HIPÓTESIS NULA.
Se denota por Ho.
Es una afirmación o enunciado tentativo que se realiza acerca del valor de un
parámetro poblacional.
Por lo común es una afirmación acerca del parámetro de población cuando toma
un valor específico.
b. HIPÓTESIS ALTERNATIVA.
Se denota por H1.
Es una afirmación o enunciado contraria a la presentada en la hipótesis nula.
Error Tipo I:
•Se comete este error cuando se rechaza la hipótesis nula, cuando es verdadera.
•Se denota por α = P(Rechazar Ho/Ho es verdadera)
Error Tipo II:
•Se comete este error cuando se acepta la hipótesis, cuando es falsa.
•Se denota por β = P(Aceptar Ho/Ho es falsa)
Decisión
Ho Verdadera Ho Falsa
posible
Aceptar Ho Decisión Error Tipo II
correcta
Rechazar Ho Error tipo I Decisión Correcta
PASOS:
Plantear la hipótesis nula y alternativa.
Especificar el nivel de significancia (o confianza) que se va a
utilizar.(Generalmente la plantea el investigador)
Elegir el estadístico de prueba que debe ser especificado en términos de
un estimador del parámetro a probar.
Establecer el valor o valores críticos para rechazar o aceptar Ho. (Se
encuentran en la tabla de probabilidades)
Determinar la Región de Aceptación y de Rechazo, en función a los
valores críticos y tomar la decisión de aceptar o rechazar Ho.
Dar la conclusión respectiva
Para resolver prueba de hipótesis con EXCEL hay que tener presente lo siguiente. En Excel
solamente se puede evaluar hipótesis de comparación de medias en la cual se puede utilizar
la prueba de T de Student o la prueba Z.
Se utilizara la prueba T de Student cuando la varianza se desconoce y además la muestra
es pequeña (n≤30). Aquí hay que distinguir dos casos:
a. Cuando se supone que la varianza es igual en ambos grupos.
b. Cuando se supone que la varianza es diferente en ambos grupos.
PRUEBA Z:
Se utilizará la prueba Z cuando la varianza se conoce y cuando la muestra es grande (n>30).