Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
LA ESTADISTICA
1. DEFINICIÓN:
La Estadística es una ciencia que nos ofrece un conjunto de métodos y técnicas para recopilar,
organizar, presentar, analizar e interpretar un conjunto de datos respecto a variables en estudio
de una población, con el fin de obtener conclusiones y tomar decisiones sobre determinados
hechos o fenómenos en estudio.
La estadística es una rama de la matemática y es parte del método científico. En la actualidad,
para hacer investigación científica se necesita conocer de estadística.
2. CLASIFICACION DE LA ESTADÍSTICA
La Estadística se clasifica de la siguiente manera:
2.1. Estadística Descriptiva
Es aquella área de la Estadística que describe y analiza una población, sin pretender
sacar conclusiones de tipo general. Es decir, las conclusiones obtenidas son validas solo
para dicha población.
Bioestadística
Se entiende como bioestadística la aplicación de técnicas estadísticas a las ciencias de
la naturaleza, entre las que se encuentran todas las ciencias de la salud. Para que esta
definición tenga sentido habremos de entender plenamente que es la estadística
3. DEFINICIONES PRELIMINARES:
3.1. UNIVERSO:
Es el conjunto de individuos, objetos o entes que tienen características comunes,
definidas en forma general en un espacio y tiempo.
Ejemplo:
Conjuntos de alumnos, conjunto de docentes universitarios, conjunto de pacientes,
conjunto de clientes, conjunto de proveedores, conjunto de viviendas, conjunto de
establecimientos, conjunto de documentos, etc.; de una determinada región o zona en un
tiempo determinado.
3.2. POBLACIÓN:
Es un conjunto grande y completo de individuos, elementos o unidades que presentan
como mínimo una característica en común y observable. Para definir una población esta
debe contener los siguientes elementos: contenido, espacio y tiempo. Al número de
elementos de una población de denota por “N”. Una población puede clasificarse de la
siguiente manera:
3.2.1. Según su extensión:
Población Finita: Es aquella que tiene un determinado número de elementos.
Población Infinita: Es aquella cuyos elementos no se pueden contar.
3.2.2 Según su ámbito o naturaleza:
Población Objeto: Está dada por los elementos que forman la población.
Población Objetivo: Está dada por la información que da la población objeto
Nota: De un universo se pueden desprender muchas poblaciones, pero operativamente
se pueden hablar indistintamente como población o universo.
3.3. MUESTRA
Es una parte o un subconjunto de la población en estudio. También se puede decir que
es una colección de unidades de muestreo seleccionados de un marco muestral o de
varios marcos muéstrales. Al número de elementos de la muestra se denota por “n”.
Una muestra tiene las siguientes características:
a. Es representativa.
b. Es adecuada.
MUESTREO
Es una técnica estadística por la cual se realizan inferencias o generalizaciones para
una población examinando solo una muestra de ella.
Es una técnica empleada para seleccionar elementos de una población.
Su propósito es proporcionar diferente tipo de información estadística de naturaleza
cuantitativa o cualitativa.
Por su gran importancia los investigadores lo utilizan en los diferentes campos de saber
y también lo usamos en la vida diaria.
3.5. OBSERVACIONES:
Estadísticamente son los datos que se recolectan para un estudio. Una observación o
dato es cuando una variable en si toma un valor especifico.
3.6. VARIABLE:
Una variable es una característica de estudio de una población. Una variable es lo que
se quiere evaluar en una investigación. Las características toma diferentes valores que
varían de individuo a individuo o de objeto a objeto. Aquellas características que
permanecen inalterables en las unidades de estudio reciben el nombre de constantes.
Generalmente, las variables se designan con las últimas letras mayúsculas del
abecedario: X, Y, Z; y los valores de las variables se designan con letras minúsculas: xi
, yi , etc.
Variable:
temperatura
T = 28 ºC
(Dato)
Variable
Cualidad Cantidad
Cualitativa O Cuantitativa o
Atributo número
Ejemplos:
Unidad de estudio Variable
Estudiante Peso, talla, edad, ci, número de hermanos, raza,
color de ojos, tipo de sangre, etc.
Empresa Ganancia, costos, producción, número de
trabajadores, numero de computadoras, etc.
PYME Número de trabajadores, años de funcionamiento,
ganancias, etc.
3.7. PARAMETRO:
Es un valor, una cantidad, un indicador que se obtiene con información de la población.
Dentro de estos tenemos:
a. El promedio poblacional
b. La varianza poblacional.
c. La proporción poblacional, etc.
3.8. ESTIMADOR:
Es un valor, una cantidad, un indicador que se obtiene con información de la muestra.
Dentro de estos tenemos:
a. El promedio muestral.
b. La varianza muestral.
c. La proporción muestral, etc.
PRACTICA N°1
I. Identifique si representa una población (N), muestra(n) en las siguientes situaciones.
( ) 1. Número de enfermos con cáncer observados durante un año en la clínica “x”
( ) 2. Número de reclusos egresados de un centro penitenciario en el año 1987.
( ) 3. Estudio del 20% de reclusos egresados de un centro penitenciario ene l año
1987
( ) 4. Número de personas con proceso judicial por tráfico de drogas en el año 1987.
( ) 5. Estudio del 60% de las raciones atendidas a pacientes en el hospital “x”
( ) 6. Estudio de los antecedentes fisiológicos de 15 mujeres de 30 - 49 años de edad
atendidos en el hospital “x”
( ) 7. Número de niños nacidos vivos en el hospital “x”
( ) 8. Estudio del 25% de pacientes con tuberculosis del distrito de comas.
( ) 9. Análisis de precios de productos de primera necesidad en 10 mercados de lima
metropolitana
( ) 10. Estudio de los precios de todos los productos químicos farmacéuticos
importados por el Perú en 1987.
IV. Se lleva a cabo un estudio sobre el consumo de drogas en adolescentes varones que
residen en el distrito de Miraflores. Identificar como variable (V) o constante(c) en lo
siguiente:
( ) 1. Edad
( ) 2. Sexo
( ) 3. Tipo de droga
( ) 4. Lugar de residencia
( ) 5. Consumo semanal
( ) 6. Nivel de instrucción
1. El bajo nivel de instrucción, es uno de los factores que posibilita el poco interés de
los padres, en el control de crecimiento y desarrollo de los niños de familias de
estrato socio económico bajo.
2. El aumento de los precios de los productos de primera necesidad, se debe a la
reducción de los subsidios por parte del estado , en los últimos seis meses
VI. Identifique cada una de las variable siguientes de acuerdo a la clasificación por su
naturaleza y por su escala o nivel de medición:
1. Número de niños nacidos en diferentes horas del día
2. De edad de los reclusos
3. Grado de instrucción de los drogadictos
4. Número de menores abandonados en los hospitales
5. Caso de tuberculosis pulmonar
6. Ingreso per-cápita
7. Consumo per-cápita
8. Candidatos de la alcaldía de lima , según votos obtenidos
9. Categoría docente
10. Número de hogares según servicio de alcantarillado
11. Lugar de nacimiento de las personas peso de recién nacidos en gramos
12. Peso de recién nacidos en gramos
13. Grado de desnutrición
14. Numero de hematíes
15. Urea materna en mg/100
16. Estado marital de las personas
17. Tasa de tuberculosis pulmonar
18. Valores de proteínas en mg/100
19. Sueldos de las enfermeras
20. Tasa de mortalidad infantil
21. Clasificación de la población económicas activas
22. Nivel de inflación mensual
En la Estadística se trabaja generalmente con una gran cantidad de datos los cuales por facilidad
de análisis y cálculos se organizan en Tablas de Distribución de Frecuencias (TDF) y Figuras
Estadísticas (FE).
1.1. DEFINICIÓN:
Un cuadro de distribución de frecuencias, es una tabla resumen de un conjunto de datos
que muestra el comportamiento o distribución de la variable en estudio en forma rápida
y resumida.
Aun cuando un cuadro de frecuencias se construye a libre criterio de quien lo ejecuta,
generalmente es común seguir algunos pasos que de alguna forma homogenizan criterios
y ayudan a los fines didácticos.
Para realizar este análisis se tienen que tener en cuenta el tipo de variable que se está
evaluando.
1.2. PARTES DE UNA TABLA DE DISTRIBUCION DE FRECUENCIAS:
Las partes de un TDF son las siguientes:
a. Número de la tabla de frecuencias en forma correlativa.
b. Título: Especificar la variable y la población en estudio
c. Encabezado o conceptos.
d. Cuerpo o contenido del cuadro de frecuencias
e. Nota de pie (no siempre es necesaria)
f. Fuente
g. Elaboración
2. Frecuencia relativa:
Se denotan por hi. Indica la relación o proporción existente entre la frecuencia
absoluta simple y el número total de datos. Estas frecuencias son números
fraccionarios positivos entre o y 1. Para fines interpretativos estas frecuencias
se expresan en % (hi%) . Así:
fi fi
hi ó hi (%) x100
n n
3. Frecuencia absoluta acumulada:
Se denotan por Fi. Resulta de la suma de las frecuencias simples del intervalo
dado o considerado, es decir:
F1 = f1
F2 = f1 + f2
F3 = f1 + f2 + f3
.............................................
……………………………………………………
Fj = f1 + f2 + f3 + ....... + fi
4. Frecuencia relativa acumulada:
Se denotan Hi. Resulta de la suma de las frecuencias relativas simples hasta la
frecuencia del intervalo considerado. Así:
H4 = h1 + h2 + h3 + h4
H6 = h1 + h2 + ....+ h6
Para fines interpretativos estas frecuencias se expresan en % (Hi%)
D. Marca de clase:
Se denota por “Yi”. Es el promedio de los valores correspondientes a los límites
inferior y superior de cada uno de los intervalos determinados.
Luego se seleccionan las variables a describir. Para obtener las tablas de frecuencias activar
esta opción (Visualizar tabla de frecuencias). Luego para obtener la moda hacer clic en
Estadísticos y activar moda y presionar continuar.
Para obtener el gráfico de barras hacer clic en Gráficos y activar gráficos de barras y hacer
clic en continuar. Por último pulsar el botón Aceptar del cuadro de dialogo de frecuencias.
A continuación presentamos estas ventanas de trabajo:
Luego se seleccionan las variables a describir. Para obtener la tablas de frecuencias activar esta
opción (Visualizar tabla de frecuencias). Para obtener las diferentes medidas estadísticas hacer
clic en Estadísticos y activar media, moda, varianza, asimetría y presionar continuar; para obtener
el gráfico de respectivo hacer clic en Gráficos y activar histograma y hacer clic en continuar. Por
último pulsar el botón Aceptar del cuadro de dialogo de frecuencias.
Fuente: Tabla 1
Ejemplo 2
Un docente posee un listado de 32 estudiantes que incluye el género y la carrera universitaria
a la cual se inscribieron en la USP Chimbote 2016.
Nº Apellidos Género Carrera
1 Bustos M Abogacía
2 Bisio M Abogacía
3 Callejas M Abogacía
4 Cucos F Abogacía
5 Fuster M Abogacía
6 Frutos M Abogacía
7 Gomez M Abogacía
8 Jozami F Abogacía
9 Mistral F Abogacía
10 Perez M Abogacía
11 Petres M Abogacía
12 Suarez F Abogacía
13 Yoma F Abogacía
14 Zolca M Abogacía
15 Aquines F Medicina
16 Arce M Medicina
17 Alvarez F Medicina
18 Boca M Medicina
19 Casas M Medicina
20 Colman F Medicina
21 Dexter M Medicina
22 Dolce M Medicina
23 Dimo M Medicina
24 Duran F Medicina
25 Desio F Medicina
26 Ercos M Medicina
27 Flores F Medicina
28 Marcos F Medicina
29 Millan M Medicina
30 Oses M Medicina
31 Sosa F Medicina
32 Urca M Medicina
Medicina
Carrera
Géner
Abogacía Mascul…
Femen…
0 5 10 15
Estudiantes
Fuente: Tabla 2
Si se toman los porcentajes calculados sobre el total de alumnos de cada uno de los géneros,
es decir tomando como total de cada uno de los géneros, 13 y 19, se obtiene una tabla de
porcentajes columnas.
Tabla 3: Porcentaje de estudiantes por género según carrera de la USP Chimbote,
2016
Género
Carrera F M Total
Abogacía 38 47 44
Medicina 62 53 56
Total general 100 100 100
Fuente: Datos recolectados de las escuelas
Género
Abogacía
Medicina
Femenino
Fuente: Tabla 3
En esta tabla se puede leer que el 38% de los estudiantes de género femenino se inscribieron
en la carrera de abogacía. En el género masculino el porcentaje es mayor ya que alcanza el
47%.
Tabla 4: Porcentaje de estudiantes por carrera según género de la USP Chimbote,
2016
Género
Carrera F M Total
Abogacía 36 64 100
Medicina 44 56 100
Total 41 59 100
Género
Femenino
Masculino
Abogacía
Fuente: Tabla 4
Ejemplo 3
2 0 1 2 5 3 4 1 3 3
4 3 2 1 3 0 2 5 3 2
3 6 3 4 2 3 4 3 1 3
El 35 % de los hogares poseen 3 hijos en edad escolar, el 57,5% poseen entre 2 y 3 hijos.
En general, la representación gráfica de una tabla de frecuencia permite percibir con mayor
claridad algunas características de la masa de datos que se investiga. Por ello, resulta bastante más
fácil transmitir conclusiones a personas no habituadas a la interpretación de distribuciones de
frecuencias cuando se utilizan gráficos estadísticos.
Para representar gráficamente se utiliza un par de ejes de coordenadas cartesianas, donde en el eje
de abscisa se representa la variable estudiada y en el eje de ordenada los valores de la
correspondiente frecuencia absoluta o relativa. En el caso de graficar datos provenientes de una
variable discreta, como la frecuencia corresponde a cada valor de la variable, se puede representar
por un bastón vertical, construyendo de esta forma el llamado “gráfico de bastones”
frecuencia
10
8
6
4
2
0
1 2 3 4 5 6 7
Nº de hijos
Fuente: Tabla 5.
Ejemplo 4
54 62 55 69 78 64 69
66 61 66 58 69 78 68
63 58 51 72 84 64 66
53 70 65 60 70 80 57
63 72 65 64 73 75 -
Para armar los intervalos se calculó el rango que es igual a R=84-51= 33, dado que se querían armar
m= 1 + 3.322 log ( 34 )= 6.09 m=7 intervalos la amplitud sería Ci = 33 / 6
Ci =4.71 Ci =5 Para no tomar amplitudes con decimales se prefirió usar una amplitud de 5 tomando
como límite inferior al valor 50.
Siempre el límite inferior del primer intervalo debe contener al menor valor del conjunto de
datos.
Puntaje fi hi % Fi Hi
50 55 4 0,12 12 4 0,12
55 60 4 0,12 12 8 0,24
60 65 9 0,26 26 17 0,50
65 70 9 0,26 26 26 0,76
70 75 4 0,12 12 30 0,88
75 80 3 0,09 9 33 0,97
80 85 1 0,03 3 34 1,00
Total 34 1,00 100 -
Fuente: resultado de test de atención.
En esta tabla se incluye la frecuencia relativa acumulada Hi. Esta frecuencia multiplicada por 100,
indica el porcentaje de individuos que poseen un valor inferior al límite superior de ese intervalo. En
el ejemplo anterior, en la tercera fila se podría leer: “un total de 9 alumnos poseen un puntaje entre
60 y 65, es decir 26% de los alumnos analizados. Luego el 50% posee un puntaje inferior a 65 puntos.
El 0,50 de la frecuencia relativa acumulada se calcula como 0,12+0,12+0,26 sumando a la frecuencia
relativa del intervalo, las anteriores.
Para representar gráficamente a la información que provee una variable cuantitativa se utiliza un
histograma. El histograma es un gráfico de frecuencias absolutas o relativas.
Sobre el eje de ordenada se presentan las frecuencias absolutas o relativas y sobre el eje de abscisa
se presentan las clases o intervalos. Es importante considerar que las barras no poseen espacios entre
sí, dado que la variable es continua.
10
Nº Estudiantes
8
6
4
2
0
50-55 55-60 60-65 65-70 70-75 75-80 80-85
Puntaje
Fuente: Tabla 6
Las alturas de las barras varían según sean los valores de frecuencia absoluta sobre los intervalos,
que todos tienen en este caso igual longitud de base.
El ascenso y el descenso de las líneas de contorno muestran el aumento o la disminución del
número de alumnos de intervalo en intervalo.
La representación gráfica de las frecuencias relativas acumuladas se realiza a través de un gráfico
lineal u ojiva. Si ese gráfico tiene forma de S estirada, implicaría que el histograma es bastante
simétrico, tal como ocurre en el ejemplo anterior.
100
90
80
70
Porcentaje
60
50
40
30
20
10
0
50-55 55-60 60-65 65-70 70-75 75-80 80-85
Puntaje
Fuente: Tabla 6
PRACTICA N°2
1. Los siguientes datos corresponden al índice rendimiento en una prueba de aptitud:
Se pide:
Se pide:
a) Ordenar la información en un cuadro de frecuencias.
b) Interpretar algunos valores de las frecuencias relativas.
3. Los siguientes datos corresponden al número de viajes que realizan por día 80 personas
encuestadas, para ir y regresar de su centro de trabajo:
3 6 5 7 4 4 3 6 7 4 5 4 4
5 4 3 4 3 5 6 6 4 4 5 7 4
6 2 5 7 6 3 2 5 4 4 6 5 6
5 6 4 5 2 5 3 6 2 2 3 3 5
3 5 4 2 6 3 3 3 6 5 7 4 5
4 2 3 4 2 3 6 5 4 5 5 5 4
4. Los siguientes datos, indican el número de años de niños en edad pre escolar y escolar de un
determinado centro educativo.
4.2 5.8 6.1 9.1 4.7 5.8 6.9 4.0 6.4 7.7
6.9 8.6 8.2 4.0 5.5 5.6 9.4 7.3 2.5 6.3
8.2 8.1 5.2 8.8 9.2 6.6 7.8 6.9 5.8 7.5
5.3 5.6 5.7 3.5 6.0 5.4 2.6 9.3 5.2 2.3
6.1 5.3 2.0 5.4 9.8 6.0 5.2 8.6 5.1 9.2
5.6 4.3 3.8 6.5 7.5 4.5 4.2 3.7 6.1 5.4
6.2 6.3 6.7 7.8 3.9 7.1 5.6 3.3 6.7 5.0
10.4 6.5 5.0 5.8 5.7 4.8 8.5 6.3 7.5 3.1
10.6 7.5 3.7 5.8 6.8 7.4 3.0 9.7 8.4 5.9
2.6 5.4 6.8 5.1 5.0 5.8 5.5 5.2 4.1 6.8
i Ii fi hi Hi
1 -24 0.15
2 - 0.25
3 -44 0.90
4 45-
60
6. Se tiene una distribución de frecuencias con 4 intervalos de amplitud constante para 50 datos:
i Ii fi hi Hi
1 -3 0.08
2 -5
3 12 0.40
4 -9 0.36
Completar el cuadro.
7. Las oficinas Médico Legales de país registraron la siguiente información, sobre la magnitud
de los servicios brindados durante 1982:
8. Los siguientes datos corresponden a las lecturas de la presión sanguínea sistólica que se
hicieron a 58 adultos que se presentaron para un examen físico:
11. La siguiente tabla muestra los coeficientes de inteligencia de 50 niños de la ciudad Lima:
12. Los siguientes datos corresponden a la CAA Tumán Ltda. N°14, sobre la clasificación del
personal ocupado en 1987.
1.59 1.15 1.65 1.30 2.50 1.25 1.86 1.22 2.30 2.32
1.45 1.68 1.91 2.40 1.19 1.37 2.05 1.23 1.08 1.34
1.48 1.52 1.90 1.19 1.28 1.08 2.19 2.05 2.25 1.13
1.10 1.06 1.11 1.14 1.18 1.12 1.21 1.37 1.48 1.43
1.52 1.59 1.64 1.39 1.29 1.49 1.56 1.53 1.46 1.65
Agrupar los datos en un cuadro de frecuencias.
14. A continuación se presentan las edades (en años) de un grupo de pacientes con Carcinoma
Cervical, registradas en el Hospital San Antonio, en Enero de 1988.
25 21 31 24 26 27 42 43 22 48
36 24 39 43 38 39 36 37 44 51
79 76 80 75 39 42 41 51 56 44
62 55 61 43 42 38 27 35 53 50
Se pide:
a) Agrupar los datos en un cuadro de frecuencias.
b) Analizar algunos valores de frecuencias halladas.
15. Se hizo un estudio de 143 casos refentes a las complicaciones presentadas en mujeres luego
del parto, y se obtuvo los siguientes resultados: Infecciones 74 casos; anemia 42 casos;
hemorragias 12 casos; otros 15 casos.
16. Los siguientes datos corresponden al tiempo ( en meses) de reclusión en que permanecieron
un grupo de mujeres con gonorrea, y que fueron tratadas en el Hospital Central de Chiclayo,
en Diciembre de 1987.
5 12 11 16 15 45 46 10 8 4
36 6 10 21 20 18 14 5 3 1
22 11 9 3 17 12 16 19 49 52
18 15
Se pide:
a) Elaborar un cuadro completo de distribución de frecuencias.
b) Interpretar algunos valores de las frecuencias encontradas.
17. Se muestra a continuación la estatura en cms. de un un grupo de niños y niñas normales, de
0 a 12 años, residentes en las regiones de 4900 m sobre el nivel del mar:
18. Se realizó una encuesta a un grupo de jóvenes del Distrito de San Martín de Porres, referente
a sus hábitos alimentarios y nocivos para la salud; encontrándose los siguientes resultados:
Consumo de alcohol 20; condimentos, ají 10; tabaco 9; coca 9; café 7; té 1; líquidos
calientes 1.
19. En enero de 1988 un grupo de enfermeras del ITS “Daniel A. Carrión” efectuaron prácticas
comunitarias en el Distrito de Comas, recolectando los siguientes datos referentes al número
de hijos por familia, en una muestra de 40 familias:
6 12 4 10 11 15 9 13 8 11
5 9 8 10 12 11 10 9 8 5
12 10 12 8 9 11 12 8 7 10
11 12 9 7 8 8 9 10 13 15
20. Se ha recolectado la siguiente información acerca del número de casos de cáncer uterino en
40 Hospitales del país.
1 4 0 5 3 2 0 4
a) Identifique
0 3 la variable
4 y5 determine
8 el número
4 5de clases.
3
5 11 0 2 10 1 10 9
b) Hallar las frecuencias absolutas y relativas simples y acumuladas.
0 8 9 3 2 3 10 9
7 6 resultados.
c) Interpretar 5 15 8 3 3 4
21. Un grupo de Sociólogas de la UNIFE visitaron la CAA. Tumán (Chiclayo) y se interesaron
por el nivel de ingresos de sus trabajadores. Una muestra de 35 trabajadores arrojó los
siguientes resultados en Intis:
1.1.MEDIA ARITMÉTICA:
Se denota por x
Es la medida estadística más fácil de calcular.
La media o promedio es el punto central de un conjunto de datos.
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
1.2.MEDIANA:
Se denota por Me.
Es un valor que divide al conjunto de datos en dos partes iguales, es decir, cada
segmento tiene el 50% de los datos.
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
1.3.MODA:
Se denota por Mo.
La moda es el valor que más se repite en un conjunto de datos.
En un conjunto de datos se presentan los siguientes casos:
a. No existir datos Amodal
b. 1 moda Unimodal.
c. 2 modas Bimodal
d. 3 a más modas Multimodal
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
2. MEDIDAS DE LOCALIZACIÓN:
2.1. CUARTILES:
Se denotan por Qk, donde k=1,2,3
Son valores que dividen a un conjunto de datos en 4 partes iguales, es decir, cada
sector tiene el 25% de los datos.
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
2.2. DECILES:
Se denotan por Dk, donde k=1,2,3,4,5,6,7,8,9
Son valores que dividen a un conjunto de datos en 10 partes iguales, es decir, cada
sector tiene el 10% de los datos.
2.3. PERCENTILES:
Se denotan por Pk, donde k=1,2,3,4,5,6,7,8,9,10, … , 99
Son valores que dividen a un conjunto de datos en 100 partes iguales, es decir, cada
sector tiene el 1% de los datos.
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
PARA DATOS NO
MEDIDAS PARA DATOS AGRUPADOS
AGRUPADOS
m
n
x _ Y f i i
Y
i i i
X i 1
n
PROMEDIO n
Yi: Marca de clase o punto
Xi: datos
medio
n = número de datos
fi: frecuencia absoluta simple
n: número de datos.
Procedimiento: 1
Observar la base de datos y Mo Li A
determinar el valor que más se 1 2
repite. Li: limite inferior del intervalo
MODA modal.
A: amplitud interválica
1 f j f j 1
2 f j f j 1
n / 2 F j 1
Me Li A
Procedimiento: fj
Ordenar la serie en forma
Li: limite inferior del intervalo
ascendente
mediano.
Cuando “n” impar:
MEDIANA A: amplitud interválica.
Me = valor central
Cuando “n” par: n / 2 es el elemento determinante
Me = promedio de los valores Fj-1: Frecuencia acumulada
centrales anterior al intervalo mediano
fj:Frecuencia abs. simple del
intervalo mediano
kn / 4 Fj 1
QK Li A
Seguir pasos similares a la fj
QUARTILES
mediana. Similar a la Me. Lo único que
cambia es el elemento
determinante.
kn / 10 Fj 1
CUANTILES
DK Li A
Seguir pasos similares a la
fj
DECILES mediana.
Similar a la Me. Lo único que
cambia es el elemento
determinante.
kn / 100 Fj 1
PK Li A
Seguir pasos similares a la fj
PERCENTILES mediana.
Similar a la Me. Lo único que
cambia es el elemento
determinante.
Practica Nª3 Trabaje con la base de datos 3
Sesión 5: Medidas de Dispersión: Rango, rango intercuartil, varianza y desviación estándar.
Coeficiente de variación.
MEDIDAS DE VARIABILIDAD:
3.1. RANGO:
Se denota por R y la medida de variabilidad más fácil de calcular.
Es la diferencia que existe entre el valor máximo y el valor mínimo del conjunto de
datos.
3.2. VARIANZA:
Mide la variabilidad de un conjunto de datos respecto a un valor central(promedio)
Mide la variabilidad pero en unidades elevadas al cuadrado, por lo tanto es ilógica
su interpretación.
Para calcular la media aritmética se utilizan las fórmulas adecuadas ya sea sin son
datos agrupados o datos no agrupados.
2 i 1 N
N
POBLACIONAL
Xi : Datos de la población Yi : Marca de clase
u : promedio poblacional u : promedio poblacional
N: Número de elementos de N: Número de elementos de la
la población población
fi: frecuencia absoluta simple
(x x)2
m
VARIANZA
s 2
i 1
i
(y i y)2 * fi
n 1 s2 i 1
n 1
MUESTRAL
Xi : Datos de la muestra yi : Marca de clase
x : promedio muestral y : promedio muestral
n : Número de elementos de
n : Número de elementos de la
la muestra
muestra
fi: frecuencia absoluta simple
n
n ( xi ) 2 m
1 m ( yi f i ) 2
Formulas s2
n 1 i1
xi2 i1
n s2
1 y 2 f i1
i i
abreviadas n 1 i1 n
DESVIACION 2 s s2
ESTANDAR
D.E. Poblacional D.E. Muestral
s
C.V . *100 C.V . * 100
COEFIENTE DE u x
VARIACIÓN
C.V. Poblacional C.V. Muestral
Practica Nº5 TRABAJE CON LA BASE DE DATOS 2
ASIMETRIA:
La asimetría se entiende como la deformación horizontal de un conjunto de datos.
Para conocer esta asimetría se calcula el coeficiente de asimetría As.
En un conjunto de datos pueden presentar los siguientes casos:
a. As= 0, el conjunto de datos es simétrica.
b. As<0, el conjunto de datos es asimétrica negativa.
c. As>0, el conjunto de datos es asimétrica positiva.
X Mo 3( X Me) Q3 2Q2 Q1
As As As
S S Q3 Q1
KURTOSIS:
Se entiende por Kurtosis a la deformación vertical de un conjunto de datos, es decir,
mide el apuntamiento o achatamiento de un conjunto de datos.
Para conocer que tipo de asimetría tiene un conjunto de datos, se utilizan las
siguientes formulas:
M4
K1
(M 2 )2
Q3 Q1
As
2( P90 P10 )
c. Luego se presenta las siguientes ventanas de dialogo, donde tenemos que ingresar el rango,
si la información esta agrupado en columnas o filas, si se seleccionó el rotulo o titulo,
señalar la celda donde van a salir los datos y finalmente activar todas las alternativas que
necesita el investigador.
p q
x i f i. y
j 1
j f. j
M (X ) X i
M (Y ) Y
n n
Media para X Media para Y
p
q
2
1 p ( xi f i. ) 2
1 q 2
( yi .j
f )
V (X ) xi2 f i. i 1 V (Y ) yi f. j i 1
n 1 i n n 1 i 1 n
Varianza para X Varianza para Y
xi fik y j f kj
M ( X / Yk ) i
M (Y / X k ) j 1
f.k fk.
Media de X dado Y Media de Y dado X
p
2
q
2
1 p 2
( x i ik
f )
1 q 2
( i 1 i kj
y f )
V ( X / Yk ) xi f ik i 1
V (Y / X k ) yi f kj
f .k 1 i f .k fk. 1 i fk.
Varianza de X dado un Y Varianza de Y dado un X
PRÁCTICA PRESENCIAL
Instrucción: Utilizando las definiciones anteriores acerca de estadística bidimensional
resolver los siguientes casos:
CASO Nº 01:
En el siguiente estudio social se evalúa a 30 viviendas familiares de la ciudad de Chimbote,
se considera como primera variable:
X: Número de personas por vivienda
Y: Número de habitaciones por vivienda.
La información bidimensional que se obtuvo (X,Y) es la siguiente:
Número de
personas (X)
6 4 6 5 6 9 7 8 4 4 5 6 8 7 7
Número de
habitaciones (Y)
3 3 3 4 3 6 3 3 2 3 3 3 4 4 3
Número de
personas (X)
9 5 5 5 5 4 9 5 8 5 9 7 8 4 4
Número de
habitaciones (Y)
4 5 2 3 3 3 4 4 3 2 6 3 3 2 3
Y Número de habitaciones
Total
X 2 3 4 5 6
4
Número de 5
personas 6
7
8
9
Total
CASO Nº 02:
Se tiene la siguiente información bidimensional correspondiente a las siguientes variables:
X: Consumo de agua en m3;
Y: Tiempo de servicio en años.
Esta información corresponde a 40 centros educativos de Chimbote, cuyos datos son los
siguientes:
250 - 300> 4 2 1
Consumo de agua
300 - 350> 2 4 4 8 2
350 - 400> 1 2 2 1
400 - 450> 1 3 3
f .j n =
CASO Nº 04:
En base al siguiente cuadro bidimensional que corresponde a la ganancia en miles de dólares
(X) y el gasto en publicidad en miles de dólares (Y), de 55 Instituciones Educativas Privadas
de nuestro medio se presentan en el siguiente cuadro bidimensional:
25- 5 3 2
30>
30- 3 5 5 9 3
35>
35- 2 3 3 2
40>
40-45] 2 4 4
f .j n=
Calcular e interpretar:
a. M(X)=
b. Interpretar: f32 , h31% , h24% , f21 ,
c. M(X / Y2)
d. M(Y / X2…)
e. V ( Y ).
g. V (X)
Los experimentos u operaciones reales o hipotéticos puede dividirse en dos clases: determinísticos
y no determinísticos.
Un experimento es determinístico (no aleatorio), si los resultados del experimento están
completamente determinado y pueden describirse por una fórmula matemática llamado también
modelo determinístico. Así, los siguientes ejemplos:
a. El experimento consiste en soltar una piedra en el aire. la piedra caerá, y su movimiento se
describe por las ecuaciones de caída libre
b. Lanzar una pelota en un tanque de agua y ver si flota o se hunde. la pelota flotara.
c. A un cuerpo de masa “m” en reposo, se somete a una fuerza constante F. el cuerpo se moverá
con una aceleración constante
𝐹
a=𝑚
3.- Dos objetos A y B se distribuyen al azar en tres celdas numeradas. Defina un espacio muestral
adecuado para este experimento.
Solución:
OBJETOS CELDAS
A 1
B 2
Ω = {DD, NDD, DNDD, DNDN, DNND, DNNN, NDND, NDNN, NNDD, NNDN, NNND,
NNNN}
5.- Sea el experimento: “resultado del examen final en el curso de estadística por parte del
estudiante”.
Solución:
Ω = {aprobara o desaprobara}
NOTA:
1.- El espacio muestral puede ser finito o infinito, según si tiene un último elemento o no.
2.- Un espacio muestral puede ser discreto si contiene un numero finito o infinito numerable de
puntos muéstrales, o puede ser continuo, si contiene una infinidad no numerable de puntos
muéstrales.
3.- Pueden existir diferentes espacios muéstrales asociados a un mismo experimento.
Practica Nº7
En el espacio en blanco, escribe los espacios muéstrales que corresponden a los siguientes.
Experimentos aleatorios:
1. Se selecciona una muestra de 50 semillas de un saco, para ver cuantas germinan. Los
resultados posibles son las cantidades que germinan de las 50 semillas:
Ω={ }
2. El experimento aleatorio consiste en preguntar a los espectadores de la televisión de cierta
ciudad si presencian regularmente, tres programas especificados.
Ω ={ }
3. Dado el experimento de ordenar 3 solicitudes: S1, S2, S3 de acuerdo a sus habilidades para
realizar determinado trabajo.
Ω={ }
4. En una encuesta a estudiantes de Ingeniería se pregunta ¿Cree Ud., que el próximo domingo
esta nublado?
Ω={ }
NOTA:
Un suceso imposible A, si A = {} = Ø, significa que no tiene elemento de Ω.
a) Ejemplo: “Selección de un propietario de inmuebles con ingresos bajos de la
Urbanización Las Casuarinas – Lima”.
b) En este caso, el evento es imposible, ya que no se podrá seleccionar un propietario
de inmueble con bajos ingresos, en una zona residencial.
Un suceso es seguro o cierto A, si A = Ω.
c) Ejemplo: “Selección de un propietario de inmuebles con ingresos medio - alto de
la Urbanización Las Casuarinas – Lima”.
d) Se puede apreciar que el Evento es seguro o universal, ya que al Seleccionar un
propietario de inmueble, este de todas maneras tendrá ingresos medio – alto, ya que se trata
de una zona residencial de Lima.
Los sucesos A y B son mutuamente excluyentes o incompatibles si AB = Ø.
Ejemplo1:
Selección de un profesor de la universidad nacional del santa según categoría Docente”
Ω = {PRINCIPAL, ASOCIADO, AUXILIAR, JEFE DE PRACTICA}
3B: ___________________________________
Ejemplo 3.- De los resultados del ejercicio 7 podemos definir los siguientes sucesos o eventos:
Sea el evento A, tal que las dos personas seleccionadas estén ocupadas; entonces:
A= {OO}
Sea el evento B, tal que al menos una de las dos personas esta ocupada; entonces:
B= {OO, OD, DO}
Sea el evento C, tal que la primera persona seleccionada este ocupada; entonces:
C= {OO, OD}
Ejemplo 4:
A: “el puntaje obtenido es un número impar”.
Entonces, A= {1, 3,5}
Ejemplo 5:
B: “se extrae una esfera blanca”.
Luego, B= {b}
Ejercicios.-
a. Una familia tiene 3 hijos, examinar su sexo, teniendo en cuenta la edad, del mayor al
menor.
1. El espacio muestral
2. El evento P: Que B ocupe el primer lugar.
3. El evento Q: Que A y B ocupen los primeros lugares.
e. En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria
sin reemplazo 3 bolas de la urna.
f. En una urna se tiene 2 bolas rojas, 2 bolas azules y 2 verdes. Seleccionar en forma aleatoria
con reemplazo 3 bolas de la urna.
g. Una urna contiene 5 bolas blancas y 6 negras, se extrae al azar sin reposición dos bolas.
h. Se tiene una baraja con 52 cartas. Se seleccionan al azar 2 cartas y se observa la figura.
PROBABILIDADES
Reseña Histórica
Una disputa entre jugadores en 1654 llevó a dos famosos matemáticos franceses, Blaise Pascal y
Pierre de Fermat, a la creación del cálculo de Probabilidades. Antoine Gombaud, caballero de
Meré, noble francés interesado en cuestiones de juegos y apuestas, llamó la atención a Pascal
respecto a una aparente contradicción en un popular juego de dados. Este y otros problemas
planteados por de Meré motivaron un intercambio de cartas entre Pascal y Fermat en las que por
primera vez se formularon los principios fundamentales de las probabilidades. Si bien unos pocos
problemas sobre juegos de azar habían sido resueltos por matemáticos italianos en los siglos XV
y XVI, no existía una teoría general antes de esa famosa correspondencia.
En 1812, Pierre de Laplace introdujo gran cantidad de ideas nuevas y técnicas matemáticas en su
libro, Teoría Analítica de Probabilidades. Antes de Laplace, las probabilidades prácticamente
consistían en un análisis matemático de los juegos del azar. Laplace demostró que esa teoría podía
ser aplicada a multitud de problemas científicos y prácticos. Ejemplo de tales aplicaciones son la
teoría de errores, la matemática actuarial y la mecánica estadística que se desarrollaron en el siglo
XIX. Una de las dificultades que se presentaron al desarrollar una teoría matemática ha sido
alcanzar una definición de probabilidad lo bastante precisa para su utilización matemática.
La búsqueda de una definición completamente aceptable duro cerca de 3 siglos y fue caracterizada
por un gran número de controversias. El asunto fue definitivamente resuelto en el siglo XX al
tratar la teoría de la probabilidad en forma axiomática establecida por el matemático ruso Andrei
Kolmogorov, quien consideró la relación entre la frecuencia relativa de un suceso y su
probabilidad cuando el número de veces que se realiza el experimento es muy grande.
Enfoques de Probabilidad
Definición Clásica o “a priori”: Si el espacio muestral Ω tiene n (Ω) resultados mutuamente
excluyentes y con igual probabilidad (principio de equiprobabilidad) y si un evento A (suceso)
definido sobre dicho espacio muestral tiene n (A) elementos, entonces la probabilidad de ese
evento, que se denota P (A) es el cociente entre n (A) y n (Ω), es decir:
Ejemplo:
Se ha observado que 9 de cada 50 vehículos que pasan por una esquina no tienen cinturón de
seguridad. Si un vigilante de transito se para en esa misma esquina un día cualquiera ¿Cuál será
la probabilidad de que detenga un vehículo sin cinturón de seguridad?
Tanto el enfoque clásico como el enfoque empírico conducen a valores objetivos de probabilidad,
en el sentido de que los valores de probabilidad indican al largo plazo la tasa relativa de ocurrencia
del evento.
El enfoque subjetivo
Dice que la probabilidad de ocurrencia de un evento es el grado de creencia por parte de un
individuo de que un evento ocurra, basado en toda la evidencia a su disposición. Bajo esta premisa
se puede decir que este enfoque es adecuado cuando solo hay una oportunidad de ocurrencia del
evento. Es decir, que el evento ocurrirá o no ocurrirá esa sola vez. El valor de probabilidad bajo
este enfoque es un juicio personal.
AXIOMA DE PROBABILIDAD
Luego: 0 ≤ P (A) ≤ 1
El axioma tercero se refiere a las UNIONES, y podemos expresarlo de la siguiente manera:
La probabilidad de un evento compuesto A es la suma de probabilidades de los eventos simples
de los cuales A es compuesto.
AXIOMA 4.- La probabilidad de un suceso imposible es cero.
AXIOMA5.- P (Aꞌ) =) = 1 – P (A)
AXIOMA 6.- Si A y B son sucesos no necesariamente excluyentes entonces
P (A B) = P (A) + P (B) - P (A B)
n( A) n( B ) n( A B )
P [A B] = P [A] + P [B] – P [AB] = +
n( S ) n( S ) n (S )
Ejemplo :
Se extrae una carta al azar. ¿Cuál es la probabilidad de que la carta seleccionada sea menor de 7,
si se conoce que es roja?
A = menor que 7
B = color rojo
P [A/B] = 12/26 = 6/13 = 46.15 % Hay 46.15% de probabilidades de que la carta seleccionada
sea menor que 7, sabiendo que es roja.
Ejercicio:
Para obtener licencia para conducir, es necesario aprobar tanto el examen teórico como el práctico.
Se sabe que la probabilidad que un alumno apruebe la parte teórica es 0,68, la de que apruebe la
parte práctica es 0,72 y la de que haya aprobado alguna de las dos partes es 0,82. Si se elige un
alumno al azar, ¿cuál es la probabilidad de que apruebe el examen para obtener licencia?
Dos o más eventos son independientes cuando la ocurrencia o no-ocurrencia de un evento o suceso
no tiene efecto sobre la probabilidad de ocurrencia del otro evento (o eventos). Un caso típico de
eventos independiente es el muestreo con reposición, es decir, una vez tomada la muestra se
regresa de nuevo a la población donde se obtuvo.
Consideremos dos eventos A y B no vacíos en . Las siguientes proposiciones son equivalentes
A es independiente de B P (A B) = P (A) P (B)
P (A/ B) = P (A)
P (B/A) = P (B)
Ejemplo:
Una habitación tiene 3 portabombillas conectadas a un mismo interruptor. De una caja con 10
bombillas, de las que 6 son buenas, se sacan 3 bombillas que se colocan al azar en 3
portabombillas. Al dar contacto con el interruptor en la noche. ¿Cuál es la probabilidad de que la
habitación quede iluminada?
Solución.-
La habitación va aquedar iluminada si de las 3 que elige van a estar buenas 1 ó 2 ó 3 bombillas,
esto es:
P (queda iluminada) = P (1 buena ó 2 buenas ó 3 buenas)
Nos interesa el suceso “de que al menos una de las bombillas este buena” simbólicamente:
P (queda iluminada) = P (A1 A2ꞌ A3ꞌ) + P (A1ꞌ A2 A3ꞌ) + P (A1ꞌ A2ꞌ A3) +
P (A1 A2 A3) + P (A1ꞌ A2 A3) + P (A1ꞌ A2ꞌ A3) +
P (A1 A2 A3)
Donde:
P (A1 A2ꞌ A3ꞌ): Es la probabilidad que la primera bombilla esta buena y la segunda y tercera
defectuosa.
P (A1 A2 A3): Es la probabilidad que las tres bombillas están buenas.
Así definimos los sucesos:
A1: Suceso que la primera bombilla sea buena.
A2: Suceso que la segunda bombilla sea buena.
A3: Suceso que la tercera bombilla sea buena.
Por tanto la probabilidad de que la habitación quede iluminada es:
P (queda iluminada) = P (A1). P (A2ꞌ/A1ꞌ). P (A3ꞌ/A1 A2ꞌ) + P (A1ꞌ). P (A2ꞌ/A1).
P (A3ꞌ/ A1ꞌ A2) +… + P (A1). P (A1/A2) + P (A3/ A1 A2)
Estas probabilidades son condicionales, por cuanto los sucesos A1, A2 y A3 no son independientes;
pues la probabilidad de que la primera bombilla este buena o no, influye en la probabilidad de la
segunda bombilla que este buena o defectuosa; de igual manera los otros sucesos.
Ahora reemplazando tenemos:
6 4 3 4 6 3 4 3 6 6 5 4 6 4 5
P (queda iluminada) = 𝑥 𝑥 + 10 𝑥 𝑥 + 𝑥 𝑥 + 𝑥 𝑥 + 10 𝑥 𝑥 +
10 9 8 9 8 10 9 8 10 9 8 9 8
4 6 5 6 5 4
𝑥 𝑥 + 𝑥 𝑥
10 9 8 10 9 8
6 4 3 6 5 4 6 5 4
= 3(10 𝑥 𝑥 8) + 3 (10 𝑥 𝑥 ) + 10 𝑥 𝑥
9 9 8 9 8
29
P (queda iluminada) = 30
Ejercicio:
Lanzar al aire dos veces una moneda son eventos independientes por que el resultado del primer
evento no afecta sobre las probabilidades efectivas de que ocurra cara o sello, en el segundo
lanzamiento.
Esto significa que es cubierto por todas las partes Bi que son mutuamente excluyentes, es decir
que el experimento aleatorio asociado a ocurre cuando sucede alguno de los Bi .
AXIOMA 12.- Probabilidad total
Ejemplo:
Dos listas de candidatos compiten por los puestos en el directorio de una compañía. Las
probabilidades de que la primera y la segunda ganen son de 0.6 y 0.4 respectivamente.
Además, si la primera lista gana, la probabilidad de introducir un nuevo producto es de 0.8 y la
correspondiente probabilidad si la segunda lista gana es de 0.3. ¿Cuál es la probabilidad de que el
nuevo producto sea introducido?
Solución
Definimos los sucesos: B1: primera lista gana.
B2: segunda lista gana.
Además, P (B1) = 0.6 y P (B2) = 0.4
y las probabilidades condicionales son:
P (A/ B1) = 0.8 y P (A/ B2) = 0.3
Esto es la probabilidad de introducir un nuevo producto, “si la primera lista gana (P (A/ B1)) y la
probabilidad de introducir un nuevo producto “si” la segunda lista gana (P (A/ B2))”.
Sea P (A): suceso introducir un nuevo producto.
Entonces:
Regla de Bayes
Para medir la probabilidad de que un Bi sea la causa de un evento observado en A.
P Bi A P Bi P A / Bi
“fácil” P Bi / A k para i = 1, 2,3,..., k
P A
P Bi P A / Bi
i 1
Es una de las leyes más importantes de la probabilidad, ayuda a tomar decisiones sobre algún
problema concreto.
Ejemplo:
Una firma manufacturera produce tubos de acero en tres plantas con un volumen de producción
diaria de 500, 1000 y 2000 unidades, respectivamente. Por la experiencia, se sabe que la fracción
de producción defectuosa de las tres plantas es de 0.005, 0.008 y 0.010, respectivamente. S se
selecciona un tubo en forma aleatoria del total de producción de un día y se descubre que es
defectuoso ¿de qué planta proviene ese tubo?
Solución
Tenemos los siguientes eventos a partir del problema:
B1: Volumen de producción de la primera planta: 500 u. por día.
B2: Volumen de producción de la segunda planta: 1000 u. por día.
B3: Volumen de producción de la tercera planta: 2000 u. por día.
Total = 3500 unidades por día.
E: un ítem defectuoso.
Luego: P (Bi/E) esta probabilidad de que el ítem sea producido por la i-ésima planta, “dado que”
el ítem es defectuoso.
P (Bi ∩ E) es la probabilidad de que los ítems sean producidos por la i-ésima planta y sean
defectuosos.
Entonces:
500
P (B1) = 3500 = 1/7 P (E/ B1) = 0.005
1000
P (B2) = 3500 = 2/7 P (E/ B2) = 0.008
2000
P (B3) = 3500 = 4/7 P (E/ B3) = 0.010
Observe que:
e) ∑3𝑖=1 P (Bi) = 1
Calculamos la probabilidad de que el tubo defectuoso provenga de la planta 1:
P (Bi ∩ E) P (B1). P (E/B1)
P (B1/E) = ∑ P (Bi) . P (E/B1)
= P (B1). P (E/B1)+P (B2). P (E/B2)+ P (B3). P (E/B3)
P (B1). P (E/B1)
P (B1/E) = P (E)
Reemplazando:
(1/7) (0.005) 0.005/7 5
P (B1/E) = (1/7) (0.005)+ (2/7) (0.008)+(4/7) (0.010)
= 0.061/7 = 61
ÁRBOL DE PROBABILIDADES
El diagrama del árbol es más sugerente para determinar el espacio muestral de un experimento
aleatorio compuesto.
Ejercicio:
Se tiene 6 esferas de colores en una ánfora, de las cuales 3 son rojas, 2 son blancas y 1 es negra.
Se extraen aleatoriamente ó a la suerte de 1 en 1 sin reposición
a. Construya un árbol de probabilidades hasta la tercera extracción
b. Cuál es la probabilidad de obtener 2 rojas hasta la tercera extracción
c. Cuál es la probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda
extracción.
SOLUCIÓN:
a. Figura
R
1/
R
2/ B
2/5
1/ N
R
R 2/
2/5 B
1/ B
1/ N
1/5 2/ R
R
N
3/6 2/ B 2/
R
1/ B
3/5
1/ N
R
B
2/6 1/5 B 3/
1/ N
3/ R
1/5
N
R
1/ B
2/
1/6 R
3/5
2/ B
N R
3/
2/5
B
1/ B
c. Probabilidad de obtener una esfera blanca y una esfera negra hasta la segunda extracción:
P [x] = 2/6 * 1/5 + 1/6 * 2/5
= 2/15 = 0.1333 ó 13.33%
Ejemplos de Aplicación de los Axiomas de probabilidades
Ejemplo1:
Sea: Ɛ 1= Lanzamiento de un dado y su puntaje obtenido.
Su espacio muestral está dado por: Ω 1= {1, 2, 3, 4, 5,6}
Calcule la probabilidad de la ocurrencia de los sucesos A, B, C definidos a continuación:
a) A: El puntaje obtenido es un número par: A = {2, 4, 6}
n( A) 3
P [A]= = = 0.5 ó 50%
n( S ) 6
n( B ) 5
P [B]= = = 0.8333 ó 83.33%
n( S ) 6
n (C ) 0
P [C]= = = 0 ó 0%
n( S ) 6
Ejemplo2:
n( A) 13
P [A]= = = 0.25 = ó 25%
n( S ) 52
8 cartas son menores que 9, por lo tanto el total de cartas es igual a 32 (8x4)
n( B ) 32
P [B] = = = 0.6153 ó 61.53%
n( S ) 52
n (C ) 4
P [C]= = = 0.0769 ó 7.69%
n( S ) 52
Ejemplo 3:
SOLUCIÓN:
26 16 8 34
= = 0.6538 ó 65.38%
52 52 52 52
A= roja
B= mayor a 9
n( A B ) 8
Luego, P [AB] = = = 0.1538 ó 15.38%
n (S ) 52
A= espada
B= 5
13 4 1
Luego, P [AB] = P [A] + P [B] – P [AB] =
52 52 52
d. Sea menor de 5 ó mayor de 10
A<5
B >10
Ejemplo 4:
Un lote consta de 10 artículos buenos, 4 con pequeños defectos y 2 con defectos graves. Se elige
un artículo al azar. Encontrar la probabilidad de que:
Solución:
PASO1: Sean los eventos:
A = {artículos buenos}, donde n(A) = 10
B = {artículos con pequeños defectos}, donde n (B) = 4
C = {artículos con defectos graves} donde n(C) = 2
Ejemplo 5:
En un puesto de inspección el 1% de los carros investigados tuvieron malos freos, malos faros y
causaron demasiada contaminación; 19% produjeron demasiada contaminación; 14% tuvieron
malos freos; 5% tuvieron mal los frenos y los faros delanteros; 3% tuvieron faros malos y causaron
contaminación; 16% tuvieron faros malos y 3% frenos malos y causaron contaminación.
Solución:
PASO 1:
Sean los eventos:
A: carros que tienen malos frenos
B: carros que tienen malos faros
C: carros que causan demasiada contaminación
Donde:
P (ABC) = 0.01, P(C) = 0.19, P(A) = 0.14, P(AB) = 0.05, P(BC) = 0.03, P(B) 0.16, P(AC) = 0.03
Ejemplo 6:
En una habitación se encuentra el siguiente grupo de personas: 5 hombres mayores de 21, 4
hombres menores de 21, 6 mujeres mayores de 21 y 3 mujeres menores de 21. Se elige a una
persona al azar, se definen los sucesos siguientes: A = {la persona es mayor de 21}; B = {la
persona es menor de 21}; C = {la persona es hombre}; D = {la persona es mujer}. Evaluar las
siguientes:
(a) P (BUD) (b) P (AUC)
Solución: 4 21 5
Tenemos: 5 hombres mayores de 21 H
4 hombres menores de 21
6 hombres mayores de 21 M
3 hombres menores de 21 3 6
Al elegir una persona, esta puede ser un hombre o una mujer:
9 1
Si resulta hombre, la probabilidad es P (H) = 18 = 2
9 1
Si resulta mujer, la probabilidad es P (M) = 18 = 2
Además:
5+6 11 5+4 9
P(A) = 5+4+6+3 = 18 , P(C) = 5+4+6+3 = 18
4+3 7 6+3 9
P (B) = 5+4+6+3 = 18 , P(C) = 5+4+6+3 = 18
Luego:
(a) P (BUD) = P (B) + P (D) – P (B∩D)
7 9 3 13
= 18 + 18 - 5+4+6+3 = 18
EJERCICIO Nº 01:
Se lanza 4 veces una moneda. ¿De cuántas formas posibles pueden caer las monedas? Utilice un
diagrama de árbol para mostrar todos los resultados y luego determina su espacio muestral.
EJERCICIO Nº 02:
EJERCICIO Nº 03:
En cierta ciudad el 40% de los docentes tiene el cabello castaño, el 20% tiene los ojos negros y el
5% tiene los ojos negros y el cabello castaño. Se escoge un docente al azar.
Halle la probabilidad de que:
a. Tenga el cabello castaño o los ojos negros
b. Tenga solo el cabello castaño, pero no los ojos negros
c. No tenga el cabello castaño ni los ojos negros
EJERCICIO Nº 04:
En una caja hay 6 esferas. 2 son rojas, 1 blanca y las 3 restantes son negras. Si se sacan al azar
de una en una (sin reemplazo) hasta la tercera esfera.
a. Construya un árbol de probabilidades que ilustre el experimento aleatorio b. Indique la
probabilidad de obtener una esfera roja hasta la segunda selección
c. Indique la probabilidad de obtener dos esferas negras hasta la tercera selección.
EJERCICIO Nº 05:
Un estudio de 200 centros educativos iniciales reveló que sus ingresos mensuales (en dólares,
después del pago de impuestos:
Ingreso en dólares Centros educativos
[0 - 150 > 40
[500 - 1000 ] 90
a. ¿Cuál es la probabilidad de que un centro educativo tenga un ingreso menor de 150 dolares en
ingresos después de los impuestos?
EJERCICIO Nº 06:
Se selecciona al azar una carta de un juego de 52 naipes. ¿Cuál es la probabilidad de que la carta
seleccionada:
EJERCICIO Nº 07:
Se tienen 5 esferas de colores de las cuales 2 son rojas, 2 son blancas y una negra. Si se seleccionan
al azar en forma aleatoria de una en una sin reposición hasta la tercera extracción:
c. ¿Cuál es la probabilidad de obtener hasta la tercera extracción una esfera roja y una negra?
EJERCICIO Nº 08:
Se lanzan dos dados a la vez, si se conoce que por lo menos en uno de ellos sale 2, ¿Cuál es la
probabilidad de que el puntaje total obtenido sea 5?
EJERCICIO Nº 09:
EJERCICIO Nº 10:
En una Institución educativa hay 30 trabajadores, de los cuales la tercera parte son mujeres. Si la
cuarta parte de los hombres y la mitad de las mujeres son de la capital, ¿Cuál es la probabilidad
de que al seleccionarse un trabajador aleatoriamente este:
a. Sea hombre
b. Sea mujer y provinciana c. Sea mujer sabiendo que es de la capital
d. Sea hombre sabiendo que es provinciano
EJERCICIO Nº 11:
La UNS está formada por 56% de hombres y 44% de mujeres, se sabe que el 44% de los hombres
y el 20% de las mujeres fuman. Si elige un estudiante al azar y si resulta que fuma. Calcular la
probabilidad de que sea hombre.
EJERCICIO Nº 13:
El 60% de los doctores, 80% de los licenciados y el 25% de los bachilleres son varones. Se elige
al azar un profesor y resulta ser mujer, ¿Cuál es la probabilidad de que sea doctor?
EJERCICIO Nº 14:
Un ingeniero ha descubierto, en una gran empresa industrial, que el 20% de los casos de
emergencia que examina, provienen del departamento A, el 10% del departamento B, el 45% del
departamento C y el 25% del departamento D. también ha descubierto que el 10% de los casos de
emergencia del departamento A, el 5% del departamento B, el 15% del departamento C y el 12%
del departamento D son accidentes debidos a aparente descuido. Se presenta en la clínica un caso
de accidente ocasionado por descuido. ¿Qué probabilidad hay de que ese paciente pertenezca al
departamento ¿A?¿B?¿C?¿D?
EJERCICIO Nº 16:
Tabla:
EJERCICIO Nº 18:
Tabla
DISTRIBUCIONES DE PROBABILIDADES
1. LA DISTRIBUCIÓN BINOMIAL
Experimento Binomial:
Es aquel que consiste en realizar “n” veces ensayos de Bernoulli, en el cual se debe
cumplir lo siguiente:
a. Cada ensayo tienen solo dos resultados posibles.
b. Los ensayos son independientes.
c. La probabilidad de éxito “p” es constante en cada ensayo.
5. Su notación es : X B ( n, p )
6. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente
ESTUDIO DE CASOS
CASO Nº 01:
En el almacén de la Universidad Nacional de la Santa, hay 12 artículos eléctricos de los cuales 3
de ellos son defectuosos. Si se extrae una muestra aleatoria de 5 a partir del grupo. Cuál es la
probabilidad de que:
CASO Nº 02:
En el Centro Educativo “Champagnan” se está aplicando un nuevo método de enseñanza del
aprendizaje del Idioma Inglés. Después de completar con la aplicación de este método se evalúa
que el 1% salió desaprobado. El Administrador selecciona en forma aleatoria estudiantes al azar
del colegio:
CASO Nº 03:
En un juego de apuestas entre los estudiantes de la UPN y el profesor de estadística, el estudiante
arroja una moneda 10 veces. En este juego se tienen en cuenta las siguientes apuestas:
a. Si obtiene 5 caras o más, el estudiante gana 2 puntos en su examen de medio ciclo.
b. Si obtiene menos de 3 caras no gana ningún punto.
c. Si obtiene más de 6 caras gana 3 puntos.
d. Si obtiene 2 caras o menos se le quita 1 punto en el examen de medio ciclo.
Cuáles son las respectivas probabilidades en las diferentes apuestas:
a. P(X≥5)=
b. P(X<3)=
c. P(X>6)=
d. P(X≤2)=
CASO Nº 04:
Según información de Secretaría Académica de la UCV, el 65% de los estudiantes son del sexo
masculino y el resto mujeres. Para la aplicación de una encuesta por parte de la asistenta social,
se selecciona aleatoriamente a 10 estudiantes:
a. Cuál es la probabilidad de encuestar a menos de 5 hombres.
b. Cuál es la probabilidad de encuestar más de 5 hombres
c. Cuál es la probabilidad de encuestar a 3 y 8 hombres inclusive.
d. Cuál es la probabilidad de encuestar a ningún hombre.
2. LA DISTRIBUCIÓN POISSON
Ejemplos:
1. Numero de manchas en un metro cuadrado de un esmaltado de un refrigerador.
2. Número de vehículos que llegan a una estación de servicios durante una hora.
3. Número de llamadas telefónicas en un día.
4. Número de clientes que llegan a un banco durante las 10 y 12 p.m.
5. Numero de bacterias en un cm3 de agua.
11. Su notación es : X P( λ )
12. Uso de tabla: Para el uso de tabla tener en cuenta lo siguiente
ESTUDIO DE CASOS
CASO Nº 01:
En un estudio de Satisfacción del Cliente en la UNS, se determinó que las personas llegan
aleatoriamente a la ventanilla de caja, con una tasa promedio de 24 personas por hora, durante la
hora punta comprendida entre 11:00 am y 12:00 am de cierto día. El jefe administrativo desea
calcular las siguientes probabilidades:
a. Cuál es la probabilidad de que lleguen exactamente 5 personas durante esa hora?
b. Cuál es la probabilidad de que lleguen más de 5 personas durante esa hora?
c. Cuál es la probabilidad de que lleguen menos de 5 personas durante esa hora?
d. Cuál es la probabilidad de que lleguen más de 8 personas durante esa hora?
CASO Nº 02:
Si la secretaria de la Escuela de Postgrado de la UNS, recibe un promedio de 2 llamadas cada 3
minutos por motivos académicos. Calcular lo siguiente:
a. Cuál es la probabilidad de que reciba más de 3 llamadas en 3 minutos.
b. Cuál es la probabilidad de que reciba menos de 2 llamadas en tres minutos.
c. Cual es la probabilidad de que reciba exactamente 2 llamadas en tres minutos.
d. Cuál es la probabilidad de reciba 5 llamadas en 6 minutos.
e. Cuál es la probabilidad de que reciba menos de 2 llamadas en un minuto.
CASO Nº 04:
En un estudio por parte del Ministerio de Transporte y Comunicaciones (MTC), se ha determinado
que en la carretera panamericana con destino a Lima, hay en promedio de 20 accidentes por
semana (7 días), calcular las siguientes probabilidades:
a. Cuál es la probabilidad de que en una semana no haya ningún accidente.
b. Cuál es la probabilidad de que en dos semanas haya 10 accidentes.
c. Cual es la probabilidad de que en 1semana ocurra menos de 15 accidentes.
d. Cuál es la probabilidad de que en un día haya tres o menos accidentes.
e. Cuál es la probabilidad de que en un día haya tres o más accidentes.
CASO Nº 05:
En el Centro de impresiones de la UNS se comete dos fallas en las impresiones debido a causas
externas cada vez que imprime 2,500 hojas como promedio. Con esta información determinar:
a. La probabilidad de que en una impresión de 500 hojas, ocurra uno más errores.
b. La probabilidad de que no ocurrirán errores en una impresión de 50 hojas.
CASO Nº 06:
Los alumnos llegan a una garita de vigilancia de la ciudad universitaria aleatoriamente a una
tasa de 300 alumnos por hora. Calcular la probabilidad de que:
a. Un alumno llegue durante un periodo de 1 minuto
b. Por lo menos dos alumnos lleguen durante un periodo dado de un minuto.
c. Ningún alumno llegue durante un periodo de 1 minuto
CASO Nº 07:
En la empresa de textiles “Paracas” se producen ciertos tejidos de lana, con un promedio de un
defecto cada 100 metros cuadrados.
a. Cual es la probabilidad de que una pieza de 50 por 10 metros tenga defectos?
b. Cual es la probabilidad de que presente un defecto como máximo?
LA DISTRIBUCIÓN NORMAL
CARACTERÍSTICAS
1. Tiene como parámetros a y
2. Su función de probabilidad está dada por:
1 X
2
1
f ( x) 2
, X
2
Además:
- +
- < < + y >0
3. El promedio puede tomar valores entre – y + mientras que > 0, entonces existen
infinitas curvas normales.
4. Esta función de probabilidad es asintótica con respecto al eje X, (a pesar de tener recorrido
infinito, la curva nunca toca el eje X); además es unimodal y es simétrica con respecto a
la media .
5. El areá bajo esta función o curva es 1 ó 100%, de la misma manera se sabe que las áreas
comprendidas bajo la curva normal son :
1. = 68.3%
2. 2 = 95.5%
3. 3 = 99%
- 3 2 1 1 2 3 +
X
Z
2. La modificación de la escala ha permitido elaborar una tabla para el cálculo de las
probabilidades; si esto no hubiera sido posible, sería necesario construir una tabla para
cada valor de y .
3. La función de densidad de la variable estandarizada es:
1
1 z2
f ( z) e2
2
USO DE TABLA:
Si se conoce el comportamiento de una variable, es decir, se sabe que tienen una distribución
normal, para calcular las diferentes probabilidades se tiene que estandarizar la variable. Una
vez estandarizada la variable, recién utilizar la tabla de la distribución normal estandarizada o
tabla Z.
FORMULAS:
x a a
a. P( x a) P( ) P( Z )
x a a
b. P( x a) 1 P( x a) 1 P( ) 1 P( Z )
a b a a
c. P(a x b) P( x ) P( Z )
ESTUDIO DE CASOS
CASO Nº 01:
El rendimiento académico de los estudiantes de la UCV, tiene una distribución normal con media
igual a 16 y varianza igual a 4. Si se selecciona un estudiante de esta Universidad, encuentre la
probabilidad de que:
a. El rendimiento sea mayor que 16
b. El rendimiento sea menor que 14
c. El rendimiento este entre 14 y 18
d. El rendimiento este entre 15.5 y 16.5
CASO Nº 02:
Los salarios mensuales de los trabajadores administrativos de la UNS tiene un comportamiento
normal cuya media es S/. 2100 y una desviación estándar de S/. 50. Cuantos trabajadores tienen
salarios:
a. Menores de S/. 2150.
b. Menos de S/. 2200.
c. Mas de S/. 2180.
d. Entre 2080 y 2150 soles.
CASO Nº 03:
El tiempo de duración de los focos eléctrico de los cañones proyectores tienen una distribución
normal con una media de 1000 horas y una desviación estándar de 250 horas. Determinar la
probabilidad de que:
a. Un foco tomado al azar se queme antes de las 990 horas de funcionamiento
b. Un foco se que queme entre 980 y 1120 horas de funcionamiento.
c. Un foco dure mas de 998 horas
CASO Nº 04:
NEUMA Perú, es una empresa que produce llantas para automóviles en nuestro país. La vida útil
de estas llantas se distribuye aproximadamente como una normal con media y desviación estándar
iguales a 32000 y 1000 millas respectivamente. Esta empresa quiere exportar estas llantas por lo
que empieza a hacer ciertos cálculos acerca de la calidad de estas llantas, para lo cual se hace las
siguientes preguntas:
a. Cuál es la probabilidad de una llanta producida por esta empresa tenga una vida útil de 31900
millas.
b. Cuál es la probabilidad de una llanta producida por esta empresa tenga una vida útil desde
31000 y 33000 millas.
c. Si la empresa fija una garantía de 30000 millas. ¿Qué porcentaje de esta producción necesitará
ser reemplazada?
CASO Nº 05:
El tiempo requerido para realizar una pregunta de examen es una variable aleatoria cuya
distribución es aproximadamente normal con media 12.9 minutos y una desviación estándar de
2.0 minutos. ¿Cuáles son la probabilidades de que un alumno resuelva una pregunta del examen
en:
a. Al menos 11.5 minutos.
b. Entre 11.0 y 14.8 minutos.
c. A lo más 12 minutos
d. Entre 10 y 13 minutos.
MUESTREO
1. DEFINICIONES PRELIMINARES:
MUESTREO
Ventajas: Desventajas:
TÉCNICAS DE MUESTREO
UNIDAD DE ANÁLISIS:
Para seleccionar una muestra, primero se define la unidad de análisis que puede
ser un cliente, un votante, una organización, un libro contable, un periódico, un
hospital, un paciente, etc. Esta definición nos permite identificar “Quien va ha ser
medido” , “Quien nos va ha dar la información” y por lo tanto precisar claramente el
problema a investigar y los objetivos de la investigación.
POBLACION OBJETIVO:
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o
99% y que origina el valor de Z.
b. El error de estimación (E): Que también es fijado por el investigador
c. La desviación estándar ó varianza: que son valores que se obtienen por estudios anteriores,
por la muestra piloto o por la distribución de la población.
d. El Tamaño de la población (N): Que generalmente no se conoce.
a. Un nivel de confianza: Que es adoptado por el investigador, el cual puede ser 90%, 95% o
99% y que origina el valor de Z.
b. El error de estimación (E): Que también es fijado por el investigador
c. La proporción poblacional (P): que son valores que se obtienen por estudios anteriores, por
la muestra piloto y si no se conoce asumir p=0.5.
d. El Tamaño de la población (N): Que generalmente no se conoce.
Cualitativa Cuantitativa
VARIABLE
(Proporción Poblacional) (Promedio Poblacional)
POBLACION
INFINITA Z 2 P(1 P) Z 2S 2
(Cuando no se n0 n0
E2 E2
conoce N)
POBLACION Z 2 P(1 P) N Z 2S 2N
FINITA n 2 n 2
(Cuando se E ( N 1) Z 2 P(1 P) E ( N 1) Z 2 S 2
conoce N)
B. Cálculo del Valor de P: Se calcula este valor cuando la variable de estudio es cualitativa.
TABLA N° 02
COMPORTAMIENTO DE P y Q
P Q=1-P PQ
0.05 0.95 0.0475
0.10 0.90 0.090
0.20 0.80 0.160
0.30 0.70 0.210
0.40 0.60 0.240
0.50 0.50 0.250
0.60 0.40 0.240
0.70 0.30 0.210
0.80 0.20 0.160
0.90 0.10 0.090
0.95 0.05 0.0475
C. Cálculo del Valor de la varianza (Si la variable es CUANTITATIVA): este valor es
obtenida por estudios anteriores, muestra piloto, criterio de experto o distribución de la
variable de interés.
D. Cálculo del error de estimación: Generalmente se asume 2%, 5%, y 8% de error. Este
valor es fijado por el investigador. Es la diferencia entre el parámetro (población) y el
estimador (Muestra). Es decir: E o oˆ .Este error puede ser absoluto o relativo. Si
E=±0.35 se denomina error absoluto. Si consideramos un error del 10% de la media, es
decir, E=10%( x )=0.10(3.5)=0.35 se denomina error relativo.
ESTUDIO DE CASOS
Por estudios anteriores en una empresa en plena campaña de producción se obtuvo que el
promedio de horas extras por trabajador es de 3.3 hrs, con una varianza de 4.18 hrs2. Si en el
presente año esta misma empresa se encuentra en plena campaña de producción y cuenta con 120
trabajadores, los cuales registran sus horas extras en tarjetas de control. Determinar el tamaño de
muestra necesario para estimar el promedio de horas extras diarias con un error del 20% del
promedio y una confianza del 95%.
Cual será el tamaño de corridas de producción adecuado si se requiere estimar el tiempo promedio
para efectuar la producción de un producto químico con una confianza del 95%. Además en un
estudio piloto se encontró x 3.5 horas y s = 2.2 horas y además el investigador asume E = 0.35
horas.
Se desea estimar el tiempo medio de duración de artefactos eléctricos (focos) producidos por la
empresa PHILIPSS. Se sabe por un estudio piloto de 10 focos que la desviación estándar del
tiempo de duración es de 20 meses. De que tamaño debe ser la muestra para estimar el tiempo
medio de duración con un error máximo de 4 meses y con una confianza del 95%?.
El ministerio de Salud-Chiclayo esta realizando una investigación acerca del comportamiento del
peso de niños en la ciudad de Chiclayo y ver si presenta un plan de salud para mejorar esta factor
latente de bajo de peso. Como no se conoce la varianza se obtiene una muestra piloto de 20 niños
cuyos pesos son:
14.8, 14.2, 15.3, 15.4, 15.0, 15.2, 15.3, 14.2, 15.2, 15.5, 14.5, 15.5, 15.2, 15.0, 14.3, 15.2, 14.0,
14.0, 14.2, 15.3
Determinar el tamaño de muestra apropiado con una confianza del 95% y un error tolerable del
1% respecto al promedio.
Por estudios científicos se sabe que el Coeficiente de Inteligencia promedio para jóvenes según
la escala de Weshler es de 100 puntos con una desviación estándar de 15 puntos. Determinar el
tamaño de muestra para realizar una investigación sobre niveles de inteligencia en la UCV-
Chiclayo, si se admite un error del 2% del promedio y una seguridad del 95%.
CASO N° 07:
CASO N° 08:
Se desea estimar la proporción de jóvenes de la ciudad de CHIMBOTE que hacen uso de Internet
como mínimo una hora diaria con un 95% de confianza. De estudios anteriores se conoce que
P=0.70 y se desea un E = 5%. Suponiendo que N = 1500. Cual debe ser el tamaño de muestra.
CASO Nº 09:
Se desea estimar la proporción de la población que esta de acuerdo con la actual gestión del
Congreso de la Republica, con un error máximo de 0.5% y con una confianza del 95%. Por
estudios similares, se cree que la proporción será cerca al 1%. ¿Cuál será el tamaño de muestra
requerido?
CASO N° 10:
El administrador del Restaurant “El Romano” desea saber que proporción de sus Clientes-Turistas
están inconformes con las atenciones recibidas durante su estadía en Trujillo. ¿De que tamaño
debe ser la muestra si se considera E=0.05, nivel de confianza del 95% y no se dispone de alguna
otra información?
Las técnicas de muestreo probabilísticas tienen menos sesgo que las técnicas de muestreo no
probabilísticas; pero, incluso al interior de las técnicas de muestreo probabilísticas también
existen técnicas con más sesgo que otras, lo mismo ocurrirá en las técnicas de muestreo no
probabilísticas.
MUESTREO PROBABILÍSTICO
El muestreo aleatorio simple desde el punto de vista matemático esta es la forma más sencilla
de seleccionar una muestra, de ahí viene el nombre de muestreo aleatorio simple; pero, desde el
punto de vista práctico de la recolección de los datos y de aproximación a las unidades de estudio
es la técnica más compleja.
Muestreo sistemático
El muestreo sistemático es una alternativa muy interesante al muestreo aleatorio simple cuando
no tenemos un tamaño N, pero incluso el muestreo sistemático no es completamente factible en
muchos casos; por eso, existen otras técnicas de muestreo probabilísticas.
Muestreo estratificado
Muestreo no probabilística
Dentro de los muestreos no probabilísticos aquel que tiene menos sesgo es el muestreo por
cuotas que si bien está al interior de un grupo de muestreos no probabilísticos viene a ser la mejor
opción para los casos en que no podemos utilizar un muestreo probabilístico. Es preciso que
recordar que elegir entre uno y otro no es cuestión de gustos ni de comodidades; es, de
circunstancias
Ahora, ¿qué pasaría si tú quisieras estudiar a diez alumnos en cada colegio? Pues tendrías
que recurrir a 40 de colegios, pero ocurre la misma situación que la visita domiciliaria, porque
acudir a 40 colegios ya es muy trabajoso. Por lo tanto, el número de diez es un número bastante
razonable y en cada colegio tendrás que evaluar a 400 estudiantes.
Pero, ¿por qué exactamente diez Instituciones Educativas? ¿Por qué no once? o ¿por qué no
nueve? Recuerda: esto es un muestreo no probabilístico y la decisión del número de
instituciones educativas que se va a visitar está plenamente en las manos del investigador; de
acuerdo a la experiencia que tiene dentro de su línea de investigación o al conocimiento que tiene
acerca de la variable que desea conocer o medir
Será el investigador quien decidirá cuántas instituciones educativas debe evaluar. En nuestro
ejemplo, estamos poniendo un número de diez que parece bastante razonable. En otros casos
podría ser más o menos de una manera cualitativa.
No existe una formula, no tenemos un algoritmo ni un esquema matemático que nos permita
calcular cuántos colegios vamos a evaluar; lo que sí ocurre en el muestreo por conglomerados,
ahí s hacemos un cálculo del tamaño de la muestra; sí aplicamos un algoritmo para ver a cuántos
de los centros y puestos de salud vamos a evaluar; ahí sí podemos hacer un cálculo y establecer
a cuántas de estas instalaciones vamos a acudir porque se trata de muestreo probabilístico
El muestreo en bola de nieve es un complemento que aparece con mucha frecuencia cuando
realizamos, por ejemplo, estudios de validación de instrumentos.
Lo que necesitamos es saber qué costumbres tienen estas mujeres a la hora del parto; sin
embargo, la región alto andina del sur del Perú no es una región muy poblada, de tal modo que
encontrar una sola gestante es una tarea complicada. Dicho de otro modo: que si quieres
colectar un grupo de 50 gestantes te podrías pasar todo el año y tenemos la necesidad de construir
el instrumento lo más antes posible. Por lo tanto, necesitamos adaptar nuestra estrategia de
recolección de datos a la circunstancia.
Debemos tener en cuenta que no existe un listado de elementos; no tenemos un marco muestral
No existe un número, un cálculo del tamaño muestral, no tenemos un algoritmo ni una fórmula;
porque esta estrategia es cualitativa y la técnica de muestreo en bola de nieve es no probabilística;
por lo tanto, es el investigador quien tendrá que decidir el número de unidades de estudio que
tendrá que evaluar; el número de parteras a las que tendrá que entrevistar.
Esto significa que el investigador tiene que tener mucho conocimiento y experiencia en el tema
que está investigando; que tiene que ser parte de esta línea de investigación.
tienen contacto entre si son candidatos para ser seleccionados mediante esta técnica de muestreo
no probabilístico; también podríamos incluir a los indocumentados, a las personas ilegales o
que se encuentran con residencia ilegal: el requisito es que estas unidades de estudio se
encuentren conectados entre sí, de tal forma que la identificación de uno de ellos nos permita
acceder al resto de la comunidad.
En mi ciudad yo conozco a los profesionales que brindan asesoramiento estadístico, te puedo
poner en contacto con ellos, te puedo dar su número telefónico; pero, no es que exista un listado,
un registro oficial, una nómina de todas las personas que hacen esta labor. Sin embargo, por la
labor que realicé durante diez años conozco el medio y a las personas que se dedican a esto. Por
lo tanto, bien podría aplicarse también en este caso un muestreo en bola de nieve.
Dentro del muestreo según criterio existen dos formas de criterio: el primer criterio, que es el
criterio del investigador; y el segundo criterio, que es el criterio de un grupo de expertos. Al
primero de ellos se le denomina discrecional; y al segundo, de juicio.
como siempre, pienso en aquel que tenga la menor cantidad de sesgo posible. Comienzo
por el muestreo por cuotas a ver si este es el tipo de selección que me permitiría recolectar datos.
Este tipo de muestreo es muy utilizado en las pruebas piloto, porque cuando construyes un
instrumento necesitas ponerlo a prueba. Para realizar tu cálculo del alfa de Cronbach y realizar
un ajuste acerca de la forma de redacción que debe tener tu instrumento, en ese caso no tienes
que hacer un cálculo ni utilizar una técnica probabilística, sino simplemente identificar un
conjunto de unidades de estudio muy similar al que pertenece tu población y a esto se le
denomina focus group, muy utilizado en los estudios de mercado.
El muestreo por conveniencia recibe diversos nombres, como por ejemplo: deliberado, porque
no hay ningún procedimiento, ninguna acción ni razón; en suma, no hay ninguna forma de
seleccionar la muestra, es simplemente deliberado.
Sesión 11: Inferencia Estadística: Estadística Paramétrica: Requisitos para su aplicación. Estimación puntual
e intervalica. *Intervalo de confianza para la Media y Diferencia de Medias Hipótesis científica y
estadística .Error de tipo I y II.
ESTIMACIÓN ESTADÍSTICA
A. ESTIMACION PUNTUAL:
Es aquel único valor que se obtiene de la muestra, es decir, que para su cálculo se debe
tener información muestral. Las formulas para calcular o realizar estas estimaciones son
las siguientes:
PARAMETRO
2 P
n n
ESTIMACION
x i (x x)
i
2
Pˆ p
a
PUNTUAL ̂ x i 1
ˆ s
2 2 i 1
n
n n 1
B. ESTIMACIÓN INTERVÁLICA:
Al realizar una estimación, siempre se va a cometer un error. Entonces, cuando estimamos un
parámetro nunca va a ser exacto, ese valor será mayor o menor al verdadero. Entonces se
obtendrá un intervalo de valores posibles. Ese intervalo se llama estimación interválica.A esa
diferencia mayor o menor se llama error de estimación, el cual esta en relación directa con la
variabilidad del estimador y el nivel de confianza determinado por el investigador. La
estimación intervalica para un parámetro en general, esta dada por:
ˆ Z / 2 ˆ Z / 2
: ˆ Z / 2
Para determinar este intervalo se necesita de:
a. La estimación puntual
b. La desviación estándar del estimador.
c. Nivel de confianza, el cual será repartido para cada lado del intervalo.
pq
P : p Z / 2
n
A. Si las muestras son de tamaño n1>30 y n2>30 (grandes) y además las varianzas
poblacionales se CONOCEN:
12 22
1 2 : ( x1 x 2 ) Z / 2
n1 n2
B. Si las muestras son de tamaño n1<30 y n2<30 (pequeñas) y además las
varianzas poblacionales DESCONOCIDAS:
1 1
1 2 : ( x1 x2 ) t( / 2, n n 2) sc2 ( )
1 2
n1 n2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
2
, se llama varianza mancomunada
n1 n 2 2
RESPECTO AL PROMEDIO:
1. Los estudiantes de Administración de la UNT realizaron un trabajo de aplicación respecto a
los sueldos de los trabajadores de la mina YANACOCHA, para lo cual seleccionaron una
muestra aleatoria de 24 trabajadores en el cual se determinó que el sueldo promedio semanal
es de $160 y una varianza de 10 dolares2.
3. Nuestro amigo BRUNO se dedica al negocio de los AUTOS, el sospecha que su margen de
beneficios mensual promedio por auto vendido está por debajo del promedio nacional de S/.
700. Para evaluar su margen de beneficio toma información (muestra) respecto a 8 meses cuya
información es la siguiente:
1. Según un vendedor de automóviles, de todos los vehículos adquiridos por los docentes
universitarios, en más del 80% de los casos el color es elegido por la mujer. Para verificar esta
hipótesis se toma una muestra de 400 parejas que han comprado autos nuevos durante el
último año, hallándose que en 310 casos el color fue en efecto elegido por la dama.
Calcular:
a. El intervalo confidencial para la proporción considerando el 99 % de confianza.
b. El intervalo confidencial para la proporción considerando el 90% de confianza.
TEXACO : 90 85 95 76 80
REPSOL : 84 87 90 92 90
Para realizar un análisis de pruebas de hipótesis hay que conocer algunas definiciones
preliminares que debemos conocer:
1. DEFINICIONES PRELIMINARES:
2. CLASES DE HIPOTESIS:
Error Tipo I:
•Se comete este error cuando se rechaza la hipótesis nula, cuando es verdadera.
•Se denota por α = P(Rechazar Ho/Ho es verdadera)
x
t t t t ( / 2 , n 1) (distribución t de student)
s
n
II. PRUEBA DE HIPOTESS PARA LA PROPORCION POBLACIONAL
Estadístico de prueba:
pP Zt Z / 2
Z
PQ
n
Esta formula es tanto para muestras grandes como para muestras pequeñas.
III. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE MEDIAS
C. Si las muestras son de tamaño n1>30 y n2>30 (grandes) y además las varianzas
poblacionales se CONOCEN:
Estadístico de prueba:
( x1 x 2 ) D Zt Z / 2
Z
1 2
n1 n2
D. Si las muestras son de tamaño n1<30 y n2<30 (pequeñas) y además las varianzas
poblacionales DESCONOCIDAS:
( x x2 ) D t t t ( / 2 , n 1) (distribución t de student)
t 1
1 1
Sc
n1 n 2
Donde :
(n 1 1)s 12 (n 2 1)s 22
sc
2
, se llama varianza mancomunada
n1 n 2 2
IV. PRUEBA DE HIPOTESIS PARA LA DIFERENCIA DE PROPORCIONES:
B. Si p1 y p2 se determinan a partir de muestras:
( p1 p 2 ) D
Z Zt Z / 2
p1 q1 p 2 q 2
n1 n2
Esta formula es tanto para muestras grandes como para muestras pequeñas.
7. PRUEBA DE HIPOTESIS CON EXCEL:
Para resolver prueba de hipótesis con EXCEL hay que tener presente lo siguiente. En Excel
solamente se puede evaluar hipótesis de comparación de medias en la cual se puede utilizar
la prueba de T de Student o la prueba Z.
Se utilizara la prueba T de Student cuando la varianza se desconoce y además la muestra es
pequeña (n≤30). Aquí hay que distinguir dos casos:
a. Cuando se supone que la varianza es igual en ambos grupos.
b. Cuando se supone que la varianza es diferente en ambos grupos.
7.1. PRUEBA Z:
Se utilizará la prueba Z cuando la varianza se conoce y cuando la muestra es grande
(n>30).
CASO Nº 01:
Las ganancias en miles de dólares de 10 centros educativos de nuestro medio han producido la
siguiente información:
15.8, 12.7, 13.2 16.9, 10.6, 18.8, 11.1, 14.3, 17.0 y 12.5.
Otro conjunto de centros educativos fueron evaluados también respecto a sus ganancias en miles
dólares, obteniendo los siguientes resultados:
24.9, 23.6, 19.8, 22.1, 20.4, 21.6, 21.8 y 22.5
Realizar una prueba de hipótesis para verificar si las ganancias de este último grupo es superior a
las ganancias de las empresas de nuestro medio. Para probar esta hipótesis utilice un = 0.05.
Llegaría a la misma conclusión si utiliza = 0.01.
CASO Nº 02:
JORGE MELENDEZ, Administrador deL BCP está interesado en saber si existe diferencia
significativa entre los tiempos de atención al cliente de los empleados que trabajan en los dos
turnos: mañana y tarde. Al respecto, ayer personalmente registró los tiempos que utilizaron los
empleados para atender a los clientes en ambos turnos y en forma aleatoria. Los tiempos en
minutos que registró fueron los siguientes:
Mañana 2.10 4.10 4.70 3.70 6.00 3.90
Tarde 4.00 4.50 3.70 4.00 4.10 3.45
A la luz de estos resultados, ¿A qué conclusión llegó Jorge Meléndez?. Utilice un nivel de
confianza del 95%.
CASO Nº 03:
Un fabricante de microcircuitos esta interesado en determinar si dos diseños diferentes producen un
flujo de electricidad equivalente. El ingeniero responsable ha obtenido la siguiente información:
Diseño 1 20.3 22.5 23.3 29.1 26.5 22.1 20.8 28.6 23.3 21.5
Diseño 2 23.5 26.5 28.6 21.5 26.4 27.9 26.5 25.5 26.7 28.9
Con =0.01, se desea determinar si existe alguna diferencia significativa en el flujo de electricidad
entre los dos diseños.
CASO Nº 04:
Una compañía desea estudiar el efecto que tiene la pausa para el café, sobre la productividad de
sus obreros. Selecciona 6 obreros y mide su productividad en un día cualquiera (sin pausa para el
café), y luego mide la productividad de los mismos 6 obreros en un día que se concede la pausa
para el café. Las cifras que miden la productividad son las que siguen: Con = 0,05. ¿A qué
conclusión llegará la compañía?.
TRABAJADO 1 2 3 4 5 6
R
Sin pausa 23 35 29 33 43 32
Con pausa 28 38 29 37 42 30
PRUEBA DE HIPOTESIS
Las hipótesis son afirmaciones o conjeturas respecto al problema planteado. Tales afirmaciones
pueden ser verdaderas o falsas, por lo que se requiere de una comprobación en base a un conjunto
de datos muestrales para determinar si los resultado afirman o contradicen tal suposición
con cierta probabilidad pre establecida.
El procedimiento a seguir en una prueba de hipótesis es :
a) Formular las hipótesis estadísticas .- Se refiere a la formulación de la hipótesis nula ( Ho)
y de la alternativa ( H1)
Ho : No existe diferencia significativa (efecto nulo)
a) Formulación de Hipótesis.
Ho : = 0
H1 : 0
: Puntaje promedio poblacional
c) Estadística de prueba
x 0
t
DE
n
donde :
1 n 2 2
DE x i n x
(n -1) i 1
d) Valor tabular
t tab t(n-1
; 1 - 2 )
e) Decisión
Criterios de decisión :
x Z x Z
n
(1 / 2 ) (1 / 2 )
n
Ejemplo:
a) Formulación de Ho y Ha .
Ho : = 420
Ha : 420
b) = 0.05
c) Estadística de prueba
-
x 420
t t (19)
S
n
430 420
t 0.45 , p 0.657
100
20
e) Decisión
Como p > 0.05 se rechaza la hipótesis nula, por tanto existe evidencia suficiente para poder
afirmar que el sueldo promedio es diferente de 420 dólares.
Ejercicio:
Calcular el intervalo de estimación del verdadero sueldo promedio, con un nivel de confianza
del 95%.
a) Formulación de Hipótesis.
Ho : 12 = 22
H1 : 12 22
b) Nivel de significación :
= 0,05
c) Estadística de prueba
S12
F0 2 F( n1 1;n2 1)
S2
2 2
donde S1 es mayor que S 2 .
d) Valor tabular
e) Decisión
a) Formulación de Hipótesis.
Ho : 1 = 2
H1 : 1 2
c) Estadística de prueba
x 1 x 2
t
1 1
(DE) 2
n1 n
2
donde :
(n 1 - 1)S1 (n 2 - 1 )S2
2 2
( DE )
2
n 1 n2 - 2
d) Valor de p
p: Es la probabilidad que hay del valor t calculado hacia la derecha
e) Decisión
Rechazar Ho si p < 0.05 ó p < 0.01
Criterios de decisión:
Ejemplo
Treinta empleados de una gran empresa fueron distribuidos en dos grupos iguales a dos
diferentes programas de capacitación industrial. El grupo I fue capacitado con el Método
A, que consiste en adiestrarlos directamente en la maquinaria y el grupo II con el Método
B, con la atención personal de un instructor. Los puntajes obtenidos después de la
capacitación en una prueba apropiada fueron:
Método A Método B
Media ( x ) 78 70
N 15 15
Ho : 1 = 2
H1 : 1 2
c) Nivel de significación :
= 0,05
c) Estadística de prueba
78 - 70 = 4,30
t0
1 1
(26)
15 15
d) Valor de p
p = 0.0002
e) Decisión
Como p < 0.01, se rechaza Ho. Por tanto existe diferencia estadísticamente
significativa en los dos métodos de capacitación.
PRUEBA DE HIPOTESIS PARA LA DIFERENCIA ENTRE LAS MEDIAS DE DOS
POBLACIONES CORRELACIONADAS
Debe usarse cuando se desea comparar 2 tratamientos y las unidades en estudio son heterogéneas
pero es factible conformar parejas homogéneas o gemelas, Ejm. Cuando se desea comparar :
- 2 tipos de cueros de zapatos en diferentes individuos.
- 2 tipos de fungicidas en diferentes individuos.
- 2 marcas de termómetros en diferentes ambientes.
- 2 instrumentos para medir corrosión en diferentes superficies.
- Efectividad de una técnica de ventas (antes y después de la aplicación de la técnica ).
- 2 tipos de alimentación en cerdos de diferentes camadas.
- 2 variedades de maíz en diferentes localidades.
Prueba de hipótesis :
a) Hipótesis estadísticas
Ho : 1 = 2
H1 : 1 ≠ 2
b) Nivel de significación
= 0.05
c) Prueba
d n di X1i X2i
tc ,
Sd
n
di
d i 1
n
n
(d i d)
2
Sd2 i 1
n -1
d) Valor de p
e) Decisión
Criterios de decisión :
Se llevó a cabo un experimento para probar el efecto de dos medicamentos distintos sobre el
tiempo de coagulación de la sangre (en minutos). Se extrajeron muestras de sangre de 10 personas
y se dividieron igualmente en dos partes que se asignaron al azar a uno de los dos medicamentos.
Los resultados fueron los siguientes:
Persona X1 X2 Dif.
1 1.5 1.6 -0.1
2 1.4 1.4 0.0
3 1.8 1.6 0.2
4 1.3 1.2 0.1
5 2.0 2.1 -0.1
6 1.1 1.0 0.1
7 1.5 1.6 -0.1
8 1.5 1.5 0.0
9 1.2 1.0 0.2
10 1.5 1.6 -0.1
Solución
a) Hipótesis
H0 : 1 = 2 ó H0 : d = 0
H1 : 1 2 H1 : d 0
b) = 0,05
c) Prueba
d 0,0220
t
S 0,12273/ 10
d
0,0220
0.567
0,03881
d) Valor tabular
e) Decisión
donde :
d = X1 - X2
d = 0,022
S2 = 0,12273
n = 10
Ejercicio:
B 89 60 82 50 39 22 57 32 96
a) Formulación de Hipótesis.
Ho : P = P0
H1 : P P0
c) Estadística de prueba
p - P0
Z Normal ( 0 , 1)
P Q
0 0
n
donde :
Q0 = 1- P0
d) Valor tabular
Ztab Z1 -
2
e) Decisión
pq pq
p Z1 / 2 P p Z1 / 2 , con un nivel de confianza (1 –α)
n n
Ejercicio:
Se afirma que el nivel de desempleo en una ciudad es del 8%, para confirmar tal versión se
a) ¿Qué se puede concluir acerca de la afirmación? Use un nivel de error del 5%.
en la ciudad en referencia.
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
c) Estadística de prueba
p1 - p 2
Z Normal ( 0 , 1)
1 1
pq
n1 n2
n1 p1 n 2 p 2
p
n1 n 2
d) Valor p
e) Decisión
Ejemplo
Una firma distribuye dos marcas de detergente. En una encuesta se encuentra que 56 de 200
amas de casa prefieren el detergente de la marca A y que 29 de 150 amas de casa prefieren
la marca B. ¿ Se puede concluir al nivel de significación del 5% que la marca A tiene mayor
preferencia que la marca B?
Solución
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 > P2
b) = 0,05
c) Estadística de prueba
0,28 - 0,19
Z 1.87
1 1
(0,243)(0, 757)
200 150
56 29
p , q = 1-p
200 150
= 0,243
d) Valor de p
p = 0.031
e) Decisión
Como p<0.05, se rechaza la hipótesis nula, por tanto la marca A tiene mayor preferencia que
la marca B.
Los intervalos de confianza que se utilizan con mayor frecuencia son los de 90, 95, y 99%.
PROPORCIONES SELECCIONADAS DE ÁREAS
BAJO LA CURVA NORMAL.
1.645 0.90
1.96 0.95
2.58 0.99
EMEPLO Nº 1
Suponga que se sabe que la desviación estándar de la vida útil de los lentes de una marca
especifica de microscopios es σ = 500 horas, pero no se conoce el promedio de vida útil en
términos generales, se supone que la vida útil de los lentes tiene una distribución
aproximadamente normal. Para una muestra de n = 15, la vida útil promedio es de X = 8900 horas.
Construya intervalos de confianza para estimar la media de la población.
a) con el 95%
En este caso puede utilizarse la distribución normal porque la población tiene una distribución
normal y se conoce σ. .
Solución.
a.- datos
500 500
x = 8900 hrs. n = 15 σ = 500 σx = 129.20
n 15 3.87
x z σx = 8900 1.96 * 129.20 = 8900 253.23 Intervalo 8647 a 9153 hrs
b.- 8900 1.645 (129.20) = 8900 212.53 Intervalo 8687 a 9113 hrs.
EJEMPLO Nº 2
Con relación al ejemplo anterior, suponga que no puede asumirse que la vida útil de la población
de los lentes tiene una distribución normal. Sin embargo, la media muestral X = 8900 hrs se basa
en una muestra de n = 35. Construya un intervalo de confianza del 95 % para estimar la media
de la población.
En este caso, puede utilizarse la distribución normal de probabilidad utilizando el Teorema del
Límite Central, que señala que cuando n ≥ 30 puede asumirse que la distribución muestral tiene
una distribución normal, aun cuando no tenga distribución normal.
Solución.
500
X Z σx = 8900 1.96 * = 8900 165.5 Intervalo 8735 a 9066 hrs.
35
EJEMPLO Nº 3
Con relación al ejemplo nº 2, suponga que puede asumirse que la población tiene distribución,
pero que se desconoce la desviación estándar de la población, más bien, se sabe que la desviación
estándar muestral es S = 500 y X = 8900. Estime la media de la población utilizando un intervalo
de confianza del 90%.
Solución.
La distribución es normal.
El límite central.
500
X Z Sx 8900 1.645 * 8900 1.645 * 84.46
35
En los ejemplos anteriores se señalo que el uso de la distribución normal en la estimación de una
media poblacional es válida para cualquier muestra grande ( n ≥ 30 ), y para una muestra pequeña
( n < 30 ) sólo si la población tiene distribución y se conoce . Ahora, se revisa el caso en el
que la muestra es pequeña y la población tiene una distribución normal pero se desconoce σ. :
Formula.
x ttabla; gl n 1 sx
EJEMPLO Nº 5
La vida útil promedio de una muestra aleatoria de n = 10 focos es X = 4000 horas, con una
desviación estándar muestral S = 200 horas. Se supone que la vida útil de los focos tiene una
distribución aproximadamente normal. Estimar la vida útil promedio de la población de los focos
de la cual se tomó la muestra, utilizando un intervalo de confianza del 95%
Solución.
200 200
4000 ± 2.262 · = 4000 ± 2.262 · = 4000 ± 143.16
10 3.16
Limite inferior 4000 - 143.16 = 3857 horas Limite superior = 4000 + 143.16 = 4143 horas
INTERVALOS DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS
POBLACIONALES.
Con frecuencia es necesario estimar la diferencia entre dos medias poblacionales, tal como la
diferencia entre los niveles de sueldos en dos empresas.
Formula.
x
1 x 2 z tabla
12
n1
22
n2
→ Error estándar de la diferencia entre dos medias,
Nota: Se debe utilizar los factores de corrección por población finita cuando sea apropiado.
EJEMPLO Nº 6
(1400) 2 (1000) 2
28000 – 27000 ± 2.575
30 40
2800 – 27000 ± 2.575 · 300.55
$ 1000 ± 773.92
Se puede afirmarse que el salario diario promedio del primer laboratorio es mayor que el
correspondiente al segundo, en una cantidad que va de $ 226 a $ 1774, con una confianza del
99% en esa estimación por intervalos.
LA DIFERENCIA t STUDENT Y LOS INTERVALOS DE CONFIANZA PARA LA
DIFERENCIA ENTRE LAS MEDIAS DE DOS POBLACIONES.
2.- Las muestras son pequeñas ( n < 30 ). Si las muestras son grandes, entonces es posible
aproximar los valores t mediante la distribución normal estándar Z.
3.- Se supone que las poblaciones tienen distribuciones aproximadamente normales (debe
observarse que no se puede aplicarse el Teorema del Límite Central cuando se trata de muestras
pequeñas.
Sin embargo, cuando se utiliza la distribución t para definir los intervalos de confianza para la
diferencia entre dos medias, en vez de hacerlo para una sola, se requiere de una suposición
adicional.
4.- Las varianzas de las dos poblaciones (que se desconocen ) son iguales, σ1 = σ2.
Donde las varianzas poblacionales, si bien son desconocidas, se considera que son iguales, s c2
representa entonces la varianza común y se calcula:
sc2
n1 1 s12 n2 1 s22
n1 n2 2
x1
x 2 tgltabla
s12
n1
s2
2
n2
Donde gl = n1 + n2, = 2
Ejemplo Nº 7
La vida útil promedio de una muestra aleatoria de n1 = 10 focos es X = 4600 hrs, con S1 = 250
horas. Para otra marca de focos, la vida útil promedio y la desviación para una muestra de n2 = 8
focos son X = 4000 hrs y S2 = 200 hrs. Se asume que la vida útil de los focos de ambas marcas
tienen una distribución normal. Determinar el intervalo de confianza del 90% para estimar la
diferencia entre las vidas útiles promedio de las dos marcas de focos.
Solución
x1
x2 = 4600 – 4000 = 600
t gl = 10 + 8 = 18 – 2 = 16 1. 746
sc2
n1 1 s12 n2 1 s22 =
9(250) 2 7(200) 2
52656.25
n1 n2 2 10 8 2
x1
x 2 tgltabla
s12
n1
s2
2
n2
= 600 ± 1.746 ( 108.847 ) = 410 a 790 horas
Puede afirmarse con una confianza del 90% que la primera marca de focos tiene una vida útil
promedio mayor que la segunda, en una cantidad de 410 y 790 hrs.
INTERVALOS DE CONFIANZA PARA LA PROPORCIÓN UTILIZANDO LA
DISTRIBUCIÓN NORMAL.
Pˆ ztabla sPˆ
Donde:
:
pˆ 1 pˆ
n
pˆ 1 pˆ N n
s Pˆ ;
n N 1
Si la población es finita o el muestreo es sin reemplazo
n: es el tamaño de la muestra
p̂ : es la proporción de la muestra
N es el tamaño de la población
Ejemplo Nº 8
Una empresa de investigación de mercados entrevista a una muestra aleatoria de 100 hombres de
una comunidad grande y encuentra que una proporción muestral de 0,40 de ellos prefieren
maquinas de afeitar fabricadas por la empresa cliente de los investigadores, y no las demás
marcas. Determinar el intervalo de confianza del 95% para la proporción de todos los hombres en
esa comunidad que prefieren las maquinas de afeitar de la empresa cliente de los investigadores.
Solución
Pˆ ztabla sPˆ
s Pˆ = (0.40)(0.60) 0.24
0.0024 ~ 0.05
100 100
Por lo tanto, puede estimarse con una confianza del 95% que la proporción de hombres de esa
comunidad que prefieren las maquinas de afeitar de la empresa está entre 0.30 y 0.50.
Para estimar la diferencia entre dos proporciones de dos poblaciones, el estimador puntual
sesgado de (π1 – π2) es (P1 – P2). El intervalo de confianza implica utilizar el error estándar de
la diferencia entre las proporciones. El uso de la distribución normal se basa en las mismas
condiciones que para la distribución muestral de la proporción, excepto que se trata de dos
muestras y se aplican los requerimientos para cada una de ellas. El intervalo de confianza para
estimar la diferencia entre las proporciones de dos poblaciones es:
Formula.
N es el tamaño de la población
EJEMPLO Nº 9
En el ejemplo anterior se reporto que una proporción de 0.40 hombres de una muestra aleatoria
de 100 tomada de una comunidad grande, manifestó preferir las hojas de afeitar de la empresa
cliente de los investigadores y no de las demás marcas. En otra comunidad grande, 60 hombres
de una muestra aleatoria de 200 prefirieron las máquinas de afeitar de la empresa cliente.
Determinar el intervalo de confianza del 90% para la proporción de hombres de las dos
comunidades que prefirieron las maquinas de afeitar de la empresa cliente.
Solución
Z = 1.645
0.10 ± 1.645(0.059)
0.10 ± 0.097 = 0.003 a 0.197
EJERCICIOS DE INTERVALOS
1. De un lote de 3.500 pilas se probaron 98 al azar. La vida promedio en esa muestra resultó ser
de 3,5 horas con una desviación estándar de 0,9 horas. Construya un intervalo de confianza
del 99% para la vida media del lote de pilas (suponer normalidad en la población).
3. Se desea medir la diferencia en ventas entre dos tipos de empleados en la actividad de seguros,
unos con titulo profesional y otros de personas con estudios medios. Se toma una muestra de
41 empleados entre los primeros y la media de las ventas resulta ser 32($ miles), en tanto que
la media de una muestra de 30 empleados con sólo estudios medios es de 25. Se encontró
también que la varianza en la primera muestra es de 48 y en la segunda de 56. Determine el
intervalo de confianza del 95% para estimar la diferencia en las ventas medias de los dos tipos
de vendedores. (suponer normalidad).
4. Se desea estimar la diferencia ente los salarios semanales promedios de empleados y obreros.
Se toman dos muestras independientes de 61 personas cada una obteniéndose:
Empleados Obreros
Media $150.000 $100.000
Varianza 100.000 81.000
Construya un intervalo del 95% de confianza para estimar la diferencia de medias (suponer
normalidad).
5. Una pequeña empresa compró un lote grande de piezas electrónicas a una firma. En una
muestra aleatoria de 50 piezas se comprobó que 5 eran defectuosas. Estime la proporción de
piezas defectuosas de todo el lote, empleando un intervalo de 95% de confianza.
6. En una muestra aleatoria de 100 posibles clientes se encontró que 30 dicen que prefieren cierto
producto. Estimar el verdadero % de todos los posibles clientes que prefieren el producto,
usando un intervalo de 95% de confianza.
7. En dos ciudades se tomaron muestras de automóviles, cada una de 100 automóviles. En una
ciudad 72 automóviles pasaron con éxito la prueba de seguridad, en la otra solamente lo
hicieron 66. Construya un intervalo de 95% de confianza para estimar la diferencia de
proporciones de autos seguros en las dos ciudades.
8. Se desea hacer una encuesta para estimar el porcentaje de personas mayores de edad, de una
ciudad, que están a favor de cierto proyecto de ley. ¿Cuál debe ser el tamaño de la muestra, si
se desea un nivel de confianza del 95% y un error máximo de estimación de 4%?
9. Se desea estimar el gasto medio en movilización de los alumnos de cierta Universidad que
tiene 5.000 alumnos. ¿Cuál es el tamaño de muestra necesario, si se desea un nivel de
confianza del 95%, un error máximo de ±$2.000, y se sabe por estudios anteriores que la
desviación estándar es de $15.000?
Para comprobar si una muestra pertenece a una población con cierta media,
Para realizar la prueba de diferencia de medias para muestras independientes y
Para realizar la prueba de diferencia de medias para muestras relacionadas.
En el primer caso se compara la media de una muestra con una media poblacional, en el
segundo caso se comparan las medias de dos grupos de sujetos diferentes y en el tercero se
comparan las medias de dos variables pero generados por un mismo grupo.
Para la realización del presente análisis se tendrá en cuenta la base de datos Data_03.sav, la
cual contiene 05 variables en estudio que son las siguientes:
Para esta base datos obtener las diferentes medidas estadísticas, como rango, Vmin, Vmax,
Promedio y Varianza. Solamente como información preliminar y en base a esto realizar el
presente análisis.
Dentro de los resultados tenemos el valor de t =-5.412 y su valor p=0.00 < 0.05
Entonces podemos decidir que se rechaza la hipótesis Ho: µ=3.5 y se acepta H1.
La conclusión es que la muestra proviene de una población cuyo promedio es diferente de
3.5.
Ejercicio:
a. Probar si la muestra de estudio proviene de una población cuyo nivel de hemoglobina
promedio es igual a 14.
b. Probar si la muestra en estudio proviene de una población cuya edad promedio de la madre
es igual a 20 años.
EJERCICIO DE APLICACIÓN:
Un ingeniero esta interesado en probar si el instrumento que mide el pH esta sesgada. Se
reúnen datos de una sustancia neutral (pH=7.0). Se toma una muestra de las mediciones y los
datos son los siguientes:
7.07 7.00 7.10 6.97 7.00 7.03 7.01 7.01 6.98 7.08
Probar si el medidor presenta sesgo.
Prueba de Levene
para la igualdad de
varianz as Prueba T para la igualdad de medias
95% Intervalo de
confianza para la
Diferencia Error t íp. de diferencia
F Sig. t gl Sig. (bilateral) de medias la diferenc ia Inferior Superior
Hemoglobina Se han as umido
1.809 .190 -.294 27 .771 -.09783 .33283 -.78073 .58508
varianz as iguales
No se han asumido
-.232 6.216 .824 -.09783 .42247 -1. 12295 .92729
varianz as iguales
EJERCICIO DE APLICACIÓN:
a. Una compañía química realiza una evaluación de su proceso productivo para lo cual
compara dos marcas de aceite. Los ingenieros químicos de la empresa, toman muestras
para ambas marcas de aceite y hacen las mediciones acerca de la viscosidad. Según la
información muestral las viscosidades de ambas marcas de aceite son iguales?
Marca A Marca B
0.56 0.56
0.48 0.59
0.56 0.56
0.49 0.58
0.48 0.58
0.45 0.64
0.48 0.48
0.49 0.50
0.56 0.51
0.50 0.50
Señale Ud.
a. Cuales son las hipótesis.
b. Cual es el valor de t
c. Cual es e valor de p
d. Cual es la decisión
1
Método A Método B
11.00 11.10
5.00 9.70
9.80 5.30
5.70 6.70
6.70 8.50
8.20 5.60
5.90 7.10
6.10 5.10
N Correlación Sig.
Par 1 VAR00001 y VAR00002 8 .157 .711
Diferencias relacionadas
95% Intervalo de
confianza para la
Desviación Error típ. de diferencia
Media típ. la media Inferior Superior t gl Sig. (bilateral)
Par 1 VAR00001 - VAR00002 -.08750 2.82157 .99758 -2.44639 2.27139 -.088 7 .933
EJERCICIO DE APLICACION:
a. Deseamos comparar dos productos químicos 1 y 2 que se aplican a telas para hacerlas
mas resistentes a las arrugas. Seleccionamos 6 telas diferentes y cortamos en dos
para aplicar el producto químico. Luego sumergimos las piezas de tela en agua
caliente durante 6 horas y medimos el arrugamiento de cada pieza y obtenemos los
siguientes datos:
Producto 1 Producto 2
4.20 1.60
1.70 1.30
1.00 0.50
3.70 1.50
2.10 1.30
Probar si el producto químico 2 hace a las telas más resistentes a las arrugas que el
producto químico 1?
Solución:
Aplique sus conocimientos aprendidos en el curso.
Criterio 1
(Oij - Eij )2
2
Eij
n i. x n . j
E ij
n i.
Oij : Frecuencia observada
Eij : Frecuencia esperada
b) d) Valor tabular
c) tab
2
(2r 1)(c1) ; 1-
d)
e) Decisión
Rechazar Ho si 2 tab
2
, ( p < 0.05 ó p < 0.01)
No rechazar Ho si 2
2
tab , ( p > 0.05)
Esto es :
Ejemplo :
Suponga que un grupo de investigadores, estudiando la relación entre el tipo
sanguíneo y la severidad de la HIE en una población, reunió datos de 1500 gestantes,
que se presentan en la siguiente tabla de contingencia :
GRUPO SANGUINEO
GRADO DE A B AB O TOTAL
AFECCIÓN
Ninguno 543 211 90 476 1320
Moderado 44 22 8 31 105
Severo 28 9 7 31 75
b) = 0,05
c) Función de prueba
tab
2
22x3 ; 0,95 62; 0,95 12,59
e) Decisión
2 5,12 tab
2
12,59
No se rechaza Ho. Por tanto ambos criterios son independientes.-El tipo
sanguíneo no condiciona o predispone el grado de afección de HIE.
PRUEBAS JI- CUADRADO DE HOMOGENEIDAD
Este procedimiento es útil para probar si las muestras extraídas son poblaciones
homogéneas o equivalentes respecto a algún criterio de clasificación. En este caso, en
la hipótesis nula se establece que ambas muestras son homogéneas o que las muestras
se han extraído de la misma "población". A pesar de apreciarse diferencias en
conceptos y procedimientos de muestreo, la prueba de independencia de criterios y la
prueba de homogeneidad son matemáticamente idénticas.
Ejemplo
Se desea verificar si dos grupos experimentales son homogéneos respecto a la
edad.
GRUPOS EXPERIMENTALES
EDAD A B TOTAL
20 - 29 28 30 58
30 - 39 37 38 75
40 - 49 15 14 29
50 - 60 5 3 8
TOTAL 85 85 170
2
cal 0,62
tab
2
(2r 1)(c1) ; 1- 2
3 ; 0,95 = 7,81
2 0,62 < 2
3 ; 0,95 7,81 ( p > 0,05 )
presente el daño a la salud bajo estudio (casos) con un grupo de individuos en los cuales
está ausente el daño a la salud bajo estudio (controles). Interesa conocer la proporción
de individuos expuestos a los factores de riesgo en ambos grupos y que pueden
considerarse relevantes para la condición o enfermedad en estudio.
GRUPO DE ESTUDIO
FACTOR DE Casos Control Total
RIESGO Nº % Nº % Nº %
2. Expuestos a b m1
No expuestos c d m2
Total n1 100,0 n2 100,0 n 100,0
ODDS RATIO :
axd
OR
bxc
El OR debe entenderse como el riesgo de presentar el daño en aquellos que tienen el
factor exposición respecto a aquellos que no tienen el factor de exposición.
Ejemplo
3. Se puede observar un estudio retrospectivo de casos – controles (relación efecto –
causa ). Se captaron a todos los recién nacidos con RCIU y se toma una muestra de recién
nacidos sin RCIU, evaluándose como factor de riesgo a la talla materna. Los datos son los
siguientes :
4. Si 20 4
No 60 156
Total 80 160
a) Formulación de Hipótesis.
José Antonio Boza Rosario 2016
8
Ho : P1 = P2
H1 : P1 P2
P1 : Proporción de recién nacidos con RCIU con talla materna < 145 cm.
P2 : Proporción de recién nacidos sin RCIU con talla materna < 145 cm.
b) = 0,05
c) Estadística de prueba
5. d) Valor tabular
2
tab 3.842
d) Decisión
Rechazar Ho 2 tab
2
( p < 0.05 )
axd
OR
cxb
10 x 132
OR 2.75
8 x 60
El riesgo de presentar RCIU en las madres con talla menor a 145 es 2.75
veces respecto a aquellas madres con talla mayor o igual que 145 cm.
ESTUDIOS DE COHORTES
Los estudios prospectivos observacionales se basan en la identificación y observación de
grupos bien definidos de sujetos que experimentan en el futuro un daño a la salud. El riesgo
de experimentar este daño a la salud, se puede calcular tanto para quienes están expuestos a
un atributo o factor de riesgo determinado como para quienes no lo están; para luego
a/m
RR 1
c/m
2
APGAR Si No Total
6. Bajo 30 60 90
Normal 20 78 98
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
c) Estadística de prueba
(ad - bc ) 2 n
cal
2 = 4.01
n1n 2 m1m 2
d) Valor tabular
7. tab
2 2
1; 1- = 3,842
e) Decisión
30/90
RR 1.63
20/98
Los RN con apgar bajo ( 4 - 6) tienen el riesgo de 1.63 veces, de acusar un deficiente
desarrollo psicomotriz a los 3 años , respecto a aquellos que tiene un apgar normal.
Procedimiento de Prueba
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
ab
p1
n
ac
p2
n
b) Nivel de significación : = 0,05
c) Estadística de prueba
b-c
Z
bc
Esta prueba también puede aplicarse para evaluar un examen de tamizaje donde se necesita
contrastar sus resultados con los que se obtengan con una prueba diferente denominada
"Gold Standar" o "Prueba de Oro", a la cual se asigna un valor de certeza diagnóstica.
Los resultados pueden presentarse de la siguiente manera:
PRUEBA DE ORO
PRUEBA DE ORO
Formulación de Hipótesis.
a) Ho : P1 = P2
H1 : P1 P2
a b 180 80
p1 0.26
n 1000
a c 180 20
p2 0.20
n 1000
José Antonio Boza Rosario 2016
13
b-c 80 - 20
Z cal 6
bc 80 20
d) Valor tabular
a
S x 100
ac
d
E x 100
bd
a
VPP x 100
ab
José Antonio Boza Rosario 2016
14
d
VPN x 100
cd
En el ejemplo
180
S x 100 = 90,0
200
720
E x 100 = 90,0
800
180
VPP x 100 = 69,2
260
720
VPN x 100 = 97,3
740
200
P x 100 = 20,0 ( Prevalencia )
1000
Grupo
Resultado A B
Éxito a b m1
Fracaso c d m2
José Antonio Boza Rosario 2016
15
n1 n2 n
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
c) Nivel de significación : = 0,05
d) Estadística de prueba
(ad - bc ) 2 n
2
n 1 n 2 m1 m 2
d) Valor tabular
tab
2 2
1; 1- = 3,842
e) Decisión
Rechazar Ho si 2 tab2
No rechazar Ho si 2
2
tab
Grupo de estudio
Factor de Casos Control Total
riesgo Nº % Nº % Nº %
f) Expuestos a b m1
No expuestos c d m2
Total n1 100,0 n2 100,0 n 100,0
Tamaño de Muestra
Para determinar el número de casos y de controles existen muchos criterios. Si el número
de casos no es grande, la estrategia de muestreo puede ser tomar a todos los casos y luego
una muestra de los controles. Si tantos casos como controles tiene una población
relativamente grande la estrategia es tomar una muestra de casos y una muestra no menor de
los controles; Schlesselman ha desarrollado la siguiente fórmula donde el número de casos
se establece por :
n
Z/2 2pq Z p1q1 p2q 2 2
p1 - p2 2
, : error de tipo I y error de tipo II
p1 p 2
p
2
p1 : Proporción de expuestos en los casos
q1 : 1 - p1
p2 : Proporción de expuestos en los controles
q2 : 1- p2
ODDS RATIO :
Razón de disparidad ó Razón de ventajas. Es una estimación del Riesgo relativo y nos
axd
OR
bxc
José Antonio Boza Rosario 2016
17
Ejemplo
Se puede observar un estudio retrospectivo de casos – controles (relación efecto – causa).
Se captaron a todos los recién nacidos con RCIU y se toma una muestra de recién nacidos
sin RCIU, evaluándose como factor de riesgo a la talla materna. Los datos son los siguientes
:
g) Si 20 4
No 60 156
Total 80 160
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
P1 : Proporción de recién nacidos con RCIU con talla materna < 145
cm.
P2 : Proporción de recién nacidos sin RCIU con talla materna < 145
cm.
b) = 0,05
c) Estadística de prueba
d) Valor tabular
2
tab 3.842
e) Decisión
Rechazar Ho 2 tab
2
( p < 0.05 )
axd
OR
cxb
10 x 132
OR 2.75
8 x 60
El riesgo de presentar RCIU en las madres con talla menor a 145 es
2.75 veces respecto a aquellas madres con talla mayor o igual que
145 cm.
3.- ESTUDIOS DE COHORTES
n
Z /2 2pq Z p1q1 p 2 q2 2
p1 - p2 2
p1 p 2
p
2
RIESGO RELATIVO
a/m
RR 1
c/m
2
El riesgo relativo es el riesgo de presentar el daño en aquellos que tienen el factor de
exposición en relación a aquellos que no tienen el factor de exposición.
Ejemplo :
Apgar Si No Total
h) 30 60 90
Bajo
Normal 20 78 98
a) Formulación de Hipótesis.
Ho : P1 = P2
H1 : P1 P2
P1 : Proporción de RN de apgar bajo con desarrollo psicomotriz
deficiente.
P2 : Proporción de RN de apgar normal con desarrollo psicomotriz
deficiente.
b) Nivel de significación : = 0,05
c) Estadística de prueba
José Antonio Boza Rosario 2016
20
(ad - bc ) 2 n
cal
2 = 4.01
n1n 2 m1m 2
d) Valor tabular
tab
2 2
1; 1- = 3,842
e) Decisión
30/90
RR 1.63
20/98
poblaciones respectivas.
sus medianas.
Procedimiento :
- Unir las dos muestras y posteriormente ordenar sus valores que toman
a) Hipótesis a probar :
H0 : M 1 ≥ M2
H1 : M1 < M2
b) Nivel de significación
= 0,05
c) Función de prueba
n1 (n 1 1)
T S
2
n1 : Número de observaciones de la muestra de la población 1.
la población1.
n 1n 2
d) Valor tabular T
Z cal 2
T cal ó Z cal
n n 1
n 1n 2 1 2
e) Decisión 12
- Rechazar H0 : M1 ≥ M2, si Tcal < W α .
W α.
α/2.
Ejemplo :
del experimento. Se desea saber si se puede concluir que la inhalación prolongada de óxido
Grupos de estudio
Animales expuestos (1) Animales no expuestos (2)
14.4 17.4
14.2 16.2
13.8 17.1
16.5 17.5
14.1 15.0
16.6 16.0
15.9 16.9
15.6 15.0
14.1 16.3
15.3 16.8
15.7
16.7
13.7
15.3
14.0
Solución :
a) Hipótesis a probar :
H0 : M 1 ≥ M2
H1 : M1 < M2
b) Nivel de significación
= 0,05
c) Función de prueba
José Antonio Boza Rosario 2016
24
15(15 1)
Tcal 145 25
2
n1 = 15
S = 145
d) Valor tabular
e) Decisión
Como Tcal= 25 < W0.05 = 45, se rechaza H0 por tanto hay evidencias de
Grupos de estudio
Muestra 1 Rango Muestra 2 Rango
13.7 1
13.8 2
14.0 3
14.1 4.5
14.1 4.5
14.2 6
14.4 7
15.0 15.0 8.5
15.0 15.0 8.5
15.3 10.5
15.3 10.5
15.6 12
15.7 13
15.9 14
16.0 16.0 15
16.2 16.2 16
16.3 16.3 17
16.5 18
16.6 19
16.7 20
16.8 16.8 21
16.9 16.9 22
17.1 17.1 23
17.4 17.4 24
17.5 17.5 25
145
Cuando tenemos una muestra de parejas de valores, por ejemplo antes y después del
tratamiento, que podemos denominar (X1,Y1), (X2,Y2), ... ,(Xn,Yn)
a) Hipótesis a probar :
H0 : M1 = M2
H1 : M1 ≠ M2
b) Nivel de significación
= 0,05
c) Función de prueba
T T
Zcal
T
donde :
n(n 1)
T
4
d) Valor tabular
T cal ó Z cal
e) Decisión
BASE DE DATOS 01
PROFES
DENCIA
O CIVIL
INGRES
TAMAÑ
N° ENC.
FAMILI
MENSU
ACTIVI
MEDAD
PROCE
ESTAD
SEGUR
EDAD
ENFER
SEXO
DAD
ION
AR
AL
O
O
O
BASE DE DATOS 03
ANEXO 1
Excel cuenta con un asistente para crear informes de tablas y gráficos dinámicos. Para crear
una tabla dinámica seleccionamos cualquier celda de la lista de datos y ejecutamos en la ficha
Insertar, en el grupo Tablas, Tabla Dinámica.
Ejemplo 1
En nuestro caso como hemos iniciado el proceso desde una celda de la lista, Excel selecciona
automáticamente los datos. Nos pide dónde queremos situar la tabla dinámica. Dejamos la
opción seleccionada por defecto: Nueva hoja de cálculo.
Seleccionamos en la ficha Opciones que nos ha creado, en Tabla Dinámica -> Opciones ->
Mostrar ->Diseño de tabla dinámica clásica ( permite arrastrar campos a la cuadrícula)
Ahora debemos arrastrar los nombres de las columnas de la tabla a las áreas.
PAGINA, FILA, COLUMNA y DATOS.
Por ejemplo, si queremos saber el importe de las llamadas realizadas cada día según el
destino, arrastramos FECHA a FILA, DESTINO a COLUMNA y IMPORTE a DATOS.
Ya tenemos creada la tabla dinámica. En este momento podemos añadir y eliminar campos
a la tabla. Para añadir un campo lo seleccionamos en Lista de campos de tabla dinámica
y lo arrastramos al área al que queremos añadirlo. Para eliminar un campo basta con
arrastrarlo fuera de la tabla.
Por ejemplo, agregar el campo DURACIÓN al Área de datos.
Observar que cada uno de los campos que hemos arrastrado a la tabla dinámica aparece con
un desplegable. Si lo desplegamos podemos ver los valores que toma dicho campo. Por
defecto aparecen todos seleccionados. Sin embargo, podemos desactivar algunos de los
valores para que sólo muestre la tabla con los valores que nos interesa en cada caso. De este
modo conseguimos filtrar la información que queremos mostrar.
Por ejemplo, si desplegamos el campo DESTINO vemos
Si sólo queremos analizar las llamadas a Fijo y Vodafone seleccionamos esos dos campos
únicamente y pulsamos el botón Aceptar
Queremos ver sólo la información de las llamadas que se han realizado con tarifa Normal.
Para ello, agregamos el campo TARIFA a Campos de página y seleccionamos sólo la
opción Normal. Además, seleccionamos todas las opciones del campo DESTINO.
BASE DE DATOS 02
Calidad
No. Genero Edad Calificación Índice Éxito Rendimiento
Universitaria
1 1 22 15.41 3 62 72
2 1 26 15.71 1 60 71
3 1 22 12.45 2 80 66
4 1 23 15.69 2 86 91
5 1 25 16.05 1 86 48
6 1 26 16.21 3 64 95
7 0 27 14.42 2 54 82
8 1 23 12.87 3 80 92
9 1 23 13.08 2 62 73
10 1 26 16.30 3 77 81
11 1 24 15.82 4 61 67
12 0 24 14.85 3 67 95
13 0 36 13.31 4 95 96
14 1 27 16.67 4 62 59
15 0 26 16.35 2 50 79
16 1 24 12.50 1 62 88
17 1 26 12.32 1 81 52
18 1 23 14.72 2 76 71
19 1 24 13.94 2 87 75
20 1 24 16.92 2 73 75
21 0 25 13.14 3 85 93
22 1 23 14.92 3 57 84
23 1 23 13.81 2 89 90
24 0 26 15.53 3 70 83
25 1 25 15.33 3 65 73
26 0 25 12.95 2 89 97
27 1 24 12.24 4 87 88
28 1 23 14.94 4 89 81
29 1 22 12.57 3 94 74
30 0 30 12.92 3 71 67
31 1 24 15.94 1 63 80
32 1 25 13.80 4 67 64
33 1 23 14.42 3 96 82
34 1 24 14.72 2 73 82
35 1 26 12.60 3 92 81
36 0 23 14.53 3 88 77
37 1 26 14.76 4 82 89
38 0 26 13.12 3 84 95
39 1 26 13.35 4 86 58
40 0 23 14.76 2 72 74
41 1 22 15.27 4 82 89
42 1 26 17.00 2 77 68
43 1 24 16.57 2 66 77
José Antonio Boza Rosario 2016
47
44 1 26 14.02 3 73 67
45 1 25 13.08 1 85 99
46 1 24 13.93 3 58 96
47 1 25 14.17 2 58 97
48 0 24 14.65 3 79 92
49 1 22 13.92 1 50 95
50 1 25 13.28 3 93 67
51 1 25 12.96 2 75 52
52 0 23 13.97 2 82 82
53 1 25 13.92 3 57 83
54 1 24 14.92 3 67 87
55 1 24 16.33 2 60 73
56 0 23 14.25 4 56 67
57 1 23 15.29 1 94 72
58 1 26 15.23 3 92 66
59 1 26 15.73 3 81 95
60 0 23 12.94 1 73 82
61 1 24 15.96 1 91 84
62 1 24 16.96 2 72 98
63 1 27 12.23 3 85 93
64 1 22 15.35 2 96 87
65 0 23 16.77 2 85 57
66 1 24 16.12 2 89 85
67 0 25 14.34 3 92 81
68 1 24 14.69 3 66 95
69 1 22 14.67 2 85 90
70 1 23 15.56 2 54 80
71 1 22 12.35 2 85 48
72 1 24 13.39 3 65 71
73 0 26 16.99 1 76 63
74 0 28 15.29 4 63 87
75 0 26 15.93 2 89 97
76 1 25 13.41 3 83 97
77 1 25 15.55 2 57 79
78 1 25 13.97 1 96 71
79 0 23 12.81 4 72 72
80 1 24 12.99 2 73 89
81 1 25 15.67 2 53 94
82 1 23 12.47 3 86 78
83 1 24 12.77 3 64 89
84 0 24 14.67 1 80 84
85 0 25 13.94 3 77 91
86 1 24 14.90 1 52 69
87 1 23 15.44 2 70 89
88 0 23 16.03 4 90 91
89 1 29 12.15 4 74 89
90 0 22 13.42 2 95 94
91 0 26 12.02 4 84 95
92 0 22 13.04 3 68 78
93 0 30 14.35 4 92 84
94 1 25 13.65 2 52 85
95 1 23 12.66 2 82 69
96 1 26 13.22 3 56 71
97 1 23 13.43 3 85 58
98 1 22 15.54 4 85 93
99 1 26 16.51 3 64 97
100 1 23 16.91 3 61 83
I. BIBLIOGRAFÍA
Básica
Web grafía:
Universidad de Málaga