Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
FACULTAD DE INGENIERIA
Especialidad: Ing. Sistemas y Computacin
ESTADSTICA DESCRIPTIVA E
INFERENCIAL
Prlogo
ndice
Pgs.
Dedicatoria
Prlogo
ndice
09
10
11
13
13
14
15
18
18
18
18
19
20
20
21
21
21
21
22
23
28
31
32
36
38
38
41
47
50
60
63
65
66
68
69
69
69
70
73
73
74
76
77
78
81
87
100
101
103
108
116
119
120
121
123
124
124
126
Practiquemos N 12.......................................................................................................
10.7. Valor Esperado (Esperanza Matemtica)......................................................
Practiquemos N 13......................................................................................................
Captulo 11: Distribuciones Especiales
11.1. Distribucin de Bernoulli....................................................................................
11.2. Distribucin Binomial..........................................................................................
11.3. Distribucin de Poisson......................................................................................
11.4. Distribucin Normal............................................................................................
11.5. Distribucin Normal Estandar..........................................................................
11.6. Distribucin Exponencial...................................................................................
Practiquemos N 14......................................................................................................
Captulo 12: Teora de Muestras
12.1. Tipos de Muestreos.............................................................................................
12.2. Muestreos Aleatorios........................................................................................
12.3. Toma de Datos: la encuesta.............................................................................
12.4. Teorema Central del Lmite.............................................................................
Practiquemos N 15......................................................................................................
Captulo 13: Las Tcnicas de Estimacin
13.1. Estimacin..............................................................................................................
13.2. Estimacin de la Media de una Poblacin.......................................................
13.3. Estimacin de la Muestra Proporcin.............................................................
13.4. Estimacin de una Proporcin...........................................................................
13.5. Distribucin Muestral de Proporciones.........................................................
13.6. Estimacin de una Proporcin..........................................................................
13.7. Tamao de la Muestra.......................................................................................
Practiquemos N 16......................................................................................................
Captulo 14: Test y Pruebas de Hiptesis
14.1. Elementos de los Test de Hiptesis................................................................
14.2. Pruebas de Hiptesis.........................................................................................
14.3. Dcima de una muestra de Kolmogorov-Smirnov.........................................
Glosario de Trminos
Referencias
libros
pginas web
Anexos
Anexo N 1: Tabla de la Distribucin Normal
Anexo N 2: Tabla de 500 Nmeros Generados Aleatoriamente
Anexo N 3: Contraste de Hiptesis a partir del p-valor
Anexo N 4. Error de Tipo II Clculo
Anexo N 5. Gua para Elaborar una Tesis
129
130
131
132
133
144
146
148
152
152
155
155
157
158
162
164
165
167
167
168
170
171
172
178
183
184
Captulo 1
Generalidades de la Estadstica
************************************
El Imperio romano fue el primer gobierno que recopil una gran cantidad de
datos sobre la poblacin, superficie y renta de todos los territorios bajo su
control. Durante la edad media slo se realizaron algunos censos exhaustivos en
Europa. Los reyes carolingios Pipino el Breve y Carlomagno ordenaron hacer
estudios minuciosos de las propiedades de la Iglesia en los aos 758 y 762
respectivamente.
Despus de la conquista normanda de Inglaterra en 1066, el rey Guillermo I
de Inglaterra encarg un censo. La informacin obtenida con este censo, llevado a
cabo en 1086, se recoge en el Domesday Book. El registro de nacimientos y
defunciones comenz en Inglaterra a principios del siglo XVI, y en 1662 apareci el
primer estudio estadstico notable de poblacin, titulado Observations on the
London Bills of Mortality (Comentarios sobre las partidas de defuncin en
Londres).
Un estudio similar sobre la tasa de mortalidad en la ciudad de Breslau, en
Alemania, realizado en 1691, fue utilizado por el astrnomo ingls Edmund Halley
como base para la primera tabla de mortalidad. En el siglo XIX, con la
generalizacin del mtodo cientfico para estudiar todos los fenmenos de las
ciencias naturales y sociales, los investigadores aceptaron la necesidad de reducir
la informacin a valores numricos para evitar la ambigedad de las descripciones
verbales.
En nuestros das, la estadstica se ha convertido en un mtodo efectivo para
describir con exactitud los valores de los datos econmicos, polticos, sociales,
educativos, psicolgicos, biolgicos y fsicos, y sirve como herramienta para
relacionar y analizar dichos datos. El trabajo del experto estadstico no consiste
ya slo en reunir y tabular los datos, sino sobre todo el proceso de interpretacin
de esa informacin. El desarrollo de la teora de la probabilidad ha aumentado el
alcance de las aplicaciones de la estadstica. Muchos conjuntos de datos se pueden
aproximar, con gran exactitud, utilizando determinadas distribuciones
probabilsticas; los resultados de stas se pueden utilizar para analizar datos
estadsticos. La probabilidad es til para comprobar la fiabilidad de las inferencias
estadsticas y para predecir el tipo y la cantidad de datos necesarios en un
determinado estudio estadstico.
1.2. IMPORTANCIA:
En las ltimas dcadas la estadstica ha alcanzado un alto grado de
desarrollo, hasta el punto de incursionar en la totalidad de las ciencias; inclusive,
en la lingstica se aplican tcnicas estadsticas para esclarecer la paternidad de
un escrito o los caracteres ms relevantes de un idioma.
La estadstica es una ciencia auxiliar para todas las ramas del saber; su
utilidad se entiende mejor si tenemos en cuenta que los quehaceres y decisiones
diarias embargan cierto grado de incertidumbre... y la Estadstica ayuda en la
incertidumbre, trabaja con ella y nos orienta para tomar las decisiones con un
determinado grado de confianza.
Los crticos de la estadstica afirman que a travs de ella es posible probar
cualquier cosa, lo cual es un concepto profano que se deriva de la ignorancia en
este campo y de lo polifactico de los mtodos estadsticos. Sin embargo muchos
"investigadores" tendenciosos han cometido abusos con la estadstica, elaborando
"investigaciones" de intencin, teniendo previamente los resultados que les
interesan mostrar a personas ingenuas y desconocedoras de los hechos. Otros, por
ignorancia o negligencia, abusan de la estadstica utilizando modelos inapropiados o
razonamientos ilgicos y errneos que conducen al rotundo fracaso de sus
investigaciones.
Lincoln L. Chao hace referencia a uno de los ms estruendosos fracasos,
debido a los abusos en la toma de una muestra: Se trata del error cometido por la
Literary Digest que, en sus pronsticos para las elecciones presidenciales en
EE.UU. para 1936, afirm que Franklin D. Roosvelt obtendra 161 votos electorales
y Alfred Landon, 370. La realidad mostr a Roosvelt con 523 votos y a Landon con
8 solamente. El error se debi a que la muestra fue tomada telefnicamente a
partir de la lista de suscriptores de la Digest y, en 1936, las personas que se daban
el lujo de tener telfonos y suscripciones a revistas no configuraban una muestra
representativa de los votantes de EE.UU. y, por ende, no poda hacerse un
pronstico confiable con tan sesgada informacin.
1.3. PARA QUE SIRVE LA ESTADISTICA?
La Estadstica puede dar respuesta a muchas de las necesidades que la
sociedad actual nos plantea. Su tarea fundamental es la reduccin de datos, con el
objetivo de representar la realidad y transformarla, predecir su futuro o
simplemente conocerla.
ordenamiento poltico de todos los estados del mundo conocido , es decir, est al
servicio del Estado, de hecho, la palabra Estadstica deriva de Estado.
La Estadstica responde a la actividad planificadora de la sociedad . Con
la Revolucin Industrial aparecen nuevos problemas, sobre todo de desigualdades
sociales. La Estadstica es un instrumento para identificar estas injusticias y para
producir informacin en el llamado Estado del Bienestar.
La Estadstica responde a nuevas demandas sociales. Para realizar
investigaciones exhaustivas sobre temas sociales surgen tres problemas bsicos a
la hora del trabajo de campo, como el tiempo que tardaramos en entrevistar a
toda la poblacin y el costo econmico y de personal de estas entrevistas. Con las
tcnicas de MUESTREO se consigue hacer buenas investigaciones sobre una
pequea parte de esa poblacin, obteniendo resultados vlidos para toda ella.
La Estadstica responde a las necesidades del desarrollo cientfico y
tecnolgico de la sociedad. Tras la Revolucin Industrial se produce un desarrollo
de la sociedad en todos sus mbitos y, en particular, en el Cientfico y Tecnolgico.
Las Comunicaciones, la Industria, la Agricultura, la Salud... se desarrollan
rpidamente y se exige el mximo rendimiento y la mejor utilizacin de estos
sectores.
Las tcnicas de Investigacin de Mercados permiten saber si un producto
cualquiera ser bien acogido en el mercado antes de su salida a este, o bien medir
la audiencia en Televisin y Radio.
El Control de Calidad permite medir las caractersticas de la calidad de un
producto, compararlas con ciertos requisitos y tomar decisiones correctivas si hay
diferencias entre el funcionamiento real y el esperado. Con estudios estadsticos
aplicados a la Agricultura y a la Pesca podemos estimar los rendimientos obtenidos
en una cosecha, o encontrar bancos de peces...
En Medicina e Investigacin farmacolgica es imprescindible la Estadstica,
probando nuevos tratamientos en grupos de pacientes o bien, obteniendo
conclusiones sobre ciertas enfermedades observando durante un tiempo un grupo
de pacientes (saber si para el tratamiento de cierto tipo de cncer es ms efectiva
la ciruga, la radioterapia o la quimioterapia, sin ms que observar un grupo de
pacientes tratados con estas tcnicas).
Con el estudio de los Procesos Estocsticos se puede tener una mejor
comprensin de fenmenos de comportamiento aleatorio como meteorologa, fsica
nuclear, campaas de seguridad...
1.4. DEFINICIN:
Qu entendemos cmo Estadstica?. Estadstica, deriva del latn status,
que significa estado, posicin o situacin. Por estadstica entendemos la coleccin
de los datos que caracterizan las condiciones predominantes en el estado: por
ejemplo, el nmero de nacimientos y muertes, las cosechas, el comercio exterior,
etc. Por estadsticas oficiales entendemos los datos publicados por las agencias del
gobierno en forma de informacin o de prospectos. Cuerpo de conocimientos
basados en una teora propia. Ciencia que estudia conjuntos de datos cualitativos y
su interpretacin en trminos matemticos, estableciendo mtodos para la
obtencin de las medidas que lo describen, as como para el anlisis de las
conclusiones, con especial referencia a la teora de la probabilidad, considerada
tambin como ciencia de base matemtica para la toma de decisiones en presencia
de la incertidumbre. Indica una medida o frmula especial, tal como un promedio,
un nmero ndice o un coeficiente de correlacin, calculado sobre la base de los
datos. Considerada tambin como un suministro de un conjunto de herramientas
sumamente tiles en la investigacin. Adems es un conjunto de tcnicas que,
partiendo de la observacin de fenmenos, permiten al investigador obtener
conclusiones tiles sobre ellos.
Captulo 2
Etapas del Mtodo Estadstico
***********************************
El mtodo estadstico, parte de la observacin de un fenmeno, y como no
puede siempre mantener las mismas condiciones predeterminadas o a voluntad del
investigador, deja que acten libremente, pero se registran las diferentes
observaciones y se analizan sus variaciones.
Para el planeamiento de una investigacin, por norma general, se siguen las
siguientes etapas:
2.1. Planteamiento del problema.
2.2. Fijacin de los objetivos.
2.3. Formulacin de la hiptesis.
2.4. Definicin de la unidad de observacin y de la unidad de medida.
2.5. Determinacin de la poblacin y de la muestra.
2.6. La recoleccin.
2.7. Crtica, clasificacin y ordenacin.
2.8. Tabulacin.
2.9. Presentacin.
2.10 Anlisis.
2.11 Publicacin.
2.9. LA PRESENTACIN
Una informacin estadstica adquiere ms claridad cuando se presenta en la
forma adecuada. Los cuadros, tablas y grficos facilitan el anlisis, pero se debe
tener cuidado con las variables que se van a presentar y la forma de hacerlo. No es
aconsejable saturar un informe con tablas y grficos redundantes que, antes que
claridad, crean confusin. Adems la eleccin de determinada tabla o grfico para
mostrar los resultados, debe hacerse no slo en funcin de las variables que
relaciona, sino del lector a quien va dirigido el informe.
2.10. EL ANLISIS
La tcnica estadstica ofrece mtodos y procedimientos objetivos que
convierten las especulaciones de primera mano en aseveraciones cuya confiabilidad
puede ser evaluada y ofrecer una premisa medible en la toma de una decisin.
Es el anlisis donde se cristaliza la investigacin. Esta es la fase de la
determinacin de los parmetros y estadsticos muestrales para las estimaciones e
inferencias respecto a la poblacin, el ajuste de modelos y las pruebas de las
hiptesis planteadas, con el fin de establecer y redactar las conclusiones
definitivas.
2.11. PUBLICACIN
Toda conclusin es digna de ser comunicada a un auditorio. Es ms, hay otros
estudiosos del mismo problema a quienes se les puede aportar informacin,
conocimientos y otros puntos de vista acerca de l.
PRACTIQUEMOS N 1
1.
2.
3.
4.
Captulo 3
Distribucin de Frecuencias
*******************************
Despus de recoger toda la informacin correspondiente a la investigacin,
es decir, al agotar todo el trabajo de campo, nuestro escritorio se llena de un
cmulo de datos y cifras desordenadas
los cuales, al ser tomados como
observaciones individuales, dicen muy poco sobre la poblacin estudiada; es,
entonces, tarea del investigador hacer hablar las cifras, comenzando por la
clasificacin y ordenacin, consignando la informacin en tablas inteligibles que
denominamos distribuciones de frecuencias.
3.1. DISTRIBUCIN DE FRECUENCIAS SIMPLE
Para una mayor sencillez, en la exposicin del tema, nos valemos del siguiente
ejemplo: Supongamos que en la Fbrica Textil Manufacturas del Centro S.A. ha
estallado un conflicto laboral y sus cincuenta operarias solicitan un aumento en el
salario integral diario sopena de paralizar la fbrica.
El Gerente-propietario recoge la informacin respecto a la variable salario
diario de sus 50 operarias y la relaciona en la Tabla No 1.
Tabla No.1
SALARIO DIARIO DE 50 OPERARIOS EN LA Fbrica
Textil Manufacturas del Centro S.A. (S/.)
Tabla No. 2
SALARIO DIARIO DE 50 OPERARIAS DE LA FBRICA
TEXTIL MANUFACTURAS DEL CENTRO S.A.
Tabla No. 3
SALARIO DIARIO DE 50 OPERARIAS DE LA FBRICA TEXTIL
MANUFACTURAS DEL CENTRO S.A.
Tabla No. 4
Como se puede observar, hay una gran diferencia entre los datos brutos de
la Tabla No.1 y el ordenamiento y agrupamiento de la Tabla No. 4.
PRACTIQUEMOS N 2
1. Qu es frecuencia absoluta?.
2. Cmo se obtiene:
2.1. La frecuencia acumulada?
2.2. La frecuencia relativa?
2.3. La frecuencia relativa acumulada
3. En una distribucin de frecuencias se pueden establecer conclusiones
porcentuales, utilizando solamente la frecuencia relativa? Por qu?
4. La siguiente tabla relaciona las ausencias al trabajo de 50 obreras, durante el
mes de octubre, en la Fbrica Textil Manufacturas del Centro S.A.
3.3.
REGLAS EMPRICAS
INTERVALOS
PARA
LA
CONSTRUCCIN
DE
3.3.7. Construir los intervalos, calcular los puntos medios o marcas de clase y
hacer el agrupamiento de frecuencias.
Distribucin Terica de Frecuencias por Intervalos de n Observaciones
N:
LIPI:
LSUI:
Xi:
Nmero de observaciones
Lmite inferior del primer intervalo
Lmite superior del ltimo interval
Punto medio del intervalo, o marca de clase
3.3.1 Rango
3.3.2 Rango
3.3.3 Nmero de
intervalos
,
,
, y busquemos la amplitud.
,
sino
Tabla No. 8
Construccin de los Intervalos para la Resistencia de las Baldosas
Conclusiones:
El 72% de las baldosas tiene una resistencia entre 300 y 600 Kg/Cm 2.
El 86% de las baldosas resiste menos de 600 Kg/Cm 2.
Slo el 5% resiste 700 o ms Kg/Cm2.
PRACTIQUEMOS N 3
1. Por qu se recurre al agrupamiento en distribuciones de frecuencias por
intervalos?
2. Cmo se determina el nmero de intervalos y la amplitud de ellos?.
3. Qu es una marca de clase?.
5.
Captulo 4
Representacin Grfica
***************************
A pesar de la gran ayuda que prestan las tablas y cuadros con informacin
organizada, no todos los pblicos alcanzan a comprenderla o no disponen del tiempo
suficiente para analizarla.
Es por ello que la mayora de los investigadores acostumbran a reforzar la
descripcin a travs de dibujos, generalmente con formas geomtricas, que ayudan
a visualizar el comportamiento de las variables tratadas.
4.1. DEFINICIN
Una grfica o diagrama es un dibujo complementario a una tabla o cuadro,
que permite observar las tendencias de un fenmeno en estudio y facilita el
anlisis estadstico de las variables all relacionadas.
4.2.COMPONENTES DE UNA GRFICA
Una grfica, al igual que un cuadro o una tabla, debe constar de:
4.2.1. Ttulo adecuado: El cual debe ser claro y conciso, que responda a las
preguntas: Qu relaciona, cundo y dnde se hicieron las observaciones.
Grfico No. 1
Grfico No. 2
Grfico No. 3
Donde:
La longitud del eje vertical es igual a tres cuartos de la longitud del eje
horizontal.
4.3.PRINCIPALES TIPOS DE GRFICOS
Existe una gran cantidad de grficos para la representacin de datos
estadsticos, ya que de ellos depende el diseo artstico de quien los elabora, as
como de su imaginacin al combinar varios tipos de ellos, como forma de presentar
una informacin.
Entre los grficos ms comunes tenemos:
4.3.1 Grfico de Lneas: Usado bsicamente para mostrar el comportamiento de
una variable cuantitativa a travs del tiempo. El grfico de lneas consiste en
segmentos rectilneos unidos entre s, los cuales resaltan las variaciones de
la variable por unidad de tiempo. Para su construccin ha de procederse de
la siguiente manera: en el eje de las ordenadas se marcan los puntos de
acuerdo con la escala que se est utilizando. En el caso de una escala
aritmtica, distancias iguales en el eje, representan distancias iguales en la
variable.
Variacin de la Inflacin en Colombia 1995 -2000
PRACTIQUEMOS N 04
1. Cul es el objetivo de un grfico?
2. Describa los componentes de una grfica .
3. Cules son las principales causas de distorsin de la informacin de un
grfico?.
4. Cul debe de ser la proporcin entre los ejes del plano cartesiano para la
construccin de un grfico?.
5. Para los ejercicios 4 y 5 del captulo 3, numeral 3.2 construir:
5.1. Un histograma de frecuencias.
5.2. Un polgono de frecuencias.
5.3. Un histograma de frecuencias acumuladas.
5.4. Un polgono de frecuencias acumuladas.
6.
Captulo 5
Medidas de Tendencia Central
***********************************
En los captulos anteriores, nos referimos a la clasificacin, ordenacin y
presentacin de datos estadsticos, limitando el anlisis de la informacin a la
interpretacin porcentual de las distribuciones de frecuencia.
El anlisis estadstico propiamente dicho, parte de la bsqueda de
parmetros sobre los cuales pueda recaer la representacin de toda la informacin.
Las medidas de tendencia central, llamadas as porque tienden a localizarse
en el centro de la informacin, son de gran importancia en el manejo de las
tcnicas estadsticas, sin embargo, su interpretacin no debe hacerse
aisladamente de las medidas de dispersin, ya que la representabilidad de ellas
est asociada con el grado de concentracin de la informacin.
Las principales medidas de tendencia central son:
5.1 Media aritmtica.
5.2 Mediana
5.3 Moda.
5.1. MEDIA ARITMTICA
Valores de la variable X
n:
:
Nmero de observaciones
Signo de sumatoria, indica que se debe
sumar
18
21
22
21
20
19
19
Ejemplo:
Cantidad de Cigarrillos consumidos por un fumador en una Semana dada:
Ejemplo:
Clculo de La Media Aritmtica. El Salario/da de 50 Operarias
= 54.100 Soles/da
Si la informacin est relacionada en una distribucin de frecuencias por
intervalos, se toman como valores de la variable las marcas de clase de los
intervalos, entindase por marca de clase el punto medio entre los lmites de cada
clase o intervalo.
Ejemplo:
Clculo de La Media Aritmtica de la Resistencia de 100 Baldosas
Demostracin:
pero
Como
Ejemplo de Comprobacin:
En el Ejercicio del Fumador Cuya Media Aritmtica
es de 20 Cigarrillos / da:
que
Para
Demostracin:
Debemos, entonces, probar que:
veamos:
Pero
(propiedad a.)
entonces:
como
luego
Demostracin:
1
2,
n .
Sea
entonces
5.1.1.4.
2,
Sea
una constante
tenemos:
Sea
.....
donde
: Media aritmtica ponderada
xi:
wi:
Valor de la variable X
Ponderacin del tem xi
Ejemplo:
Las calificaciones de un estudiante estn conformadas por los
siguientes factores:
Un examen cuyo valor es 40% en el cual obtuvo una nota de 4.5, un
trabajo de consulta con ponderacin del 10% y calificacin de 1.0, una
exposicin equivalente al 15% con nota de 2.0, y por ltimo una
investigacin con valor del 35% calificada con 3.5.
5.2. LA MEDIANA
Otra medida de tendencia central, utilizada principalmente en estadstica no
paramtrica, es la mediana, la cual no se basa en la magnitud de los datos, como la
media aritmtica, sino en la posicin central que ocupa en el orden de su magnitud,
dividiendo la informacin en dos partes iguales, dejando igual nmero de datos por
encima y por debajo de ella.
5.2.1. La Mediana Cuando los datos no estn Agrupados en Intervalos.
Partiendo de la informacin bruta, ordenamos los datos ascendente o
descendentemente:
se
define
Mediana =
, si n es impar
, si n es
par
Mediana =
n, es impar, entonces
10 . . . .
,
Febrero=12
,
Marzo= 15
,
Abril= 18
,
Mayo= 14 . . . . Septiembre=18,
,
Junio= 19
Octubre=
22,
,
Julio= 17
Noviembre= 15,
,
Agosto=18
Diciembre= 13
,
Mediana=
Como se puede observar, en este caso la mediana no es un dato
perteneciente a la informacin, es un parmetro que divide la
informacin dejando el 50% por encima y el 50% por debajo de ella.
Me:
Mediana
LI:
n:
Nmero de observaciones
:
A:
Ejemplo:
Resistencia de 100 Baldosas de la Fbrica Bolaos
5.3. LA MODA
La moda, como su nombre lo indica, es el valor ms comn (de mayor
frecuencia dentro de una distribucin. Una informacin puede tener una moda y se
llama unimodal, dos modas y se llama bimodal, o varias modas y llamarse multimodal.
Sin embargo puede ocurrir que la informacin no posea moda.
Donde:
Mo:
LI:
fm:
f(m-1) :
f(m+1) :
A:
Moda
Lmite inferior del intervalo modal
Frecuencia de la clase modal
Frecuencia de la clase premodal
Frecuencia de la clase posmodal
Amplitud de los intervalos
Ejemplo:
Resistencia de 100 Baldosas
PRACTIQUEMOS N 5
1. Que es una medida de tendencia central?.
2. Cuales son las principales medidas de tendencia central?.
3. Defina : media aritmtica mediana y moda.
4. Cundo se utiliza la media aritmtica ponderada?.
5. Enuncie las propiedades de la media aritmtica.
6. Para cada informacin de los ejercicios del capitulo 3, calcular e interpretar la
media aritmtica, la mediana y la moda.
7. La tripulacin de un avin, en su itinerario compra los siguientes galones de
gasolina:
Ciudad X 200 galones a 4000 pesos el galn.
Ciudad Y 250 galones a 3500 pesos el galn.
Ciudad Z 300 galones a 3000 pesos el galn.
Cul es el costo promedio de la gasolina comprada?.
Captulo 6
Medidas de Posicin
***********************
En el Capitulo anterior, vimos lo referente a las medidas de tendencia
central, las cuales, a su vez, son tambin medidas de posicin ya que, de todas
maneras ocupan un lugar dentro de la informacin. Nos ocuparemos ahora de
ciertos parmetros posicionales muy tiles en la interpretacin porcentual de la
informacin.
6.1. CUARTILES
Las cuartillas o cuartiles son valores posicionales que dividen la informacin
en cuatro partes iguales, el primer cuartil deja el 25% de la informacin por
debajo de l, y el 75% por encima, el segundo cuartil, al igual que la mediana, divide
la informacin en dos partes iguales, y por ltimo el tercer cuartil deja el 75% por
debajo de s, y el 25% por encima.
Grficamente:
Donde:
k:
Orden del cuartil k = 1,2,3
LI:.......... Lmite inferior del intervalo que contiene el cuartil.
Fa(i-1):
Frecuencia acumulada hasta el intervalo anterior al que contiene el
cuartil.
fi :
Frecuencia del intervalo que contiene el cuartil.
n:
Nmero de observaciones.
A:
Amplitud de los intervalos.
Ejemplo:
Resistencia de 100 Baldosas de la Fbrica "Bolaos "
Primer cuartil:
es
lo
mismo
que
la
mediana:
6.2. QUINTILES
Los quintiles o quintillas dividen la informacin en cinco partes iguales,
agrupndolas en porcentajes de 20, 40, 60, y 80 por ciento, en consecuencia
debemos calcular cuatro parmetros:
Grficamente:
k=2,
6.3. DECILES
Similarmente, los deciles o decillas dividen la informacin en diez partes
iguales, en cantidades porcentuales de 10 en 10.
6.4. CENTILES
Obviamente los centiles dividen la informacin en 100 partes, lo cual facilita
la interpretacin porcentual de una distribucin de frecuencias.
6.5. RESUMEN
En general para calcular cualquier percentil:
Donde:
r:
k:
LI:
fa(i-1):
fi:
n:
A:
PRACTIQUEMOS N 6
1. Para qu se utilizan los percentiles?.
2. En cuantas partes se divide la informacin con:
2.1 Los cuartiles
2.2 Los quintiles
2.3 Los deciles
2.4 Los centiles
3. Para la informacin de los ejercicios 4 y 5 de la seccin 3.2 calcular e
interpretar;
3.1. La primera y tercera cuartilla.
3.2
El segundo y cuarto quintil.
3.3 Qu porcentaje hay entre la primera y tercera quintilla?.
3.4 Qu porcentaje hay entre la primera cuartilla y la segunda
quintilla?.
3.5 Qu porcentaje hay entre la tercera cuartilla y el noveno decil?.
Captulo 7
Medidas de Dispersin
**************************
En el anlisis estadstico no basta el clculo e interpretacin de las medidas
de tendencia central o de posicin, ya que, por ejemplo, cuando pretendemos
representar toda una informacin con la media aritmtica, no estamos siendo
absolutamente fieles a la realidad, pues suelen existir datos extremos inferiores y
superiores a la media aritmtica, los cuales, en honor a la verdad, no estn siendo
bien representados por este parmetro.
En dos informaciones con igual media aritmtica, no significa este hecho, que
las distribuciones sean exactamente iguales, por lo tanto, debemos analizar el
grado de homogeneidad entre sus datos. Por ejemplo, los valores 5, 50, 95 tiene
igual media aritmtica, y mediana que los valores 49, 50,51; sin embargo, para la
primera informacin la media aritmtica , se encuentra muy alejada de los valores
extremos 5 y 95, cosa que no ocurre con la segunda informacin que posee igual
media aritmtica y mediana, vemos entonces que la primera informacin es mas
heterognea o dispersa que la segunda.
Para medir el grado de dispersin de una variable, se utilizan principalmente
los siguientes indicadores:
7.1 Rango o recorrido.
7.2 Desviacin media.
7.3 Varianza y desviacin tpica o estndar.
R = Xmax Xmin
Xmax, Xmin son el mximo y el mnimo valor de la variable X, respectivamente.
En el ejemplo introductorio, vemos que el rango para la primera informacin es
R1=95-5=90, mientras que R2=51-49=2, se hace pues manifiesta la gran dispersin
de la primera informacin contra la homogeneidad de la segunda.
Donde:
DM :
xi :
fi :
n:
M:
Desviacin media
Diferentes valores de la variable X
Nmero de veces que se repite la observacin xi
Media aritmtica de la informacin
Tamao de la muestra.
Nmero de agrupamientos o intervalos
Ejemplo:
Salario de 50 Operarias de la fbrica textil Manufacturas del Centro S.A.
7.3. VARIANZA
El problema de los signos en la desviacin media, es eludido tomando los
valores absolutos de las diferencias de los datos con respecto a la media
aritmtica. Ahora bien, la varianza obvia los signos elevando las diferencias al
cuadrado, lo cual resulta ser ms elegante, aparte de que es supremamente til en
el ajuste de modelos estadsticos que generalmente conllevan formas cuadrticas.
La varianza es uno de los parmetros ms importantes en estadstica
paramtrica, se puede decir que, teniendo conocimiento de la varianza de una
poblacin, se ha avanzado mucho en el conocimiento de la poblacin misma.
Numricamente definimos la varianza, como desviacin cuadrtica media de
los datos con respecto a la media aritmtica:
Donde:
S2:Varianza
xi : Valor de la variable X
: Media aritmtica de la informacin
para la resistencia
PRACTIQUEMOS N 7
1. Cul es la utilidad de las medidas de dispersin?.
2. Cules son las principales medidas de dispersin?.
3. Cul es la medida adecuada para comparar la dispersin entre varias variables
que posean diferente magnitud o diferente unidad de medida?.
4. Para cada una de las informaciones de los ejercicios de los captulos anteriores,
calcular e interpretar:
4.1 Rango.
4.2 Desviacin media.
4.3 Coeficiente de variabilidad.
Captulo 8
Regresin y Correlacin Lineal
**********************************
Hasta ahora hemos hecho la tabulacin y el anlisis para una sola variable.
Pero los investigadores, adems de analizar una informacin en forma individual,
generalmente se interesan en establecer cruces y buscar relaciones entre
diferentes variables.
xi:
Valores de la variable X, i=1,2,....m
yj:
Valores de la variable Y, j=1,2,... k
fxi: Frecuencia de la observacin xi
fyj: Frecuencia de la observacin yj
fij:
Frecuencia conjunta de los valores (xi,yj)
fa0xi :Frecuencia acumulada de la variable X, en el item
i
fayj : Frecuencia acumulada de la variable Y, en el item j
frxi : Frecuencia relativa para la variable X, en el item i
fryj : Frecuencia relativa para la variable Y, en el item j
fraxi : Frecuencia relativa acumulada para la variable X
frayj : Frecuencia relativa acumulada para la variable Y.
Analizando los relativos para cada una de las variables podemos sacar, entre
otras, las siguientes conclusiones:
El 64%
El 68%
El 60%
El 62%
Las tablas de doble entrada tambin pueden usarse para variables cualitativas,
o combinarse variables cualitativas con cuantitativas.
Estado Civil y Nmero de Hijos de 50 Obreras de la fbrica textil
Manufacturas del Centro S.A. X: Estado Civil, Y: Nmero De Hijos.
8.2. CORRELACIN
A pesar de la ilustracin visual que ofrecen las grficas, solo podemos percibir la
tendencia, mas no el grado o fortaleza de la relacin, entre la variable
independiente X y la variable dependiente Y.
Para cuantificar la calidad de la dependencia, entre las dos variables, el indicador
mas acostumbrado es el Coeficiente de correlacin, definido com
Donde:
r:
Si
Correlacin perfecta
2.
Si
Correlacin excelente
3.
Si
Correlacin buena
4.
Si
Correlacin regular
5.
Si
6.
Si
Correlacin mala
No hay correlacin
7
4
7
5
55
52
55
53
385 49 3025
208 16 2704
385 49 3025
265 25 2809
5
6
6
7
TOTAL 294
53
54
53
56
265
324
318
392
25
36
36
49
2809
2916
2809
3136
X :Variable independiente
Y : Variable dependiente
a Trmino independiente o
: intercepto
b : Coeficiente de X
Debemos establecer los parmetro a y b de la ecuacin para poder
expresar los valores de la variable Y en funcin de los valores de la variable X, esto
es:
Las ecuaciones (1) y (2) son llamadas ecuaciones normales de la lnea recta,
de donde se pueden despejar los parmetros a, b en funcin de los datos originales.
De (1) tenemos:
Como quiera que los items de la variable salario estn en unidades de mil
pesos, la ecuacin de pronstico definitiva es:
El programa calcula:
y
y consecuentemente el modelo
,
el paquete hace tambin las pruebas t student para la hiptesis nula H0 : a=0
vs la hiptesis alternativa H1 :
y H0 : b = 0 vs H1 :
para ambos casos p= 0.0000, con una confiabilidad superior al 99% se rechazan
ambas hiptesis de nulidad, a favor de las hiptesis alternativas. En cuanto al valor
p = 0.0000 (para la prueba F) en la tabla de
R-cuadrado para este modelo es 95.58% , es decir el porcentaje del salario que
est siendo explicado por las variables independientes, es ligeramente menor al Rcuadrado anterior (95.8%), sacrificio insignificante cuando se trata de reducir la
complejidad del modelo.
4
5
7
6
5
7
5
9
3
6
7
3
6
7
6
8
4
6
5
7
7
7
4
7
5
8
6
6
5
7
8
5
9
6
5
5
4
4
3
8
3
9
3
3
6
3
7
7
5
8
3
4
4
9
8
6
3
6
3
9
5
5
4
4
6
4
8
5
52
54
55
54
53
56
54
58
51
54
54
51
54
55
54
56
52
54
53
55
55
55
52
55
53
57
54
55
53
55
56
53
57
54
5
6
8
9
3
1
2
0
10
9
3
6
1
1
2
3
2
5
5
4
4
4
7
3
7
3
13
8
8
9
4
6
2
3
3
2
1
1
2
1
2
0
3
2
2
5
1
1
2
1
3
2
3
2
1
2
3
1
2
1
2
2
2
0
0
2
0
1
1
1
4
3
2
4
3
5
1
2
3
1
2
3
3
4
2
2
2
3
3
3
1
3
2
5
3
3
2
3
4
2
4
3
52.51
53.23
55.25
54.36
52.91
55.84
53.26
57.79
51.35
53.59
54.98
50.82
54.55
55.34
53.93
56.18
52.20
53.87
53.05
55.26
55.29
54.89
51.82
55.26
53.25
56.67
54.30
54.43
53.40
55.18
56.23
53.23
57.10
54.47
0.51
- 0.77
0.25
0.36
- 0.09
- 0.16
- 0.74
- 0.21
0.35
- 0.41
0.98
- 0.18
0.55
0.34
- 0.07
0.18
0.20
- 0.13
0.05
0.26
0.29
- 0.11
- 0.18
0.26
0.25
- 0.33
0.30
- 0.57
0.40
0.18
0.23
0.23
0.10
0.47
2
2
2
2
2
2
3
1
0
2
1
2
1
2
2
1
5
2
6
4
5
6
4
8
7
3
8
6
5
6
6
7
3
3
5
3
4
4
3
9
8
3
9
5
5
4
5
6
53
50
55
52
53
54
52
57
56
51
58
55
53
54
53
56
6
7
6
6
8
8
11
3
5
6
3
4
2
3
7
3
2
5
0
4
3
1
4
0
0
4
0
0
4
1
3
0
3
1
3
1
1
2
1
4
4
1
4
2
1
1
1
3
53.23
50.18
54.82
51.64
52.50
53.85
51.51
57.07
55.72
51.10
57.07
54.77
52.71
54.10
53.39
55.54
0.23
0.18
0.18
0.36
0.50
0.15
0.49
0.07
0.28
0.10
0.93
0.23
0.29
0.10
0.39
0.46
(1)
(2)
(3)
De donde se pueden estimar los parmetros de la parbola
Parbola Ajustada
PRACTIQUEMOS N 8
1.
Ingresos y Gastos en Arrendamiento de un Grupo de Familias;
en Miles de Soles.
Captulo 9
Tasas e ndices
********************
Como ya se dijo, el anlisis de un fenmeno basado en las cifras absolutas,
ofrece una idea general de su tendencia o comportamiento; pero para efectos de
establecer comparaciones adecuadas del mismo fenmeno con otra regin, o su
ocurrencia a travs del tiempo, se utilizan ciertos indicadores denominados tasas e
ndices.
9.1. TASA
Una tasa es la resultante de una fraccin, en donde el numerador est
contenido dentro del denominador:
Ejemplos:
Donde:
D: Tasa de desercin escolar.
R: Nmero de retiros durante el ao.
M: Nmero total de matriculados durante el ao.
TE:
Tasa de empleo.
PEAO: Poblacin econmicamente activa ocupada.
PEA : Poblacin econmicamente activa.
Valga anotar que a las tasas se les debe multiplicar por una constante k, la cual
generalmente es 100, 1000 o mltiplos de ellos, con el fin de convertirlos en
porcentajes, por millares etc.
En demografa, las tasas son de uso frecuente, entre otras, mencionaremos las
siguientes:
Donde:
TM :Tasa de mortalidad.
D : Nmero de defunciones en un periodo y rea dada.
P : Poblacin total en esa rea a mitad del periodo.
Donde
TN :Tasa de natalidad
N : Nmero de nacidos vivos ocurridos en un periodo y rea dada
P : Poblacin total del rea a mitad del periodo.
Donde:
TC :Tasa de nupcialidad.
M : Nmero de matrimonios efectuados en un periodo y rea
dada.
P : Total de la poblacin a mitad del periodo.
9.2. NDICE
Un nmero ndice, como comnmente se le llama, es un indicador de los
cambios relativos de una o ms variables a travs del tiempo.
Entre las principales aplicaciones de los nmeros ndice, est la de
establecer comparaciones entre los indicadores de las diferentes zonas
geogrficas, profesiones , grupos tnicos etc.
Para la construccin de un nmero ndice, se procede ante todo, a fijar el
periodo de referencia o "periodo base" de la serie temporal, teniendo presente que
debe ser un periodo normal, esto es, que no se hayan presentado situaciones
fortuitas (guerras, terremotos, incendios u otro tipo de imprevisto), que incidan en
el valor de la variable para ese periodo. Adems debe considerarse un periodo
reciente que
consideradas.
haga
comparables
los
diferentes
valores
de
las
variables
Ip :
Pn:
P0 :
Iq :
qn :
q0 :
ndice de precios
Precio del artculo en el periodo n
Precio del artculo en el periodo base
ndice de cantidades
Cantidad del articulo en el periodo n
Cantidad del articulo en el periodo bas
En la primera tabla hemos calculado los ndices de precios simples, con base
en 1995 y 1998 respectivamente, pero no se han tenido en cuenta las
cantidades, mientras que en la segunda tabla se han calculado los ndices de
cantidades sin considerar los precios. Calculemos, ahora los ndices del
valor relativo, que considere tanto los precios como las cantidades:
Donde:
PL : ndice de precios global (Laspeyres).
q0 :Cantidad del periodo base.
p0 :Precio del artculo en el periodo base
pn : Precio del artculo en el periodo n
Dado el deterioro del salario real en los dos ltimos aos debera
considerarse un generoso aumento.
PRACTIQUEMOS N 9
1. Qu es una tasa?.
2. Qu es un ndice?.
3. Para qu se utilizan los nmeros ndices?.
4. Cmo se construye un nmero ndice simple?.
5. Cmo se construye un nmero ndice compuesto?.
6. Los precios y las cantidades de un artculo X vienen dados en la siguiente tabla:
8.
Salario Mnimo Legal Diario en Bolivia e ndice de Precios al
Consumidor para el Ao 2.000-2001
Captulo 10
Introduccin a la Teora de Probabilidades
*************************************************
Los planes corresponden al hombre,
las probabilidades a Dios.
Proverbio chino
Introduccin.
Jacob Berooulli (1654 - 1705), Abraham de Moivre (1667 - 1754), el
reverendo Thomas Bayes (1702 - 1761) y Joseph Lagrange (1736 - 1813)
desarrollaron frmulas y tcnicas para el clculo de la probabilidad. En el siglo
XIX, Pierre Simon, marqus de Laplace (1749 - 1827), unific todas estas primeras
ideas y compil la primera teora general de la probabilidad.
La teora de la probabilidad fue aplicada con xito en las mesas de juego y,
lo que es ms importante, en problemas sociales y econmicos. La industria de
seguros requera un conocimiento preciso acerca de los riesgos de prdida. Muchos
centros de aprendizaje estudiaron la probabilidad como una herramienta para el
entendimiento de los fenmenos sociales.
Nuestra necesidad de tratar con total incertidumbre nos lleva a estudiar y
utilizar la teora de la probabilidad. Al organizar la informacin y considerarla de
manera sistemtica, seremos capaces de reconocer nuestras suposiciones,
comunicar nuestro razonamiento a otras personas y tomar una decisin ms slida.
Conceptos bsicos sobre probabilidad.
El evento
El evento
En general,
conjuntos.
Espacio muestral
Eventos elementales
Evento seguro
Evento imposible
E1 y E2 son eventos excluyentes.
Ejemplo:
Lanzar un par de dados, marcados c/u con los nmeros 1,2,3,4,5 y 6.
Espacio muestral
suceso elemental
suceso elemental
nloe, nleo, nelo, neol, nole noel, lnoe, lneo, leno, leon, lone, loen, elon,
elno, enlo, enol, eoln, eonl, olne, olen, oeln, oenl, onle, onel.
10.1.4. Variaciones
A cada uno de los arreglos de r elementos obtenidos de un grupo de n elementos
, cuya diferenciacin mutua se deba a los elementos el orden de colocacin,
se le denomina variacin. El nmero total de variaciones se representa por:
Ejemplo:
Cuantos nmeros de tres cifras se pueden construir con los dgitos
1,2,3,4,5,6,7,8,9,0 si ninguno se puede repetir
10.1.5. Combinaciones
A cada uno de los arreglos de r elementos obtenidos de un grupo de n
elementos
, cuya diferenciacin mutua se deba a los elementos sin importar el
orden de colocacin de ellos, se le denomina combinacin. El nmero total de
combinaciones se representa por:
Ejemplo:
De cuantas maneras se puede escoger un comit de 4 hombres de un
grupo de 8?.
Ejemplo:
Cuantas palabras diferentes, aun sin significado, se pueden formar
con las letras de la palabra amorosos?.
Ejemplo:
PRACTIQUEMOS N 10
1. De cuntas maneras se pueden colocar dos anillos diferentes en la misma mano,
de modo que no estn en el mismo dedo?.
2. Al lanzar cinco dados de distintos colores cuntos resultados podemos
obtener?.
3. Con los nmeros 1,2,3,4,5 y 6:
3.1 Cuntos nmeros distintos de siete cifras podramos formar?.
3.2 Podremos numerar a los 3224564 habitantes de una ciudad con esos
nmeros?.
4. Se lanzan al aire uno tras otro cinco dados equilibrados de seis caras. Cul es
el nmero de casos posibles?.
5. Cuntos nmeros de seis cifras existen que estn formados por cuatro
nmeros dos y por dos nmeros tres?.
6. Lola tiene 25 bolitas (10 rojas, 8 azules y 7 blancas) para hacerse un collar.
Engarzando las 25 bolitas en un hilo, cuntos collares distintos podr
realizar?.
7. Cuntas palabras distintas, con o sin sentido, podremos formar con las letras
de la palabra educacin? y con la palabra vacaciones?.
8. Un grupo de amigos formado por Ral, Sonia, Ricardo y Carmen organizan una
fiesta, acuerdan que dos de ellos se encargarn de comprar la comida y las
bebidas De cuntas formas posibles puede estar compuesta la pareja
encargada de dicha misin?.
9. Una fbrica de helados dispone de cinco sabores distintos (vainilla, chocolate,
nata, fresa y cola) y quiere hacer helados de dos sabores Cuntos tipos de
helado podrn fabricar?.
10. Un grupo de amigos y amigas se encuentran y se dan un beso para saludarse. Si
se han dado en total 21 besos, cuntas personas haba?.
11. En una carrera de 500 metros participan doce corredores De cuntas
maneras pueden adjudicarse las medallas de oro, plata, bronce?.
12. De cuntas formas pueden cubrirse los cargos de presidente, vicepresidente,
secretario y tesorero de un club deportivo sabiendo que hay 14 candidatos?.
Ejemplo:
En el lanzamiento de un dado de seis caras una vez, si
en tal caso
10.3.3.2
La probabilidad de un evento es igual a la
unidad menos la probabilidad de su complemento.
10.3.3.3
Toda probabilidad est definida entre la
probabilidad del suceso imposible y la probabilidad del evento seguro.
10.3.3.4
10.3.3.5
Si dos eventos son compatibles, la probabilidad de su unin es igual a
la suma de sus probabilidades menos la probabilidad de su
interseccin.
Ejemplo:
a un grupo de personas se le pregunta sobre la intencin de voto para
las prximas elecciones.
Independencia Estadstica
PRACTIQUEMOS N 11
1. Defina:
1.1 Experimento aleatorio, y experimento determinstico.
1.2 Evento elemental, suceso seguro, suceso imposible, eventos
excluyentes y eventos independientes.
2. Para cada uno de los eventos definidos en el lanzamiento de dos dados, calcular
su respectiva probabilidad de ocurrencia.
3. En el experimento de seleccionar una ficha de domin, determinar las
probabilidades para todos sus eventos elementales.
4. Para el ejemplo de la intencin de voto segn el sexo, calcular la probabilidad de
no votante dado que es de sexo masculino.
10.5. VARIABLE ALEATORIA
En el clculo de probabilidades, generalmente, es ms sencillo identificar los
eventos numricamente, y no con la simple descripcin del suceso que pueda
ocurrir, es ms, en muchas ocasiones no podemos registrar todos los sucesos
inmersos en el espacio muestral del experimento. Debemos recurrir a
cuantificar esos smbolos iniciales en nmeros reales que se puedan operar
matemticamente.
X(c) = 0
X(s) = 1
Ejemplo:
X es la Suma Obtenida en el Lanzamiento de dos Dados:
Ejemplo:
Si X: Diferencia en Valor Absoluto, Entre los dos Sectores de una Ficha
de Domin:
PRACTIQUEMOS N 12
1. Defina: Variable aleatoria, variable aleatoria discreta, variable aleatoria
continua, funcin de probabilidad y funcin de distribucin.
2. En el ejercicio de la ficha de domin, si X representa la diferencia absoluta
entre los dos nmeros, representar y calcular la probabilidad de ocurrencia de
los siguientes eventos:
2.1 La diferencia sea menor o igual a 5.
2.2 La diferencia sea mayor que 2.
2.3 La diferencia sea mayor que 2 pero menor o igual 5
2.4 La diferencia sea mayor que 5 menor que 3
10.7. VALOR ESPERADO (ESPERANZA MATEMTICA)
10.7.1. Media Aritmtica Poblacional
En el tratamiento de las medidas de tendencia central, resaltamos la
importancia de la media aritmtica de una variable, como parmetro
representativo de una muestra.
En el anlisis poblacional, la media aritmtica o valor esperado de una
variable aleatoria, se define como el promedio ponderado de los diferentes valores
si X es discreta
si X es continua
PRACTIQUEMOS N 13
1. Calcular el valor esperado para la variable diferencia en el ejemplo del domin.
2. Si usted juega chance, calcule su valor real de acuerdo con los premios que
espera obtener y comprelo con lo que realmente paga.
3. Tome un billete de lotera y calcule su precio equitativo.
4. Un contrabandista se enfrenta al siguiente dilema: Introducir o no, mercanca
por valor de $ 5'000.000 obteniendo una utilidad de $ 1'000.000. El riesgo de
ser detectado y castigado con el decomiso de la mercanca es del 17%. Que le
aconseja usted?.
Captulo 11
Distribuciones Especiales
*****************************
En el captulo anterior desarrollamos modelos probabilsticos a partir de
abstracciones de los experimentos previamente descritos, a los cuales se les crea
una funcin de probabilidad, que describa las posibilidades de esa realidad
experimental.
Muchos de los acontecimientos cotidianos, pueden ser asimilados a funciones
probabilsticas tericas, que son de gran ayuda en la toma de decisiones bajo
condiciones de incertidumbre. Eminentes estudiosos de la estadstica han
planteado modelos probabilsticos que han contribuido al desarrollo de la ciencia.
Veamos algunos de ellos:
Es el caso cuando se lanza una moneda una vez y se observa de cual lado cae
o se analiza un artculo para ver si est defectuoso o no, se obtiene o no un trabajo
etc.
(1)
y la funcin de distribucin:
Tablas Binomiales
Ejemplo:
Se sabe que el 20% de la cartera de una empresa est vencida, se toma una
muestra al azar de 15 cuentas. Cul es la probabilidad de que:
, en la interseccin
.
4.
5.
6.
7.
8.
Donde:
:
X:
Ejemplo:
4.
Ejemplo:
En cierto ncleo poblacional, el 0.5% es portador del V.I.H. En una muestra
de 80 personas, cual es la probabilidad:
1. De que haya alguna persona portadora.
2. No haya personas portadoras.
Solucin:
1.
2.
Probabilidades de Poisson Acumuladas
se representa como:
La aparente complejidad de la distribucin normal no debe preocupar al lector,
donde:
X : Variable aleatoria distribuida normalmente
Media aritmtica de la variable
Varianza de la variable
con
Ejemplo:
Si asumimos que la resistencia de las baldosas se distribuye
normalmente con
y
Resistencia de 100 Baldosas
propiedades son:
E (X) =
Var (X) =
PRACTIQUEMOS N 14
1. La probabilidad de que un visitante efecte una compra en un almacn, durante
un da dado es 0.8. Si al negocio entran 20 clientes, cul es la probabilidad de que
el almacn realice:
1.1 Exactamente 16 ventas?.
1.2 Menos de 17 ventas?.
1.3 Ms de 14 ventas?.
1.4 Exactamente 5 ventas?.
1.5 Cul es el nmero esperado de ventas?.
2. Si un almacn tiene en promedio 5 ventas por hora. Cual es la probabilidad de
que en una hora determinada:
2.1 Haya exactamente 4 ventas?.
2.2 Haya ms de 3 ventas?.
2.3 No se efecten ventas?.
3. Una de cada 10 personas mayores de 40 aos de una comunidad, sufren de
hipertensin. Se toma una muestra de 50 personas mayores de 40 aos. Utilizando
primero la distribucin binomial y luego la aproximacin a la distribucin de
Poisson, responder y comparar los resultados:
3.1 Cul es la probabilidad que haya ms de 4 hipertensos?.
3.2 Cul es la probabilidad que haya exactamente 5 hipertensos?.
4. Un lote de arandelas tiene un dimetro normal con media 10 milmetros y
desviacin tpica 0.5 milmetros. Se toma una arandela al azar. Cul es la
probabilidad de que tenga un dimetro:
4.1 Superior a 10.5 milmetros?.
4.2 Entre 9 y 11 milmetros?.
4.3 Menos de 9 milmetros?.
Captulo 12
Teora de Muestras
***********************
Como ya hemos dicho, nuestro objetivo va a ser a partir de ahora, el
tratamiento estadstico de muestras.
Pero bajo que condiciones, resulta apropiada una muestra?. Existen una
serie de factores que inciden en la respuesta de esta pregunta, y que resultan
fundamentales en Estadstica Inferencial.
Una primera cuestin, es el tamao que ha de tener. Parece evidente, que a
mayor tamao, ms se acercaran los parmetros que calculemos, a los de la
poblacin ( y es cierto siempre que se tenga en cuenta la representatividad de la
muestra, que es un aspecto que desarrollaremos ahora). En la prctica real, el
nmero de elementos de una muestra est determinado por una serie de factores:
grado de fiabilidad deseado, dificultad en la eleccin de los elementos que la
compongan, tiempo necesario para la eleccin, gastos originados,...
La segunda y ms importante cuestin es cmo deben ser elegidos los
elementos que la compongan?. Para ser vlidas, las muestras han de ser
representativas, esto es, si queremos inferir de los resultados de una muestra, en
ella se ha de reproducir en igual porcentaje el carcter estudiado, que en la
poblacin total. Por tanto, ser necesario, que en el momento de la eleccin de los
elementos de la muestra, verifiquemos que todos los elementos de la poblacin
tiene igual probabilidad de ser elegidos para la muestra.
(1)
Adems, cuanto mayor es el valor de n, mejor es la aproximacin "normal".
Hemos nombrado un concepto importante: la d.t. de la media
, que es el grado
de variabilidad de las medias muestrales. Cuanto menor sea, ms ajustadas a la
media de la poblacin sern las medias que obtengamos de una muestra. De su
propia definicin, es fcil darse cuenta de que cuanto mayor es el tamao de la
muestra, menor es este grado de variabilidad, y por tanto ms similar a la media de
la poblacin ser la media obtenida de la muestra.
NOTAS IMPORTANTES
Nuestra afirmacin de que la desviacin tpica de la media es
, se hace
asumiendo que la poblacin es infinita ( o el muestreo se realiza con
reemplazamiento ). En caso contrario, se debe utilizar el "factor de correccin
para poblaciones finitas", de forma que la d.t. de la media quedara:
4.- Establece un mtodo para elegir una muestra de vecinos de una calle.
5.- De los 500 directores de complejos tursticos de las costas peruanas, 300
corresponden a complejos de 20 o menos habitaciones, 150 a complejos de
entre 20 y 50 habitaciones y por ltimo 50 corresponden a complejos de ms de
50 habitaciones.
6. Si pretendieras hacer una encuesta a una muestra de tamao 50, cmo la
tomaras?, sera indiferente el aspecto estadstico que tuvieras que estudiar?.
7.- Un hospital dispone de un listado de los pacientes, organizados por reas de
atencin (neurologa, traumatologa,....). D que tipos de muestreo podran
realizarse, y como los haras.
8.- Para realizar una encuesta sobre el consumo de un producto en una ciudad, se
tom una muestra de forma que de cada barrio se consultaba a un nmero de
personas proporcional a la superficie ocupada por el barrio. Te parece un
mtodo fiable?. Escribe un comentario.
9.- Un mayorista de alimentos, quiere enviar muestras de sus productos, a una
muestra de supermercados. Elige de las 5 grandes cadenas de supermercados ,
una muestra de cada, y manda sus productos para ponerlos a prueba. Qu tipo
de muestreo est utilizando?
10.-Sabemos que el tiempo medio de espera en las colas del Banco "El inters
interesado" es de 15 min. con una desviacin tpica de 5 minutos. Si tomsemos
al azar a un grupo de 35 clientes:
a) Cul es la probabilidad de que el tiempo medio de espera del grupo fuera
menor de 17 minutos?.
b) Cul es la probabilidad de que estuviera entre 12 y 16 minutos?.
c) Entre qu valores se encontrara el tiempo medio con una seguridad del
95%?. Y del 99%?.
11.-En un almacn se trabaja con bultos de igual volmen, cuyo peso se distribuye
segn N(250,45) expresados en kg. Los elevadores encargados de su transporte
dentro del almacn, pueden aguantar hasta un peso mximo total de 2000 kg. Si
la empresa decide que las carretillas se carguen con 7 bultos cada vez:
a) Cul es la probabilidad de que se supere el peso mximo de seguridad?.
b) Cuntos bultos de cada vez haran falta para que dicha probabilidad fuera
menor del 0,1%?.
12.-En unos grandes almacenes, la media de los salarios es de 105.000 pts, con una
d.t. de 25.000 pts. Si preguntaramos a 35 empleados elegidos aleatoriamente,
por su sueldo, Cul es la probabilidad de que la media correspondiente a los 35
fuera inferior a 100.000 pts?.
13.- En unas negociaciones sindicales correpondientes al sector turstico, la
patronal alega que en un establecimiento tipo de 40 empleados, en el 90% de los
casos la suma de los sueldos mensuales pagados superan los 5.000.000 de pts.
Los sindicatos disponen de cifras oficiales segn las cuales, en el sector la
media de sueldos es de 120.000 pts con una d.t. de 10.000 pts. Pueden rebatir
"estadsticamente" lo alegado por la patronal? Los sindicatos te piden redactar
un informe ilustrado con cifras que les permita contestar a la patronal.
Captulo 13
Las Tcnicas de Estimacin
********************************
13.1. ESTIMACIN
Llamaremos as al procedimiento utilizado cuando se quiere conocer las
caractersticas de un parmetro poblacional, a partir del conocimiento de la
muestra.
Imaginemos que hemos hecho la encuesta a la que se aluda en el apartado
anterior, y queremos saber cual es la verdadera media del instituto. Podemos hacer
una primera aproximacin, utilizando la media muestral
km. Sin embargo ,
este valor est sesgado debido a que solo representa a una muestra.
Podramos decir que la media buscada es prxima a 3, pero cunto de
prxima?. Digamos que 200 metros ms o menos?. Esto significara que la media
estara entre 2,8 y 3,2. Esto ltimo se denomina estimar por intervalo, y es el
mtodo que ahora vamos a ver.
INTERVALO DE CONFIANZA
Se llama as a un intervalo en el que sabemos que est un parmetro, con un nivel de
confianza especfico
Si dijramos que la media se encuentra en el intervalo (2,8 , 3,2) con un nivel
de confianza del 95%, lo que decimos es que si hiciramos muestras de tamao 40,
planteamos estimar la media de todo el instituto, con un nivel de confianza del 95%
.El proceso para realizar la estimacin es el siguiente:
Sabemos por el T.C.L. que las medias muestrales se distribuyen segn
-E,
+ E)
siendo
la media de la muestra, y
el error de estimacin.
obtenemos que
(Debe notarse que en este caso, n=70, p=0,6, q=0,4 y por tanto np>5, nq>5), o lo
que es lo mismo, las proporciones que vayamos encontrando para muestras de
tamao 70, se iran distribuyendo de forma "normal" alrededor del 60%, con una
desviaicin tpica del 5,8%.
Por tanto, si en una poblacin, una determinada caracterstica de tipo binomial (es
decir la poblacin se divide entre los que la tienen y los que no), se presenta en una
proporcin p, al tomar muestras de tamao n, las proporciones p' obtenidas, se
distribuirn segn
, es decir se distribuyen de forma "normal" alrededor del 5% con una d.t. del 3'4%.
En consecuencia, la probabilidad de valores como el registrado
resulta ser:
Llevando a cabo los mismos pasos que en el caso de la estimacin de medias, vemos
que un 90% de las proporciones muestrales que se obtengan estarn a como
mximo 1,65 desviaciones tpicas de p (es decir a
) ,
y en
ser
. Existe un problema: no conocemos p, ni tan siquiera el valor p' de la
muestra puesto que an no ha sido realizada la encuesta (a no ser que por
anteriores sondeos, pueda tenerse un valor fiable para p).
Si se tiene informacin previa sobre el valor de p, puede utilizarse, pero si
no, se utilizar inicialmente p=0,5, pues se puede demostrar que para este valor se
obtiene el mximo valor del tamao de la muestra (mirar grafico siguiente) y en
consecuencia, quedar asegurado que el error es como mximo del 10%
En este caso concreto, tomando E=0,1, p=0,5 , k=1,65, obtendremos que
n=68,08 es el tamao de la muestra que debemos tomar.
Aunque el error mximo fijado es del 10%, en la prctica resultar en
general ms pequeo, a medida que la verdadera proporcin p se aleje del valor 0,5.
En particular, si en lugar de tomar inicialmente p=0,5 , hubieramos supuesto que
p=0,95, el error mximo que cometeramos utilizando 68 personas en la muestra
sera: E= 0,043, es decir un 4,3%. Una vez estimado p, podremos reajustar el
margen de error cometido. En la prctica normalmente no dispondremos de
6.- Una encuesta realizada sobre 40 aviones comerciales, revela que la antigedad
media de estos es de 13,41 aos, con una desviacin tpica muestral s=8,28.
a) Cul es con un 90% de confianza la antigedad media de toda la flota
comercial?.
b) Si se quisiera obtener un nivel de confianza del 95%, cometiendo el mismo
error que en el apartado anterior, y suponiendo tambin s=8,28, cuntos
elementos deberan componer la muestra?.
7.- Al medir el tiempo de reaccin , un psiclogo estima que la desviacin tpica
del mismo es de 0,5 segundos. Cul ser el nmero de medidas que deber
hacer para que sea del 99% la confianza de que el error de su estimacin no
exceder de 0,1 segundos?.
8.- En una muestra de 50 jvenes encontramos que la dedicacin media diaria al
ocio es de 400 minutos y la desviacin tpica muestral de 63 minutos. Calcular
el intervalo de confianza de la media de la poblacin al 95% de nivel de
confianza.
9.- La duracin de las bombillas fabricadas por una empresa sigue una distribucin
normal de media desconocida y desviacin tpica 50 horas. Para estimar la
duracin se experimenta con una muestra de tamao n. Calcular el valor de n
para que, con un nivel de confianza del 95%, se consiga un error en la
estimacin inferior a las 5 horas.
10.- Una muestra aleatoria de 60 personas tiene una media de 235 mg/dl
(miligramos por decilitro) en medidas de colesterol. Suponiendo que la
desviacin tpica de la variable que mide las unidades de colesterol es =28
mg/dl, se pide:
a) Calcular el intervalo de confianza , con un nivel de confianza 0'95 para la
media de la poblacin.
b) Determinar el tamao muestral necesario para reducir el intervalo de
confianza anterior a la mitad.
11.- Una revista, tras comentar los resultados de una encuesta, afirma, "En
teora en 19 de cada 20 casos, los resultados de esta encuesta, difieren en un
punto porcentual de la proporcin que se obtendra si hubiramos encuestado
a todos los espaoles". Podras decir, cual fu el nivel de confianza y el
tamao de la muestra empleados en esta encuesta?.
"Cuando ustedes o cualquier otro intentan decirme que 1223 personas, sirven
para conocer las opiniones y gustos en Espaa, me vuelvo loco!. Cmo se
atreven!. Deberan ustedes ser detenidos y encarcelados".
Ms adelante, afirmaba: " Dado que 1223 personas representan a 40 millones,
mi carta representa la opinin de 32706 personas (divisin de 40 millones
entre 1223) que comparten mi punto de vista".
a) Encuentra para n=1223, a un nivel de confianza del 95%, el margen de
error que se comete al estimar una proporcin.
b) Este seor argumenta que 1223 personas es una muestra demasiado
pequea para tener significancia. ests de acuerdo?. Escribe una
respuesta para apoyar o refutar sus tesis.
c) Tambin argumenta que l representa a 32706 personas. Es correcto
este argumento?. Razona la respuesta.
17.-En un sondeo a 800 personas elegidas al azar, realizado antes de una eleccin
con slo dos candidatos A y B, se obtuvo el siguiente resultado: 57% para A y
43% para B. Cul es la probabilidad de que A gane las elecciones?. Y si la
muestra hubiera estado formada por 2000 personas?.
18.-Se realiz una encuesta a 350 familias, preguntando si posean ordenador en
casa o no, encontrndose que 75 de ellas lo posean. Estima la proporcin real
de familias que dispone de ordenador, con un intervalo de confianza del 95%.
Cul es el error mximo de la estimacin?.
Captulo 14
Test y Pruebas de Hiptesis
**********************************
Veremos ahora la forma de tomar una decisin en base a datos estadsticos,
controlando el margen de error que podemos cometer.
Supongamos que una empresa privada, decide otorgar una premio a aquellos
centros, en los que la nota media de una prueba realizada por los alumnos supere
los 7 puntos.
Como no puede (por razones econmicas, de tiempo, disponibilidad, etc)
realizar la prueba en todos los alumnos en cada centro, decide elegir una muestra
aleatoria de 45 alumnos de cada centro, y que sean ellos los que realicen la prueba.
Imagina que en nuestro centro, se han obtenido los siguientes resultados:
(recuerda que poda considerarse un buen sustituto de la desviacin
tpica de la poblacin, y que por tanto a partir de ahora asumiremos que =2'95)
Ahora bien, la empresa se plantea la siguiente duda, puede afirmar con
seguridad que la media del centro es superior a 7, o por el contrario el resultado
obtenido se debe al azar en la eleccin de la muestra ( es decir, en la muestra
entraron por casualidad muchos empollones)?.
Nuestro centro, dado su convencimiento de merecer el premio, propone el
siguiente proceso:
Este valor t se obtiene buscando en primer lugar la puntuacin tpica k para la que
p(Z<k)=0,95 , que resulta ser k=1,65. Los valores que se encuentran a ms de 1,96
desviaciones de la media, es decir, superiores a t=7+1,65x0,44=7,726 son los que
forman la regin crtica, es decir las notas medias que tienen una probabilidad de
producirse menor del 5%.
Podra ocurrir que la hiptesis (2) fuera cierta y la media muestral 7'9
perteneciera a esa distribucin y fuera un valor correspondiente a la regin crtica
(y la probabilidad de que ello ocurra es del 5%), o bien que lo que ocurra realmente,
es que (2) sea falsa, y la media obtenida pertenezca a una distribucin muestral
con media superior
( por ejemplo 7,5 ), con lo cual tal valor no sera tan raro.
En estadstica, "se apuesta" a lo que tiene mayor probabilidad de ocurrir,
por lo que se considera que la segunda eleccin es la correcta. (aunque nunca
podremos saber si lo que realmente sucede es esto)
Puesto que suponiendo que la media poblacional es como mximo 7 en al
menos 95 de cada 100 muestras la media muestral debera de ser menor que
7,726, y dado que la media muestral obtenida fue 7,9 (que se encuentra en la
regin crtica), el centro concluye que:
indicar que ..
(significado de la hiptesis alternativa)".
Donde:
por los valores 482'78 y 517'22, con lo que habramos rechazado la hiptesis nula
para ese nivel de significacin.
De la misma forma que hemos estado realizando tests sobre medias, pueden
ser realizados tests sobre otros parmetros de una poblacin. En particular
resulta muy interesante hacerlo sobre una proporcin en una determinada
poblacin. Veremos ahora un ejemplo de como hacerlo:
EJEMPLO 3:
Diego dice a Diana que al menos un 15% de los alumnos del Instituto, tiene
una moto. Como discrepan, Luis realiza una encuesta aleatoria a 200 compaeros
del Instituto, y encuentra que 18 de ellos tiene moto. A un nivel de significacin del
10%, cual de los dos tiene estadsticamente la razn?
Establecemos la hiptesis nula y alternativa.
Caractersticas de la dcima
La prueba de K-S de una muestra es una dcima de bondad de ajuste. Esto es, se
interesa en el grado de acuerdo entre la distribucin de un conjunto de valores de
la muestra y alguna distribucin terica especfica. Determina si razonablemente
puede pensarse que las mediciones mustrales provengan de una poblacin que
tenga esa distribucin terica. En la prueba se compara la distribucin de
frecuencia acumulativa de la distribucin terica con la distribucin de frecuencia
acumulativa observada. Se determina el punto en el que estas dos distribuciones
muestran la mayor divergencia.
Hiptesis
Ho: La distribucin observada se ajusta a la distribucin terica.
F(x) = Ft(x) para todo x.
H1: La distribucin observada no se ajusta a la distribucin terica.
Tambin:
F(x) Ft(x) para algn x
F(x): es funcin desconocida
Ft(x): es la funcin terica. Esta puede ser por ejemplo la funcin normal con cierta
media y varianzas conocidas.
Estadgrafo y distribucin muestral
D = mxima
Sn(x): es la funcin de distribucin emprica.
Ejemplo
El entrenador de salto de un grupo de atletas, desea conocer con vistas al
procesamiento de los datos por el obtenidos sobre salto de una muestra aleatoria
de atletas de esa especialidad en un CVD, si las mediciones realizadas por l estn
distribuidas normalmente. Los datos son los siguientes:
Salto_Largo
1 1.60
2 1.65 Ho: Los datos estn distribuidos normalmente
3 1 .55 H1: Los datos no estn distribuidos normalmente.
4 1.62
5 1.64
6 1.70
7 1.71
8 1.68
9 1.66
10 1.67
11 1.65
12 1.68
13 1.69
14 1.70
Salidas de la dcima
Conclusiones:
No se rechaza a Ho, por tanto la distribucin de los datos es normal.
Tcnicas adicionales a la dcima
Tabla de frecuencias
Histograma.
Estadgrafos que deben acompaar a los estadgrafos de la dcima
1-Tabla de frecuencias.
Tcnicas auxiliares para respaldar los resultados obtenidos en la conclusin.
1-Histogramas.
TABLA2
DIFERENCIAS
Frecuencia relativa
acumulada
Diferencia de las
Frecuencias
p11
p21
p11-p21
p12
p22
p12-p21
...
...
...
...
p1i
p2i
p1i-p2i
...
...
...
...
p1k
p2k
p1k-p2k
Es necesario sealar que las dos primeras opciones suministran informacin en los
casos en que sea conveniente realizar una dcima unilateral, adems de reflejar
informacin acerca de lo que est ocurriendo en la dcima.
Tcnicas adicionales a la dcima
Existe un grupo de tcnicas adicionales a la dcima, las que hemos dividido en los
siguientes grupos.
Estadgrafos que deben acompaar a los estadgrafos de la dcima.
Entre ellos se encuentran:
Tamaos en cada una de las muestras (casos vlidos en el anlisis)
Media aritmtica de cada una de las muestras.
Desviacin estndar de cada una de las muestras.
Tcnicas auxiliares para respaldar los resultados obtenidos en la conclusin
Diagrama de caja y bigotes de cada una de las muestras.
Histograma de cada una de las muestras.
Ejemplo
Se muestran las prdidas en peso (medidos en kilogramos), de dos grupos de
personas que han sido sometidas a dos tipos diferentes de medicamentos,
GRUPO2 (n2=12
5.49
3.76
3.08
4.22
4.13
4.17
5.03
5.03
4.85
6.03
2.09
4.45
4.45
5.13
3.58
4.26
3.86
4.62
4.13
4.4
2.81
Salida de la dcima
La salida bsica de la dcima muestra los valores mximos positivos, mximos
negativos y el valor de probabilidad, los que se muestran a continuacin.
medicin
mxima diferencia
negativa
perdida de peso 0
mxima diferencia
positiva
0.4666667
valor de
probabilidad
p > .10
Desviacin. Estndar
GRUPO 1
10
4.73900
.8235661
GRUPO 2
12
3.945834
.8235661
Glosario de Trminos
1. Alcance: distancia entre los valores ms bajo y ms alto de un conjunto de datos.
2. Codificacin: mtodo para calcular la media de datos agrupados mediante la
recodificacin de los valores de los puntos medios de las clases a valores ms sencillos.
3. Coeficiente de variacin: medida relativa de la dispersin, comparable por medio
de distribuciones diferentes, que expresa la desviacin estndar como porcentaje de la
media. Proporcin o porcentaje de la media que representa la desviacin estndar.
4. Cuartiles: fractiles que dividen los datos en cuatro partes iguales.
5. Curtosis: el grado de agudeza de una distribucin de puntos.
6. Datos: coleccin de cualquier nmero de observaciones relacionadas sobre una o
ms variables.
7. Deciles: fractiles que dividen los datos en diez partes iguales.
8. Dependencia estadstica: condicin en la que la probabilidad de presentacin de un
evento depende de la presentacin de algn otro evento, o se ve afectada por sta.
9. Desviacin estndar: raz cuadrada positiva de la varianza; medida de dispersin
con las mismas unidades que los datos originales.
10. Diagrama de barras: representacin grfica de la distribucin de frecuencias de
un atributo o de una variable discreta.
11. Dispersin: la extensin o variabilidad de un conjunto de datos.
12. Distribucin binomial: modelo para variable aleatoria discreta que permite calcular
la probabilidad de obtener x xitos en n ensayos repetidos de tipo Bernoulli.
Distribucin discreta que describe los resultados de un experimento conocido como
proceso de Bernoulli.
13. Distribucin continua de probabilidad: distribucin de probabilidad en la que la
variable tiene permitido tomar cualquier valor dentro de un intervalo dado.
14. Distribucin de frecuencias: despliegue organizado de datos que muestran el
nmero de observaciones del conjunto de datos que entran en cada una de las clases de
un conjunto de clases mutuamente exclusivas y colectivamente exhaustivas. Asignacin
de frecuencias a cada uno de los valores de una variable o atributo.
15. Distribucin de Poisson: modelo para variable aleatoria discreta que permite
calcular la probabilidad de obtener x xitos en un intervalo continuo.
16. Distribucin de probabilidad: lista de los resultados de un experimento con las
probabilidades que se esperaran ver asociadas con cada resultado.
17. Distribucin exponencial: modelo para variable aleatoria continua que permite
representar variables del tipo "tiempo entre" o "distancia entre" dos eventos y vida
til de ciertos componentes.
18. Distribucin normal: modelo para variable aleatoria continua que permite
representar un gran nmero de fenmenos fsicos. Distribucin de una variable
aleatoria continua que tiene una curva de un solo pico y con forma de campana.
19. Error de muestreo: error o variacin entre estadsticas de muestra debido al
azar, es decir, diferencias entre cada muestra y la poblacin, y entre varias muestras,
que se deben nicamente a los elementos que elegimos para la muestra.
20. Error estndar: la desviacin estndar de la distribucin de muestreo de una
estadstica.
21. Espacio muestral: conjunto de todos los resultados posibles de un experimento
aleatorio.
22. Estimacin: valor particular de un estimador, que caracteriza a una muestra
especfica.
23. Evento: uno o ms de los resultados posibles de hacer algo, o uno de los resultados
posibles de realizar un experimento.
24. Experimento aleatorio actividad que tiene como resultado o que produce un evento.
Prueba donde existen dos o ms resultados posibles, y no se pude anticipar cul de
ellos va a ocurrir.
25. Histograma: grfica de un conjunto de datos compuesta de una serie de
rectngulos, cada uno con un ancho proporcional al alcance de los valores de cada clase
y altura proporcional al nmero de elementos que entran en la clase, o altura
proporcional a la fraccin de elementos de la clase.
26. Independencia estadstica: condicin en la que la presentacin de algn evento no
tiene efecto sobre la probabilidad de presentacin de otro evento.
27. Inferencia estadstica: proceso de anlisis que consiste en inferir las propiedades
de una poblacin en base a la caracterizacin de la muestra.
28. Media: medida de tendencia central que representa el promedio aritmtico de un
conjunto de observaciones.
29. Mediana: punto situado a la mitad de conjunto de datos, medida de localizacin que
divide al conjunto de datos en dos partes iguales.
30. Medida de dispersin: medida que describe cmo se dispersan o distribuyen las
observaciones de un conjunto de datos. Cantidades que describen la variabilidad de los
datos.
31. Medida de tendencia central: medida que indica el valor esperado de un punto de
datos tpico o situado en el medio. Cantidades numricas que dan una idea sobre la
ubicacin de la distribucin de frecuencias.
32. Moda: el valor que ms a menudo se repite en un conjunto de datos. Est
representado por el punto ms alto de la curva de distribucin de un conjunto de datos.
33. Muestra representativa: muestra que contiene las caractersticas importantes de
la poblacin en las mismas proporciones en que estn contenidas en la poblacin.
34. Muestra: subconjunto de la poblacin seleccionado mediante algn criterio
particular. Porcin de elementos de una poblacin elegidos para su examen o medicin
directa.
35. Muestreo aleatorio simple: mtodos de seleccin de muestras que permiten a cada
muestra posible una probabilidad igual de ser elegida y a cada elemento de la poblacin
completa una oportunidad igual de ser incluido en la muestra.
Referencias
Libros:
1.
Alatorre, et al., Introduccin a los mtodos estadsticos, Mxico, UPN.
1998.
2.
Azorn, Poch. Francisco. Curso de muestreo y aplicaciones, Aguilar, 1989.
3.
Barahoma, Abel y otro. Metodologa de trabajos cientficos, Ipler, 1999.
4.
Bencardino M., Ciro. Estadstica, Apuntes y 600 Problemas Resueltos, 2a
Edicin, Ecoe, 1992.
5.
Castillo, Juana, Estadstica inferencial bsica, Mxico, CCH, UNAM. 1996.
6.
CHAO. Lincoln L. Estadstica para Ciencias Administrativas, 2a Edicin,
MCGRAW-HILL, 1990.
7.
Dixon, Wilfrid J y otro. Introduccin al Anlisis Estadstico, 2a Edicin,
MCGRAW-HILL, 1995.
8.
Doms, Fernan P. La Estadstica Qu Sencilla, 5a Edicin, Paraninfo, 1999.
9.
Downie, N. M. y otro. Mtodos Estadsticos Aplicados. Harper Row
Publishers Inc., 2000.
10.
Giardina, Basilio. Manual de Estadstica, 3 Edicin, 1992.
11.
Haber, Audrey. Estadstica General, Fondo Educativo Interamericano, 1993.
12.
Hoel, Paul G. Estadstica Elemental, Mxico, CECSA. 2001.
13.
Johnson, Robert, Estadstica elemental, Buenos Aires, Grupo Editorial
Iberoamericana. 1996.
14.
Kazmier, Leonard J. Estadstica Aplicada a la Administracin y la Economa,
MCGRAW-HILL, 1998.
15.
Levin Yack. Fundamentos de Estadstica en la Investigacin Social, 2a
Edicin, Harla S., 1997.
16.
Llerena, Len, Ricardo y otro. Curso de Estadstica General, U. de A., 1991.
17.
Meja V., William. Bioestadstica General, Escuela Nal. De Salud Pblica, U.
de A., 1990.
18.
National Council of Teachers. Of. Mathematics USA. Recopilacin,
Organizacin e interpretacin de Datos, Trilla, 2000.
19.
Portilla, Ch. Enrique. Estadstica, Primer Curso. Interamericano, 1990.
20.
Richards, Larry E. Y otro. Estadstica en los Negocios. porqu y cundo?,
MCGRAW-HILL,1998.
21.
Seymour, Lipschutz, Teora y problemas de probabilidad , Mxico, McGrawHill. 1970.
22.
Shao, Stephen P. Estadstica para Economistas y Administradores de
Empresas, 15a Edicin, 1989.
23.
Spiegel, Murray R. Estadstica, MCGRAW-HILL, 1970.
24.
Spiegel, Murray, Teora y problemas de estadstica , Mxico, McGraw-Hill.
1970.
25.
Stevenson, William, Estadstica, Mxico, Harla. 1981.
26.
Yamane, Taro, Estadstica, Mxico, Harla. 1986.
Pginas Web:
1. Librera Virtual Elaleph: www.elaleph.com/
2. Universidad Nacional de Colombia sede Medelln: www.unalmed.edu.co/
3. El Portal de las Matemticas: www.matematicas.net/
4. Libros y Software Gratis: www.recursosgratis.com/
5. DANE Colombia: www.dane.gov.co/
6. Planeacin Nacional Colombia N.N.P.: www.dnp.gov.co/
7. Ministerio de Desarrollo Colombia: www.mindesa.gov.co/
8. Web Estadstico de Navarra: www.lander.es/
9. Bioestadstica: Mtodos y Aplicaciones: ftp.medprev.uma.es/libro
10. Aula Fcil: www.aulafacil.org/
11. Probabilidad y Estadstica: www.mor.itesm.mx/
12. Diseo de Experimentos y Teoria de Muestras:www.libros.netstoreusa.com/
13. Distribuciones Estadsticas:www.sisweb.com/
14. Probabilidad:www.thales.cica.es/
15. Distribucin de Poisson:www.ual.es/
16. Tratamiento de la Incertidumbre:www.dc.fi.udc.es/
17. Universidad de Antioquia:extension.udea.edu.co/
18. Estadstica Lejarza:www.uv.es/
Anexos
0 '00
0.50000
0.53983
0.57926
0.61791
0.65542
0.69146
0.72575
0.75804
0.78814
0.81594
0.84134
0.86433
0.88493
0.90320
0.91924
0.93319
0.94520
0.95543
0.96407
0.97128
0.97725
0.98214
0.98610
0.98928
0.99180
0.99379
0.99534
0.99653
0.99744
0.99813
0.99865
0.99903
0.99931
0.99952
0.99966
0.99977
0.99984
0.99989
0'01
0'02
0'03
0'04
0'05
0.50399
0.54380
0.58317
0.62172
0.65910
0.69497
0.72907
0.76115
0.79103
0.81859
0.84375
0.86650
0.88686
0.90490
0.92073
0.93448
0.94630
0.95637
0.96485
0.97193
0.97778
0.98257
0.98645
0.98956
0.99202
0.99396
0.99547
0.99664
0.99752
0.99819
0.99869
0.99906
0.99934
0.99953
0.99968
0.99978
0.99985
0.99990
0.50798
0.54776
0.58706
0.62552
0.66276
0.69847
0.73237
0.76424
0.79389
0.82121
0.84614
0.86864
0.88877
0.90658
0.92220
0.93574
0.94738
0.95728
0.96562
0.97257
0.97831
0.98300
0.98679
0.98983
0.99224
0.99413
0.99560
0.99674
0.99760
0.99825
0.99874
0.99910
0.99936
0.99955
0.99969
0.99978
0.99985
0.99990
0.51197
0.55172
0.59095
0.62930
0.66640
0.70194
0.73565
0.76730
0.79673
0.82381
0.84849
0.87076
0.89065
0.90824
0.92364
0.93699
0.94845
0.95818
0.96637
0.97320
0.97882
0.98341
0.98713
0.99010
0.99245
0.99430
0.99573
0.99683
0.99767
0.99831
0.99878
0.99913
0.99938
0.99957
0.99970
0.99979
0.99986
0.99990
0.51595
0.55567
0.59483
0.63307
0.67003
0.70540
0.73891
0.77035
0.79955
0.82639
0.85083
0.87286
0.89251
0.90988
0.92507
0.93822
0.94950
0.95907
0.96712
0.97381
0.97932
0.98382
0.98745
0.99036
0.99266
0.99446
0.99585
0.99693
0.99774
0.99836
0.99882
0.99916
0.99940
0.99958
0.99971
0.99980
0.99986
0.99991
0.51994
0.55962
0.59871
0.63683
0.67364
0.70884
0.74215
0.77337
0.80234
0.82894
0.85314
0.87493
0.89435
0.91149
0.92647
0.93943
0.95053
0.95994
0.96784
0.97441
0.97982
0.98422
0.98778
0.99061
0.99286
0.99461
0.99598
0.99702
0.99781
0.99841
0.99886
0.99918
0.99942
0.99960
0.99972
0.99981
0.99987
0.99991
0'06
0.52392
0.56356
0.60257
0.64058
0.67724
0.71226
0.74537
0.77637
0.80511
0.83147
0.85543
0.87698
0.89617
0.91309
0.92786
0.94062
0.95154
0.96080
0.96856
0.97500
0.98030
0.98461
0.98809
0.99086
0.99305
0.99477
0.99609
0.99711
0.99788
0.99846
0.99889
0.99921
0.99944
0.99961
0.99973
0.99981
0.99987
0.99991
0'07
0.52790
0.56749
0.60642
0.64431
0.68082
0.71566
0.74857
0.77935
0.80785
0.83398
0.85769
0.87900
0.89796
0.91466
0.92922
0.94179
0.95254
0.96164
0.96926
0.97558
0.98077
0.98500
0.98840
0.99111
0.99324
0.99492
0.99621
0.99720
0.99795
0.99851
0.99893
0.99924
0.99946
0.99962
0.99974
0.99982
0.99988
0.99992
0'08
0.53188
0.57142
0.61026
0.64803
0.68439
0.71904
0.75175
0.78230
0.81057
0.83646
0.85993
0.88100
0.89973
0.91621
0.93056
0.94295
0.95352
0.96246
0.96995
0.97615
0.98124
0.98537
0.98870
0.99134
0.99343
0.99506
0.99632
0.99728
0.99801
0.99856
0.99897
0.99926
0.99948
0.99964
0.99975
0.99983
0.99988
0.99992
0'09
0.53586
0.57535
0.61409
0.65173
0.68793
0.72240
0.75490
0.78524
0.81327
0.83891
0.86214
0.88298
0.90147
0.91774
0.93189
0.94408
0.95449
0.96327
0.97062
0.97670
0.98169
0.98574
0.98899
0.99158
0.99361
0.99520
0.99643
0.99736
0.99807
0.99861
0.99900
0.99929
0.99950
0.99965
0.99976
0.99983
0.99989
0.99992
Anexo N 2
Tabla de 500 Nmeros Generados Aleatoriamente.
49035
34650
37944
96501
83882
13967
76357
21965
13808
97901
39250
61029
42974
14020
97885
58987
15538
62747
41499
17521
26420
41870
47550
97799
21981
51301
32168
41846
87080
90387
44343
93056
91625
58005
99586
06732
66301
36966
52612
60885
86730
07492
95455
70661
14053
90588
00456
75159
95907
37302
00094
11854
66107
12170
62953
40925
45252
94638
66465
29952
74043
54849
49743
49250
87632
74328
36652
49952
92820
37418
65106
48034
94663
29349
62027
74721
35549
01953
95272
20541
72384
53807
15075
13070
22690
95415
93901
66456
20290
95588
40298
32851
16998
67066
52283
35883
49812
29732
35563
70662
, las
No se rechaza la
H.Nula
Decisin correcta
Error tipo II
Se rechaza la H.Nula
Error tipo I
Decisin correcta
Para estimar la diferencia existente entre cada uno de los casos, imagina a un mdico que acaba
de llegar al lugar de un accidente, y debe contrastar la hiptesis nula: "esta vctima est viva".
Mirando la tabla anterior, podemos ver los 4 resultados posibles, y la gravedad de cada tipo de
error.
Aunque nos gustara que no existiera posibilidad de error, esto es imposible dado que utilizamos
para tomar nuestra decisin informacin muestral y no poblacional. Se trata pues de que estos
errores sean lo menores posibles. En cada caso en concreto se debera de estudiar la gravedad de
cada tipo de error, para minimizar los riesgos inherentes a un proceso de decisin de este tipo.
En general, en la prctica, se fijan siempre el nivel de significacin (error tipo I) y el tamao de
la muestra (que deber ser tan grande como las posibilidades de tiempo, costo,... nos permitan).
Ahora veremos el procedimiento para el clculo del error del tipo II, suponiendo que ya han
sido fijados el de tipo I y el tamao de la muestra.
Imaginemos el caso con el que se introdujeron los tests de contraste en el que
Si un valor es menor que 7,726, estaremos aceptando que la media es menor que 7, a pesar de
ser 7'5. La probabilidad de que esto ocurra es
sobre N(7'5,0'44).
Podemos observar a la vista de lo expuesto, que fijado el valor de n, cuanto menor es el valor
del riesgo , mayor es el valor del riesgo , o lo que es lo mismo, para un determinado tamao
muestral, no podemos reducir simultneamente los dos errores, de forma que deberemos de
sacrificar uno de los errores si queremos disminuir el otro.
Asimismo, se observa que si est prefijado, al aumentar el tamao muestral n, disminuiremos
la variabilidad muestral y en consecuencia, tambin disminuir el riesgo , es decir la manera
de reducir simultneamente los dos tipos de error es aumentar el tamao muestral.
Por ltimo, vemos que el riesgo de aceptar errneamente una hiptesis nula es funcin
del verdadero parmetro poblacional, de forma que cuanto ms alejado est ste de los valores
ponderados en la hiptesis nula, menor es el riesgo es decir, mayor la probabilidad de tomar
la decisin correcta.
1. Definicin del problema: ttulo descriptivo del proyecto, formulacin del problema. Formular un
problema es caracterizarlo, definirlo, enmarcarlo tericamente. La caracterizacin o definicin
del problema nos lleva a otorgarle un ttulo en el que de manera clara indiquemos los elementos
esenciales. La formulacin del problema es la estructuracin de toda la informacin. Se debe
sintetizar la cuestin proyectada para investigar a travs de un interrogante.
6. Limitaciones y delimitaciones: Es pertinente precisar los lmites del problema, su alcance, para
ello es necesario tener en cuenta la viabilidad, lugar, tiempo y financiacin.
7. Marco de referencia: Fundamentos tericos, antecedentes del problema. Debe ser una
bsqueda detallada y concreta, donde el tema y la temtica del objeto a investigar tenga un
soporte terico, que se pueda debatir, ampliar, conceptualizar y concluir. Ninguna investigacin
debe privarse de un fundamento o marco terico o de referencia. Estos fundamentos tericos
permiten presentar una serie de conceptos, que constituyen un cuerpo unitario y no un simple
conjunto arbitrario de definiciones.
9. Cronograma: es un plan de trabajo o plan de actividades, que muestra la duracin del proceso
investigativo.
10. Presupuesto.
11. Bibliografa.
2.
3.
4.
5.
6.
Dependencia
Ao
Ttulo (poca que comprende el trabajo, ensayo, memoria, etc.)
Editorial (o los talleres donde se imprimi)
Nmero de pginas (si la dependencia que la publica no es la responsable del contenido, el registro se iniciar con el
nombre del autor.
Ficha de textos jurdicos.
1. Territorio en donde se aplican
2. Referencia al tipo de normas de que trata
3. Nombre de la ley o decreto (subrayado)
4. Editor o talleres donde se imprimi (o el conducto por el cual se dio a conocer)
5. Fecha
6. Nmero de pginas.
Ficha de documentos nacionales.
1. Ttulo (o asunto de que trata)
2. Lugar
3. Fecha
4. Archivo
5. Legajo
6. Foja
7. Dems especificaciones
8. Nmero de pginas
9. Caractersticas de inters particular, si el investigador juzga indispensable registrarlas)
Ficha de documentos internacionales.
1. rgano responsable
2. Ttulo (o asunto)
3. Nmero, clave o codificacin
4. Lugar donde se public
5. Editor (o conducto por el que se da a conocer
6. Fecha
Ficha de registro de obras de recopilacin de constituciones o leyes.
1. Nombre del compilador o editor
2. Referencia al tipo de norma o documento (subrayado)
3. Nmero de volumen (con nmeros romanos)
4. Lugar
5. Editor
6. Fecha
7. Nmero de pginas en donde est comprendido.
Ficha de registro de pactos, acuerdos o tratados internacionales.
1. Pas u organismo (con maysculas)
2. Tipo de norma o documento
3. Autor del prlogo, comentario o nota
4. Lugar
5. Editor
6. Fecha
7. Nmero de pginas en donde est comprendido.
Ficha de artculos contenidos en libros o enciclopedias.
1. Autor del captulo o artculo
2. Ttulo del captulo o artculo (entre comillas)
3. Pginas en que est comprendido
4. Autor de la obra que contiene el artculo o captulo
5. Ttulo de la obra (subrayado)
6. Dems datos de la ficha bibliogrfica de la obra.
Ficha de campo.
1. Tema de investigacin
2. Nombre del investigador
3. Institucin
4. Lugar
5. Fecha
6. Hora
7. Datos de la fuente (edad, sexo, ocupacin).
Ficha de noticiario.
1. Agencia noticiosa / comentarista
2. Nombre del noticiario
3. Nmero / horario
4. Estacin / canal / cine
5. Lugar
6. Fecha
7. Noticia o comentario
Ficha de institucin.
Nombre de la institucin (subrayado)
1. Institucin de la que forma parte
2. Objetivos que tiene en su funcin
3. Ubicacin
Direccin
Lugar que ocupa en la disciplina a la que pertenece o practica
1. Funciones y servicios
2. Informacin que puede proporcionar
3. Conexin, nexos, relacin con otras fuentes similares
4. Forma de acceso (procedimientos para obtener sus servicios, o persona u oficina por cuyo conducto se pueden obtener
sus servicios).
5. Publicaciones que emite
6. Otros datos importantes.
Ficha para registrar informacin que aparece en mapas, dibujos, fotografas, etc.
1. Nombre (de lo que se trata, subrayado)
2. Autor
3. Fuente (lugar, libro, revista, museo, etc., dnde est)
4. Descripcin del objeto (colores, medidas, material de que est hecho, datos indispensables para tener nocin de cmo
es)
5. Contenido (descripcin de lo que se ilustra o representa)
6. Otros datos que interesen al investigador (fecha, sala, en el caso de museos, exposicin, etc.)
FICHA DE TRABAJO.
Es aquella donde se registran los datos que interesan al investigador.
Cuando el dato est contenido en ms de una tarjeta, las tarjetas que ocupe constituirn una sola ficha. En estos casos, conviene
marcar las tarjetas con el nmero de ficha y una letra (ej.: 5a y 5b).
Una ficha debe contener un solo dato, ste puede ser un solo detalle (una fecha, un nombre, un acontecimiento, etc.) o estar
formado por ms informacin (una carta, la descripcin de un hecho, una biografa, etc.). Para saber qu informacin debe
registrarse en una ficha de trabajo, en el momento de hacer la anotacin debe pensarse si esa informacin va a aparecer en un
solo lugar o hay detalles que se utilizarn en otros lugares del escrito; en el primer caso se tratar de una ficha; en el segundo,
ser necesario hacer una ficha por cada informacin que aparecer en distintas partes del escrito.
El regesto es el asunto, tema o ttulo del contenido de la ficha de trabajo. Debe ser breve y reflejar fielmente la informacin
anotada.
La informacin (dato) puede registrarse textualmente o resumirse.
Datos fundamentales:
1. Autor
2. Ttulo (entre comillas)
3. Nmero de pgina (s) donde aparece el dato
4. Regesto (asunto, tema; va subrayado)
Datos complementarios:
1. Fecha en que se recogi el dato
2. Razn o motivo por el que se recab la informacin.
Ficha de transcripcin textual.
Como su nombre lo indica, es aquella a la que se traslada ntegramente el texto tomado de la fuente, por lo que esta informacin
siempre ir entre comillas.
Ficha de sntesis.
Es la que se utiliza para consignar, en pocas palabras, el extracto del texto consultado. Se debe tener cuidado de no omitir o
tergiversar el contenido
No es necesario utilizar una tarjeta especial para los comentarios personales acerca de la fuente, puesto que es conveniente
incluirlos en la misma ficha que la registra. Se escriben entre corchetes.
Fichas metodolgicas.
Se refieren a aquellos puntos obtenidos de las lecturas, concretamente relacionados con notas metodolgicas, es decir, con qu
sujetos se hizo la investigacin, cmo se eligieron stos, qu hiptesis se emplearon, cmo se analizaron los datos, algn
instrumento original que se utiliz, alguna cuestin interesante que se investig, es decir, con las cuestiones operativas del
estudio. El origen de estas fichas, al igual que en los casos anteriores, debe identificarse utilizando la abreviacin de la fuente
original y el nmero de pgina.