Temario Completo Analisis de Datos

1
TEMA 1 - CONCEPTOS BSICOS Y ORGANIZACIN DE DATOS

Estadstica terica (aspectos formales y normativos) y aplicada (aplicacin a un campo concreto)

Estadstica aplicada o anlisis de datos: Niveles de medida
1.-nominal
2.-ordinal
3.-de intervalo
4.-de razn

Mtodo cientfico: dar razn sistemtica, emprica y experimental, de los fenmenos
Es sistemtico!porque tiene etapas definidas
Es replicable!porque los datos obtenidos pueden ser replicados o refutados

1.- Definicin de problemas
2.- Deduccin de hiptesis contrastables
3.- Establecimiento de un procedimiento de recogida de datos
4.- Anlisis de datos
5.- Discusin de dichos resultados y bsqueda de conclusiones
6.- Elaboracin del informe de la investigacin

Estadstica: se ocupa de sistematizacin, recogida, ordenacin y presentacin de los datos
referentes a un fenmeno que presenta variabilidad o incertidumbre para su estudio metdico, con
objeto de hacer previsiones sobre los mismos, tomar decisiones u obtener conclusiones.

Estadstica descriptiva! Se organizan y resumen conjuntos de observaciones
procedentes de una muestra. Cuantitativa (tablas, grficos, valores numricos)
Con 1 variable:
ndices para valores ms habituales (ndices de tendencia central)
Hasta que punto son similares o diferentes entre si (estadsticos de variabilidad)
Gado en que las observaciones se representan por encima o debajo de la
tendencia central (estadsticos de asimetra)
Con 2 variables:
Relacionar variables entre s (coeficientes de correlacin)
Predecir el valor de una variable en funcin de otra (ecuaciones de regresin)

Estadstica Inferencial!Inferencias a cerca de una poblacin basndose en datos
obtenidos de una muestra. Se utiliza el clculo de probabilidades.

En una investigacin se pretende conocer un parmetro (una caracterstica) de una poblacin, y
como es demasiado amplia, se realiza un muestreo con el que se obtiene una muestra de
elementos que la representan. Se estudia la caracterstica deseada en la muestra mediante
estadsticos que estiman los parmetros de la poblacin.
Queremos conocer un parmetro porcentaje de individuos que responden si (y como no es posible
por lo extensa de la poblacin) conocemos la estimacin de ese parmetro!el estadstico o
porcentaje de la muestra que responden si.

POBLACION!conjunto de todos los elementos que cumplen una determinada caracterstica objeto
de estudio.
MUESTRA!subconjunto cualquiera de una poblacin. Solo sirve para el total de la poblacin si es
representativa.
PARMETRO!propiedad descriptiva (medida) de una poblacin
ESTADSTICO!propiedad descriptiva (medida) de una muestra

2
Para que una muestra sea representativa se deben utilizar mtodos de muestreo probabilstica (una
muestra probabilstica se elige mediante reglas matemticas y una muestra no probabilstica no,
ej. Muestras de conveniencia o incidental (conformada por personas de fcil acceso para el
investigador, o la bola de nieve (un elemento lleva a otro y as sucesivamente)

MEDICIN Y ESCALAS DE MEDIDAS
Medicin: Proceso por el cual se asignan nmeros a objetos o caractersticas segn determinadas
reglas
Objetos fsicos!medicin directa
Variables no directamente observables!??

Caracterstica: cualquier propiedad de un objeto
Modalidad: formas en las que se presenta la caracterstica (se asigna un n a cada una de las
modalidades de una caracterstica)

Se utilizan diferentes escalas (conjunto de reglas o modelos desarrollados para la asignacin de n a
los valores de las variables) en funcin de la variable a medir (timidez en clase, tiempo en realizar
una tarea, nacionalidades de un conjunto, etc.)

Segn Stevens (1946) Cuatro tipos de escalas de medidas:
1) Nominal (igualdad o desigualdad, entre 2 modalidades)
2) Ordinal (adems, se puede establecer un orden)
3) De intervalo (adems, se usa una unidad y tienen sentido las diferencias)
4) De razn (adems, se pueden comparar dos medidas mediante un cociente)
Escala nominal
Asignacin arbitraria de nmeros o smbolos a cada una de las diferentes modalidades de la
caracterstica. Relacin de igualdad o desigualdad, que implica la pertenencia o no a una categora
determinada.
Ej.: Religin (practicantes, no practicantes)
Escala Ordinal
Asignacin (no arbitraria, sino atendiendo el orden existente entre las categoras) de nmeros a
objetos para indicar la extensin relativa en que se posee una caracterstica. Se clasifica a las
personas, objetos o eventos en una posicin con relacin a cierto atributo, pero sin indicar la
distancia entre las posiciones. Solo se indica el orden. Permite la identificacin, diferenciacin y el
establecimiento de relaciones de tipo mayor que o menor que.
Ej.: Estatus (alto, medio, bajo)
Escala de intervalo
Ordena los objetos o eventos segn la magnitud del atributo que presentan y proveen intervalos
entre las unidades de medida. Origen arbitrario y no refleja la ausencia de la magnitud que estamos
midiendo. Se puede saber si un objeto es igual o diferente, si posee en mayor o en menor grado la
caracterstica de inters y estos nmeros se pueden restar y sumar y las diferencias entre esos
nmeros se pueden multiplicar y dividir.
Su caracterstica es la existencia de una unidad de medicin comn y constante, que permite
asignar un n real a todos los pares de objetos del conjunto ordenado.
Ej. Inteligencia (0,90, 160, etc.)
Escala de razn
Los nmeros asignados admiten como vlidas las relaciones de igualdad-desigualdad, orden, suma,
resta, multiplicacin y divisin. Tiene todas las caractersticas de la medida de intervalo y se suma
que se le puede asignar un punto de origen verdadero, un valor absoluto (valor cero= ausencia de
la magnitud).
Ej.: Altura
NOMINAL Los nmeros identifican y clasifican objetos Igual-desigual Sexo, estado civil, raza,
ORDINAL +, los nmeros indican las posiciones relativas de los objetos mayor que- igual que Grado de satisfaccin, dureza
INTERVALO +, hay una unidad de medicin comn +, igualdad-desigualdad de diferencias Temperatura, inteligencia
RAZN +, el punto cero es absoluto. +, igualdad-desigualdad de razones Longitud, peso, altura
3
VARIABLE: CLASIFICACIN Y NOTACIN
Caracterstica con 1 sola modalidad!constante
Variable: Representacin numrica de una caracterstica que presenta ms de una modalidad
(valor) de un conjunto determinado.
Tres tipos: 1) Cualitativa (nominales)
En funcin del nmero de categoras o modalidades:
Variable dicotmica: 2 categoras (Ej.: el sexo)
Variable politmica: Ms de 2 categoras (Ej.: nacionalidades)

2) Cuasicuantitativa (ordinales)

3) Cuantitativa (de intervalo y de razn)
En funcin de los valores numricos que pueden asignarse:
Variable continua: valores en cualquier punto de la escala (Ej.:
peso)
Variable discreta: valores aislados, sin valores intermedios (Ej.:
n de hijos)

Variable independiente!suceso causa de otro
Variable dependiente!efectos de la variable independiente
Variable extraa!las que influyen sobre la variable independiente, pero que no se estudian.

Notacin de la variable
Letras latinas maysculas, con un subndice i
Xi, siendo i=1, 2, 3, , n (siendo n, el nmero de elementos que componen la muestra)

DISTRIBUCIN DE FRECUENCIAS
Los datos con los que se trabaja pueden provenir de la medicin directa de las variables o de
frecuencias que provienen de un proceso de conteo. Normalmente se organiza la informacin
mediante una distribucin de frecuencias (representacin de la relacin entre un conjunto de
medidas exhaustivas y mutuamente excluyentes y la frecuencia de cada una de ellas)
Organiza los datos
Da informacin para la representacin grfica
Facilita los clculos para estadsticos muestrales

Frecuencia absoluta!(ni) nmero de observaciones en cada categora
Frecuencia relativa o proporcin de cada categora !(pi) se obtiene dividiendo la (ni) , entre el
nmero total de observaciones.
En porcentaje (Pi) multiplicando cada
proporcin por 100.
Variable cualitativa (nominal)

Variable cuasicuantitativa (ordinales)
Igual pero respetando el orden predeterminado. Y se aaden la frecuencia absoluta acumulada
(na), frecuencia relativa acumulada o proporcin acumulada (pa) y el porcentaje acumulado
(Pa), para cada una de las categoras o modalidades de respuesta, y se obtienen acumulando
(sumando) desde la categora de menor valor de la variable a la de mayor valor, las frecuencias
absolutas, proporciones o porcentajes, de cada categora de respuesta.

X ni pi Pi
Hombres 24 0,6 60
Mujeres 16 0,4 40
n= 40 1 100
4
X ni pi Pi na pa Pa
Primaria 13 0,33 33 13 0,33 33
ESO 11 0,28 28 24 0,60 60
FP 7 0,18 18 31 0,78 78
Diplomatura 4 0,10 10 35 0,88 88
Licenciatura 5 0,13 13 40 1,00 100
n= 40 1,00 100

Frecuencia absoluta!(ni) N de veces que se repite cada uno de los valores de una variable. La
suma de todas las frecuencias absolutas representa el total de la muestra (n)

Frecuencia relativa o proporcin de cada categora !(pi) Cociente entre la frecuencia absoluta
de cada variable (ni) y N total de observaciones (n)! (pi)= (ni) / (n)

Porcentaje! (Pi) Valor de la frecuencia relativa multiplicado por 100. (Pi)= (pi).100

Frecuencia absoluta acumulada!(na) N de veces que se repite cada modalidad o cualquiera de
las modalidades inferiores

Frecuencia relativa acumulada o proporcin acumulada!(pa) Cociente entre la frecuencia
absoluta acumulada de cada clase y total de observaciones (n)! (pa)= (na) / (n)

Porcentaje acumulado!(Pa), Valor de la frecuencia relativa acumulada multiplicado por 100.
(Pa)= (pa).100

Variable cuantitativa (de intervalo y de orden)
1) N de valores de la variable reducido (Ej.: n de hijos)!Igual que con variables ordinales
2) N de valores amplio (Ej.: edad, altura)!agrupar en intervalos (grupos de valores
consecutivos) al establecer intervalos siempre se pierde informacin y se puede optar por la
amplitud que ms se ajuste al estudio (equilibrio entre la precisin que se necesite y la
manejabilidad de los datos.
Limites de los intervalos: hay que tratar de que el lmite superior exacto de un intervalo
coincidan con el lmite inferior exacto del siguiente. Cuando no es as, se los llama: lmites
informados o aparentes (Ej.: edades entre 26 - 35, debe ser entre 25,5 - 35,5)

Limites exactos= valor informado+- 0,5 x I (siendo I la unidad del instrumento de medida)
Punto medio: semisuma ((a+b)/2) del lmite superior e inferior del intervalo de los lmites
exactos o de los aparentes
Intervalo abierto: que no tiene lmite inferior o superior (76 aos o ms)

Intervalo!cada uno de los grupos de valores que ocupan una fila en una distribucin de frecuencia.

Lmites aparentes, virtuales o informados!valores mayor y menor de cada intervalo, teniendo en
cuenta el nivel de precisin del instrumento de medida.

Lmites reales o exactos!valores mximo y mnimo que tendra cada intervalo si el instrumento de
medida fuera exacto.

Punto medio del intervalo!semisuma de los lmites exactos o de los lmites aparente.

Amplitud del intervalo!diferencia entre el lmite exacto superior y el lmite exacto inferior

5
REPRESENTACIONES GRFICAS
Eje vertical!ordenada (o eje de las Y)
Eje horizontal!abscisa (o eje de las X)
1 cuadrante: +x, +y
2 cuadrante: -x, +y
3 cuadrante: -x, -y
4 cuadrante: +x, -y

a) Diagrama de barras (variables nominales, ordinales y cuantitativas discretas)
Abscisa (X)!valores de la variable
Ordenada (Y)! frecuencias
En las ordinales y cuantitativas discretas, se puede utilizar tambin un diagrama de barras
acumulativo.

b) Diagrama de sectores (variables cualitativas (nominal) y cuasicuantitativas (ordinal))
Forma de crculo, cuya superficie es proporcional a la frecuencia de la modalidad
correspondiente. El ngulo total representa el n total de observaciones y para determinar el
ngulo de los sectores se multiplica la frecuencia relativa (proporcin) por 360

c) Pictograma (variables cualitativas (nominal))
Dibujos alusivos cuya rea es proporcional a la frecuencia de la modalidad que representa.

d) Histograma (variables cuantitativas continuas con datos agrupados en intervalos)
Abscisa (X)!intervalos con limites exactos (todos con la misma amplitud) o los puntos medios y
sobre ellos se levantan rectngulos cuyas reas sean proporcionales a la frecuencia
correspondiente.
Ordenada (Y)! frecuencias

e) Polgono de frecuencias (variables discretas y continuas)
Se unen los extremos superiores de lo que seran las barras (si se hubiera hecho un diagrama de
barras) o de un histograma en los puntos medios de las bases superiores (variable continua)

REPRESENTACIONES GRFICAS DE DOS VARIABLES

a) Diagrama de barras conjunto (al menos una de las dos variables es cualitativa (nominal))
Cuando las dos son cualitativas conviene organizar los datos en una tabla de doble entrada.
X Hombre Mujer

Casado 12 12 24
Divorciado 4 2 6
Soltero 4 2 6
Viudo 4 0 4
24 16 40
Deben representarse en el mismo grfico ambas situaciones.
Abscisa (X)!estados civiles
Ordenada (Y)! porcentaje
Es importante que el n de sujetos sea el mismo para utilizar las frecuencias absolutas, de lo
contrario es recomendable utilizar las frecuencias relativas o porcentajes.

b) Diagramas de dispersin o nube de puntos (dos variables cuantitativas)
Dando idea de la relacin que existe entre ambas variables.
Abscisa (X)!una variable
Ordenada (Y)! la otra
Para cada par de datos se localiza la interseccin y se marca con un punto
Se pueden establecer relaciones lineales entre variables.

6
PROPIEDADES DE LA DISTRIBUCIN DE FRECUENCIAS

Tendencia general: Lugar donde se centra una distribucin particular en la escala de valores.

Variabilidad: Grado de concentracin de las observaciones en torno al promedio.
Homognea (poca variabilidad) si los valores ests cercanos al promedio.
Heterognea (mucha variabilidad) si los valores se dispersan mucho con respecto
al promedio.

Asimetra o sesgo: Grado en que los datos se reparten equilibradamente por encima y por
debajo de la tendencia general.
Distribucin simtrica: cuando al dividirla en dos a la altura de la media, las dos
mitades se superponen.
Asimetra positiva: cuando la mayor concentracin est en la parte baja de la
escala (test difciles)
Asimetra negativa: cuando la mayor concentracin est en la parte alta de la
escala (test fciles)
1
TEMA 2 MEDIDAS DE TENDENCIA CENTRAL Y POSICIN
MEDIDAS DE TENDENCIA CENTRAL
La tendencia central de una distribucin de frecuencias se puede resumir en un valor o puntuacin,
las medidas o ndices de puntuacin de tendencia central indican sobre que puntuacin se
concentran las observaciones.

Media aritmtica
Mediana
Moda
.
Media aritmtica (X)
Promedio o medio ms conocido y usado. Valor central alrededor del cual estn la
mayora de las observaciones. Solo para variables cuantitativas.
_
X= suma de todos los valores (X1, X2, X3+Xn) = E X
i

n= n total de observaciones n

Cuando el n de observaciones es elevado:
A partir de las Frecuencias absolutas (n
i
):
_
X= E n
i
X
i
= E n
i
X
i
E n
i
n
n= n total de observaciones
X
i
= el valor i en la variable X (o punto medio del intervalo)
n
i
= frecuencia absoluta del valor o intervalo i.

o de las Frecuencias relativas (p
i
):
_
X= E p
i
X
i

X
i
= el valor i en la variable X (o punto medio del intervalo)
p
i
= frecuencia relativa o proporcin de observaciones del valor o intervalo i.

Propiedades matemticas:
1) La suma de las desviaciones de cada valor con respecto a su media es igual a cero.

n
_

E(X
i
-X)=0

i=1

2) Si a los valores de la variable X le aplicamos la siguiente transformacin lineal: Y
i
=bX
i
+
a, la media de los nuevos valores Y ! Y = bX + a

Lmites:
a) Cuando los datos estn agrupados en intervalos, la media no se puede calcular si el
intervalo mximo no tienen lmites superior o el intervalo mnimo no tiene lmite inferior
b) Sensible a valores extremos (no se recomienda en distribuciones asimtricas)

Mediana (Md):
Buena para representaciones asimtricas. No es sensible a valores extremos porque en su
clculo no entran todos los valores (como en la media aritmtica) sino nicamente los que
ocupan las posiciones centrales. En todo tipo de variables, menos en las cualitativas.
Valor de la variable que divide la distribucin de frecuencias en dos partes iguales,
conteniendo un 50% de las observaciones.
2

Se ordenan las puntuaciones de mayor a menor, si es n impar, la mediana es la
observacin que ocupa la posicin central; si es n par la mediana es la media aritmtica de
los dos valores centrales.

Cuando el n de observaciones es elevado:
Intervalo en el que se encuentra la mediana!intervalo crtico y corresponde con aquel en
el que la frecuencia absoluta es igual o superior a n/2.
n _ n
d

Md= L
i
+ 2 . I
n
c

L
i
= Limite exacto inferior del intervalo crtico
n = n de observaciones
n
d
=Frecuencia absoluta acumulada por debajo del intervalo crtico
n
c
=

Frecuencia del intervalo crtico
I = Amplitud del intervalo crtico

Se asume que la distribucin de las frecuencias dentro de cada intervalo es homognea. Ej.:
sabemos que el n de observaciones totales es de 50 y por tanto la media dividir en 25
sujetos a esta observacin, si el lmite superior del intervalo crtico es de 22, faltan 3
observaciones para llegar al 50% en el que se encuentra la mediana. Asumimos que estas
puntuaciones se reparten homogneamente dentro del intervalo.

Si los datos no estn ordenados en intervalos:
Se genera un caso particular en el que I (amplitud del intervalo crtico) es =1

No se puede utilizar cuando el intervalo donde se encuentra la mediana es abierto.

Moda (Mo):
Se puede utilizar en variables cuantitativas y cualitativas.
Cualitativa!la moda es la categora con la mxima frecuencia.
Cuantitativa sin intervalos!la moda es el valor con mayor frecuencia absoluta (n
i
)
Cuantitativa con intervalos!se localiza el intervalo modal que es el intervalo con la
frecuencia mxima y la moda es el punto medio de dicho
intervalo.
Si un nico valor con la frecuencia mxima, una moda!unimodal
Son dos o ms valores con la frecuencia mxima!bimodal, trimodal, etc.

Caractersticas:
a) Clculo sencillo y de fcil interpretacin.
b) Cuando la variable es cuantitativa con intervalo, la moda no se puede calcular si el
intervalo modal est en un intervalo abierto.

Eleccin de una medida de tendencia central
Se recomienda la media aritmtica (se desaconseja cuando la distribucin de las
frecuencias es muy asimtrica) y no se puede cuando el nivel de medida es nominal u
ordinal ni en datos agrupados con intervalos abiertos en sus extremos.
La siguiente es la mediana, resistente a los valores extremos, si se puede con niveles
ordinales y en datos agrupados con intervalos abiertos. No en variables nominales,
cuando la mediana se encuentra en el intervalo abierto.
Moda, no se puede cuando la frecuencia sea amodal o el intervalo modal coincida con el
intervalo abierto.

3
CUALITATIVA (nominal)! MODA
CUASICUANTITATIVA (ordinal)!MODA, MEDIANA
CUANTITATIVA ((de intervalo y de razn)!MODA, MEDIANA Y MEDIA ARITMTICA

(CUANTITATIVA, SIMETRICA Y UNIMODAL!MEDIA, MEDIANA Y MODA= VALOR)

MEDIDAS DE POSICIN
Medidas o ndices de posicin o cuantiles: Informan acerca de la posicin relativa de un sujeto
con respecto a su grupo de referencia, dentro de la distribucin de frecuencias de la variable
(situacin de una puntuacin con respecto a un grupo, utilizando a ste como referencia).
Dividir la distribucin en un n de partes o secciones iguales entre s en cuanto al n de
observaciones (la mediana divide en dos partes, 50%) dependiendo de cuantos valores utilicemos
para dividir la distribucin:
Percentiles
Cuarteles
Deciles

Percentiles (o centiles)! k!(P
k
)
99 valores que dividen en 100 partes iguales la distribucin de frecuencias.
Ej.: percentil 50! (P
50
): Divide a la distribucin de frecuencia en 50%, igual que la
mediana. P
50
= Md
Clculo:
Frecuencias absolutas (n
i
) en intervalos
Intervalo donde est el percentil
k
!intervalo crtico
Intervalo crtico =frecuencia absoluta acumulada (n
a
) es igual o superior a n.k
100
n.k _ n
d

P
k
=L
i
+ 100 . I
n
c
n
d:
Frecuencia absoluta acumulada por debajo del intervalo crtico
n
c
: Frecuencia absoluta del intervalo crtico
L
i
: Lmite inferior exacto del intervalo crtico
I: Amplitud del intervalo

Datos agrupados sin intervalos:
Misma formula con (I=0)
Este mtodo es para calcular el valor de cualquier de los 99 valores (valor de X, dado k)

Para calcular que posicin ocupa un valor de la variable X
i
(valor de k, dado X)

(P
k
-L
i
).n
c
+ n
d
k= I . 100
n

n
d:
Frecuencia absoluta acumulada por debajo del intervalo crtico
n
c
: Frecuencia absoluta del intervalo crtico
L
i
: Lmite inferior exacto del intervalo crtico
I: Amplitud del intervalo

Si el resultado es con decimales se toma la cantidad entera ms prxima.

4
Cuartiles (Q
1
) (Q
2
) (Q
3
)
3 valores que dividen en 4 partes iguales la distribucin de frecuencias:
Primer cuartil (Q
1
) por debajo 25%, por encima 75% ! Q
1=
P
25

Segundo cuartil (Q
2
2
= P
50
= Md

Tercer cuartil (Q
3
3=
P
75

Igual forma de clculo que los percentiles.
Se utilizan para construir ndices para el estudio de la variabilidad de una distribucin de
frecuencias.

Deciles (D
1
) (D
2
) (D
3
) (D
4
) (D
5
) (D
6
) (D
7
) (D
8
) (D
9
)
9 valores que dividen en 10 partes iguales la distribucin de frecuencias:
Primer decil (D
1
) por debajo 10%, por encima 90%
Primer decil (D
2
Primer decil (D
3

Primer decil (D
9

Igual forma de clculo que los percentiles.
1
1LMA 3 - MLDIDAS DL VAkIA8ILIDAD ASIML1kIA
uos nuevas propledades de una dlsLrlbucln de frecuenclas:
Var|edad o d|spers|n: grado en que las punLuaclones se aseme[an o dlferenclan enLre sl, o se
aproxlman o se ale[an de una medlda de Lendencla cenLral como la medla arlLmeLlca.
lndlces de medlda: Amp||tud tota|
Var|anza
Desv|ac|n t|p|ca
Amp||tud sem|-|ntercuart||
Coef|c|ente de covar|ac|n: para comparar dlsLlnLas dlsLrlbuclones de
frecuenclas en Lermlnos de su varlabllldad

As|metr|a o sesgo de |a d|str|buc|n:
Ind|ce de as|metr|a de earson: resulLado numerlco sobre el grado y Llpo de
aslmeLrla de la dlsLrlbucln.

untuac|ones d|rectas:
ara comparar a los su[eLos enLre sl y en dlferenLes varlables.
untac|ones d|ferenc|a|es
untac|ones t|p|cas

Med|das de var|ab|||dad
Var|ab|||dad o d|spers|n: grado de varlacln en un con[unLo de punLuaclones. unLuaclones muy prxlmas
enLre sl (concenLradas alrededor de la medla)! poca dlspersln, punLuaclones
ale[adas enLre sl! ms dlspersln = mayor varlabllldad. CuanLa menos varlabllldad
ms homogenea es la muesLra. CuanLa ms varlabllldad ms heLerogenea es la
muesLra.
ara cuanLlflcarlo ! medldas o lndlces de varlabllldad:
Amp||tud tota| o de rango y |a amp||tud sem|-|ntercuart||: Los que mlden el grado
en que las punLuaclones se aseme[an o dlferenclan
enLre sl
Var|anza y desv|ac|n t|p|ca: Los que mlden la dlspersln con respecLo a alguna
medlda de Lendencla cenLral (medla arlLmeLlca)

Amp||tud tota| (rango o recorr|do) (A
1
): ulsLancla que hay en la escala numerlca enLre los valores que
represenLan la punLuacln mxlma (llmlte exocto sopetlot Jel lotetvolo mxlmo) y la punLuacln mlnlma
(llmlte exocto lofetlot Jel lotetvolo mlolmo): A
1
= k
mx
- k
m|n

I.
.
A
1
= \
mx
- \
mlo
! 9,5 - 4,5=5

lnconvenlenLes: senslble unlcamenLe a los calores exLremos, por lo que no capLura la poca o mucha
dlspersln enLre los resLanLes valores.

X i ni
5 135
6 66
7 45
8 36
9 18
! 300
2
Var|anza y desv|ac|n t|p|ca: ulsLancla enLre las punLuaclones y un valor cenLral (medla arlLmeLlca)
oca varlabllldad: medldas muy cercana a la medla, mucha varlabllldad: medldas ale[adas de la medla.
_
romed|o de |as desv|ac|ones o d|ferenc|as de cada puntuac|n respecto a su med|a (k
d
):
_ _
k
d
: d
|
= (k
|
- k)
n n

Como se vlo en la prlmera propledad maLemLlca de la medla, el sumaLorlo del numerador
slempre es lgual a cero (z (x
l
- x)), por lo que no serla una buena medlda para la varlabllldad.
ara poder uLlllzar un lndlce con esLas desvlaclones evlLando el cero:

1. Desv|ac|n med|a (DM): calcular el valor absoluLo de cada desvlacln anLes de
reallzar la suma:
_ _ _ _
DM= (k
1
- k) + (k
2
- k) + ..+ ( k
n
- k) = !(k
|
-k)
2

n n
Se usa muy poco porque es poco mane[able maLemLlcamenLe.

2. Var|anza (S
2
x
): oLra alLernaLlva para el problema del slgno es el promedlo de los
cuadrados de las desvlaclones de las punLuaclones respecLo a la medla
_ _ _ _
S
2
x
= (k
1
- k)
2
+ (k
2
- k)
2
+ ..+ ( k
n
- k)
2
= S
2
x
= ! (k
|
- k)
2

n n
C _
S
2
k
= ! k
2
|
_ k
2
n
rlmero de elevan al cuadrado las dlferenclas y luego se obLlene el promedlo de
esas desvlaclones al cuadrado

Datos en frecuenc|as agrupadas o s|n agrupar en |nterva|os:
_ _
S
2
x
= n
|
(k
|
- k)
2
= n
|
(k
|
- k)
2

n
|
n

C
_
S
2
k
= ! n
|
k
|
2
_ k
2
= ! n
|
k
|
2
_ k
2

! n
|
n

n= n LoLal de observaclones
x
l
= valor de l en la varlable x o el punLo medlo del lnLervalo
n
l
= es la frecuencla absoluLa del valor o lnLervalo l

Datos en frecuenc|as re|at|vas:
_
S
2
k
= ! p
|
k
|
2

_ k
2

pl= frecuencla relaLlva o proporcln de observaclones del valor o del lnLervalo l

3
J. lo votloozo ol ttobojot coo o ol cooJtoJo slempte es posltlvo poe se expteso eo los
oolJoJes Je lo votloble ol cooJtoJo, poto loqtot ooo meJlJo Je Jlspetslo eo los
mlsmos oolJoJes poe lo votloble, se colcolo lo !"#$ &'"(!"(" () *" +"!,"-$"!
().+,"&,/- 0#1,&"2

S
x
= " ! (X
i
- "X)
2

n
La desvlacln Llplca se uLlllza ms que la varlanza porque se expresa en las mlsmas
unldades de medlda que la varlable ob[eLo de esLudlo.

ropledades de la varlanza y de la desvlacln Llplca
.- usan Lodas las punLuaclones observadas
.- Mlden la varlabllldad respecLo a la medla arlLmeLlca, solo deben uLlllzarse
sl se usa la medla como medlda de Lendencla cenLral.
.- lguales o mayores (poslLlvas) que cero. = 0 sl Lodas las punLuaclones son
lguales enLre sl (no hay varlabllldad o dlspersln). nunca negaLlvas.
.- Sl a una varlable \ se le suma o se le resLa una consLanLe o, la varlanza y la
desvlacln Llplca de la varlable orlglnal no se ven afecLadas, slguen slendo
las mlsmas. ero cuando mulLlpllcamos los valores de las \ por una
consLanLe b, la varlanza queda mulLlpllcada por la consLanLe b
2
y la
desvlacln Llplca por b.

4. Cuas|var|anza: se dlvlde por o-1 en lugar de o como en la varlanza
_
S
2
n-1
= ! (k
|
- k)
2

n-1
3. Cuas| desv|ac|n t|p|ca: ralz cuadrada de la cuaslvarlanza

"S
2
n-1
= "! (k
|
- k)
2

n-1
Coef|c|ente de var|ac|n: Comparacln del grado de varlabllldad o dlspersln enLre dos con[unLos de
punLuaclones en una mlsma o dlsLlnLas varlables. or lo general, las varlables se mlden en unldades dlsLlnLas y
es necesarlo deflnlr un lndlce de varlabllldad relaLlva que no dependa de las unldades de medlda.
CV = S
x
. 100
k
LsL deflnldo para varlables con la medla x > 0 y es recomendable que su resulLado se acompane de la medla
y de la desvlacln Llplca de la dlsLrlbucln a parLlr de las que se ha calculado.
Solo se puede uLlllzar cuando la medla de ambos grupos es la mlsma.

Amp||tud sem|-|ntercuart||:
votloozo, Jesvloclo tlplco, meJlo otltmtlco! stoJlstlcos poto estoJlot lo votloblllJoJ y lo teoJeoclo
ceottol.
ulsLrlbucln aslmeLrlca! medlana y ampllLud seml-lnLercuarLll

ulsLancla medla enLre el Lercer y el prlmer cuarLll! =
3
-
1
=
7S
-
2S

2 2
lnforma sobre la varlabllldad del 30 de las punLuaclones, preclsamenLe las comprendldas enLre el percenLll
23 y el 73 de la dlsLrlbucln.

INDICL DL ASIML1kIA DL LAkSCN
4
As|metr|a: Crado en que las punLuaclones se reparLen por deba[o y por enclma de la medlda de Lendencla
cenLral! medlanLe la represenLacln grflca (poslLlva o negaLlva)!lndlce numerlco que lo cuanLlflca: Ind|ce
de as|metr|a de earson: re|ac|n entre |a med|a (k) y |a moda (Mo)

A
s
= k - Mo
S
x

lndlce adlmenslonal (no Llene unldades de medlda) que se apllca a dlsLrlbuclones unlmodales.
ulsLrlbucln slmeLrlca! Medla y Moda lguales y se anulan!A
s
= 0
AslmeLrla poslLlva!Medla mayor que la Moda!A
s
> 0
AslmeLrla negaLlva! Medla menor que la Moda !A
s
< 0

UN1UACICNLS 1IICAS
Las punLuaclones dlrecLas (LesL, eLc.) nos ofrecen poca lnformacln, conoclda una punLuacln dlrecLa no
sabemos sl se LraLa de un valor alLo o ba[o porque depende del promedlo del grupo.
untuac|n d|ferenc|a| (x
|
)! permlLen comparar las punLuaclones de un su[eLo en dos varlables dlsLlnLas. A
una punLuacln dlrecLa x le resLamos la medla de su grupo.

x
|
= k
|
- k
LsLa lnformacln nos permlLe saber sl la punLuacln colnclde con la medla de su
grupo, es lnferlor o superlor
ropledades:
a) Su medla es cero: x = 0
b) La varlanza de las punLuaclones dlferenclales es = a la varlanza de las
punLuaclones dlrecLas
untuac|n t|p|ca (2
x
)!permlLen comparar las punLuaclones de un su[eLo en dos varlables dlsLlnLas y
comparar dos su[eLos dlsLlnLos en dos varlables dlsLlnLas. Al proceso de obLenerlas se le llama Llplflcacln.
lndlca el n de desvlaclones Llplcas que se aparLan de la medla de una deLermlnada punLuacln.

2
x
= x = k - k
S
x
S
x

ropledades:
a) Su medla es cero: Z = 0
b) Su varlanza es 1
8efle[an las relaclones enLre las punLuaclones con lndependencla de la unldad de medlda. ermlLen
comparaclones enLre dlsLlnLos grupos y enLre dlsLlnLas varlables.

1
!"#$ & '$()*+,+, -.(/0(!. 1" 1., 2$3+$4*",
uos varlables con dos medldas c/u, en una muesLra de 100 su[eLos. Se obLlene una llsLa de 4 columnas y 100
fllas

$5678978:; 6 <=>978:; ?= ?65 @9<89A>=5
uos varlables esLn relaclonadas enLre sl cuando clerLos valores de una de las varlables, se asoclan con clerLos
valores de la oLra varlable.

$,.-+$-+.( "(!3" 1., 2$3+$4*"$ -0$*+!$!+2$,
varlable cuallLaLlva!se mlde en escala nomlnal o de claslflcacln.
" ueden ser dlcoLmlcas (dos caLegorlas)
" C pollLmlcas (ms de dos caLegorlas)
" 1amblen son cuallLaLlvas varlables que presenLan un mayor nlvel de medlda 8lnLervalos o
razn) pero han sldo caLegorlzadas.

1abla de conLlngencla! con los daLos de dos varlables cuallLaLlvas para Lodos los su[eLos de una muesLra.
B<=7C=;7895 6A5=<@9?95 6 =DEF<8795 G;
=
H =; I = J

Cue se represenLa grflcamenLe en un dlagrama de barras:

ara poder saber sl exlsLe o no <=>978:; =;K<= >95 @9<89A>=5, se uLlllza el =5K9?F5K876 I
L
, asoclado a una
dlsLrlbucln de probabllldad (Chl cuadrado x
2
). I
L
se deflne en funcln de las M<=7C=;7895 =DEF<8795 G;
=
H y de
las M<=7C=;7895 K=:<8795 G;
K
)! que se calculan asumlendo que ambas varlables son lndependlenLes o no
relaclonadas y son el producLo del LoLal de su flla por el LoLal de su columna, dlvldldo por la frecuencla LoLal.
B<=7C=;789 K=:<879 G;
K
H N !6K9> M8>9 I !6K9> 76>CD;9
(
2
!"#$

? luego se elabora la dlferencla enLre las M<=7C=;7895 =DEF<8795 G;
=
H y las M<=7C=;7895 K=:<8795 G;
K
H

Cue slempre Llene que dar cero. Ll valor -, nos lndlca una relacln negaLlva.

Clculo del =5K9?F5K876 I
L
!! G;
=
' ;
K
H
L

;
K
lnconvenlenLes: dlflcll lnLerpreLacln, ya que desconocemos su llmlLe superlor. Sabemos que Llene
valor cero cuando no hay relacln enLre las varlables (&'()*+ ,(- ./0&'0)&1(- 0234/1&(- 5 607/1&(-
-+) 18'(,0-).

ara resolver esLe problema se uLlllza el F;?87= 6 -6=M878=;K= ?= -6;K8;O=;789P - que Loma valores 0 <= C < 1

C = x
2

! x
2
+ n

Ll valor obLenldo se puede comparar, dado que la Labla de conLlngencla Llene lgual n de fllas que de columna
(k) con una - DQR8D6 deflnldo como:

C mx = k - 1
! k

S?=D 76; ?65 @9<89A>=5 7C9>8K9K8@95 76; DQ5 ?= ?65 79K=O6<F95
CaracLerlsLlca del coeflclenLe C:
1. valores mayores, lguales a 0y menores que 1.
0 cuando x
2
= 0 ! dos varlables sln relacln (lrec. Lmplrlcas = lrec. 1erlcas)
1 cuando n = 0 ! no hay observaclones (nunca se puede dar)

2. A mayor valor de C, mayor es la relacln enLre las dos varlables y al reves. ara usar el
valor de C para comparar la relacln enLre dos varlables de dlferenLes lnvesLlgaclones es
necesarlo que Lengan el mlsmo n de fllas, de columnas y de daLos.
3. lundamenLar la causalldad en un coeflclenLe de conLlngencla ( hay varlables que se
relaclonan enLre sl porque exlsLe oLra varlable a[ena que Llene una relacln clara con
ambas
4. Se puede esLlmar un valor mxlmo de C sl la Labla de conLlngencla Llene el mlsmo n de
fllas que de columnas.
3
CC88LLAClCn Ln18L uCS vA8lA8LLS CuAn1l1A1lvAS
8equlslLos: MuesLra grande
8epresenLaclones grflcas: 189O<9D9 ?= ?=E<=58:; 6 ;CA= ?= EC;K65 (se puede apreclar sl exlsLe una relacln
llneal enLre x e ?)

lndlces para cuanLlflcar la relacln llneal:
-6@9<89;T9: varlacln con[unLa de dos varlables! Cov (X, Y) S
XY
.

Xi= Valor de la variable X en el caso i
Yi= Valor de la variable Y en el caso i
X = Media de la variable X
Y = Media de la variable Y
n= nmero de casos de la muestra

Ll slgno + - lndlca sl la relacln enLre ambas varlables es dlrecLa o lnversa.
3=>978:; >8;=9> ?8<=7K9! mayores valores de x, mayores valores de ?, menores
valores de x, menores valores de ? (y vlceversa) (+/+, -/-)
3=>978:; >8;=9> 8;@=<59!mayores valores de x, menores valores de ?, menores
valores de x, mayores valores de ? (+/-, -/+)
roblemas (Igual que el coeficiente X2, en las cualitativas)! Se desconoce su
rango, sus valores mxlmos y mlnlmos, para evlLar esLe problema!-6=M878=;K= ?=
76<<=>978:; ?= U=9<56; (<
IJ
H!
<
IJ
N ,
IJ
,
I
,
J
SX= Desviacin tpica de la variable X
SY= Desviacin tpica de la variable Y
SXY= Covarianza entre X e Y
CoclenLe enLre la covarlanza enLre x e ?, y el producLo de la desvlacln Llplca de x
y de la desvlacln Llplca de ?.
ropledades:
.- Solo Loma valores comprendldos enLre -1 y 1. Cero: cuando no exlsLa relacln
enLre x e ?.
.- r
x?
= +_ 1 sl una varlable es una Lransformacln llneal de oLra

lrmula alLernaLlva:
r
x?
= n " (x?) - "x"?
!n "x
2
- ("x)
2
!n "?
2
- ("?)
2

ara lnLerpreLar los resulLados hay que Lener en cuenLa:
a) valor absoluLo! a mayor valor absoluLo, relacln llneal enLre las dos varlables
ms fuerLe.
b) Slgno!poslLlvo (+/+, -/-)! relacln dlrecLa
negaLlvo (+/-, -/+) ! relacln lnversa

4
roblemas:
a) Solo deLecLa relaclones llneales, un coeflclenLe de correlacln llneal cercano a
cero lndlca que no exlsLe correlacln, pero pueden exlsLlr oLro Llpo de
relaclones de carcLer no llneal (relacln curvlllnea)
b) no Llene una comparacln dlrecLa enLre resulLados de esLudlos dlferenLes rx?=
0 , no hay relacln y r
x?
=+_ 1, relacln dlrecLa.
c) ulflculLad para fundamenLar la causalldad, cuando exlsLe un coeflclenLe de
correlacln elevado enLre dos varlables, no se puede aflrmar que una varlable
sea la causanLe de la oLra.
3"V3",+W( *+("$*
3=7K9 ?= <=O<=58:;, para efecLuar pronsLlcos de los valores de una varlable a parLlr de la oLra varlable!
JN9 X AI (9: 30)*10)60; (: +/*0)(*()
unLuaclones en ? a parLlr de punLuaclones en x! b= n " (x?) - "x"?
n zx
2
- (zx)
2

a= ? - bx

A las punLuaclones de J obLenldas a Lraves de esLa ecuacln !UC;KC9786;=5 E<6;65K879?95

ropledades:
a) La medla de los errores es cero.
b) La medla de las punLuaclones pronosLlcadas colnclden con la medla de las punLuaclones reales de ?
c) La varlanza de las punLuaclones en ? es lgual a la suma de la varlanza de los pronsLlcos, ms la
varlanza de los errores

1
!"#$ & '()*+)(", -.,+*$, /" 01)-$-+2+/$/

*)(*"0!),
"34567859:; <=5<:;67;> roceso que puede repeLlrse lndeflnldamenLe en las mlsmas condlclones, cuyo
resulLado no se puede predeclr con cerLeza.
CbLenemos un resulLado (experlmenLo) aleaLorlo (porque lnLervlene el azar)!
a) 1odos los resulLados poslbles son conocldos con anLerlorldad
b) no se puede predeclr con cerLeza cul ser el resulLado que se obLendr
c) uede repeLlrse cuanLas veces se desee.

"?4<@7; 8A5?:6<= B"C ; !"#$!% !$'"(%> con[unLo de Lodos los resulLados poslbles.

,A@5?;? B$D -D EC> 8esulLados del experlmenLo aleaLorlo o subcon[unLos del espaclo muesLral.
"=5859:<=5? B?784=5C! un solo resulLado del espaclo muesLral
*;84A5?:;?!uos o ms resulLados del espaclo muesLral
,A@5?; +84;?7F=5 B;C ; #%)*")+% ,-#.%> Suceso que no puede ocurrlr nunca

)456<@7;95? @;9 ?A@5?;?
a) G97H9 $G-! Subcon[unLo de " formado por los elemenLos que perLenecen a A y perLenecen a 8 o a
ambos a la vez.
b) +9:56?5@@7H9 $ -!Subcon[unLo de " formado solamenLe por los elemenLos perLeneclenLes a A y a 8.
Cuando la lnLerseccln no conLlene nlngun elemenLo, los sucesos son lncompaLlbles o excluyenLes, no
pueden verlflcarse slmulLneamenLe.
c) *;84=5859:<67; $! Subcon[unLo de L formado por los elemenLos que no perLenecen al suceso A. se
represenLa con el ulagrama de venn.

/"I+(+*+)( /" 01)-$-+2+/$/
Calcular la probabllldad de la ocurrencla de un suceso. Cero! Suceso lmposlble, uno! Suceso seguro, oLro
suceso!enLre 0 y 1

*=J?7@< B2<4=<@5C> la probabllldad de un suceso es lgual al coclenLe enLre el n de casos favorables de que
ocurra ese suceso y el n de casos poslbles, en el supuesLo de que Lodos los casos Lengan la mlsma
oporLunldad de ocurrlr (sean lgualmenLe probables)

06;F<F7=7K<K K5 ?A@5?;L (M K5 @<?;? N<O;6<F=5?
(M K5 @<?;? 4;?7F=5?
"? 95@5?<67; PA5 =;? ?A@5?;? ?5<9 5PA746;F<F=5?

"?:<KQ?:7@<
Sl repeLlmos el experlmenLo aleaLorlo muchas veces y anoLamos las frecuenclas relaLlvas (!"#$%#&$'( (*+,-%.( /&
'
0 1#
%&( 2("'(*-# #+.(13+.'$( 4
'
5 #+ #- &67#", 1# 2#$#+ 8%# (9("#$# #& #- #+.%1', #+.# 2(-,"5 !"#$%#&$'( "#-(.'2( /:
'
05 #+ #- $,$'#&.# #&."# -( :"#$%#&$'(
(*+,-%.( ; #- .(7(<, 1# -( 7%#+."( /=00de un suceso, Llende a esLablllzarse en un valor enLre 0 y 1, que se denomlna
46;F<F7=7K<K K5 ?A@5?;!#- -37'.# (- 8%# .'#&# -( :"#$%#&$'( "#-(.'2( 1# (9("'$'>& 1# %& +%$#+, ? $%(&1, #- &@
1# #&+(;,+5 & .'#&1# ( '&:'&'.,A
B/?0C-'7 &
?

&!D &

roblema: Muchas veces no se puede o no es prcLlco, repeLlr el experlmenLo un gran n de veces.

2

$37;8J:7@<> uado un espaclo muesLral L, se llama probabllldad de un suceso A, deflnldo en el espaclo
muesLral L, que se deslgna por (A), a un n real que se aslgna al suceso A, que cumpla las slgulenLes
condlclones:
a) 0= o < (A) = o < 1 (propledad cuanLlflcable enLre 0 y 1)
b) (L)=1 (Cero cuando no puede ocurrlr nunca y 1 cuando el suceso se produce con
segurldad)
c) (A)=1 - ( ) La probabllldad de A se puede obLener resLando de uno la probabllldad de su
complemenLarlo, .
d) 1eorema de la suma: la probabllldad de que ocurra el suceso A o el suceso 8 es lgual a la
suma de la probabllldad de que ocurra el suceso A ms la probabllldad de que ocurra el
suceso 8, menos la probabllldad de que ocurran ambos: (Au8)= (A) + (8) -(A 8)
A y 8 lncompaLlbles! (Au8)= (A) + (8) (ya que (A 8) = o.

01)-$-+2+/$/ *)(/+*+)($/$
Cuando la aparlcln de un suceso A, depende de la aparlcln de oLro 8. Los sucesos A y 8 son
K5459K759:5?.
(A 8) donde 8 es la condlcln requerlda!"probabllldad de A condlclonada a 8": Ls lgual a la
probabllldad de la lnLerseccln dlvldldo por la probabllldad de la condlcln 8:

0 B$ -CL 0B$ -C ?758465 PA5 0B-C RS
0B-C

0 B- $CL 0B- $C ?758465 PA5 0B$C RS
0B$C

,7 $ T - 79K5459K759:5?! 0 B$ -CL 0B$C T 0B- $C L 0B-C

2$ 1"U2$ /"2 01)/G*!) V "2 !")1"#$ /" -$V",
varlos experlmenLos slmulLneos.
robabllldad condlclonada:
(8 A)= (A 8)
(A)

Sl despe[amos (A 8) ! 0B$ -CL 0B$CW 0 B$ -C
/- 0(%1-12324-4 4$ 5"$ %#"((- 6 7 8 $! 2'"-3 - 3- 0(%1-12324-4 4$ 3- %#"(($)#2- 4$
6 0%( 3- 0(%1-12324-4 4$ 3- %#"(($)#2- 4$ 89 4-4% 5"$ 6 :- %#"((24% 0($,2-;$)+$
B/? E0!9",*(*'-'1(1 1# 8%# ,$%""( E 1(1, 8%# F( ,$%""'1, ?

,7 $ T - 79K5459K759:5?! 0B$ -CL 0B$CW 0 B-C
Se represenLa grflcamenLe con el K7<X6<8< K5= J6F;=D (1( .,1, -, 8%# 9%#1#+ $,7*'&("0
donde los n corresponden a las probabllldades condlclonadas al suceso que
aparece anLes. Se debe cumpllr slempre que las sumas de las probabllldades que
salgan de un mlsmo punLo deben sumar 1.
ara calcular las poslbllldades de lnLerseccln de dos sucesos hay que lr
mulLlpllcando las probabllldades de cada rama", hasLa que se llegue al exLremo del
rbol.

3

!5;658< K5 -<T5?>
A parLlr de que ha ocurrldo el suceso 8 (ha ocurrldo un accldenLe) deduclmos las probabllldades del suceso A
(esLaba llovlendo o hacla buen Llempo?)
0 B$ -CL 0B$CW 0B- $C
0B-C
Su lmporLancla radlca en los Lraba[os que ha generado y en la corrlenLe
denomlnada bayeslana.

B(".# 1# %&( +'.%($'>& #& -( 8%# #+ 9,+'*-# $,&,$#" -(+ 9",*(*'-'1(1#+ 1# 8%# ,$%""(& %&( +#"'# 1# +%$#+,+A ? #+.( +# (<(1# %& +%$#+, E $%;( ,$%""#&$'( 9",9,"$',&(
$'#".( '&:,"7($'>&5 9,"8%# -(+ 9",*(*'-'1(1#+ 1# ,$%""#&$'( 1# E +,& 1'+.'&.(+ +#G6& #- +%$#+, ? 8%# F(;( ,$%""'1,A H,&,$'#&1, 8%# F( ,$%""'1, #- +%$#+, E5 -(
:>"7%-( 1#- .#,"#7( 1# E(;#+ &,+ '&1'$( $,7, 7,1':'$( #+.( '&:,"7($'>& -(+ 9",*(*'-'1(1#+ 1# -,+ +%$#+,+ ?A

1
!"#$ & '()!*(+,-(./") '()-*"!$) '" 0*.+$+(1('$'
Ln experlmenLos en los que no se pueden predeclr los resulLados.

23453678 37839:453
luncln que aslgna un numero real (y solo uno) a cada uno de los resulLados de un experlmenLo aleaLorlo.
Se puede deflnlr de la manera que conslderemos oporLuna. una vez deflnlda la varlable y obLenldo el
resulLado, la funcln aslgna un valor numerlco lnequlvoco a esLe resulLado. Ll resulLado es aleaLorlo no la
varlable o funcln.
Se represenLa por leLras mayusculas: x, ?,
? leLras mlnusculas para referlrnos a los valores concreLos que Loman esas varlables: x
2
, y
1
,
'5;<4893;! cuando solo puede Lomar un con[unLo lnflnlLo y numerable de valores (!"# %& %'()*'+,-) o
flnlLo de valores (!"# %& ., /'*'- '+ +'%0'* )%' 12%,.')
-:=95=>3;!cuando puede Lomar lnflnlLos y no numerable.

23453678; 37839:453; ?5;<4893;
@A B>=<5C= ?8 D4:636575?3? f(x)
x! vlene dada por los valores que puede Lomar la varlable aleaLorla
Asocla a cada valor de la varlable la probabllldad de que esLa adopLe ese valor.
f(x) = P (X = x)
8epresenLacln grflca!dlagrama de barras.
ropledades fundamenLales:
1. Cualquler valor de x, slempre Loma valores poslLlvos o nulos.
2. La suma de Lodas las probabllldades es lgual a 1.

EA B>=<5C= ?8 ?5;9456><5C= F(x)
lndlca cual es la probabllldad de que la varlable aleaLorla Lome un valor menor o lgual que un
valor concreLo x.
Asocla a cada valor de la varlable la probabllldad de que esLa adopLe ese valor u oLro lnferlor.
F(x) = P (X ! x)

Sl ordenamos de menor a mayor los valores x de la varlable aleaLorla dlscreLa, se obLlene
acumulando (sumando) los valores de la funcln de probabllldad:

F(x) = P (X ! x) = f(x1)+f(x2)+...+f(x)
8epresenLacln grflca!va dando salLos.
1. 1odos los valores son poslLlvos o nulos.

2. F (x) es nula (vale 0) para Lodo valor lnferlor al menor valor de la varlanza aleaLorla.
F(x) = 0 si x < x
1
(represenLa al menor valor)

3. F (x) es = 1 para Lodo valor lgual o superlor al mayor valor de la varlable aleaLorla.
F(x) = 1 si x > x
k
(represenLa al mayor valor)

4. La funcln l(x) es no decreclenLe ya que es una acumulacln o suma de probabllldades
que son slempre poslLlvas o nulas.

2
3. La probabllldad, , de que la varlable aleaLorla x, Lome valores x comprendldos enLre x
1

y x
2
(x
1
< x < x
2
) es la dlferencla enLre los valores de la funcln de dlsLrlbucln
correspondlenLes a su valor superlor menos su valor lnferlor.
P (x
1
< x < x
2
) = F(x
2
) F(x
1
)

#8?53 F G3453=H3 ?8 73 G3453678 37839:453
#8?53 IJA!E(X)K ";D843=H3 L398LM95<3 : 237:4 8;D843?:sumaLorlo de cada uno de los valores
que Loma la varlable por su funcln de probabllldad:
= " x . f(x)
romedlo Lerlco que Lomarla la varlable aleaLorla sl se replLlese el experlmenLo aleaLorlo
lnflnlLas veces.

23453=H3 N
E
! V(X): SumaLorlo del producLo de cada uno de los valores que Loma la varlable
menos su medla elevada al cuadrado por su correspondlenLe valor de la funcln de probabllldad.

#
2
= " (x )
2
. f(x)

2

#
2
= E(X
2
) - [E(X)]
2
unde:
L(x
2
) = z x
2
.f(x)
[L(x)]
2=
la medla elevada al cuadrado.

'8;G53<5C= 9OD5<3 NP ralz cuadrada de la varlanza.

# =$ #
2

'()!*(+,-(./") '()-*"!$) '" 0*.+$+(1('$'
'5;9456><5C= +5=:L537 B(n, p)!varlables aleaLorlas dlscreLas que Loman solo dos valores
(dlcoLmlcas) represenLados por 0 y 1.
LxperlmenLos 8ernoullll o blnomlal (exlLo - fracaso) se replLe n" veces y de forma lndependlenLe.
una varlable aleaLorla x slgue una dlsLrlbucln blnomlal (con parmeLros n y p) sl expresa el numero
de reallzaclones lndependlenLes n" con la probabllldad p" y por LanLo (1 - p) de obLener fracaso. Se
represenLa por 8(n, p), dnde + lndlca 65=:L537, = el =QL84: ?8 8=;3F:; y D la D4:636575?3? ?8
RS59:.
3!"#4 !",15+24 67 (7*'12- (*,- 8,/,- +' 12%,.' '+ '7*, 9 .,:7%712- ; /212 ,+ %<1,*2 ., /'*'-= ,-('
8'*7'>+, -,?)7*@ +2- 5'*@1,(*2- % A B 9 5 A C=D# E2 17-12 F), G3BH C=DII

CaracLerlsLlcas lundamenLales:
n
1. J)%/7K% ., 5*2>'>7+7.'.: F(x) = P (X=x)= p
x
q
n-x

x

3
n
2. J)%/7K% ., .7-(*7>)/7K%4 F(x) = P (X! x)= p
x
q
n-x

x

3. L,.7'4 = np

4. M'*7'%0' : # = npq

DK%., N ,- ,+ %<1,*2 ., '/7,*(2-= % ,+ %<1,*2 ., ,%-'92-= 5 +' 5*2>'>7+7.'. ., ON7(2 ., /'.'
,%-'92= F +' 5*2>'>7+7.'. ., :*'/'-2 3PQ5I 9 ,+ %<1,*2 /21>7%'(2*72 n F), -, +,, R%
-2>*, NS ,- 7?)'+ ' : x
%T
NT 3%QNIT

6, )(7+70'% +'- ('>+'- UU 9 UUU 3,% ,-(' -, 5*,-,%('% +'- 5*2>'>7+7.'.,- '/)1)+'.'-I -7 (,%,12- )%' 5 V
C=D= W'9 F), 7%(,*/'1>7'* +'- /2%.7/72%,- ., ON7(2 9 :*'/'-2#

!"#$% '(%"#()*+(,-.% '(%+#."$%
!N7-(,% 2(*2- 12.,+2- ., .7-(*7>)/72%,- .7-/*,('-# !+ 12.,+2 X27--2% ., +2- R-)/,-2- *'*2-S= F), -, )(7+70'% ,%
/2%.7/72%,- -717+'*,- ' +'- >7%217'+,- 5,*2 /2% )% ,+,8'.2 %<1,*2 ., ,%-'92- 9 )% 8'+2* 5 1)9 5,F),Y2#
1
!"#$ & '()!*(+,-(./") -./!(/,$) '" 0*.+$+(1('$'
Modelos en los que se a[usLan las varlables con las que Lraba[amos!modelo normal
Modelos con lmpllcacln como lnsLrumenLos esLadlsLlcos!Chl-cuadrado de erson
L de SudenL
l de Snedecor

12 34567489:4;< <=7>2?
varlable aleaLorla que Loma lnflnlLos valores!varlable aleaLorla conLlnua y ya no se puede hablar de que la
varlable Lome un valor en concreLo, slno que esLe denLro de un deLermlnado lnLervalo.
CaracLerlsLlcas y propledades
La slgulenLe frmula recoge la funcln:

ara - ~ < x < ~

unde y o (medla y desvlacln Llplca) son sus parmeLros, n = 3,1416 y e = 2,718 y (base de los
logarlLmos neperlano).

Sl una varlable x Llene una dlsLrlbucln que se a[usLa a la frmula anLerlor, es una dlsLrlbucln normal y se
expresa x!N ( y !) lndlcando que Llene una dlsLrlbucln normal n con parmeLros y o.
lorma una campana que es ms apunLada cuanLo menor es su desvlacln Llplca.

Sl una varlable X le apllcamos una Lransformacln llneal Y = bX+a, la nueva varlable Y se dlsLrlbulr
normalmenLe pero con medla bx+ a y la desvlacln Llplca |b|! . Sl resLamos la medla y dlvldlmos por la
desvlacln Llplca obLenemos una nueva varlable z". or LanLo:
z!N (0,1)
? su funcln de probabllldad:

ara - ~ < x < ~ '4567489:4;< <=7>2? 64@4A4:232 B!28?25 ((( C (DE

a. SlmeLrlca enLorno a su medla, , que colnclde con su medlana y su moda.
b. La curva normal Llene dos punLos de lnflexln, dos punLos donde la curva pasa de ser cncava a
convexa, slLuados a una desvlacln Llplca de la medla.
c. Ls aslnLLlca en el e[e de absclsas, se exLlende desde - ~ hasLa + ~ sln Locar nunca el e[e.

Casos de uLlllzacln de las Lablas
1. Ln el supuesLo que la Labla no reco[a el valor, podemos uLlllzar el ms prxlmo.
2. Clculo de la probabllldad para valores menores o lguales que una deLermlnada punLuacln Llplca: se
mlra dlrecLamenLe en la Labla.
3. Clculo de la probabllldad para valores mayores que una deLermlnada punLuacln: se mlra en la Labla
la probabllldad que esa punLuacln de[a por deba[o y se resLa a 1.
2
4. Clculo de la probabllldad enLre dos punLuaclones deLermlnadas: se resLan las probabllldades que
de[an por deba[o de sl las dos punLuaclones Llplcas.

F()!.G*$#$ H '()!*(+,-(./ /.*#$1
Sl dlsponemos de los daLos orlglnales de una varlable x, y su dlsLrlbucln es normal, uLlllzaremos las Lablas lll y
lv, pero anLerlormenLe Lransformaremos las punLuaclones dlrecLas en punLuaclones Llplcas:

z
i
= X
i
- X
S
x
"#$%&' " () &$*+#),#-% ./0#,)

$0*.I(#$-(./ '" 1$ +(/.#($1 $ 1$ /.*#$1
Cuando las dlsLrlbuclones blnomlales superan sus valores de 20 (n"< 20) se puede aproxlmar la blnomlal a la
normal. 1enlendo una varlable x, con dlsLrlbucln blnomlal, su medla es = np y su desvlacln Llplca =
npq
odemos reallzar:
P(X = x) = P (x0,5) " x- " (x+0,5)
! ! !

P(X = x) = P (x0,5) np " z " (x+0,5) np
# npq # npq

A medlda que aumenLa n (lnLenLos) me[ora la aproxlmacln.
Sumar y resLar el valor 0,3 se llama :=77J::4;< @=7 :=<64<94323, permlLlendo uLlllzar las punLuaclones
dlscreLas como conLlnuas. Se lnLerpreLa cada punLuacln x como sl fuera el punLo medlo de un lnLervalo, se
lnLenLa asegurar que el lnLervalo lncluya los valores dlscreLos de la blnomlal.

'()!*(+,-(./ -F(K-,$'*$'. '" 0"*)./
Ln la dlsLrlbucln de Chl cuadrado de earson una varlable x con dlsLrlbucln x
2
1,
x
2
2
...x
2
n
pasa a ser X = X
2
n

Su medla y varlanza valdrn = n y
!
2
= 2n
LsLa dlsLrlbucln se usa para conLrasLar sl la dlsLrlbucln de una varlable se a[usLa a una dlsLrlbucln
deLermlnada.

ropledades
1. nunca adopLa valores menores de 0.
2. Ls aslmeLrlca poslLlva pero a medlda que aumenLan sus grados de llberLad se va aproxlmando a la
dlsLrlbucln normal.
3. ara n > 30 la podemos aproxlmar a una dlsLrlbucln n(n, 2n).

Ln la 628?2 D se hallan algunos valores de las dlsLrlbuclones x
2
.

3
L[.: Ln una varlable con 3 grados de llberLad, x!x
2
3
, el valor 11,07 de[a por deba[o de sl una proporcln de
0,93, represenLndose de la slgulenLe manera:
0,93
x
2
3
= 11,07
Ahora sl qulsleramos calcular (x > 11,07):
(x > 11,07) = 1 - (x < 11,07) = 1 - 0,93= 0,03

'()!*(+,-(./ L6M '" )!,'"/!
Slendo x e ? dos varlables aleaLorlas lndependlenLes, donde x slgue una dlsLrlbucln n (0,1) e ? slgue una
dlsLrlbucln x
2
n
. La varlable aleaLorla 1= x , slgue una dlsLrlbucln L" con n" grados de llberLad y se
v ?/n
Lxpresa por T!t
n
Su medla slempre vale 0 (=0)
Su varlanza !
2
= n
n-2
!"#$%&'% %&')% *&+ ,+)$+-.% /01234 5 .+ )+67 #*+8)+8+ 8% *&+ ,+)$+-.% 9
:
&
8$,$8$8+ ;") <*< =)+8"< 8% .$-%)'+8

CaracLerlsLlcas:
1. Ls slmeLrlca, con = 0. Su forma es muy pareclda a la n(0,1), aunque menos apunLada.
2. uede Lomar cualquler valor (-~ +~).
3. A medlda que aumenLan los grados de llberLad, la dlsLrlbucln se aproxlma ms a una dlsLrlbucln normal.
4. La curva es aslnLLlca al e[e de absclsas.

Se emplea en esLadlsLlca lnferenclal en conLrasLes. Ln la 628?2 D( se muesLran los valores de esLa dlsLrlbucln.

'()!*(+,-(./ LNM '" )/"'"-.*
Sl x
1
y x
2
son varlables aleaLorlas lndependlenLes, con dlsLrlbucln chl-cuadrdado con n
1
y n
2
grados de
llberLad respecLlvamenLe, enLonces una nueva varlable l= x
1
/n
1

x
2
/n
2

Slgue una dlsLrlbucln l con n
1
y n
2
grados de llberLad!(ln
1
, n
2
).
Slendo n
1
los grados de llberLad del numerados y n
2
los grados de llberLad del denomlnador.
Medla: ! n
2
para n
2
> 2
n
2
- 2

varlanza: o
2
! 2n
2
2
(n
1
+ n
2
-2) para n
2
>4
n
1
(n
2
- 4) (n
2
- 2)
2

Se emplea para el conLrasLe de hlpLesls.
CaracLerlsLlcas:
1. AslmeLrlca poslLlva, nunca Loma valores menores que 0.
2. ropledad reclproca: Sl x es una varlable con dlsLrlbucln l con n
1
y n
2
grados de llberLad, enLonces la
varlable ? = 1/x es Lamblen una varlable con dlsLrlbucln l con n1 y n2 grados de llberLad:
1-p
l
n1, n2
= 1 donde p es la probabllldad asoclada al valor de la varlable,
p
l
n2, n1
!28?2 D(( slo aparece la probabllldad de que x = 0,900, 0,930, 0,973 y 0,990.

1
!"#$ & "'!(#$)(*+
),-./01,2 03/45,2

6,789.5:- se reflere al con[unLo LoLal de elemenLos que se quleren esLudlar una o ms caracLerlsLlcas. uebe
esLar blen deflnlda. Llamaremos + al numero LoLal de elemenLos de una poblacln. 1amblen se suelen uLlllzar
los Lermlnos 5-;545;<,2= 2<>/1,2 ? .92,2 para referlrnos a los elemenLos de la poblacln.
Cuando se dlspone de un censo (llsLado) de la poblacln, se puede esLudlar a Lodos ellos.
no slempre es facLlble esLudlar a la LoLalldad de una poblacln, por lo que se esLudla un subcon[unLo de los
elemenLos LoLales, es declr, una @</2139. Llamaremos - al numero de los elemenLos de una muesLra.

Ll @</213/, es un proceso de seleccln con el fln de obLener una muesLra lo ms seme[anLe poslble a la
poblacln y asl obLener esLlmaclones preclsas. Ll Lamano es una caracLerlsLlca esenclal, ya que debe ser lo
suflclenLemenLe amplla para represenLar adecuadamenLe las propledades de la poblacln y reduclda para que
pueda ser examlnada en la prcLlca.
63,797585215.,: se conoce la probabllldad asoclada a una muesLra y cada elemenLo de la poblacln
Llene una probabllldad conoclda de perLenecer a la muesLra

una forma de obLener una muesLra de una poblacln homogenea es uLlllzar:
1) Ll @</213/, 98/91,35, 25@08/, por el cual se garanLlza que cada elemenLo de la poblacln
Lenga la mlsma probabllldad de formar parLe de la muesLra. rlmero se aslgna un numero a
cada elemenLo y despues medlanLe algun medlo (sorLeo, papeleLas,...) se ellgen LanLos
elemenLos como sea necesarlo para la muesLra.

2) Cuando los elemenLos esLn ordenados o pueden ordenarse se uLlllza el @</213/,
2521/@A15.,. Se selecclona al azar enLre los que ocupan los lugares n
n
L[emplo: n = 100, n = 3, 100/3= 20, escogerlamos los elemenLos slLuados en las poslclones
20. Ll rlesgo de esLe muesLreo es la falLa de represenLacln, que se pudlese dar, del LoLal
de los elemenLos.

3) Cuando Lopamos con una poblacln heLerogenea, uLlllzamos el @</213/, /213915B5.9;,.
Se emplea cuando dlsponemos de lnformacln suflclenLe sobre alguna caracLerlsLlca y
podemos eleglr una muesLra en funcln del numero de elemenLos segun esLas
caracLerlsLlcas o esLraLos.

4) AnLe poblaclones desordenadas y conglomeradas en grupos, se emplea el @</213/, 0,3
.,-C8,@/39;,2, donde se van selecclonando de Lodos los grupos, subgrupos, clases. y
flnalmenLe de los elemenLos resLanLes la muesLra.

3) ue la unln del /213915B5.9;, ? del .,-C8,@/39;,, surge oLro @</213/, /8 0,85/1A05.,.

+, 03,79758D215.,: se desconoce, o no se Llene en cuenLa, la probabllldad asoclada a cada muesLra
y se selecclona la que ms le parezca represenLaLlva al lnvesLlgador.
2
1) Ll muesLreo 0,3 .<,192 E9..5;/-198F se basa en un buen conoclmlenLo de los esLraLos o
lndlvlduos ms represenLaLlvos para la lnvesLlgacln. Slmllar al esLraLlflcado pero
carenLe del carcLer aleaLorlo.

2) Ll muesLreo ,05-A15., E5-1/-.5,-98F muesLra el lnLeres por lnclulr en la muesLra a grupos
supuesLamenLe Llplcos.

3) Ll .9<298 E5-.5;/-198F seleccln de los lndlvlduos de fcll acceso.

4) G,89 ;/ -5/4/, donde un elemenLo selecclonado lleva a oLro y esLe a oLro y asl
suceslvamenLe hasLa compleLar la muesLra.

una muesLra es represenLaLlva sl exhlbe lnLernamenLe el mlsmo grado de dlversldad que la poblacln y es
aleaLorla sl los elemenLos han sldo exLraldos al azar de la poblacln.

(+H"I"+)($ "'!$JK'!()$
Ll valor esLadlsLlco obLenldo de una muesLra (como medla) no ser lgual al valor del parmeLro de poblacln.
ara lnferlr un parmeLro a parLlr de un esLadlsLlco hay que apllcar herramlenLas esLadlsLlcas de Llpo
lnferenclal como la esLlmacln por lnLervalo (lnLervalos de conflanza) o conLrasLe de hlpLesls.

"'!(#$)(L+ J" M$ #"J($
La medla muesLral es una varlable aleaLorla que Loma un valor u oLro segun la muesLra (Lendremos LanLas
medlas como poslbles muesLras del mlsmo Lamano podamos exLraer de la poblacln. Su funcln de
probabllldad es la ;521357<.5:- @</21398 ;/ 89 @/;59N
La ;521357<.5:- @</21398 ;/ <- /219;D215., es un concepLo cenLral, LanLo de la esLlmacln como del
conLrasLe de hlpLesls.

J521357<.5:- @</21398 ;/ 89 @/;59
una funcln de probabllldad queda caracLerlzada por su forma, su medla y su varlanza. La medla de la
dlsLrlbucln muesLral de la @/;59 (
x
) es lgual a la medla de la poblacln (). La 49359-O9 de la
dlsLrlbucln muesLral de la medla es !
2
y la ;/2459.5:- 1D05.9 de la dlsLrlbucln muesLral de la medla es:
n

La forma de la dlsLrlbucln orlglnal de la medla se parece a una dlsLrlbucln normal aunque la dlsLrlbucln
orlglnal de la varlable en la poblacln no es normal.

uado el muesLreo aleaLorlo slmple:
- Sl la dlsLrlbucln de x en la poblacln es normal con medla y desvlacln Llplca o, enLonces la
dlsLrlbucln muesLral de la x es normal
, o
vn
3

- Sl la dlsLrlbucln de x en la poblacln no es normal con medla y desvlacln Llplca o, enLonces la
dlsLrlbucln muesLral de la x Llende a la normal a medlda que n crece (1eorema CenLral del LlmlLe),
slendo la aproxlmacln buena para n > 30.
La desvlacln Llplca de la poblacln es una medlda de la varlabllldad de la varlable x en la poblacln
La desvlacln Llplca de la muesLra (cuasldesvlacln Llplca) es una medlda de la varlabllldad de la varlable x
en la muesLra.
La desvlacln Llplca de la dlsLrlbucln muesLral de la medla (error Llplco de la medla) represenLa el grado
de varlabllldad enLre los valores de las medlas muesLrales.
A mayor error Llplco, menor preclsln en la esLlmacln.

M9 @/;59 .,@, /215@9;,3
un esLlmador es un esLadlsLlco que se uLlllza para esLlmar un parmeLro.
or lo que la medla de la muesLra es un esLlmador de la medla poblaclonal, y el valor del esLlmador en
una muesLra se denomlna esLlmacln o esLlmacln punLual.
La medla muesLral x es un esLlmador lnsesgado de la medla poblaclonal (). Ll error Llplco de la medla es
un lndlcador de la preclsln de la esLlmacln de la medla, CuanLo menor es la desvlacln Llplca de la
poblacln, menor ser el error Llplco, cuanLo mayor es n", menor ser el error Llplco, cuanLo menor es el
error Llplco, mayor es la preclsln. uependlendo de la desvlacln Llplca de la poblacln y del Lamano de la
muesLra.

"'!(#$)(L+ J" M$ 6IL6LI)(L+
La obLencln de la dlsLrlbucln muesLral de la proporcln es slmllar a la de la medla.
J521357<.5:- @</21398 ;/ 89 03,0,3.5:-
Sea x una varlable que slo Loma valores 0 y 1, la proporcln de la muesLra se deflne como:
= z x
n
uado el muesLreo aleaLorlo slmple, el esLadlsLlco proporcln () se dlsLrlbuye segun una blnomlal
con: n(1-n)

= n y o
2
= n

Como es la medla de los valores de x en la muesLra, segun el !/,3/@9)/-1398 ;/8 MD@51/, a medlda
que el Lamano crece, la dlsLrlbucln muesLral de la proporcln Llende a la normal con medla n y
varlanza n(1-n)
n
CuanLo ms ale[ado esLe n de 0,3, ms elemenLos debe Lener la muesLra para reallzar la
aproxlmacln a la normal.

- La medla de la dlsLrlbucln muesLral de la proporcln (
) es lgual a la proporcln de la poblacln

(n)
- La varlanza de la dlsLrlbucln muesLral de la proporcln es : n(1-n)
o
2
= n
- La desvlacln Llplca de la dlsLrlbucln muesLral de la proporcln (error Llplco de la proporcln) es:
n(1-n)
o
= v n
4
M9 03,0,3.5:- .,@, /215@9;,3
La proporcln muesLral (p) es un esLlmador lnsesgado de la proporcln poblaclonal (n).
Ll error Llplco de la proporcln, es un lndlcador de la preclsln de la esLlmacln de la proporcln. CuanLo
menor es el error Llplco, mayor es la preclsln.

(+!"IP$ML' J" )L+H($+Q$
La flnalldad de un lnLervalo de conflanza es esLlmar un parmeLro desconocldo de una poblacln a parLlr de
una muesLra. Al esLlmar la medla de la poblacln a parLlr de una muesLra, podemos comeLer un error de
esLlmacln |x- |.
La esLlmacln por lnLervalo conslsLe en acoLar el error con una alLa probabllldad 1 " (nivel de confianza) de
forma que |x- | no sea superlor a un esLlmado mxlmo (E
mx
).
Ll error de esLlmacln mxlmo (E
mx
) es funcln de la varlabllldad de la varlable en la poblacln, del nlvel de
conflanza (n.c.) y del Lamano de la muesLra:

L
mx
= z
1 - o/2
o
v n
dnde:
- z
1-o/2
es funcln del n.c. = 1 - o y se obLlene en la Labla de la dlsLrlbucln normal Llplflcada (Labla lv).

- o
v n Ls la desvlacln Llplca de la dlsLrlbucln muesLral de la medla, es declr, el error Llplco de la medla.

- o es la desvlacln Llplca de la poblacln que es conoclda

- n es el Lamano de la muesLra.

A parLlr de esLa ecuacln deduclmos LanLo el Lamano de la muesLra como los llmlLes del lnLervalo de
conflanza. Ll Lamano de la muesLra se obLlene despe[ando n de la ecuacln.

n = z
2

1 - o/2
o
2

L
mx
2

vemos que n depende de:
- La desvlacln Llplca de la poblacln.
- Ll nlvel de conflanza.
- Ll error de esLlmacln mxlmo.

Los 8D@51/2 5-B/35,3 EM5F ? 2<0/35,3 EM2F se obLlenen a parLlr del L
mx
:

L
l
= x - L
mx
// L
l
= x - z
1 - o/2
o
vn

L
s
= x + L
mx
// L
s
= x+ z
1 - o/2
o
vn
5
Ll n.c. o probabllldad R S T slgnlflca que sl exLra[esemos Lodas las muesLras poslbles de una poblacln,
calculsemos la medla en cada una de ellas y el lnLervalo de conflanza, una proporcln R S T de Lodos los
lnLervalos de conflanza conLendr la medla poblaclonal y una proporcln T no lo conLendr.

!9@9U, ;/ 89 @</2139
lnLeresa que un lnLervalo sea lo ms esLrecho poslble y con alLa probabllldad. A mayor nlvel de conflanza
mayor es el error de esLlmacln mxlmo, por lo que ms ampllo ser el lnLervalo y menos preclsa ser la
esLlmacln. una forma de manLener y reduclr el error de esLlmacln mxlmo dado y aumenLar el n.c., es
aumenLando n.
CLro facLor que lnLervlene es la varlabllldad de la varlable, cuanLo mayor sea la desvlacln Llplca de la
poblacln, mayor debe ser n para alcanzar una mlsma preclsln.
ara calcular el Lamano de la muesLra desconoclendo o, hay que susLlLulr en la ecuacln, la desvlacln Llplca
por la cuasldesvlacln Llplca (S
n-1
) y z
1-o/2
por L
n-1, 1-o/2
(19789 P().

Apllcaclones
Los pasos para apllcar un lnLervalo de conflanza son los slgulenLes:
- LsLablecer un error de esLlmacln mxlmo para un nlvel de conflanza 1 - o.
- CbLener el Lamano de la muesLra n para el error de esLlmacln mxlmo especlflcado.
- LxLraer una muesLra aleaLorla de Lamano n y medlr la varlable.
- Calcular el esLadlsLlco (es esLlmador del parmeLro) con las medldas obLenldas.
- Calcular los llmlLes del lnLervalo de conflanza.

(-1/3498, ;/ .,-B59-O9 0939 89 03,0,3.5:-
Ll error de esLlmacln mxlmo de la proporcln es:

dnde:
- z
1-o/2
es funcln del nlvel de conflanza 1 - o (19789 (P).

- n(1-n) es el error Llplco de la proporcln: o
p
.
n

- n es la proporcln de la poblacln que no es conoclda.

- n es el Lamano de la muesLra y se debe cumpllr nn(1-n) >3 para la aproxlmacln a la normal.

Los llmlLes lnferlor y superlor del lnLervalo de conflanza se obLlenen a parLlr del error de esLlmacln mxlmo.
Como desconocemos n, que es lo que preclsamenLe queremos esLlmar, operamos con la proporcln muesLral
. Asl, sl en L
mx
susLlLulmos n por la proporcln muesLral , los llmlLes lnferlor y superlor del lnLervalo de
conflanza son:

L
l
= - z
1 - o/2
(1-) = - L
mx
n
6
L
s
= - z
1 - o/2
(1-) = + L
mx

n

? la probabllldad de obLener un lnLervalo de conflanza que conLenga al parmeLro n es:

- z
1 - o/2
(1-) < n < + z
1 - o/2
(1-) = 1 - o
n n

Temario Completo Analisis de Datos

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Temario Completo Analisis de Datos

Caricato da

Copyright:

Formati disponibili

1

TEMA 1 - CONCEPTOS BSICOS Y ORGANIZACIN DE DATOS

) es lgual a la proporcln de la poblacln

Potrebbero piacerti anche