Probabilidad y Estadística Unidad 3

Instituto Tecnolgico Superior de Valladolid
Yucatn
Estadstica descriptiva y la teora del

muestreo.
Docente.
ARQ. CINDY VIANELY CETINA AGUILAR
Integrantes.
+ ARCEO DZIB WILLIAM
+ ARZPALO ALCOCER ALEJANDRO
+ COCOM HOIL JAIRO ANTONIO
+ DZUL CANCH CARLOS JAVIER
+ SILVA MENDOZA RENE ALEXIS
+ XIU CASTILLO GILBERTO
Introduccin
En la siguiente investigacin presentaremos el estudio de la probabilidad y la estadstica,
particularmente la estadstica descriptiva al igual que en las diferentes teoras de
muestreo. La estadstica descriptiva es una ciencia que se encarga de analizar una serie
de datos, para analizar estos datos se necesita realizar una serie determinada de
procesos los cuales te indicaran las propiedades de tu coleccin de datos tales como los
diferentes tipos de frecuencia que te indicaran la frecuencia dependiendo si se trat de
datos exactos o agrupados, de igual manera se conceptualizaron los diferentes tipos de
medida de tendencia central: media, mediana, moda, promedio, media armnica y
geomtrica al igual que los datos cuartiles. De igual manera se indago en las medidas de
dispersin las cuales no son de gran utilidad en la estadstica descriptiva como el rango o
amplitud la amplitud de variacin, desviacin media y estndar al igual que la varianza y la
krtosis. Tambin se investig sobre las diferentes teoras de muestro conceptualizadas
como lo son el muestreo simple, el sistematizado, el estratificado y el muestro realizado
por conglomerados, esperando que toda esta informacin sea de utilidad.
A menudo en una investigacin se recogen grandes cantidades de datos numricos.
Cuando esto ocurre es difcil visualizar un orden o estructura que ayude a analizarlos.
Para lograrlo es necesario condensar los datos en grupos de acuerdo a ciertas divisiones
de la recta numrica (intervalos o clases). Aunque con esta agrupacin la informacin
inicial sobre cada dato individual se pierde, es ms fcil visualizar rpidamente las
caractersticas principales del grupo total de datos.
Distribucin de Frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en
categoras mutuamente excluyentes que indican el nmero de observaciones en cada
categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero
existente en cada clase.
Tipos de Frecuencia:
Frecuencia relativa (hi):

Es aquella que resulta de dividir cada una de las frecuencias absolutas entre el nmero
total de datos. Las frecuencias relativas se designan con las letras hi.fi Se calcula, hi =n
PROPIEDAD: la suma de todas las frecuencias relativas es igual a la unidad.
Frecuencia acumulada (fi):

Las frecuencias acumuladas de una distribucin de frecuencias son aquellas que se
obtienen de las sumas sucesivas de las fi que integran cada una de las filas de una
distribucin de frecuencia, esto se logra cuando la acumulacin de las frecuencias se
realiza tomando en cuenta la primera fila hasta alcanzar la ltima. Las frecuencias
acumuladas se designan con las letras Fi. Se calcula:
i
Fi = f j = Fi1 + fi
j=1
PROPIEDAD: La ltima frecuencia acumulada absoluta es igual al total de observaciones.
Ejemplos:
a)
Distribucin de Frecuencias con Datos sin Agrupar

Colectivo: 20 familias.
N = 20
Variable X: ingresos anuales expresados en miles de euros.

Valores observados: 18, 20, 22, 19, 18, 20, 18, 19, 21, 20
20, 21, 18,
20, 21, 19, 20, 21, 18, 20

Tabla de distribucin de frecuencias:
Ingresos Absoluta
Frecuencias
Absoluta
Relativ
Acumulada
xi
ni
Ni
a
fi = ni /
Relativa
Acumulada
Fi = Ni / N
N
X1
X2
X3
X4
X5
18
19
20
21
22
5
3
7
4
1
20 = N
5
5+3= 8
5+3+7= 15
5+3+7+4= 19
5+3+7+4+1=20
0,25
0,15
0,35
0,20
0,05
1
Representacin grfica:
0,25
0,40
0,75
0,95
1
Diagrama de Barras
8
7
6
5
5
Frecuencias ni
4
3
4
3
1
0
b)
18
19
20
21
22
X (Ingresos anuales en miles de )
Distribucin de Frecuencias con Datos Agrupados en Intervalos

Colectivo: 60 cilindros fabricados por una mquina.
N = 60 Variable X: longitud en
centmetros Valores observados:

239, 254, 255, 248, 246, 249, 242, 250, 249, 244, 253, 248
250, 258, 252, 251, 250, 253, 247, 243, 245, 251, 247, 250
248, 250, 259, 249, 249, 250, 251, 253, 241, 251, 249, 252
250, 247, 251, 259, 250, 246, 252, 238, 251, 238, 236, 259
249, 257, 249, 247, 251, 246, 245, 243, 250, 249, 242, 238
Tabla de frecuencias con datos agrupados en intervalos:
intervalos
marcas
frecuencias
frecuencias
de clase
absolutas
relativas
fi
Fi
Li-1-Li
235-240
ci
237,5
ni
5
Ni
5
0,08
0,08
240-245
242,5
13
0,13
0,22
245-250
250-255
255-260
247,5
252,5
257,5
27
15
5
N=60
40
55
60
0,45
0,25
0,08
1
0,67
0,92
1
Representacin grfica de la distribucin de frecuencias:
HISTOGRAMA
15
20
30
10
Medidas De Tendencia Central

0
MEDIA
La media, llamada tambin media aritmtica, es la medida de tendencia central

conocida popularmente como promedio.
Frecuencias ni
Formulas:
Media de la Poblacin
Media de la muestra
xi
xi
= i=1
N
x =
237.5
242.5
247.5
252.5
n
257.5
Caractersticas:
+ No puede utilizarse en distribuciones cualitativas.
+ Esta afectada por todos los valores que asume la variable.
+ Si la distribucin presenta valores extremos bajos o altos, se recomida usar
otra medida de tendencia central.
Ejemplo:
Consideremos la edad de 5 personas miembros de un grupo infantil.
10 12 15 7 8
n
x =
i=1
X i 10+ 12+ 15+7+8 52

=
= =10.4
n
5
5
La edad promedio de los miembros de un grupo infantil es de 10.4 aos.
MEDIANA
Es el valor que divide a un conjunto de datos en dos partes iguales.
Clculo:
+ Ordenar los datos de menor a mayor o viceversa.
+ Si el n de datos es impar: la mediana es el valor central.
+ Si el n de datos es par: la mediana es media aritmtica de los 2 puntos
centrales.
Caractersticas:
+
+
+
+
Puede utilizarse en distribuciones cuantitativas o cualitativas.

Requiere ordenamiento de los datos.
Divide la distribucin en dos partes iguales.
No le afectan valores extremos.
Ejemplo:
Consideramos la altura de 7 personas cantantes de una iglesia
1.10 1.25 1.50 1.90 1.60 1.75 1.80
1. Ordenamos los datos.
1.10 1.25 1.50 1.60 1.75 1.801.90
2. El nmero de datos es impar. N=7
3. La mediana es entonces el valor central 1.60
La mediana es 1.60, es decir la mitad de los cantante de la iglesia tiene una altura
de 1.60 o menos y la otra mitad de 1.60 o ms.
MODA
Es el valor ms frecuente en la distribucin de datos. La moda puede no existir y

cuando existe puede no ser nica.
Caractersticas:
+ Puede utilizarse en distribuciones cuantitativas o cualitativas.
+ Si una distribucin presenta pocos valores y ninguno se repite, no existe
moda.
+ Las distribuciones con dos modas se llaman bimodal.
+ Si la distribucin tiene ms de dos modas se llama multimodal.
Ejemplo:
Hallar la moda de la distribucin:
2, 3, 3, 4, 4, 4, 5, 5
Moda= 4 por ser la de mayor frecuencia.
PROMEDIO PONDERADO
En muchas ocasiones, las observaciones recolectadas no tienen la misma

importancia relativa. Para hacer presente este hecho en la bsqueda de un 'centro'
que represente a los datos, es necesario asignar a cada uno de stos, una
ponderacin (peso o coeficiente) que represente su importancia dentro de la
muestra.
A modo de ejemplo, considrese un sistema de calificacin de un curso en que las
pruebas tienen distinto 'coeficiente', segn su importancia en el proceso de
evaluacin del trabajo del alumno. En este caso, no resulta apropiado el promedio
simple. Cada nota parcial debe ser multiplicada por su coeficiente, para luego
sumar estos resultados y dividirlos por la suma de los coeficientes respectivos.
Formula:
Ejemplo:
Si un alumno obtiene un 5.5 en una prueba de coeficiente 1 y un 4.9 en otra de
coeficiente 2. Cul es nota promedio de estas dos pruebas?
En este caso, los coeficientes son diferentes, por lo tanto no debe usarse el
promedio simple sino uno ponderado en que las ponderaciones son 1 y 2
respectivamente. En consecuencia, la suma del denominador est dada por 5.5*1 +
4.9*2 = 15.3. El denominador, que consiste en la suma de las ponderaciones, est
dado por 1 + 2 = 3 En consecuencia, el promedio ponderado es 15.3/3 = 5.1
MEDIA GEOMETRICA
La media geomtrica (MG), de un conjunto de nmeros positivos se define como la

n- del producto de los nmeros. Por tanto, la frmula para la media geomtrica es
dada por
Caractersticas:
+ Para promediar porcentajes, ndices y cifras relativas.
+ Para determinar el incremento porcentual promedio en ventas, produccin u
otras actividades o series econmicas de un periodo a otro.
Ejemplo:
Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6%, respectivamente. Cul es la media geomtrica
de las ganancias?
En este ejemplo x y as la media geomtrica es determinada por:
Y as la media geomtrica de las utilidades es el 3.46%.

La media aritmtica de los valores anteriores es 3.75%. Aunque el valor 6% no es
muy grande, hace que la media aritmtica se incline hacia valores elevados. La
media geomtrica no se ve tan afectada por valores extremos.
MEDIA ARMONICA
La media armnica se define como el recproco de la media aritmtica de los

recprocos:
Este valor se emplea para promediar variaciones con respecto al tiempo.

Ejemplo:
Supngase que una familia realiza un viaje en automvil a un ciudad y cubre los
primeros 100 km a 60 km/h, los siguientes 100 km a 70 km/h y los ltimos 100 km a
80 km/h. Calcular, en esas condiciones, la velocidad media realizada.
TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y
mtodos de muestreo no probabilsticos.
MUESTREO ALEATORIO SIMPLE

Para obtener una muestra, se numeran los elementos de la poblacin y se seleccionan al
azar los n elementos que contiene la muestra. Se elige un individuo al azar y a partir de
l, a intervalos constantes, se eligen los dems hasta completar la muestra.
Ejemplos:
1.-En un estudio, se desea determinar en qu proporcin los nios de una regin toman
incaparina en el desayuno. Si se sabe que existen 1,500 nios y deseamos tener una
precisin del 10 porciento, con un nivel de significancia del 5% . De qu tamao debe de
ser la muestra?
DATOS:
N = 1500; d = 10 % = 0.1; a = 5 %
p = 0.5 y q = 0.5 (asumiendo varianza mxima).
Za/2= 1.96
Za/2 pq
n=
1500 (1.96)(0.5)(0.5)
----------------- = -------------------------------
d + Za/2 pq 1500(0.1) + (1.96)(0.5)(0.5)
Se deben de muestrear 91 nios.
91
MUESTREO ALEATORIO SISTEMTICO:

Este procedimiento exige, como el anterior, numerar todos los elementos de la poblacin,
pero en lugar de extraer n nmeros aleatorios slo se extrae uno. Se parte de ese nmero
aleatorio i, que es un nmero elegido al azar, y los elementos que integran la muestra son
los que ocupa los lugares i, i+k, i+2k, i+3k,...,i+(n-1)k, es decir se toman los individuos de
k en k, siendo k el resultado de dividir el tamao de la poblacin entre el tamao de la
muestra: k= N/n. El nmero i que empleamos como punto de partida ser un nmero al
azar entre 1 y k.
Ejemplo:
Se acercan las Navidades y cierta empresa de turrones cree que no va a poder entregar
todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa dispone de un
listado ordenado alfabticamente de 20 personas con las mismas caractersticas para el
puesto y que actualmente estn en paro. Puesto que el tiempo apremia y no es posible
hacer una entrevista para seleccionar al personal, se decide elegir cinco trabajadores de
forma aleatoria usando el muestreo sistemtico.
Tenemos que elegir 5 elementos sistemticamente de un total de 20, por tanto se debe
elegir uno de cada k=20/5=4.
Se elige el punto de partida eligiendo un nmero al azar entre 1 y 4. Si obtenemos, por
ejemplo h=2, los elementos de la muestra sern 2, 2+4, 2+24, 2+34, es decir:
2, 6, 10, 14, 8.
MUESTREO ALEATORIO ESTRATIFICADO:

Trata de obviar las dificultades que presentan los anteriores ya que simplifican los
procesos y suelen reducir el error muestral para un tamao dado de la muestra. Consiste
en considerar categoras tpicas diferentes entre s (estratos) que poseen gran
homogeneidad respecto a alguna caracterstica (se puede estratificar, por ejemplo, segn
la profesin, el municipio de residencia, el sexo, el estado civil, etc.). Lo que se pretende
con este tipo de muestreo es asegurarse de que todos los estratos de inters estarn
representados adecuadamente en la muestra. Cada estrato funciona independientemente,
pudiendo aplicarse dentro de ellos el muestreo aleatorio simple o el estratificado para
elegir los elementos concretos que formarn parte de la muestra.
En ocasiones las dificultades que plantean son demasiado grandes, pues exige un
conocimiento detallado de la poblacin. (Tamao geogrfico, sexos, edades,...).
La distribucin de la muestra en funcin de los diferentes estratos se denomina afijacin, y
puede ser de diferentes tipos:
Afijacin Simple: A cada estrato le corresponde igual nmero de elementos mustrales.
Afijacin Proporcional: La distribucin se hace de acuerdo con el peso (tamao) de la
poblacin en cada estrato.
Afijacin ptima: Se tiene en cuenta la previsible dispersin de los resultados, de modo
que se considera la proporcin y la desviacin tpica. Tiene poca aplicacin ya que no se
suele conocer la desviacin.
Ejemplo:
La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es
1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria
que sigue una distribucin normal con varianza 2 = 0,16 m2.
Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la
poblacin.
n=400
x =1.75
1- =0.95
(1.75 1.96 0.4/20 )
=0.4
z /2=1.96
(1.7108,1.7892)
Cul sera el mnimo tamao muestral necesario para que pueda decirse que la
verdadera media de las estaturas est a menos de 2 cm de la media muestral, con un
nivel de confianza del 90%?
La muestra debe tener al menos 1083 personas.
MUESTREO ALEATORIO POR CONGLOMERADOS:

Los mtodos presentados hasta ahora estn pensados para seleccionar directamente los
elementos de la poblacin, es decir, que las unidades mustrales son los elementos de la
poblacin.
En el muestreo por conglomerados la unidad muestral es un grupo de elementos de la
poblacin que forman una unidad, a la que llamamos conglomerado. Las unidades
hospitalarias, los departamentos universitarios, una caja de determinado producto, etc.,
son conglomerados naturales. En otras ocasiones se pueden utilizar conglomerados no
naturales como, por ejemplo, las urnas electorales. Cuando los conglomerados son reas
geogrficas suele hablarse de "muestreo por reas". El muestreo por conglomerados
consiste en seleccionar aleatoriamente un cierto nmero de conglomerados (el necesario
para alcanzar el tamao muestral establecido) y en investigar despus todos los
elementos pertenecientes a los conglomerados elegidos.
Ejemplo:
Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se
eligieron 300 nueces al azar y se detectaron 21 vacas.
Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca?
1 Enunciamos las hiptesis nula y alternativa:
H0 : p 0.06
H1 : p >0.06
2Zona de aceptacin
= 0.01
z = 2.33.
Determinamos el intervalo de confianza:
3Verificacin.
MEDIDAS DE DISPERSIN.
El conocimiento de la forma de la distribucin y del respectivo promedio de una coleccin

de valores de una variable, puede servir para tener una idea bastante clara de la
conformacin, pero no de la homogeneidad de cada una de los valores con respecto a la
medida de tendencia central aplicada.
En el caso de las variables con valores que pueden definirse en trminos de
alguna escala de medida de igual intervalo, puede usarse un tipo de indicador que permite
apreciar el grado de dispersin o variabilidad existente en el grupo de variantes en
estudio.
A estos indicadores les llamamos medidas de dispersin, por cuanto que estn referidos a
la variabilidad que exhiben los valores de las observaciones, ya que si no hubiere
variabilidad o dispersin en los datos inters, entonces no habra necesidad de la gran
mayora de las medidas de la estadstica descriptiva.
Las medidas de tendencia central tienen como objetivo el sintetizar los datos en
un valor representativo, las medidas de dispersin nos dicen hasta qu punto estas
medidas de tendencia central son representativas como sntesis de la informacin. Las
medidas de dispersin cuantifican la separacin, la dispersin, la variabilidad de los
valores de la distribucin respecto al valor central. Distinguimos entre medidas de
dispersin absolutas, que no son comparables entre diferentes muestras y las relativas
que nos permitirn comparar varias muestras.
LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo
nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de
los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir
tambin su dispersin, extensin o variabilidad. La dispersin es importante porque:
Proporciona informacin adicional que permite juzgar la confiabilidad de la medida

de tendencia central. Si los datos se encuentran ampliamente dispersos, la posicin
central es menos representativa de los datos.
Ya que existen problemas caractersticos para datos ampliamente dispersos,

debemos ser capaces de distinguir que presentan esa dispersin antes de abordar esos
problemas.
Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea

tener una amplia dispersin de valores con respecto al centro de distribucin o esto
presenta riesgos inaceptables, necesitamos tener habilidad de reconocerlo y evitar
escoger distribuciones que tengan las dispersiones ms grandes.
Pero si hay dispersin en la mayora de los datos, y debemos estar en capacidad de
describirla. Ya que la dispersin ocurre frecuentemente y su grado de variabilidad es
importante, cmo medimos la variabilidad de una distribucin emprica?. Vamos a
considerar slo algunas medidas de dispersin absolutas: el rango, la varianza, la
desviacin estndar y el coeficiente de variacin.
EL RANGO O RECORRIDO ( R )
Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el

rango se define como la diferencia entre el valor ms alto (Xn Xmax.) y el mas bajo (X1
Xmin) en un conjunto de datos.
Rango para datos no agrupados;
R = Xmx.-Xmn = Xn-X1
Ejemplo:
Se tienen las edades de cinco estudiantes universitarios de leer ao, a saber: 18,23,
27,34 y 25.para calcular la media aritmtica promedio de las edades, se tiene que:
R = Xn-X1 ) = 34-18 = 16 aos
Con datos agrupados no se saben los valores mximos y mnimos. Si no hay intervalos de
clases abiertos podemos aproximar el rango mediante el uso de los lmites de clases. Se
aproxima el rango tomando el lmite superior de la ltima clase menos el lmite inferior de
la primera clase.
Rango para datos agrupados;
R= (lim. Sup. de la clase n lim. Inf. De la clase 1).
DESVIACIN MEDIA
En caso de tener los datos agrupados en una tabla de frecuencias, la frmula ser:
Dnde:
x i= es un valor cualquiera de la variable (valor ensimo).
U= es la media aritmtica de la variable
n i =es la frecuencia absoluta simple del valor ensimo
N =es el nmero total de individuos estudiados en la muestra.
Es la sumatoria (en valor absoluto) de todas las distancias entre cada valor de la variable
y su media aritmtica.
Varianza
Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el
nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el
tamao de la muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
La varianza es la medida de dispersin que mejor expresa la variabilidad del fenmeno
que estamos estudiando. Se define como la media aritmtica de las desviaciones al
cuadrado entre cada valor de la variable y la media aritmtica. Para que no se
contrarresten las diferencias, en lugar de utilizar los valores absolutos se eleva al
cuadrado el valor de cada una de ellas.
La frmula para su determinacin ser:
Si disponemos de las frecuencias de cada variable, la frmula a utilizar ser:
Al determinar la varianza en una muestra en la que se haya estimado la media, se debe

dividir por n-1 en lugar de n; esto se debe realizar para lograr que la varianza muestral
sea un estimador no sesgado de la varianza poblacional. La expresin matemtica para el
clculo de la varianza muestral ser:
Y en caso de que dispongamos de la frecuencia de cada valor de la

variable:
donde:
Varianza poblacional.
= varianza muestral.
xi= valor ensimo de la variable.
= media aritmtica poblacional.
= media aritmtica muestral.
= frecuencia absoluta simple del valor ensimo.
N = nmero total de individuos de la poblacin.
n. = nmero total de individuos estudiados en la muestra.
Para datos agrupados, la frmula ser:
DESVIACIN ESTNDAR
La desviacin estndar o desviacin tpica (denotada con el smbolo o s, dependiendo
de la procedencia del conjunto de datos) es una medida de dispersin para variables de
razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la
raz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los
datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto
de tener una visin de los mismos ms acorde con la realidad al momento de describirlos
e interpretarlos para la toma de decisiones.
Ahora veremos que la media y la varianza son casos particulares de cantidades ms
generales llamadas momentos.
Consideremos la funcin g(X) = Xk, k =1, 2, A la esperanza matemtica de Xk se le
denomina k-simo momento de X.
Si k = 1 se tiene que el primer momento de X es la media de X, es decir
E[X1] = (compare con la definicin de la seccin 4.4).

Si g(X) = (X-m )k,, obtenemos el k-simo momento central de X. Esto es:
Si el primer momento central existe, debe ser igual a cero.
El segundo momento central de X es la varianza .Por lo tanto la varianza de puede

obtener como el segundo momento de X menos el cuadrado de la media.
Obsrvese que de aqu se llega a
SESGO Y CURTOSIS DE UNA DISTRIBUCIN

Si una distribucin es simtrica con respecto a la media m y si el tercer momento central
E[(X - m )3] existe, entonces ste debe ser cero.
Cabe hacer notar que, si E[(X - m )3] = 0, no implica que la distribucin sea simtrica, pero
si es simtrica, entonces E[(X - m )3] = 0. Sin embargo es costumbre usar la
expresin
como la medida de la simetra, ya que cuando una
distribucin es simtrica, g = 0 y toma un valor positivo (o negativo) para una distribucin
que tiene una gran cola en el lado derecho (izquierdo) y g es llamado sesgo de la
distribucin.
Fig. 4. 10 Distribucin simtrica
Distribucin con sesgo positivo
Distribucin con sesgo negativo
=0
>0
<0
La cantidad
distribucin.
se usa como la medida de la altura o curtosis de una
Fig. 4. 11 Distribucin platocrtica
* < 30
Distribucin mesocrtica
*=3
Distribucin leptocrtica
*>3
MUESTREO NO ALEATORIO.
En este tipo de muestreo, puede haber clara influencia de la persona o personas que
seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad.
Salvo en situaciones muy concretas en la que los errores cometidos no son grandes,
debido a la homogeneidad de la poblacin, en general no es un tipo de muestreo riguroso
y cientfico, dado que no todos los elementos de la poblacin pueden formar parte de la
muestra. Por ejemplo, si hacemos una encuesta telefnica por la maana, las personas
que no tienen telfono o que estn trabajando, no podrn formar parte de la muestra.
A diferencia del muestreo probabilstico, la muestra no probabilstica no es un producto de
un proceso de seleccin aleatoria. Los sujetos en una muestra no probabilstica
generalmente son seleccionados en funcin de su accesibilidad o a criterio personal e
intencional del investigador.
La desventaja del mtodo de muestreo no probabilstico es que no se toman pruebas de
una porcin desconocida de la poblacin. Esto implica que la muestra puede representar
a toda la poblacin con precisin o no. Por lo tanto, los resultados de la investigacin no
pueden ser utilizados en generalizaciones respecto de toda la poblacin.
DIRIJIDO POR CUOTAS DELIBERADO

Tambin denominado en ocasiones, "accidental". Se asienta generalmente sobre la base
de un buen conocimiento de los estratos de la poblacin y/o de los individuos ms
"representativos" o "adecuados" para los fines de la investigacin. Mantiene, por tanto,
semejanzas con el muestreo aleatorio estratificado, pero no tiene el carcter de
aleatoriedad de aqul.
En este tipo de muestreo se fijan unas "cuotas" que consisten en un nmero de individuos
que renen unas determinadas condiciones.
EJEMPLOS:
1) 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Trujillo. Una vez
determinada la cuota, se eligen los primeros que se encuentren que cumplan esas
caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.
2) La Direccin Regional de Salud desea estudiar la incidencia de las drogas en la

adolescencia. Lo que deberamos hacer sera: conocer por los informes de la Direccin
Regional de Educacin cules son los centros ms afectados por el problema, fijar un
nmero de sujetos a entrevistar proporcional a cada uno de los estratos (cuotas) y
finalmente dejar en manos de los responsables del trabajo de campo a qu sujetos
concretos se deber entrevistar.
Conclusin:
Existe un sinfn de usos que le podemos dar a la estadstica, es por eso que es importante
saber y/o como aplicarlo por ejemplo:
El ser humano es curioso y controlador por naturaleza; ejercer ese control sobre su
entorno le presenta un problema serio; por ello la Estadstica es tan til en la vida diaria.
El hombre acumula informacin, luego la clasifica y la analiza para poder entenderla, de
ese modo podr controlarla; despus la traduce a cifras, clculos y datos que le ayudan a
tomar decisiones sobre cosas tan cotidianas como la compra de un vehculo, el lugar ms
seguro para vivir, la variacin del clima en una zona o cosas tan indispensables como la
compra y venta de un producto en una empresa o la matrcula de una institucin
educativa. Pero para que el hombre pueda hacer todo esto, debe tener un mtodo, una
forma de recolectar e interpretar esos datos; este mtodo es a lo que llamamos
estadstica.
De cierta forma, el hombre es capaz de saber que tiene un mundo de posibilidades, pero
nunca sabr con exactitud si por la que decidir ser la correcta, he ah donde la
estadstica se emplea en la vida cotidiana, es por eso que la estadstica es tan primordial
como cualquier cosa en la vida.
Necesidad de resumir la informacin, para que los datos sean tiles deben organizarse
para distinguir patrones y tendencias y llegar as a conclusiones lgicas
Una forma de organizar un conjunto de datos es clasificarlos en categoras o clases y
luego contar cuntas observaciones quedan dentro de cada categora.
Para el anlisis e interpretacin de datos es valioso conocer:
La forma o patrn de distribucin de los datos, la posicin de la distribucin, alrededor de
qu valor se tienden a concentrar los datos, la dispersin de los datos alrededor de los
valores centrales, ordenamiento o arreglo de los datos en clases o categoras indicando
para cada una de ellas, el nmero de elementos que contiene o frecuencia.

Probabilidad y Estadística Unidad 3

Caricato da

Informazioni sul documento

Copyright

Formati disponibili

Condividi questo documento

Condividi o incorpora il documento

Opzioni di condivisione

Hai trovato utile questo documento?

Questo contenuto è inappropriato?

Copyright:

Formati disponibili

Probabilidad y Estadística Unidad 3

Caricato da

Copyright:

Formati disponibili

Instituto Tecnolgico Superior de Valladolid

Estadstica descriptiva y la teora del

Frecuencia relativa (hi):

Frecuencia acumulada (fi):

Distribucin de Frecuencias con Datos sin Agrupar

Variable X: ingresos anuales expresados en miles de euros.

20, 21, 18,

20, 21, 19, 20, 21, 18, 20

Distribucin de Frecuencias con Datos Agrupados en Intervalos

centmetros Valores observados:

Representacin grfica de la distribucin de frecuencias:

Medidas De Tendencia Central

La media, llamada tambin media aritmtica, es la medida de tendencia central

X i 10+ 12+ 15+7+8 52

La edad promedio de los miembros de un grupo infantil es de 10.4 aos.

Puede utilizarse en distribuciones cuantitativas o cualitativas.

Es el valor ms frecuente en la distribucin de datos. La moda puede no existir y

En muchas ocasiones, las observaciones recolectadas no tienen la misma

La media geomtrica (MG), de un conjunto de nmeros positivos se define como la

Y as la media geomtrica de las utilidades es el 3.46%.

La media armnica se define como el recproco de la media aritmtica de los

Este valor se emplea para promediar variaciones con respecto al tiempo.

MUESTREO ALEATORIO SIMPLE

d + Za/2 pq 1500(0.1) + (1.96)(0.5)(0.5)

Se deben de muestrear 91 nios.

MUESTREO ALEATORIO SISTEMTICO:

MUESTREO ALEATORIO ESTRATIFICADO:

La muestra debe tener al menos 1083 personas.

MUESTREO ALEATORIO POR CONGLOMERADOS:

Determinamos el intervalo de confianza:

El conocimiento de la forma de la distribucin y del respectivo promedio de una coleccin

Proporciona informacin adicional que permite juzgar la confiabilidad de la medida

Ya que existen problemas caractersticos para datos ampliamente dispersos,

Quiz se desee comparar las dispersiones de diferentes muestras. Si no se desea

Es la medida de variabilidad ms fcil de calcular. Para datos finitos o sin agrupar, el

Si disponemos de las frecuencias de cada variable, la frmula a utilizar ser:

Al determinar la varianza en una muestra en la que se haya estimado la media, se debe

Y en caso de que dispongamos de la frecuencia de cada valor de la

Para datos agrupados, la frmula ser:

Si k = 1 se tiene que el primer momento de X es la media de X, es decir

E[X1] = (compare con la definicin de la seccin 4.4).

Si el primer momento central existe, debe ser igual a cero.

El segundo momento central de X es la varianza .Por lo tanto la varianza de puede

Obsrvese que de aqu se llega a

SESGO Y CURTOSIS DE UNA DISTRIBUCIN

Fig. 4. 10 Distribucin simtrica

Distribucin con sesgo positivo

Distribucin con sesgo negativo

se usa como la medida de la altura o curtosis de una

Fig. 4. 11 Distribucin platocrtica

DIRIJIDO POR CUOTAS DELIBERADO

2) La Direccin Regional de Salud desea estudiar la incidencia de las drogas en la

Potrebbero piacerti anche