Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Yucatn
Integrantes.
+ ARCEO DZIB WILLIAM
+ ARZPALO ALCOCER ALEJANDRO
+ COCOM HOIL JAIRO ANTONIO
+ DZUL CANCH CARLOS JAVIER
+ SILVA MENDOZA RENE ALEXIS
+ XIU CASTILLO GILBERTO
Introduccin
En la siguiente investigacin presentaremos el estudio de la probabilidad y la estadstica,
particularmente la estadstica descriptiva al igual que en las diferentes teoras de
muestreo. La estadstica descriptiva es una ciencia que se encarga de analizar una serie
de datos, para analizar estos datos se necesita realizar una serie determinada de
procesos los cuales te indicaran las propiedades de tu coleccin de datos tales como los
diferentes tipos de frecuencia que te indicaran la frecuencia dependiendo si se trat de
datos exactos o agrupados, de igual manera se conceptualizaron los diferentes tipos de
medida de tendencia central: media, mediana, moda, promedio, media armnica y
geomtrica al igual que los datos cuartiles. De igual manera se indago en las medidas de
dispersin las cuales no son de gran utilidad en la estadstica descriptiva como el rango o
amplitud la amplitud de variacin, desviacin media y estndar al igual que la varianza y la
krtosis. Tambin se investig sobre las diferentes teoras de muestro conceptualizadas
como lo son el muestreo simple, el sistematizado, el estratificado y el muestro realizado
por conglomerados, esperando que toda esta informacin sea de utilidad.
A menudo en una investigacin se recogen grandes cantidades de datos numricos.
Cuando esto ocurre es difcil visualizar un orden o estructura que ayude a analizarlos.
Para lograrlo es necesario condensar los datos en grupos de acuerdo a ciertas divisiones
de la recta numrica (intervalos o clases). Aunque con esta agrupacin la informacin
inicial sobre cada dato individual se pierde, es ms fcil visualizar rpidamente las
caractersticas principales del grupo total de datos.
Distribucin de Frecuencias
En estadstica, se le llama distribucin de frecuencias a la agrupacin de datos en
categoras mutuamente excluyentes que indican el nmero de observaciones en cada
categora. Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero
existente en cada clase.
Tipos de Frecuencia:
Ejemplos:
a)
N = 20
Frecuencias
Absoluta
Relativ
Acumulada
xi
ni
Ni
a
fi = ni /
Relativa
Acumulada
Fi = Ni / N
N
X1
X2
X3
X4
X5
18
19
20
21
22
5
3
7
4
1
20 = N
5
5+3= 8
5+3+7= 15
5+3+7+4= 19
5+3+7+4+1=20
0,25
0,15
0,35
0,20
0,05
1
Representacin grfica:
0,25
0,40
0,75
0,95
1
Diagrama de Barras
8
7
6
5
5
Frecuencias ni
4
3
4
3
1
0
b)
18
19
20
21
22
X (Ingresos anuales en miles de )
N = 60 Variable X: longitud en
intervalos
marcas
frecuencias
frecuencias
de clase
absolutas
relativas
fi
Fi
Li-1-Li
235-240
ci
237,5
ni
5
Ni
5
0,08
0,08
240-245
242,5
13
0,13
0,22
245-250
250-255
255-260
247,5
252,5
257,5
27
15
5
N=60
40
55
60
0,45
0,25
0,08
1
0,67
0,92
1
HISTOGRAMA
15
20
30
10
MEDIA
Formulas:
Media de la Poblacin
Media de la muestra
xi
xi
= i=1
N
x =
237.5
242.5
247.5
252.5
n
257.5
Caractersticas:
+ No puede utilizarse en distribuciones cualitativas.
+ Esta afectada por todos los valores que asume la variable.
+ Si la distribucin presenta valores extremos bajos o altos, se recomida usar
otra medida de tendencia central.
Ejemplo:
Consideremos la edad de 5 personas miembros de un grupo infantil.
10 12 15 7 8
n
x =
i=1
MEDIANA
Es el valor que divide a un conjunto de datos en dos partes iguales.
Clculo:
+ Ordenar los datos de menor a mayor o viceversa.
+ Si el n de datos es impar: la mediana es el valor central.
+ Si el n de datos es par: la mediana es media aritmtica de los 2 puntos
centrales.
Caractersticas:
+
+
+
+
Ejemplo:
Consideramos la altura de 7 personas cantantes de una iglesia
1.10 1.25 1.50 1.90 1.60 1.75 1.80
1. Ordenamos los datos.
1.10 1.25 1.50 1.60 1.75 1.801.90
2. El nmero de datos es impar. N=7
3. La mediana es entonces el valor central 1.60
La mediana es 1.60, es decir la mitad de los cantante de la iglesia tiene una altura
de 1.60 o menos y la otra mitad de 1.60 o ms.
MODA
PROMEDIO PONDERADO
Ejemplo:
Si un alumno obtiene un 5.5 en una prueba de coeficiente 1 y un 4.9 en otra de
coeficiente 2. Cul es nota promedio de estas dos pruebas?
En este caso, los coeficientes son diferentes, por lo tanto no debe usarse el
promedio simple sino uno ponderado en que las ponderaciones son 1 y 2
respectivamente. En consecuencia, la suma del denominador est dada por 5.5*1 +
4.9*2 = 15.3. El denominador, que consiste en la suma de las ponderaciones, est
dado por 1 + 2 = 3 En consecuencia, el promedio ponderado es 15.3/3 = 5.1
MEDIA GEOMETRICA
Caractersticas:
+ Para promediar porcentajes, ndices y cifras relativas.
+ Para determinar el incremento porcentual promedio en ventas, produccin u
otras actividades o series econmicas de un periodo a otro.
Ejemplo:
Supngase que las utilidades obtenidas por una compaa constructora en cuatro
proyectos fueron de 3, 2, 4 y 6%, respectivamente. Cul es la media geomtrica
de las ganancias?
En este ejemplo x y as la media geomtrica es determinada por:
MEDIA ARMONICA
TIPOS DE MUESTREO
Existen diferentes criterios de clasificacin de los diferentes tipos de muestreo, aunque en
general pueden dividirse en dos grandes grupos: mtodos de muestreo probabilsticos y
mtodos de muestreo no probabilsticos.
1500 (1.96)(0.5)(0.5)
----------------- = -------------------------------
91
Ejemplo:
Se acercan las Navidades y cierta empresa de turrones cree que no va a poder entregar
todos los pedidos a tiempo, a no ser que aumente la plantilla. La empresa dispone de un
listado ordenado alfabticamente de 20 personas con las mismas caractersticas para el
puesto y que actualmente estn en paro. Puesto que el tiempo apremia y no es posible
hacer una entrevista para seleccionar al personal, se decide elegir cinco trabajadores de
forma aleatoria usando el muestreo sistemtico.
Tenemos que elegir 5 elementos sistemticamente de un total de 20, por tanto se debe
elegir uno de cada k=20/5=4.
Se elige el punto de partida eligiendo un nmero al azar entre 1 y 4. Si obtenemos, por
ejemplo h=2, los elementos de la muestra sern 2, 2+4, 2+24, 2+34, es decir:
2, 6, 10, 14, 8.
Ejemplo:
La media de las estaturas de una muestra aleatoria de 400 personas de una ciudad es
1,75 m. Se sabe que la estatura de las personas de esa ciudad es una variable aleatoria
que sigue una distribucin normal con varianza 2 = 0,16 m2.
Construye un intervalo, de un 95% de confianza, para la media de las estaturas de la
poblacin.
n=400
x =1.75
1- =0.95
(1.75 1.96 0.4/20 )
=0.4
z /2=1.96
(1.7108,1.7892)
Cul sera el mnimo tamao muestral necesario para que pueda decirse que la
verdadera media de las estaturas est a menos de 2 cm de la media muestral, con un
nivel de confianza del 90%?
Ejemplo:
Una marca de nueces afirma que, como mximo, el 6% de las nueces estn vacas. Se
eligieron 300 nueces al azar y se detectaron 21 vacas.
Con un nivel de significacin del 1%, se puede aceptar la afirmacin de la marca?
1 Enunciamos las hiptesis nula y alternativa:
H0 : p 0.06
H1 : p >0.06
2Zona de aceptacin
= 0.01
z = 2.33.
3Verificacin.
MEDIDAS DE DISPERSIN.
LA DISPERSIN.
Al igual que sucede con cualquier conjunto de datos, la media, la mediana y la moda slo
nos revelan una parte de la informacin que necesitamos acerca de las caractersticas de
los datos. Para aumentar nuestro entendimiento del patrn de los datos, debemos medir
tambin su dispersin, extensin o variabilidad. La dispersin es importante porque:
EL RANGO O RECORRIDO ( R )
DESVIACIN MEDIA
En caso de tener los datos agrupados en una tabla de frecuencias, la frmula ser:
Dnde:
x i= es un valor cualquiera de la variable (valor ensimo).
U= es la media aritmtica de la variable
n i =es la frecuencia absoluta simple del valor ensimo
N =es el nmero total de individuos estudiados en la muestra.
Es la sumatoria (en valor absoluto) de todas las distancias entre cada valor de la variable
y su media aritmtica.
Varianza
Mide la distancia existente entre los valores de la serie y la media. Se calcula como
sumatorio de las diferencias al cuadrado entre cada valor y la media, multiplicadas por el
nmero de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el
tamao de la muestra.
La varianza siempre ser mayor que cero. Mientras ms se aproxima a cero, ms
concentrados estn los valores de la serie alrededor de la media. Por el contrario,
mientras mayor sea la varianza, ms dispersos estn.
La varianza es la medida de dispersin que mejor expresa la variabilidad del fenmeno
que estamos estudiando. Se define como la media aritmtica de las desviaciones al
cuadrado entre cada valor de la variable y la media aritmtica. Para que no se
contrarresten las diferencias, en lugar de utilizar los valores absolutos se eleva al
cuadrado el valor de cada una de ellas.
La frmula para su determinacin ser:
Varianza poblacional.
= varianza muestral.
xi= valor ensimo de la variable.
= media aritmtica poblacional.
= media aritmtica muestral.
= frecuencia absoluta simple del valor ensimo.
N = nmero total de individuos de la poblacin.
n. = nmero total de individuos estudiados en la muestra.
DESVIACIN ESTNDAR
La desviacin estndar o desviacin tpica (denotada con el smbolo o s, dependiendo
de la procedencia del conjunto de datos) es una medida de dispersin para variables de
razn (variables cuantitativas o cantidades racionales) y de intervalo. Se define como la
raz cuadrada de la varianza de la variable.
Para conocer con detalle un conjunto de datos, no basta con conocer las medidas de
tendencia central, sino que necesitamos conocer tambin la desviacin que presentan los
datos en su distribucin respecto de la media aritmtica de dicha distribucin, con objeto
de tener una visin de los mismos ms acorde con la realidad al momento de describirlos
e interpretarlos para la toma de decisiones.
Ahora veremos que la media y la varianza son casos particulares de cantidades ms
generales llamadas momentos.
Consideremos la funcin g(X) = Xk, k =1, 2, A la esperanza matemtica de Xk se le
denomina k-simo momento de X.
=0
>0
<0
La cantidad
distribucin.
* < 30
Distribucin mesocrtica
*=3
Distribucin leptocrtica
*>3
MUESTREO NO ALEATORIO.
En este tipo de muestreo, puede haber clara influencia de la persona o personas que
seleccionan la muestra o simplemente se realiza atendiendo a razones de comodidad.
Salvo en situaciones muy concretas en la que los errores cometidos no son grandes,
debido a la homogeneidad de la poblacin, en general no es un tipo de muestreo riguroso
y cientfico, dado que no todos los elementos de la poblacin pueden formar parte de la
muestra. Por ejemplo, si hacemos una encuesta telefnica por la maana, las personas
que no tienen telfono o que estn trabajando, no podrn formar parte de la muestra.
A diferencia del muestreo probabilstico, la muestra no probabilstica no es un producto de
un proceso de seleccin aleatoria. Los sujetos en una muestra no probabilstica
generalmente son seleccionados en funcin de su accesibilidad o a criterio personal e
intencional del investigador.
La desventaja del mtodo de muestreo no probabilstico es que no se toman pruebas de
una porcin desconocida de la poblacin. Esto implica que la muestra puede representar
a toda la poblacin con precisin o no. Por lo tanto, los resultados de la investigacin no
pueden ser utilizados en generalizaciones respecto de toda la poblacin.
EJEMPLOS:
1) 20 individuos de 25 a 40 aos, de sexo femenino y residentes en Trujillo. Una vez
determinada la cuota, se eligen los primeros que se encuentren que cumplan esas
caractersticas. Este mtodo se utiliza mucho en las encuestas de opinin.
Conclusin:
Existe un sinfn de usos que le podemos dar a la estadstica, es por eso que es importante
saber y/o como aplicarlo por ejemplo:
El ser humano es curioso y controlador por naturaleza; ejercer ese control sobre su
entorno le presenta un problema serio; por ello la Estadstica es tan til en la vida diaria.
El hombre acumula informacin, luego la clasifica y la analiza para poder entenderla, de
ese modo podr controlarla; despus la traduce a cifras, clculos y datos que le ayudan a
tomar decisiones sobre cosas tan cotidianas como la compra de un vehculo, el lugar ms
seguro para vivir, la variacin del clima en una zona o cosas tan indispensables como la
compra y venta de un producto en una empresa o la matrcula de una institucin
educativa. Pero para que el hombre pueda hacer todo esto, debe tener un mtodo, una
forma de recolectar e interpretar esos datos; este mtodo es a lo que llamamos
estadstica.
De cierta forma, el hombre es capaz de saber que tiene un mundo de posibilidades, pero
nunca sabr con exactitud si por la que decidir ser la correcta, he ah donde la
estadstica se emplea en la vida cotidiana, es por eso que la estadstica es tan primordial
como cualquier cosa en la vida.
Necesidad de resumir la informacin, para que los datos sean tiles deben organizarse
para distinguir patrones y tendencias y llegar as a conclusiones lgicas
Una forma de organizar un conjunto de datos es clasificarlos en categoras o clases y
luego contar cuntas observaciones quedan dentro de cada categora.
Para el anlisis e interpretacin de datos es valioso conocer:
La forma o patrn de distribucin de los datos, la posicin de la distribucin, alrededor de
qu valor se tienden a concentrar los datos, la dispersin de los datos alrededor de los
valores centrales, ordenamiento o arreglo de los datos en clases o categoras indicando
para cada una de ellas, el nmero de elementos que contiene o frecuencia.