Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
CAP. 1
INTRODUCCIN Y DEFINICIONES
INTRODUCCIN
Inicialmente la palabra de Estadstica se deriv del vocablo Estado
DEFINICIONES
Algunas de las definiciones la caracterizan como ciencia y otras como una metodologa.
Se llama Estadstica a la rama de las matemticas que se sirve de un conjunto de mtodos, normas, reglas y
principios para la observacin, toma, organizacin, descripcin, presentacin y anlisis del comportamiento
de un grupo de datos para la conclusin sobre un experimento o fenmeno.
Rama de las matemticas que estudia los datos cuantitativos reunidos por observacin con el fin de estudiar
y comparar las fuentes de varianza de los fenmenos, de aceptar o de rechazar las hiptesis que afectan a las
relaciones entre los fenmenos y de ayudar a hacer unas inferencias a partir de las observaciones.
Kerlinger De Landsheere.
Referente a los mtodos para la obtencin de datos, su anlisis y resumen, as como la deduccin de las
consecuencias a partir de las muestras obtenidas de los eventos.
C. Monroy Olivares
En el lenguaje corriente, el trmino se suele usar en dos sentidos diferentes. En plural (estadsticas), como
sinnimo de ordenacin de datos numricos (por ejemplo, estadsticas de viviendas construidas por intermedio
del banco hipotecario); en singular, el trmino se aplica a la ciencia estadstica, cuyo objeto es el de recopilar,
presentar, analizar e interpretar datos, referentes a hechos, con el fin de estudiar fenmenos susceptibles de
expresin numrica.
Ander Egg.
Es la que se encarga de la
Estadstica es la ciencia
Estadstica descriptiva recoleccin, clasificacin,
que nos proporciona un
presentacin, descripcin y
conjunto der mtodos y
simplificacin de los datos.
procedimientos para la
recoleccin, clasificacin Solo se pretende analizar y
(organizacin), anlisis e De acuerdo a esta describir los datos
interpretacin de datos definicin se la
de forma adecuada para puede clasificar
tomar decisiones en:
Esta proporciona la teora
cuando prevalecen necesaria para inferir o
condiciones de estimar las leyes de una
incertidumbre. Estadstica Inferencial poblacin partiendo de los
resultados o conclusiones del
anlisis de una muestra.
"Una poblacin es un conjunto de todos los elementos que estamos estudiando, acerca de los cuales
intentamos sacar conclusiones". Levin & Rubin (1996).
Se llaman unidades elementales u observaciones son los elementos individuales de una poblacin.
La poblacin puede ser finita o infinita, dependiendo de nmero de elementos que la forman.
En la practica, una poblacin finita con un numero grande de elementos se considera una poblacin infinita.
MUESTRA
Se le llama Muestra a cualquier subconjunto de elementos de la poblacin. El inters de la Estadstica es
proporcionar mtodos que permitan elegir una muestra de datos representativos destinado a suministrar
informacin a cerca de una poblacin, ser fundamental que los elementos deben tener todas las
caractersticas de la poblacin.
Murria R. Spiegel (1991).
"Se llama muestra a una parte de la poblacin a estudiar que sirve para representarla".
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de todos". Levin & Rubin
(1996).
"Una muestra debe ser definida en base de la poblacin determinada y las conclusiones que se obtengan de
dicha muestra solo podrn referirse a la poblacin en referencia",
Cadenas (1974).
Es la medida o conteo que se obtiene de alguna poblacin con el propsito de obtener informacin acerca de
ella.
Se suelen tomar muestras cuando es difcil o costosa la observacin de todos los elementos de la poblacin
estadstica.
Al nmero de elementos de la muestra se los denomina tamao de muestra.
En el lenguaje de la estadstica, uno de los conceptos ms
elementales es el muestreo. En
casi todos los problemas de estadstica, un nmero
especificado de mediciones o datos, es MUESTRA
decir, una muestra, se toma de un cuerpo de mediciones
ms grande llamado poblacin.
POBLACIN
DATO ESTADSTICO
Son los nmeros o medidas que han sido recopilados como resultado de las observaciones, que pueden ser
comparados, analizados e interpretados.
Un nmero aislado que no puede compararse o que no muestra relacin significativa con otros nmeros, no es
un dato estadstico
VARIABLE
Una variable es una caracterstica que cambia o vara con el tiempo y/o para diferentes personas u objetos
bajo consideracin
Una variable estadstica es una caracterstica de la poblacin que interesa al investigador y que puede tomar
diferentes valores.
Variable aleatoria: Si los valores que toma una variable, provienen de factores fortuitos y si un valor no se
puede predecir exactamente con anticipacin, esta es una variable aleatoria.
CLASIFICACIN DE VARIABLES
Las variables cualitativas miden una cualidad o caracterstica en cada unidad experimental. Las variables
cuantitativas miden una cantidad numrica en cada unidad experimental.
Son las que surgen cuando se definen
categoras y se cuenta el nmero de
VARIABLE CUALITATIVA: Son Nominal
observaciones pertenecientes a cada categora
variables cuyos valores consisten en
y no lleva ninguna ordenacin en las posibles
categoras de clasificacin, es decir,
modalidades.
se refieren a la cualidad que presenta
la poblacin, NO lleva clasificacin Ordinal En estas se ordenan los casos en trmino del
numrica. grado que poseen una determinada
caracterstica.
ESTADGRAFO: Es una medida utilizada para describir alguna caracterstica de la muestra y la toma de
decisiones contiene un grado de incertidumbre.
Las ms utilizadas son:
varianza muestral () y proporcin muestral (S2).
media muestral (),
ORGANIZACIN O ANLISIS E
PLANIFICACIN RECOLECCIN DE LA CLASIFICACIN DE INTERPRETACIN DE
DEL ESTUDIO INFORMACIN LA INFORMACIN LOS RESULTADOS
Es necesario conocer las posibilidades y limitaciones de una tcnica an no se tenga ninguna destreza en su
manejo, que dominar los intrincados secretos de su calculo cuando no se tiene una versin acertada de su
aplicacin.
Etapa de Planteamiento del Bsqueda de Verificacin de Anlisis y presentacin
planificacin problema y objetivos informacin la hiptesis de los datos
PROBABILSTICOS NO PROBABILSTICOS
Si los procedimientos son llevados de manera correcta, son aplicables a las leyes de probabilidad, que permite
calcular hasta que grado puede esperarse que el valor de la muestra de la cual se obtuvieron respuestas difiera
del valor real de la poblacin, es decir, se obtiene el error de muestreo.
Desventajas del muestreo probabilstico
En la mayora de los casos es ms costoso que un muestreo no probabilstico del mismo tamao. Las reglas de
seleccin incrementan los costos de entrevista y el diseo de la muestra debe estar a cargo de profesionales
Para utilizar este mtodo es necesario obtener una lista de la poblacin igual que en el muestreo aleatorio
simple.
El investigador determina un intervalo de salto y selecciona nombres basndose en el mismo.
La principal ventaja del muestreo sistemtico con respecto al muestreo aleatorio simple es la economa, pues
con frecuencia es ms sencillo, requiere menos tiempo y es menos costoso que el muestreo aleatorio simple.
Conglomerado de 2 etapas: Si se elige una muestra de elementos de los subconjuntos seleccionados de alguna
manera probabilstica.
La diferencia con el mtodo de muestras estratificadas son:
Estratificada Conglomerados
Subconjuntos de una poblacin en los cuales se efecta poco o ningn intento para lograr un corte
transversal representativo
Por definicin cualquier muestra que no cumpla los requisitos de una muestra probabilstica es no
probabilstica.
Las muestras no probabilsticas no permiten calcular el error de muestreo, por eso surgirn
dificultades an mayores para evaluar la cantidad total de muestras no probabilsticas.
Puede ser un mtodo eficiente y eficaz para obtener la informacin necesaria, en especial para realizar
exploraciones y cuando hay la necesidad urgente de estimar el valor verdadero a un costo bajo.
Algunos piensan que el muestreo por conveniencia se emplea cada da mas que el muestreo probabilstico,
por la creciente disponibilidad de bases de datos de consumidores de categoras de baja incidencia y difciles
de hallar.
Ej.) Una compaa quiere sacar un nuevo producto X , busca en las listas de datos de las empresas proveedoras
de informacin, quienes consumen ese X producto y realiza las entrevistas a un costo mucho ms bajo.
Muestreo por cuotas
Tambin denominado en ocasiones "accidental".
Son muestras en las cuales los subgrupos de poblacin establecen las cuotas. La seleccin se la efecta por
medios no probabilsticos
Se asienta generalmente sobre la base de un buen conocimiento de los estratos de la poblacin y/o de los
individuos ms "representativos" o "adecuados" para los fines de la investigacin. Este mtodo se utiliza
mucho en las encuestas de opinin.
Ej.: 20 individuos de 25 a 40 aos, de sexo femenino y residentes en La Paz. Una vez determinada la cuota se
eligen a los primeros que se encuentren y que cumplan esas caractersticas.
Bola de nieve
Este tipo de muestreo emplea procedimientos para elegir entrevistados adicionales con base en referencias
de los entrevistados iniciales y se utiliza para muestrear poblaciones extraas o de baja incidencia.
Los trminos de poblaciones extraas o de baja incidencia, se refieren a poblaciones que constituyen un
porcentaje muy bajo de la poblacin total
La ventaja principal de este tipo de muestreo, es que los costos disminuyen, pero la calidad de la muestra
se reduce en cierto grado.
Ej.: Encontrar personas con cierto tipo raro de enfermedad
Muestras a juicio
Se aplica a cualquier caso en el que el investigador trata de obtener una muestra representativa a partir de
criterios de eleccin basados en juicios personales
Ej.: Pruebas de un producto en un determinado centro comercial elegido por el investigador a su criterio
Organizacin
y/o Revisin y Correccin Presentacin de la informacin
Grficos
clasificacin de datos recolectados mediante Cuadros o Tablas
de los datos
El rango llamado tambin recorrido de datos, es la diferencia entre el mayor y menor de los valores
que forman la variable estadstica X y se lo denota por R
R= 76 - 60
TABLA DE FRECUENCIAS
La frecuencia absoluta (fi )de un valor xi de la variable estadstica X, al nmero de veces que aparece repetido
dicho valor en el conjunto de las observaciones realizadas.
Es igual al cociente de la frecuencia absoluta del valor observado xi y el nmero de observaciones (n)
Hi = = (=1 )/ = =1
5
4.5
4
3.5
3
2.5
2
1.5
1
0.5
0
I I I I II II IIIII I I II I I I
60 62 64 65 66 67 68 69 70 71 72 73 76
Nmero 30
de Plantas 25
(fi) 20
11 12 13 1 2 3 15
5% 5% 5% 5% 5% 5% 4
10
5% 10
10% 5
9
10%
5%8 5
6
5%
10% 0
7
25% I I I I II II IIIII I I II I I I
60 62 64 65 66 67 68 69 70 71 72 73 76
Nmero Fi hi Hi Porcentaje
de Plantas (%)
1 2 3 4 5 6 7 8 9 10 11 12 13 14 (fi)
Diagrama de barras
Esta forma de representacin grfica es propia de
las distribuciones que tienen muchas observaciones
pero pocos valores distintos de la variable.
En el eje de las abscisa van los diferentes v alores de
la variable u sobre cada una de ellas se levanta una
perpendicular, cuya altura es la frecuencia (absoluta
o relativa) de dicho valor
Grupo
sangune fi
o
A 6
B 4
AB 1
0 9
20
Diagrama de barras doble
Este diagrama se emplea para representar datos de asociacin cuyas dos escalas sean cualitativas.
Tambin se emplea cuando se quiere comparar dos distribuciones de frecuencias en relacin al tiempo
Histograma
Es una representacin grafica de una distribucin de
frecuencias agrupadas en intervalos de clase,
mediante una serie de rectngulos contiguos que
tienen:
a) Sus bases sobre un eje horizontal (eje x) con
centros en las marcas de clase y longitud igual al
tamao de intervalos de clase.
Consiste en dividir el rango en un nmero conveniente de intervalos de clase, generalmente del mismo tamao.
Es conveniente tener entre 5 y 20 intervalos de clase. No hay una frmula exacta para calcular el nmero de
intervalos de clase, este nmero es determinado por tentativas y aproximaciones.
Formula de Sturges:
K(nmero de clases)=
K = 1+3,22 (3.3) log10
Cuando el resultado de cualquier de los dos mtodos de un nmero decimal, se lo redondeara al inmediato
superior.
Determinacin del tamao de los intervalos
Como regla general, para encontrar la magnitud de los intervalos (del mismo tamao), se debe dividir el
rango de las observaciones entre el nmero de intervalos de clase:
Amplitud de clase: C=
En este caso todas las clases tendrn la misma longitud con posible excepcin del primer y ltimo intervalo,
esto es para permitir uniformidad en la comparacin de frecuencias de clase.
Se debe tomar el resultado numrico ms bajo de los datos originales colo el lmite inferior del primer
intervalo de clase. Agregar C para obtener el lmite superior de dicha clase, (cuando se usa R, agregar C+1
para obtener el lmite superior de clase.
Determinacin de la frecuencia
Frecuencia
Pago absoluta
(Bs.) Conteo (fi) (Fi) (hi) (Hi)
[46,52 II 2 2 0,04 0,04
[52,58 IIIII 5 7 0,10 0,14
[58,64 IIIII II 7 14 0,14 0,28
[64,70 IIIII IIIII II 12 26 0,24 0,52
[70,76 IIIII IIIII I 11 37 0,22 0,74
[76,82 IIIII I 6 43 0,12 0,86
[82,88 IIII 4 47 0,08 0,94
[88,94 III 3 50 0,06 1,00
50 1,00
Intervalos de tamaos de clases diferentes o desiguales
Frecuencia
absoluta Amplitud Densidad
N de empleados (fi) Ci (hi) (hi/ci) %
[0,10 5 10 0,02 0,002 2
[10,20 20 10 0,08 0,008 8
[20,30 35 10 0,14 0,014 14
[30,40 40 10 0,16 0,016 16
[40,60 50 20 0,20 0,010 20
[60,80 30 20 0,12 0,006 12
[80,100 20 20 0,08 0,004 8
[100,140 20 40 0,08 0,002 8
[140,180 15 40 0,06 0,002 6
[180,260 15 80 0,06 0,001 6
250 1 100
Cuando se quiere una mejor aproximacin entre un rango, se utiliza la siguiente interpolacin:
2 3
P=( ) %R 12 + % R 23 + ( )* % R 3-4
21 43
Ra Rb
R1 R2 R3 R4
%R 12 % R 23 % R 3-4
50 90
60 50 9080
P=( ) 20% + 12% +( )*8%
6040 10080
40 60 80 10
0
20 8%
% 12 P= 10%+12%+4%
%
P= 26%
Funcin de distribucin acumulada (FDA): Dado las n observaciones de una variable cuantitativa y un numero
real x cualquiera. Indiquemos N(x) el nmero de observaciones menores o iguales a x
Fn(x)= ( )
Frecuencias del N de familias de los hijos mamferos
N de 0,0000 si x0
hijos N de
0,0571 si 0x1
xi familias hi % Hi
0 2 0,0571 5,71 0,0571 0,1428 si 1x2
1 3 0,0857 8,57 0,1429 F35(x)= 0,4285 si 2x3
2 10 0,2857 28,57 0,4286 0,7142 si 3x4
3 10 0,2857 28,57 0,7143
0,8571 si 4x6
4 5 0,1429 14,29 0,8571
1,0000 si x6
6 5 0,1429 14,29 1,0000
35 1,0000 100,00