Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Saber cotidiano
Saber cientfico
Es FACTICO, en el sentido de que los hechos son fuente de informacin y de respuesta. Se dice
que el mtodo cientfico parte de la observacin de los hechos, est basado en los hechos, tiene un
referencial emprico.
TRACIENDE LOS HECHOS; si bien el Mtodo Cientfico parte de los hechos particulares, no se
detiene en ellos sino que mediante un salto del nivel observacional al terico los trasciende, los
problematiza y establece leyes, teoras, etc. La interpretacin de los hechos se realiza desde un
determinado marco de referencia terico que, a su vez, se apoya en supuestos metatericos.
Se atiene a REGLAS METODOLOGICAS formalizadas (operaciones, procedimientos
establecidos de antemano), pero no por eso deshecha la intuicin y la imaginacin.
Se vale de la VERIFICACION EMPIRICA para formular respuesta a los problemas planteados y
para apoyar sus propias afirmaciones, exigiendo una constante confrontacin con la realidad que
lleva a la problematizacin de lo ya adquirido y admitido.
Esta permanente confrontacin hace que el Mtodo Cientfico sea AUTOCORRECTIVO Y
PROGRESIVO. Es autocorrectivo en cuanto va rechazando, corrigiendo o ajustando las propias
conclusiones en la medida que algunos hechos demuestren la existencia de algn error u omisin.
Es progresivo ya que, al no tomar sus conclusiones como infalibles o finales, est abierto a nuevos
aportes y a la utilizacin de nuevas tcnicas y procedimientos.
Es GENERALIZANTE, la cosa en particular o el hecho individual o singular interesa en la medida
en que es miembro de una ley o clase. No es que el Mtodo ignore la cosa individual o el hecho
-2-
irrepetible, lo que ignora es el hecho aislado, puesto que sus enunciados son universales y expresan
el comportamiento general de la naturaleza o de los eventos en estudio.
Es SISTEMATICO, el conocimiento cientfico es un sistema de ideas conectadas lgicamente.
Necesita de la racionalidad cientfica, de modo tal que establece criterios de precisin en la
observacin.
La investigacin cientfica es ESPECIALIZADA, necesita mantener la unidad metodolgica de la
ciencia para su aplicacin a adversos factores de la misma ciencia. Su interrelacin se hace
mediante la interdisciplinariedad cientfica.
Finalmente, el conocimiento cientfico es COMUNICABLE, es expresable para el pblico. La
comunicacin debe romper los muros del secreto cientfico para encontrar la va al progreso
tecnolgico y cultural.
1.3 La Estadstica y el Mtodo Cientfico
La palabra Estadstica, proviene de la raz latina status o de la griega statera o de la palabra
alemana staat, todas relativas al concepto de Estado como ente gubernamental.
Esta acepcin de la palabra Estadstica, desafortunadamente la nica que tiene un grueso de la
opinin publica en nuestro medio acerca de lo que es esta ciencia, aparece recalcada en el prefacio
de Una visin poltica del estado actual de Europa, por E.A.W Zimmermann, publicada en 1787,
donde anota: Hace cerca de cuarenta aos que esta rama del conocimiento poltico, que tiene como
objeto estudiar la potencia real y relativa de los distintos estados modernos, la capacidad derivada
de sus condiciones naturales, la industria y la civilizacin de sus habitantes y la sabidura de sus
gobernantes, se ha constituido, principalmente por obra de escritores alemanes, en una ciencia
independientePor la forma ms conveniente que ahora ha tomado, esta ciencia, conocida por el
recin inventado nombre de Estadstica, ha llegado a ser un estudio favorito en Alemania.
Las tcnicas descriptivas, se diversifican a fenmenos no necesariamente estatales, como la
industria, la economa, etc. por lo que, se define entonces la Estadstica como un Mtodo para
describir numricamente, caractersticas de fenmenos colectivos. Hoy en da los procesos
descriptivos de la Estadstica, son una parte esencial de tal ciencia, pero no son los nicos;
corresponderan al proceso inicial del Mtodo Cientfico, anteriormente citado, o sea a la
observacin de los hechos.
Aproximadamente, por lo misma poca en que se presenta la citada acepcin de Estadstica, est en
auge una rama de las Matemticas, con sus principales exponentes en Francia e Inglaterra, que trata
de controlar el comportamiento de los juegos de azar y por ende de todo fenmeno afectado por
este, dando origen al Calculo de Probabilidades, que se constituira en un gran aporte para el mayor
desarrollo de la Estadstica. Se requiere de un procedimiento estructurado, sistematizado,
formalizado, es decir cientfico, para manejar la incertidumbre, que adems permita cuantificar los
diversos niveles de esta.
Filosficamente no se esta descubriendo o desarrollando la probabilidad, pues ella es inherente al
ser humano, sino que se est cuantificando. Al respecto es conveniente considerar dos tipos de
fenmenos a los que se enfrenta el ser humano en su vida comn y corriente y por consiguiente en
su vida tcnica y cientfica. Ellos son los llamados fenmenos deterministicos y los fenmenos
-3-
aleatorios, caracterizados los primeros por ser de naturaleza tal que, al obsrvalos o realizarlos bajo
las mismas condiciones generales, presenta siempre el mismo resultado, en tanto que los segundos
no presentan tal caracterizacin.
La distincin la origina el determinismo causal, que implica para los fenmenos deterministicos un
conocimiento y control absoluto de todos los factores que determinan el comportamiento del
fenmeno, lo cual no sucede en el caso aleatorio, donde se supone que adicionalmente actan
factores de casualidad o del azar, debidos a conocimientos de factores causales pero con la
imposibilidad de controlarlos o desconocimiento de algunas de las causas. Ciertos filsofos
aseguran que todo fenmeno esta constituido por factores de causalidad y factores de casualidad,
solo que en algunos casos la influencia de estos ltimos es tan poca, que se puede despreciar y se
acepta entonces el concepto de determinismo absoluto.
Frecuentemente se diferencian los dos tipos de fenmenos, anotando que en los deterministicos se
conocen los posibles resultados y en los aleatorios no. Esto no es cierto, pues en general en las dos
situaciones se conocen los posibles resultados, lo que sucede es que en el caso deterministico se
puede predecir o determinar con certeza cual resultado se presentar o como se comportar el
fenmeno, mientras que en el caso aleatorio solo se puede predecir con incertidumbre lo que
ocurrir. Por consiguiente, el ser humano siempre ha tratado de medir su nivel de incertidumbre, es
decir siempre ha convivido con la probabilidad, en su sentido conceptual de ser una medida de la
verosimilitud de los resultados de fenmenos aleatorios. La palabra verosimilitud es sinnimo de
potencia, posibilidad, fuerza de ocurrencia o suceso.
Palabras, frases y actitudes, han sido utilizadas por el ser humano para referirse a, o manejar lo
incierto, constituyndose aquellas en formas elementales de medida (lgicamente no numrica) de
la verosimilitud. Quien, en situaciones inciertas, no ha dicho o ha odo decir: yo creo, a lo
mejor, posiblemente, inclusive un muy usual lo ms seguro es que? Pues bien, estas
formas de medir son poco formales, muy inciertas, no sistematizadas, nada cientficas y se requiere
un proceso que si posea estas cualidades; es lo que se empieza a desarrollar en la Matemtica,
especialmente en Francia e Inglaterra, como se anot anteriormente. La idea es cuantificar la
probabilidad.
Simultneamente, con este desarrollo matemtico de la probabilidad, se empiezan a detectar en las
estadsticas descriptivas, comportamientos regularizados, tendenciosos, generalizados de los
fenmenos que se describen. Se detecta la regularidad estadstica, que se enunciara posteriormente,
dando lugar los dos procesos al nacimiento de una serie de mtodos que permiten, siempre con
incertidumbre, predecir, proyectar, estimar, inferir fenmenos en diferentes campos de la actividad
humana corriente y sobretodo tcnica y cientfica.
Aparece entonces el concepto Estadstica, para referirse a una Rama de las matemticas, que
permite realizar inferencias en situaciones de incertidumbre, lo que constituye hoy una parte
esencial de la Estadstica, llamada la Inferencia Estadstica, pero que no corresponde exactamente
a una definicin de lo que es esta ciencia.
Una tercera acepcin de la palabra Estadstica se encuentra, ms o menos en las mismas pocas
citadas anteriormente, en Suecia e Inglaterra para hacer referencias a tcnicas de Estudio
numrico de sociedades humanas, lo que hoy llamamos Demografa, pero errneamente conocido
en muchos crculos, como definicin nica y exhaustiva, de Estadstica.
-4-
Finalmente y solo a principios del siglo XX, una segunda escuela inglesa, principalmente
preocupada con problemas de estudio e investigacin en agronoma y biometra, inicia y pone los
cimientos de la ciencia a la que nos referimos actualmente con la palabra Estadstica.
En verdad resultara bastante dispendioso ampliar esta breve resea histrica de la palabra
Estadstica, mas que de la Estadstica como ciencia, pero con el propsito de una mejor ubicacin
de ella, considero suficientes estas notas. La claridad conceptual sobre lo que es la Estadstica y
posibles definiciones mas formales, actuales y generalmente aceptadas, se trataran de lograr en los
captulos siguientes.
CAPITULO II
CONCEPTOS FUNDAMENTALES DE ESTADISTICA
2.1 Definiciones de estadstica
Alexander M. Mood, profesor universitario norteamericano, define a la Estadstica como la
tecnologa del Mtodo Cientfico, ya que le proporciona instrumentos para la toma de decisiones
cuando prevalecen condiciones de incertidumbre.
El profesor escandinavo, Harald Crmer, presenta la siguiente definicin: La Estadstica es una
Ciencia basada en el calculo de probabilidades, cuyo objetivo fundamental consiste en investigar la
posibilidad de extraer de los datos estadsticos, inferencias validas, elaborando los mtodos
mediante los cuales puedan ser obtenidos dichas inferencias.
Leo Dugu de Bernonville, profesor francs, la define como La ciencia que se aplica al estudio
numrico de fenmenos colectivos. Estudio que comprende la observacin de los hechos, su
correcta ordenacin, adecuada clasificacin y su anlisis. Tiene como fin principal el
descubrimiento de caractersticas o propiedades de tipo general, para la mayora del colectivo, pero
no necesariamente a todos y cada uno de los casos.
Como es deducible, estas definiciones y otras similares, no se contradicen, por el contrario se
complementan y permiten apreciar la gran relacin entre esta ciencia y el Mtodo Cientfico. As, se
hace referencia a la observacin de los hechos, observacin que por no ser numrica genera los
datos estadsticos y que est asociada con el refencial fctico del Mtodo Cientfico; pero al igual
que en este, en la Estadstica se pretende inferir, generalizar, es decir trascender los hechos.
2.2 CARACTERISTICAS DEL METODO CIENTIFICO
A partir de las definiciones anteriores, se pueden presentar las siguientes caractersticas del mtodo
estadstico:
Es LOGICO y su lgica est basada en la llamada ley de los grandes nmeros, la cual, expresada
en trminos no formales, dice que entre mayor sea el nmero de hechos que se observan, ms
exactas sern las conclusiones que se obtengan y en la llamada ley de regularidad de frecuencias
referida al hecho de que si se realizan repeticiones u observaciones sucesivas de un fenmeno, la
frecuencia relativa de algn suceso de inters, tiende a estabilizarse alrededor de un valor, el cul
corresponder a la probabilidad de tal suceso. Es conveniente anotar, a propsito de esta
-5-
caracterstica, que la Estadstica no es exacta y como sucede en este tipo de ciencias, trata de lograr
la mayor exactitud posible, o sea el mayor acercamiento a la verdad.
El proceso de razonamiento que utiliza la Estadstica para alcanzar sus objetivos de aplicabilidad es
el INDUCTIVO y para su desarrollo propio el DEDUCTIVO.
Por la misma naturaleza, el mtodo estadstico es NUMERICO. Todo estudio estadstico siempre
conlleva algn tratamiento numrico de la informacin, as sea el elemental de contar.
Est referido siempre a FENOMENOS COLECTIVOS o como algunos autores sugieren, a
AGREGADOS: como al Mtodo Cientfico, solo le interesa el hecho individual como componente
de un hecho numeroso, o sea que es ATIPICO, en el sentido de que los resultados que se obtienen
no se pueden aplicar en forma particular o individual; siempre es GENERALIZANTE.
Naturalmente el mtodo estadstico es OBJETIVO, en la misma forma que se habla de objetividad
en el Mtodo Cientfico. Es esta una caracterstica que algunos usuarios de supuestos procesos
estadsticos, han desacreditado al manipular, en el peor sentido de la palabra, informacin
numrica para comprobar o demostrar as, verdades predeterminadas o mostrar realidades
distorsionadas.
Como conclusin de esta caracterizacin de la Estadstica y siguiendo a A. Mood, es conveniente
tener presente que el fin ltimo de la Estadstica, su objetivo inmediato, es colaborar con el Mtodo
Cientfico en procesos de TOMA DE DECISIONES, cuando prevalecen condiciones de RIESGO
Y/O INCERTIDUMBRE.
2.3 CLASIFICACION DE LOS METODOS ESTADISTICOS
Para su desarrollo y aplicacin la Estadstica utiliza diversos procedimientos, los cuales pueden
clasificarse de la siguiente manera, no exhaustiva ni necesariamente excluyente:
METODOS DESCRIPTIVOS: cuando las conclusiones que se obtienen de las experiencias o
datos en estudio, no rebasan los limites de los mismos. Tienen como objetivo fundamental su
presentacin y anlisis como paso previo a los procesos inferencias.
METODOS INDUCTIVOS O INFERENCIA ESTADISTICA: cuando las conclusiones que se
obtienen de los datos en estudio, rebasan los limites de los mismos. Implica en general, el tomar
decisiones en el caso ms universal del cual forman parte los datos. El proceso de tomar decisiones
en situaciones generales, sobre la base de una informacin incompleta contenida en algunos datos,
es arriesgado y no puede realizarse con certeza absoluta sino con incertidumbre. Sin embargo esta
ltima no es total, pueden controlarse sus niveles, puede medirse su magnitud, lo cual se lleva a
cabo con base en el CALCULO DE PROBABILIDADES.
METODOS TEORICOS O TEORIA ESTADISTICA: es est ante la misma cuando se aborda el
estudio de los fenmenos estadsticos, utilizando los mtodos matemticos en toda su plenitud. Esto
no supone, sin embargo, que la Estadstica sea una rama de las Matemticas, sino que al igual que
otras ciencias (Fsica, Economa, Qumica, etc.), la utiliza como instrumento, y as mientras en la
Matemtica Pura se permanece en el terreno de lo conceptual, en estas ciencias es preciso que las
conclusiones se ajusten a la realidad, pues de lo contrario no sirven.
-6-
-7-
-9-
- 10 -
CAPITULO III
METODOLOGIA DE LA ESTADISTICA
Sin pretender ser exhaustivos, se esbozaran a continuacin las fases que se deben llevar a cabo para
realizar un estudio utilizando las tcnicas estadsticas.
3.1 DEFINICION DE OBJETIVOS
Indudablemente esta etapa constituye el punto de partida de todo estudio y su importancia y
trascendencia, para las fases posteriores, son innegables. Lo esencial es este momento, es responder
- 11 -
a preguntas como Qu?, Para qu? y Por qu? y las respuestas a las mismas deben ser presentadas
de manera clara, concreta, concisa y unificada.
Cabe distinguir en este aspecto, al objetivo (u objetivos) general, que corresponde a una definicin
a grandes rasgos del problema o tema de estudio, de los objetivos especficos, que son definiciones
en detalle y altamente desagregadas de los fines del mismo. Los objetivos especficos, son los
subtemas en que se divide el objetivo general y que una vez alcanzados, llevan en un conjunto al
logro de este.
3.2 DEFINICION DEL COLECTIVO O POBLACION
Tan fundamental para lograr buenos resultados del estudio, como la fase anterior, lo es la definicin
del colectivo o poblacin, la cual, al ser realizada en forma clara, concreta, concisa y unificada,
debe hacer referencia al contenido, las unidades, la extensin y el momento de consideracin de la
misma.
La naturaleza de los elementos que forman el colectivo, su estructura y configuracin temporoespacial, son aspectos que determinan hasta cierto punto, el tipo de muestreo ms conveniente a
utilizar, el marco adecuado, los mtodos de obtencin de la informacin y otros conceptos similares.
En mltiples ocasiones se diferencia la Poblacin objetivo, que es aquella a la cual se refiere en
trminos generales la investigacin, de la Poblacin de estudio, Muestreo o Anlisis, definida como
la poblacin objetivo con una serie de restricciones, generadas por la misma naturaleza del estudio,
falta de cobertura del marco de muestreo, problemas de no-respuesta, etc. En sentido estricto, solo
queda representada en la muestra la poblacin de estudio, pero su descripcin puede ser difcil si se
quiere hacerlo especficamente, por lo que es mas frecuente hacer referencia a la poblacin objetivo
definida.
3.3 DETERMINACION DE LA COBERTURA
Teniendo en cuenta los objetivos del estudio, la estructura poblacional, los recursos disponibles y
las caractersticas de los mtodos de enumeracin completa (censo) o parcial (muestreo) se
determina cual de los dos se deber utilizar.
Teniendo en cuenta que en general los estudios se realizan mediante muestreo, se enunciaran a
continuacin las fases siguientes, bajo el supuesto de que el estudio se realizar utilizando el
mtodo de muestreo.
3.4 DETERMINACION DEL MARCO DE MUESTREO
3.4.1 Definicin
Se entiende por Marco de Muestreo o Marco Muestral, todo artificio o conjunto de artificios, que
permita la identificacin y ubicacin de todos y cada uno de los elementos de la poblacin o en su
defecto, de todas y cada una de las unidades mustrales, ya que es la base del proceso de seleccin
de la muestra.
Los factores relevantes de la naturaleza del marco disponible o factible, incluyen los tipos de
unidades mustrales que contenga, la extensin de la cobertura, la exactitud y completes del mismo,
- 12 -
- 13 -
- 14 -
Muestreo de comparacin, para el cual los elementos son seleccionados con base en lo que algn
experto piensa acerca de lo que esas unidades pueden aportar a la investigacin, por lo cual se les
conoce tambin como muestras por expertos. En este caso se desconoce tambin el error de
muestreo y la confianza, pero si el criterio y tica del experto son validas, la muestra puede resultar
mejor que la de conveniencia. Se utiliza este tipo de muestreo moderadamente en la prctica.
El muestreo por cuotas, que puede considerarse mas un mtodo de seleccin que un tipo de diseo.
El tamao de la muestra y los procesos de inferencia se realizan en forma tcnica, pero los
elementos para la muestra son seleccionados en forma subjetiva, pero con arreglo a ciertas
caractersticas de control previamente determinadas. Es un mtodo de seleccin muy til en las
etapas previas de la investigacin y si se elabora con cuidado, puede suministrar informacin mas
definitiva. Se utiliza muy extensamente en la prctica.
3.6.2 Muestreo Probabilistico
Se fundamenta en la probabilidad que tiene cada elemento del agregado para hacer parte de la
muestra. Dadas ciertas condiciones de confiabilidad, error mximo admisible y tamao poblacional,
se deja al azar el diseo de la muestra.
El muestreo se realiza mediante reglas estadsticas que no permiten ningn elemento de juicio al
investigador, generando muestras mas objetivas.
Permite medir la confiabilidad de los procesos de inferencia y el error de muestreo que por su
naturaleza conlleva. Presenta tambin diversas modalidades, siendo las ms clsicas el muestreo
aleatorio simple, el muestreo estratificado y el muestreo por conglomerados.
3.7 RECOLECCION DE INFORMACION
Se define como el proceso estadstico mediante el cual se obtiene toda la informacin pertinente a
un problema dado. Para llevar a cabo esta tarea de recopilacin de datos e informacin, existen
mltiples procedimientos y la utilizacin de uno u otro, depende de la naturaleza del problema a
estudiar, del equipo de investigacin disponible y de la estructura y caractersticas de las unidades
de observacin.
En trminos globales se consideran dos situaciones bsicas, que dependen del estado de la
informacin y que implican dos tipos de tareas diferentes a saber:
-
- 15 -
CAPITULO IV
DISTRIBUCIONES DE FRECUENCIAS
4.1 TABLAS DE FRECUENCIAS
Definicin 4.1 Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre
cada caracterstica en que se han dividido los datos.
Definicin 4.2 Un intervalo de clase es cada uno de los intervalos en que se ha desidido agrupar
parcialmente los datos con el propsito de hacer un resumen de ellos.
El nmero de mediciones que quedan dentro del intervalo se llama frecuencia del intervalo y se
denota por fi. La diferencia entre el extremo mayor y el extremo menor del intervalo se llama
longitud del intervalo.
Ejemplo 4.1
Tabla 4.1 Demanda diaria de cierto producto durante 40 das seguidos
Clase
Intervalo
fi
1
4.5 - 9.5
4
2
9.5 - 14.5
11
3
14.5 - 19.5
13
4
19.5 - 24.5
10
5
24.5 - 29.5
2
La tabla anterior corresponde a una frecuencia para datos cuantitativos. Los distintos intervalos son:
[4.5, 9.5], [9.5,14.5], La longitud de los intervalos es 5; los nmeros 4, 11, 13, representan las
respectivas frecuencias.
4.2 CONSTRUCCION DE UNA TABLA DE FRECUENCIAS
La construccin de una tabla de frecuencias para datos cuantitativos presenta como su punto de
mayor importancia la determinacin del nmero de intervalos (clases) que la conformaran. Este
nmero depende de la cantidad y de la naturaleza de los datos a resumir y del propsito que se
busca con el resumen. A continuacin se presentan ciertas reglas que pueden ser tiles en la
determinacin del nmero de intervalos y se prosigue con las pautas para la construccin de una
tabla de frecuencias.
1. El nmero de intervalos debe escogerse de acuerdo con el nmero de datos, como se indica a
continuacin
Numero de datos
De 10 a 100
De 100 a 1000
De 1000 a 10000
Nmero de Intervalos
De 4 a 8
De 8 a 11
De 11 a 14
- 17 -
2. Una vez escogido el nmero de intervalos, se determina la longitud L que deben tener los
intervalos. De la siguiente manera:
(1)
Yi
Yi -1 'Yi '
2
(2)
Fj f i
(3)
i 1
hj
fi
(4)
Hj
Fj
(5)
HISTOGRAMAS Y POLIGONOS
CUANTITATIVOS O CUALITATIVOS
DE
FRECUENCIAS
PARA
DATOS
- 18 -
1. Las bases de los rectngulos se localizan en el eje horizontal. La longitud de la base es igual al
ancho del intervalo
2. Las alturas de los rectngulos se registran sobre el eje vertical y corresponden a las frecuencias
de las celdas
3. Las reas de los rectngulos son proporcionales a las frecuencias de las clases.
Otro recurso grfico para ilustrar el comportamiento de los datos es el polgono de frecuencias.
Este se construye sobre el sistema de coordenadas cartesianas, al colocar sobre cada marca de clase
un punto a una altura igual a la frecuencia asociada a esa clase; luego se unen dichos puntos por
segmentos de recta.
Definicin 4.7 La ojiva es el polgono que se obtiene de unir por segmentos de recta los puntos
situados a una altura igual a la frecuencia acumulada a partir de la marca de clase como se hace con
el polgono de frecuencia.
4.4 DISTRIBUCION DE FRECUENCIAS PARA DATOS CUALITATIVOS
La construccin de una tabla de frecuencia para datos cualitativos requiere solo del conteo del
nmero de elementos o individuos que caen dentro de cierta clase o tienen determinada
caracterstica.
Ejemplo 4.2. Los siguientes datos corresponden al nmero de estudiantes de cierta universidad, de
acuerdo con su lugar de origen
Lugar de Origen
Norteamericano
Latinoamericano
Europeo
Asitico
Nmero de Estudiantes
1500
500
200
100
- 19 -
Nm ero de Em pleados
Femenino
Masculino
300
200
100
0
1988
1989
1990
1991
Ao
Para construir el diagrama circular se parte del hecho de que el circulo encierra un total de 360
grados. Luego, mediante una regla de tres simple el sector correspondiente al 20% es
X
20 x 360
72
100
Esto es, el 20% corresponde a un sector circular de medida 72 grados. El grfico 4.2 muestra la
representacin grfica.
En el caso de poblaciones infinitas, los polgonos (de frecuencias relativas) para datos cuantitativos
se transforman en curva, llamadas curvas de frecuencias. Estas curvas de frecuencias pueden
presentar distintas formas; las ms comunes son las simtricas y las sesgadas o asimtricas (a la
derecha o a la izquierda).
- 20 -
10%
5%
20%
Menos de 5 aos
Entre 5 y 10 aos
Entre 10 y 15 aos
15%
Entre 15 y 20 aos
Ms de 20 aos
50%
CAPITULO V
MEDIDAS DE POSICION Y DE VARIABILIDAD
5.1 MEDIDAS DE POSICION O MEDIDAS DE TENDENCIA CENTRAL
Una medida de posicin es un nmero que se toma como orientacin para referirnos a un conjunto
de datos.
5.1.1
Media Aritmtica
Definicin 5.1 La media artmetica representa el centro fsico del conjunto de datos y se define
como la suma de los valores observados, dividido por el total de observaciones.
Si X1, . . . , Xn son n observaciones numricas, entonces la media aritmtica de estas n
observaciones, se define como:
n
Xi
X1 X 2 X n
i 1
X
n
n
(6)
Si X1, . . . , Xn son n nmeros con media X , entonces cada una de las diferencias: d1 X 1 X ,
d 2 X 2 X , . . . , d n X n X , se llama desviacin respecto a la media.
Cuando se trata de datos agrupados (tabla de frecuencias) la media esta dada por:
n
fiXi
f1X1 f 2 X 2 f n X n
i 1
X
n
n
5.1.2
(7)
Una de las ms importantes es que la suma de las desviaciones respecto de la media es igual a cero,
esto es,
n
i 1
i 1
d i (X i X) 0
(8)
Y a bX
(9)
Se suele interpretar esta relacin al decir que la media no se altera por una transformacin lineal de
escala. De esto se deduce,
- Si Yi bX i , entonces Y bX
Por ltimo se tiene que
- Si Wi X i Yi , entonces W X Y .
En algunos casos cada uno de los nmeros de la sucesin X 1, X2,. . . , Xn tiene una importancia
relativa (peso) respecto de los dems elementos de la sucesin. Cuando esto sucede la media est
dad por:
Xp
W1 X 1 W2 X 2 Wn X n
W1 W2 Wn
(10)
Xp
5.1.3
2( 4) 3(5) 8 15 23
4. 6
23
5
5
(11)
La Mediana
Sea X1, X2,. . . , Xn una sucesin de nmeros(datos). Mediante la escritura X (1) se indica el elemento
menor de la sucesin; por X(2) el elemento que le sigue al menor y as sucesivamente hasta llegar a
X(n) que representa al elemento mayor.
Definicin 5.2 Sea X(1), X(2),. . . , X(n) una sucesin de nmeros (datos), la Mediana de estos datos se
denota y se define de la siguiente manera:
- 22 -
X (n 1 2)
si n es u nmero impar
X~ X (n 2) X (n 2)1
si n es un nmero par
(12)
n
Fm -1
2
~
X Lm
c
fm
(13)
donde,
Lm : Limite inferior de la clase mediana
n : Nmero de datos
Fm-1: Frecuencia acumulada de la clase que antecede a la clase mediana
fm : Frecuencia de la mediana
c : Longitud del intervalo de la clase mediana.
5.1.4
La Moda
A veces se tienen que clasificar los datos en grupos que no son nmeros. Por ejemplo; genero,
estado civil, ocupaciones, etc.
Definicin 5.3 La Moda de una sucesin de datos se define como el valor que se da con mayor
.
frecuencia. La moda se denota por X
- 23 -
X L m
d1
c
d1 d 2
(14)
donde,
Lm: Limite inferior de la clase modal (la clase de mayor frecuencia)
d1 : Diferencia entre la frecuencia de la clase modal y la clase que la antecede
d2 : Diferencia entre la frecuencia de la clase modal y la clase que la sigue
c : Longitud del intervalo de la clase modal.
5.1.5
La media, mediana y moda se consideran las medidas de posicin ms importantes por su sencillez
y utilidad. No obstante, no son aplicables en todos los casos.
3.2 OTRAS MEDIDAS DE POSICION
3.2.1
Cuartiles
Definicin 5.4 Los Cuartiles de una sucesin de datos ordenados son aquellos nmeros que dividen
la sucesin en cuatro partes porcentualmente iguales.
Hay tres cuartiles, Q1, Q2, Q3. El segundo cuartil Q2, es precisamente la mediana. El primer cuartil
Q1, es el valor en el cual o por debajo del cual queda un cuarto (25%) de todos los valores de la
sucesin (ordenada); el tercer cuartil Q 3 es el valor por debajo del cual quedan las tres cuartas partes
(75%) de los datos.
Para datos agrupados
n
Fk -1
4
Qk Lk
c
fk
k
k 1, 2, 3
(15)
donde,
Lk : Limite inferior de la clase del cuartil k
n : Nmero de datos
Fk-1: Frecuencia acumulada de la clase que antecede a la clase del cuartil k
fk : Frecuencia del cuartil k
c : Longitud del intervalo de la clase del cuartil k.
5.2.2 Deciles
Definicin 5.5 Los Deciles son ciertos nmeros que dividen la sucesin datos (ordenados) en diez
parte porcentualmente iguales. Los deciles se denotan por D1, D2, . . . , D9.
Para datos agrupados los deciles se calculan mediante:
- 24 -
n
Fk -1
10
Dk Lk
c
fk
k
k 1, 2, ,9
(16)
donde,
Lk : Limite inferior de la clase del decil k
n : Nmero de datos
Fk-1: Frecuencia acumulada de la clase que antecede a la clase del decil k
fk : Frecuencia del decil k
c : Longitud del intervalo de la clase del decil k.
5.2.3 Percentiles
Definicin 5.6 Los Percentiles son ciertos nmeros que dividen la sucesin de datos ordenados en
cien partes porcentualmente iguales.
Cuando los datos estn agrupados en una tabla de frecuencias, se calculan mediante
n
Fk -1
100
Pk L k
c
fk
k
k 1, 2, ,99
(16)
donde,
Lk : Limite inferior de la clase del percentil k
n : Nmero de datos
Fk-1: Frecuencia acumulada de la clase que antecede a la clase del percentil k
fk : Frecuencia del percentil k
c : Longitud del intervalo de la clase del percentil k.
5.2.4 Proporcin
Definicin 5.7 La Proporcin, designada por p, se refiere a la fraccin de la muestra que posee
determinada caracterstica o propiedad.
5.2.5 Media Geomtrica
La media, la mediana y la moda se consideran como las ms importantes medidas de posicin por
su amplia utilidad. Sin embargo, para algunos propsitos pueden ser ms apropiadas otras medidas
Definicin 5.8 La Media Geomtrica se define como la raz n-sima del producto de los nmeros
que forman los datos. Esto es,
G n X1X 2 X n
(17)
- 25 -
Ejemplo 5.3 Las ventas de una compaa han aumentado de 200 millones en 1989 a 400 millones
en 1990 y a 600 millones en 1991. El aumento fue del 200% de 1989 a 1991, lo que dara un
aumento medio aritmtico del 100% por ao. Pero esta apreciacin es errnea, ya que la proporcin
promedio de aumento por ao fue menor. Para obtener la proporcin promedio de aumento de las
ventas se utiliza la media geomtrica. Como las ventas en 1990 fueron el doble que las ventas de
1989, y las de 1991 fueron 1.5 veces las de 1990, la media geomtrica es:
G n ( 2.0)(1.5) 1.7325
n
1
1
1
X1 X 2
Xn
(18)
Ejemplo 5.4 Una persona ha gastado $10000 en cada una de tres tiendas diferentes. En la primera,
compro artculos a $2000 la unidad; en la segunda, compro a $2500 la unidad y en la tercera, a
$5000 la unidad. Cul es el precio promedio que ha pagado por artculo?
Los datos se expresan como tantos artculos por peso y lo que se quiere saber es la cuanta
pagada por artculo.
3
30000
2727.27
1
1
1
11
La Amplitud
- 26 -
Definicin 5.10 La Amplitud es la diferencia entre el valor mximo y el mnimo de los datos
(distribucin)
A X MAX X MIN
5.3.2
(19)
Definicin 5.11 La Desviacin Media Absoluta es la media aritmtica de los valores absolutos de
las desviaciones respecto de la media o de la mediana.
Si X1, X2,. . . , Xn son n nmeros (datos), la Desviacin Media Absoluta respecto de la media, esta
dada por:
n
Xi X
i 1
DM
d
i 1
(20)
d2 3
d3 1
d4 1
d5 1
d6 1
DM
18
1. 8
10
d7 1
d8 2
d9 2
d 10 3
, luego
5.3.3
S2
(X
i 1
X) 2
(21)
Definicin 5.13 La Desviacin Estndar se define como la raz cuadrada de la varianza, esto es,
n
(X
i 1
X) 2
(22)
2
Ejemplo 5.6 Para los datos del ejemplo 5.5, se tiene: S
40
4 y S 4 2
10
- 27 -
(X
i 1
S2
X) 2
(23)
n -1
S2
f (X
i
i 1
X) 2
(24)
S2
X
i 1
2
i
(25)
X2
2) Sean X1, X2,. . . , Xn y Y1, Y2,. . . , Yn dos sucesiones de nmeros relacionados entre s por:
Yi a bX i . Entonces, S Y bS X .
3) Si Y a bX , entonces S Y b S X .
4) Si Y bX , entonces S Y b S X .
5) Si Y a X , entonces S Y S X .
6) Como W X Y y si W X Y , entonces:
S 2W S 2X S 2Y 2Cov(X, Y)
(26)
donde,
n
Cov(X, Y)
5.3.4
(X
i 1
X)(Yi Y)
(27)
Q 3 Q1
2
(28)
Definicin 5.15 El Rango entre Percentiles 10-90 se toma como igual a la diferencia entre el
percentil 90% y el percentil 10%.
P10 90 P 90 P10
(29)
5.4.1
Coeficiente de Variacin
S
100%
X
(30)
X
S
CV
5.4.2
Grupo1
3.8
0.5
13.20%
Grupo2
4.5
0.5
11.10%
Valores Estandarizados
Con el propsito de reducir los datos a un mismo punto de referencia y a una escala comn, se
realiza entre ellos una transformacin llamada Estandarizacin, que consiste en lo siguiente:
A cada dato Xi se le resta la media X , se divide entre la desviacin estndar S y se obtiene un
nmero Zi que se llama el valor estandarizado de Xi. Esto es,
Zi
Xi X
S
(31)
Ejemplo 5.8 Un estudiante obtuvo una nota definitiva en la asignatura de estadstica de 3.8, el
promedio del curso fue 4.0 con una desviacin estndar de 0.5. Este mismo, en contabilidad obtuvo
una nota de 4.3, el promedio del curso fue 4.5 con una desviacin estndar de 0.8. En qu
asignatura obtuvo un puesto realmente mejor?
Estadstica
Contabilidad
5.4.3
3.8 4.0
0.4
0.5
4.3 4.5
X 2 4.3 ; X 2 4.5 ; S 2 0.8 ; Z 2
0.25
0.8
X 1 3.8 ; X1 4.0 ; S1 0.5 ; Z1
Regla de Shebyshev
- 29 -
Si se tienen n observaciones X1, X2, . . . , Xn con media X y desviacin estndar S entonces, por lo
menos 1
1
100% de las observaciones que dan comprendidos entre X kS y X kS , k>1.
k2
4.2
1.9
4.9
4.8
4.4
3.6
4.7
4.1
3.9
4.4
4.6
4.5
3.9
4.2
3.5
X 4.03
4.5
4.1
3.1
4.5
3.4
2.5
4.6
4.0
4.4
4.1
4.6
4.0
S 0.66
a) k = 2
1
100% 75% de los datos quedan
22
1
0.5 ,
k2
68%
16%
16%
- El 95% de los datos (rea) quedan comprendidos entre 2 y 2
95%
2.5%
- 30 -
2.5%
0.125%
99.75%
0.125%
Ejemplo 5.10 Una fbrica de productos comestibles ha fijado el peso promedio de cierto alimento
empaquetado en 450 gramos, con una desviacin estndar de 12 gramos. La curva que representa
estos pesos tiene forma simtrica, qu proporcin de paquetes presenta:
a) ms de 462 gramos?
b) ms de 474 gramos?
c) entre 414 y 486 gramos?
Aplicando la regla de Shebyshev, se tiene
a) k 462 450 k(12) 462
presentaran un peso superior a 462 gramos.
16%
450 462
b) k 474 450 k(12) 474
presentaron un peso superior a 474 gramos
450
k2
2.5%
2 474
0.125%
- 31 99.75%
0.125%
414
450
486
Coeficiente de Sesgo
Definicin 5.17 El Coeficiente de Sesgo es un nmero que mediante su signo podemos determinar
si los datos (la curva) tienen distribucin simtrica o sesgada.
El coeficiente de sesgo para datos agrupados, se define como:
k
C.S
f (X
i 1
X) 3
nS
(32)
5.5.2
Coeficiente de Curtosis
Definicin 5.18 El Coeficiente de Curtosis es un nmero cuya magnitud nos indica si los datos se
distribuyen simtricamente de forma normal (curva mesocrtica), ms empinados que la curva
normal (curva leptocrtica) o ms aplanados que la curva normal (curva plasticrtica).
El coeficiente de curtosis para datos agrupados se define como:
k
C.C
f (X
i 1
nS
X) 4
(33)
Si C.C = 3, entonces los datos (la curva) presentan forma de una normal estandarizada.
Si C.C > 3, entonces los datos se presentan ms empinados que los de una normal
estandarizada.
Si C.C < 3, entonces los datos se presentan ms aplanados que los de la normal.
- 32 -