CONCEPTOS PRELIMINARES Y MEDIDAS DE TENDENCIA CENTRAL
inductiva. Este curso se dedica a la Estadstica Descriptiva, por lo que se hace
necesario dar a conocer, en trminos generales, en qu consiste la Inferencia Estadstica. La Inferencia Estadstica comprende en un todo articulado el mtodo y las tcnicas necesarias para explicar el comportamiento de un grupo de datos en un nivel superior de lo que estos datos pueden dar a conocer por s mismos. Es decir, se puede concluir sobre el grupo de datos sobrepasando los lmites del conocimiento inicial que estos suministran, examinando solamente una parte de la poblacin denominada muestra. Es por ello que a la Inferencia Estadstica tambin se le conoce como Estadstica Analtica. Si esto es as, qu le corresponde entonces a la Estadstica Descriptiva? Esta tiene por fin elevar los aspectos caractersticos del grupo de datos pero sin intentar obtener ms conocimiento del que pueda adquirirse por s mismos. Es por ello que la Estadstica Descriptiva es el punto de partida del anlisis de un grupo de datos que involucran una cierta complejidad, o bien puede ser el todo de un anlisis bsico y limitado del grupo de datos. 1.1.2. LECCIN 2. CONCEPTOS BSICOS Poblacin es el conjunto de medidas, individuos u objetos que comparten una caracterstica en comn. La poblacin se basa en cuatro caractersticas: contenido, tipo de unidades y elementos, ubicacin espacial y ubicacin temporal. De la poblacin es extrada la muestra.. Muestra es un conjunto de elementos extrados de la poblacin. Los resultados obtenidos en la muestra sirven para estimar los resultados que se obtendran con el estudio completo de la poblacin. Para que los resultados de la muestra puedan generalizarse a la poblacin, es necesario que la muestra sea seleccionada adecuadamente, es decir, de modo que cualquiera de los elementos de la poblacin tengan la misma posibilidad de ser seleccionados. A este tipo de muestra se le denomina muestra aleatoria. La unidad estadstica es el elemento de la poblacin que reporta la informacin y sobre el cul se realiza un determinado anlisis. Los datos son todas aquellas caractersticas o valores susceptibles de ser observados, clasificados y contados. Estos pueden ser experimentales, cuando se le aplica un tratamiento especial a las unidades muestreadas; de encuesta, cuando son tomadas sin ningn tratamiento; clasificados, cuando estn UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva agrupados segn una caracterstica determinada; originales, informacin que no ha recibido ningn tratamiento estadstico; primarios, cuando son recogidos, anotados u observados por primera vez; o secundarios, cuando son recopilados por otra persona o entidad diferente al investigador. Variable es una caracterstica susceptible de tener distintos valores en los elementos de un grupo o conjunto. Si la variable tiene la capacidad de tomar cualquier valor que exista entre dos magnitudes dadas, entonces esta variable ser continua. Si por el contrario, slo puede tener un valor de entre cierta cantidad de valores dados, entonces ser discreta. Parmetro son aquellos valores que caracterizan numricamente a la poblacin como tal. El parmetro poblacional de inters es nico (media, varianza, etc.), pero una poblacin puede tener muchas caractersticas o parmetros de inters. Por el contrario, un estadstico es una magnitud correspondiente a una muestra aleatoria extrada de la poblacin, por lo que cambiando la muestra cambiar entonces el estadstico (media muestral, varianza muestral, etc.). En pocas palabras se puede decir que parmetro es a poblacin como estadstico es a muestra. Es comn designar los parmetros con letras minsculas del alfabeto griego y los estadsticos con letras de nuestro alfabeto. En la Unidad Didctica Dos, se ampliar ms estos dos conceptos. EEJJEEMMPPLLOO 22..11.. La Universidad Nacional Abierta y a Distancia UNAD desea establecer cuntos estudiantes hacen uso de la biblioteca en el CEAD de San Juan de Pasto. El coordinador zonal de biblioteca es designado para este trabajo y decide hacer la investigacin el da 14 de mayo de 2005. de estudiantes del CEAD que hacen uso de la biblioteca es la poblacin en estudio. la unidad estadstica de estudio de la poblacin. ubicacin temporal. ubicacin espacial. acceden a la biblioteca, decide entonces establecer perodos de tiempo para realizar el conteo. En otras palabras, selecciona una muestra. unidad estadstica, en este caso el objeto de medicin es cada uno de los estudiantes seleccionados de la muestra. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva
variable ser el nmero de estudiantes seleccionados de la muestra, como se puede ver, una variable discreta. e esto el coordinador selecciona los datos necesarios para el estudio, en este caso especfico slo requerir del nmero de estudiantes que acceden a la biblioteca. Sin embargo, el coordinador zonal puede adems, tomar otro tipo de datos como sexo, edad, razn por la cual visita la biblioteca, libros ms consultados, etc.
1.1.2.1 Aleatoriedad Y Representatividad de la muestra La muestra asociada a un estudio debe ser representativa y aleatoria. Representativa, pues debe estar formada por un nmero razonable de elementos y aleatoria porque debe ser escogida al azar, de tal manera que quien realiza el estudio no pueda influir en la eleccin de los individuos por encuestar. Cada elemento de la poblacin debe tener la misma oportunidad de ser seleccionado. El muestre aleatorio puede ser: 1.1.2.2 Muestra aleatoria simple Si cada posible muestra de la poblacin, del mismo tamao, tiene igual probabilidad de ser seleccionada. 1.1.2.3 Muestra Aleatoria sistemtica Cuando los elementos son seleccionados de una manera ordenada. En este caso, la poblacin se encuentra organizada por algn cdigo ya sea por fecha, hora, orden de llegada o algn otro aspecto. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva La manera en que se realiza la seleccin depende del nmero de elementos en la poblacin y el tamao de la muestra. 1.1.2.4 Muestra Aleatoria Estratificada Cuando la seleccin tiene en cuenta los diferentes grupos o estratos que conforman la poblacin. Los elementos de la muestra se seleccionan de cada grupo en forma aleatoria o por un mtodo sistemtico. Los estudios de la poblacin, basados en muestras estratificadas usualmente, tienen mayor precisin (o menor error muestral) que cuando se seleccionan por muestreo aleatorio simple. 1.1.2.5 Muestra Aleatoria de conglomerados Si para su seleccin se tiene en cuenta el siguiente procedimiento: En primer lugar, se divide la poblacin en grupos que sea conveniente para el muestreo. Luego, se selecciona una parte de los grupos al azar o por un mtodo sistemtico; por ltimo, se toman todos los elementos, o parte de ellos al azar o por un mtodo sistemtico, de los grupos seleccionados para conformar la muestra. Una muestra de conglomerados usualmente, produce un mayor error muestral que una muestra aleatoria simple del mismo tamao. Si la poblacin no tiene ninguna organizacin interna, entonces se dice que la muestra puede tomarse de forma aleatoria simple y todos los individuos de la poblacin tienen la misma probabilidad de ser seleccionados en la muestra. EEJJEEMMPPLLOO 22..22.. El comit cientfico de una reconocida multinacional de medicamentos desea promover un producto que ha sido efectivo en el tratamiento de la malaria en varios pases. Para esto dicho comit decide realizar una campaa en seis hospitales que estn ubicados en tres de las zonas colombianas donde se ha detectado la enfermedad. 1.1.2.6. Determinar: poblacin, muestra y tipo de muestreo a utilizar
UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva
y que han contrado la malaria. La muestra estar formada por los pacientes seleccionados en los seis hospitales y que adems tienen la enfermedad. la costa atlntica y la Amazona. Dado que la poblacin est dividida en tres grandes zonas, es posible seleccionar dos hospitales por zona y luego en forma aleatoria, se puede seleccionar la muestra. Por ello, la muestra ser tomada de forma estratificada.
EEJJEEMMPPLLOO 22..33.. Para mejorar el servicio a los usuarios, el director de un hospital realizar un estudio relacionado con el tipo de sangre que ellos tienen Dada la gran cantidad de pacientes a los cuales se les presta el servicio, decide encuestar a 400 de los usuarios que normalmente acuden al hospital en un mes. Determinar: poblacin, muestra y tipo de muestreo a utilizar hospital en un periodo de un mes. La muestra estar formada por los 400 usuarios encuestados.
hace que no haya una distincin especial en la poblacin, lo cual indica que no se requiere de una estratificacin. Por ello, la muestra ser tomada de forma aleatoria simple.
1.1.3. LECCIN 3. VARIABLES ESTADSTICAS Una variable es una caracterstica que va a sr estudiada en una poblacin. Una variable es estadstica, si se puede escribir como una pregunta cuyas respuestas pueden ser tabuladas o clasificadas en determinados rangos, o si pertenecen a una pregunta cuya respuesta tiene un valor correspondiente a una escala numrica. Las variables estadsticas se clasifican en cualitativas y cuantitativas UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva 1.1.3.1 VARIABLES CUALITATIVAS Una variable es cualitativa si en la caracterstica que se va a estudiar se busca conocer gustos, preferencias u opiniones, etc.; por ejemplo: tipo de sangre, gaseosa preferida, color de cabello. Una variable cualitativa es estadstica cuando es posible clasificar los datos obtenidos de la muestra en clases bien definidas, en las cuales el individuo que suministra la informacin pueda elegir una de ellas. Cuando una variable es cualitativa es necesario determinar las posibles respuestas. 1.1.3.2 VARIABLES CUANTITATIVAS Una variable es cuantitativa si la caracterstica que se va a estudiar se pude medir en una escala numrica. magnitudes dadas, entonces esta variable ser continua.
valores dados, entonces ser discreta.
1.1.3.3 ESCALA DE MEDIDA DE VARIABLES Una escala es la relacin numrica entre la longitud real y la longitud que se asigna en el plano en el cual se va a representar su grfica. Las variables cuantitativas pueden ser consideradas en diferentes escalas teniendo en cuenta las unidades asociadas a la poblacin que se encuentra en estudio. Los datos asociados a un estudio deben estar en las mismas unidades, de tal manera que sea posible asignarles una escala a todos. La notacin de una escala es de la forma 1 : n, lo cual indica que n unidades de medida estn representadas en el grfico e una sola. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva EEJJEEMMPPLLOO 33..11.. Los profesores de Educacin Fsica de un colegio medirn la estatura de los nios de secundaria en cada uno de los grados. En este caso, la variable estatura es cuantitativa y continua ya que los datos que resultan son nmeros reales; es posible considerar las mediciones en centmetros o en metros. El profesor de educacin fsica puede usar un escala de 1 : 10 en la cual cada 10 centimetros de ltura estn representados en 1 cm del grfico. Suponiendo que los estudiantes de primaria tienen alturas entre 100 cm y 140 cm la representacin grfica de la escala 1:10 es la siguiente: _ EEJJEEMMPPLLOO 33..22.. En cada una de las siguientes situaciones, identificar la variable de estudio. Determinar si es cualitativa o cuantitativa. 1. En un barrio de la ciudad se aplic una encuesta para conocer el consumo, en centmetros cbicos, del servicio de gas natural. 2. El alcalde de la ciudad quiere revisar la situacin de violencia intrafamiliar en las familias de estrato 3, 4, 5. 3. El nmero de hermanos de cada jugador del equipo de futboll. 4. En un caf gourmet, se decidi preguntar por el tipo de variedad que ms consumen sus clientes. Solucin 1. La variable es consumo de gas. Es cuantitativa y continua 2. La variable es situacin de violencia. Es cualitativa 3. La variable es nmero de hermanos. Es cuantitativa y discreta 4. La variable es variedad de caf. Es cualitativa. UNIVERSIDAD NACIONAL ABIERTA Y A DISTANCIA UNAD ESCUELA DE CIENCIAS BSICAS, TECNOLOGA E INGENIERA CONTENIDO DIDCTICO DEL CURSO: 100105 Estadstica Descriptiva 1.1.4. LECCIN 4. CARACTERIZACIN DE UNA VARIABLE CUALITATIVA Caracterizar una variable significa describir su comportamiento en la poblacin, segn algunos parmetros establecidos. De acuerdo con el tipo de variable estadstica que se desee estudiar existen distintas tcnicas para caracterizarla.
1.1.4.1 TABLAS DE FRECUENCIAS:
Una distribucin o tablas de frecuencias es un resumen de los datos en el cual, cada opcin de respuesta de la variable se relaciona con el nmero de datos correspondiente. Una tabla de frecuencias contiene:
Clases: que corresponde a opiniones, gustos, preferencias, cualidades o caractersticas.
Frecuencia: es el nmero de datos que pertenece a cada clase. La frecuencia se simboliza con f . El conteo de la frecuencia de cada clase se puede registrar mediante marcas en grupos.
Frecuencia Relativa: es el cociente entre la frecuencia y el nmero total de datos, se simboliza fr . La frecuencia relativa representa un porcentaje, que se haya multiplicando por 100 al cociente indicado de la frecuencia relativa.
Red=facebook Frecuencia= f =37 F.relativa= fr = 37/100 %=37
1.1.4.2 REPRESENTACIONES GRAFICAS: Un grfico estadstico es un resumen visual de la tabla de frecuencias. Hay varios tipos de representaciones grficas para las variables cualitativas: los diagramas de barras, los diagramas circulares, entre otros.
1.1.4.2.1 Diagramas de barras: un diagrama de barras es una representacin grfica de los datos asociados a una variable cualitativa. La grfica se realiza en sistema de coordenadas cartesianas, en el eje horizontal se representan las clases correspondientes a la variable y en eje vertical se representan las frecuencias correspondientes a cada clase. El diagrama de barras (figura 1.1) correspondiente a la variable medios de comunicacin de nuestro ejemplo es el siguiente:
1.1.4.2.2 Diagrama Circular: un diagrama circular es la representacin grfica de los datos en un crculo. El diagrama circular presenta los porcentajes correspondientes a cada clase. En un diagrama circular, la informacin correspondiente a cada clase se representa usando sectores circulares, por lo cual es necesario hallar el ngulo correspondiente a cada frecuencia
1.1.4.3 MODA La moda es el dato que tiene mayor frecuencia, es decir, el dato que mas se repite. Para el ejemplo 4.1, la moda corresponde a informarse de las noticias por medio de la televisin; es decir, si se encuesta a una persona al azar la probabilidad que se informe por las noticas es alta, ya que corresponde al 37.5% del total. Hay estudios en los cuales no existe la moda, ya que todas las clases tiene una misma frecuencia, y hay casos en los cuales existen varias modas, pues varias clases pueden tener la misma frecuencia.