Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
RESOLVERAN Y ENTREGARAN COMO TRABAJO EL DIA VIERNES, DONDE TAMBIEN SE REALIZARA UN PEQUEO TALLER EN EL SALON, POR FAVOR AVISAR A TODOS SUS COMPAEROS Y DIFUNDIR EL CORREO A QUIEN NO LE LLEGUE. Definicin de estadstica La Estadstica es una disciplina que utiliza recursos matemticos para organizar y resumir una gran cantidad de datos obtenidos de la realidad, e inferir conclusiones respecto de ellos. Por ejemplo, la estadstica interviene cuando se quiere conocer el estado sanitario de un pas, a travs de ciertos parmetros como la tasa de morbilidad o mortalidad de la poblacin. En este caso la estadstica describe la muestra en trminos de datos organizados y resumidos, y luego infiere conclusiones respecto de la poblacin. Aplicada a la investigacin cientfica, tambin infiere cuando provee los medios matemticos para establecer si una hiptesis debe o no ser rechazada. La estadstica puede aplicarse a cualquier mbito de la realidad, y por ello es utilizada en fsica, qumica, biologa, medicina, astronoma, psicologa, sociologa, lingstica, demografa, etc. Poblacin y muestra Puesto que la estadstica se ocupa de una gran cantidad de datos, debe primeramente definir de cules datos se va a ocupar. El conjunto de datos de los cuales se ocupa un determinado estudio estadstico se llama poblacin. No debe confundirse la poblacin en sentido demogrfico y la poblacin en sentido estadstico. La poblacin en sentido demogrfico es un conjunto de individuos (todos los habitantes de un pas, todas las ratas de una ciudad), mientras que una poblacin en sentido estadstico es un conjunto de datos referidos a determinada caracterstica o atributo de los individuos (las edades de todos los individuos de un pas, el color de todas las ratas de una ciudad). Incluso una poblacin en sentido estadstico no tiene porqu referirse a muchos individuos. Una poblacin estadstica puede ser tambin el conjunto de calificaciones obtenidas por un individuo a lo largo de sus estudios universitarios. Los datos de la totalidad de una poblacin pueden obtenerse a travs de un censo. Sin embargo, en la mayora de los casos no es posible obtenerlos por razones de esfuerzo, tiempo y dinero, razn por la cual se extrae, de la poblacin, una muestra, mediante un procedimiento llamado muestreo. Se llama muestra a un subconjunto de la poblacin, preferiblemente representativo de la misma. Por ejemplo, si la poblacin es el conjunto de todas las edades de los estudiantes de la provincia de Buenos Aires, una muestra ser conjunto de edades de 2000 estudiantes de la provincia de Buenos Aires tomados al azar. Datos individuales y datos estadsticos Un dato individual es un dato de un solo individuo, mientras que un dato estadstico es un dato de una muestra o de una poblacin en su conjunto. Por ejemplo, la edad de Juan es un dato individual, mientras que el promedio de edades de una muestra o poblacin de personas es un dato estadstico.
Desde ya, puede ocurrir que ambos no coincidan: la edad de Juan puede ser 37 aos, y el promedio de edades de la muestra donde est includo Juan es 23 aos. Por esta razn un dato estadstico nada dice respecto de los individuos, porque solamente describe la muestra o poblacin. Los datos estadsticos que describen una muestra suelen llamarse estadsticos (por ejemplo, el promedio de ingresos mensuales de las personas de una muestra), mientras que los datos estadsticos descriptores de una poblacin suelen llamarse parmetros (por ejemplo, el promedio de ingresos mensuales de las personas de una poblacin). Estructura del dato Los datos son la materia prima con que trabaja la estadstica, del mismo modo que la madera es la materia prima con que trabaja el carpintero. As como este procesa o transforma la madera para obtener un producto til, as tambin el estadstico procesa o transforma los datos para obtener informacin til. Tanto los datos como la madera no se inventan: se extraen de la realidad; en todo caso el secreto est en recoger la madera o los datos ms adecuados a los objetivos del trabajo a realizar. De una manera general, puede definirse tcnicamente dato como una categora asignada a una variable de una unidad de anlisis. Por ejemplo, "Luis tiene 1.70 metros de estatura" es un dato, donde Luis es la unidad de anlisis, estatura es la variable, y 1.70 metros es la categora asignada. Como puede apreciarse, todo dato tienen al menos tres componentes: una unidad de anlisis, una variable y una categora. La unidad de anlisis es el elemento del cual se predica una propiedad y caracterstica. Puede ser una persona, una familia, un animal, una sustancia qumica, o un objeto como una dentadura o una mesa. La variable es la caracterstica, propiedad o atributo que se predica de la unidad de anlisis. Por ejemplo puede ser la edad para una persona, el grado de cohesin para una familia, el nivel de aprendizaje alcanzado para un animal, el peso especfico para una sustancia qumica, el nivel de salud para una dentadura, y el tamao para una mesa. Pueden entonces tambin definirse poblacin estadstica (o simplemente poblacin) como el conjunto de datos acerca de unidades de anlisis (individuos, objetos) en relacin a una misma caracterstica, propiedad o atributo (variable). Sobre una misma poblacin demogrfica pueden definirse varias poblaciones de datos, una para cada variable. Por ejemplo, en el conjunto de habitantes de un pas (poblacin demogrfica), puede definirse una poblacin referida a la variable edad (el conjunto de edades de los habitantes), a la variable ocupacin (el conjunto de ocupaciones de los habitantes), a la variable sexo (el conjunto de condiciones de sexo de los habitantes). La categora es cada una de las posibles variaciones de una variable. Categoras de la variable sexo son masculino y femenino, de la variable ocupacin pueden ser arquitecto, mdico, etc, y de la variable edad pueden ser 10 aos, 11 aos, etc. Cuando la variable se mide cuantitativamente, es decir cuando se expresa numricamente, a la categora suele llamrsela valor. En estos casos, el dato incluye tambin una unidad de medida, como por ejemplo aos, cantidad de hijos, grados de temperatura, cantidad de piezas dentarias, centmetros, etc. El valor es, entonces, cada una de las posibles variaciones de una variable cuantitativa
La medicin Los datos se obtienen a travs un proceso llamado medicin. Desde este punto de vista, puede definirse medicin como el proceso por el cual asignamos una categora (o un valor) a una variable, para determinada unidad de anlisis. Ejemplo: cuando decimos que Martn es varn, estamos haciendo una medicin, porque estamos asignando una categora (varn) a una variable (sexo) para una unidad de anlisis (Martn). Se pueden hacer mediciones con mayor o menor grado de precisin. Cuanto ms precisa sea la medicin, ms informacin nos suministra sobre la variable y, por tanto, sobre la unidad de anlisis. No es lo mismo decir que una persona es alta, a decir que mide 1,83 metros. Los diferentes grados de precisin o de contenido informativo de una medicin se suelen caracterizar como niveles de medicin. Tpicamente se definen cuatro niveles de medicin, y en cada uno de ellos la obtencin del dato o resultado de la medicin ser diferente: Ejemplos de datos en diferentes niveles de medicin Ejemplos de datos en diferentes niveles de medicin Nivel de medicin Nivel nominal Nivel ordinal Nivel cuantitativo discreto Juan tiene 32 dientes Nivel cuantitativo continuo Mara tiene 70 pulsaciones por minuto Mara
DATO
Martn es electricista
Elena
Juan
Nivel de instruccin Cantidad de piezas Frecuencia cardaca dentarias Secundaria completa 32 -----------Diente 70 Pulsaciones por minuto
En el nivel nominal, medir significa simplemente asignar un atributo a una unidad de anlisis (Martn es electricista). En el nivel ordinal, medir significa asignar un atributo a una unidad de anlisis cuyas categoras pueden ser ordenadas en una serie creciente o decreciente (la categora secundaria completa puede ordenarse en una serie, pues est entre secundaria incompleta y universitaria incompleta). En el nivel cuantitativo, medir significa adems asignar un atributo a una unidad de anlisis de modo tal que la categora asignada permita saber cunto mayor o menor es respecto de otra categora, es decir, especifica la distancia o intervalo entre categoras (la categora 70 es el doble de la categora 35). Las variables medibles en el nivel cuantitativo pueden ser discretas o continuas.
Una variable discreta es aquella en la cual, dados dos valores consecutivos, no puede adoptar ningn valor intermedio (por ejemplo entre 32 y 33 dientes, no puede hablarse de 32.5 dientes). En cambio, una variable es continua cuando, dados dos valores consecutivos, la variable puede adoptar muchos valores intermedios (por ejemplo entre 1 y 2 metros, puede haber muchas longitudes posibles). Clasificaciones de la estadstica Existen varias formas de clasificar los estudios estadsticos. 1) Segn la etapa.- Hay una estadstica descriptiva y una estadstica inferencial. La primera etapa se ocupa de describir la muestra, y la segunda etapa infiere conclusiones a partir de los datos que describen la muestra (por ejemplo con respecto a la poblacin). 2) Segn el tiempo considerado.- Dentro de la estadstica descriptiva se distingue la estadstica esttica o estructural, que describe la poblacin en un momento dado (por ejemplo la tasa de nacimientos en determinado censo), y la estadstica dinmica o evolutiva, que describe como va cambiando la poblacin en el tiempo (por ejemplo el aumento anual en la tasa de nacimientos). 3) Segn la cantidad de variables estudiada.- Desde este punto de vista hay una estadstica univariada (estudia una sola variable, como por ejemplo la inteligencia, en una muestra), una estadstica bivariada (estudia como estn relacionadas dos variables, como por ejemplo inteligencia y alimentacin), y una estadstica multivariada (que estudia tres o ms variables, como por ejemplo como estn relacionados el sexo, la edad y la alimentacin con la inteligencia).
Definicin de Estadstica
La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones. Un estudio estadstico consta de las siguientes fases: Recogida de datos. Organizacin y representacin de datos. Anlisis de datos. Obtencin de conclusiones.
Conceptos de Estadstica
Poblacin Una poblacin es el conjunto de todos los elementos a los que se somete a un estudio estadstico. Individuo Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin. Muestra Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.
Muestreo El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin. Valor Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz. Dato Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz. Definicin de variable Una variable estadstica es cada una de las caractersticas o cualidades que poseen los individuos de una poblacin.
Variable discreta Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos. Por ejemplo: El nmero de hermanos de 5 amigos: 2, 1, 0, 1, 3.
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros. Por ejemplo: La altura de los 5 amigos: 1.73, 1.82, 1.77, 1.69, 1.75. En la prctica medimos la altura con dos decimales, pero tambin se podra dar con tres decimales.
Distribucin de frecuencias
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Tipos de frecuencias
Frecuencia absoluta La frecuencia absoluta es el nmero de veces que aparece un determinado valor en un estudio estadstico. Se representa por fi. La suma de las frecuencias absolutas es igual al nmero total de datos, que se representa por N. Para indicar resumidamente estas sumas se utiliza la letra griega (sigma mayscula) que se lee suma o sumatoria. Frecuencia relativa La frecuencia relativa es el cociente entre la frecuencia absoluta de un determinado valor y el nmero total de datos. Se puede expresar en tantos por ciento y se representa por ni. La suma de las frecuencias relativas es igual a 1. Frecuencia acumulada La frecuencia acumulada es la suma de las frecuencias absolutas de todos los valores inferiores o iguales al valor considerado. Se representa por Fi. Frecuencia relativa acumulada La frecuencia relativa acumulada es el cociente entre la frecuencia acumulada de un determinado
valor y el nmero total de datos. Se puede expresar en tantos por ciento. Ejemplo Durante el mes de julio, en una ciudad se han registrado las siguientes temperaturas mximas: 32, 31, 28, 29, 33, 32, 31, 30, 31, 31, 27, 28, 29, 30, 32, 31, 31, 30, 30, 29, 29, 30, 30, 31, 30, 31, 34, 33, 33, 29, 29. En la primera columna de la tabla colocamos la variable ordenada de menor a mayor, en la segunda hacemos el recuento y en la tercera anotamos la frecuencia absoluta. xi 27 28 29 30 31 32 33 34 III III I I II Recuento 1 2 6 7 8 3 3 1 31 fi Fi 1 3 9 16 24 27 30 31 ni 0.032 0.065 0.194 0.226 0.258 0.097 0.097 0.032 1 Ni 0.032 0.097 0.290 0.516 0.774 0.871 0.968 1
Marca de clase La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo el intervalo para el clculo de algunos parmetros.
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto. Se representan sobre unos ejes de coordenadas, en el eje de abscisas se colocan los valores de la variable, y sobre el eje de ordenadas las frecuencias absolutas o relativas o acumuladas.
Los datos se representan mediante barras de una altura proporcional a la frecuencia. Ejemplo Un estudio hecho al conjunto de los 20 alumnos de una clase para determinar su grupo sanguneo ha dado el siguiente resultado: Grupo sanguneo A B AB 0
fi 6 4 1 9 20
Polgonos de frecuencia
Un polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos. Ejemplo Las temperaturas en un da de otoo de una ciudad han sufrido las siguientes variaciones: Hora 6 9 12 15 18 21 24 Temperatura 7 12 14 11 12 10 8
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente. El diagrama circular se construye con la ayuda de un transportador de ngulos. Ejemplo En una clase de 30 alumnos, 12 juegan a baloncesto, 3 practican la natacin, 4 juegan al ftbol y el resto no practica ningn deporte.
Un histograma es una representacin grfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo. La superficie de cada barra es proporcional a la frecuencia de los valores representados.
Polgono de frecuencia
Para construir el polgono de frecuencia se toma la marca de clase que coincide con el punto medio de cada rectngulo. Ejemplo El peso de 65 personas adultas viene dado por la siguiente tabla: ci [50, 60) 55 8 fi 8 Fi
[60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120)
65 75 85 95 110 115
10 16 14 10 5 2 65
18 34 48 58 63 65
[9, 10)
3 50
Definicin de parmetro estadstico Un parmetro estadstico es un nmero que se obtiene a partir de los datos de una distribucin estadstica. Los parmetros estadsticos sirven para sintetizar la informacin dada por una tabla o por una grfica.
Medidas de centralizacin
Nos indican en torno a qu valor (centro) se distribuyen los datos. La medidas de centralizacin son: Media aritmtica La media es el valor promedio de la distribucin. Mediana La mediana es la puntacin de la escala que separa la mitad superior de la distribucin y la inferior, es decir divide la serie de datos en dos partes iguales. Moda La moda es el valor que ms se repite en una distribucin.
Medidas de posicin
Las medidas de posicin dividen un conjunto de datos en grupos con el mismo nmero de individuos. Para calcular las medidas de posicin es necesario que los datos estn ordenados de menor a mayor.
La medidas de posicin son: Cuartiles Los cuartiles dividen la serie de datos en cuatro partes iguales. Deciles Los deciles dividen la serie de datos en diez partes iguales. Percentiles Los percentiles dividen la serie de datos en cien partes iguales.
Medidas de dispersin
Las medidas de dispersin nos informan sobre cuanto se alejan del centro los valores de la distribucin. Las medidas de dispersin son: Rango o recorrido El rango es la diferencia entre el mayor y el menor de los datos de una distribucin estadstica. Desviacin media La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. Varianza La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media. Desviacin tpica La desviacin tpica es la raz cuadrada de la varianza. Definicin de moda La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo. Se puede hallar la moda para variables cualitativas y cuantitativas. Hallar la moda de la distribucin: 2, 3, 3, 4, 4, 4, 5, 5 Mo= 4 Si en un grupo hay dos o varias puntuaciones con la misma frecuencia y esa frecuencia es la mxima, la distribucin es bimodal o multimodal, es decir, tiene varias modas.
1, 1, 1, 4, 4, 5, 5, 5, 7, 8, 9, 9, 9Mo= 1, 5, 9 Cuando todas las puntuaciones de un grupo tienen la misma frecuencia, no hay moda. 2, 2, 3, 3, 6, 6, 9, 9 Si dos puntuaciones adyacentes tienen la frecuencia mxima, la moda es el promedio de las dos puntuaciones adyacentes. 0, 1, 3, 3, 5, 5, 7, 8Mo = 4
Ejemplo Calcular la moda de una distribucin estadstica que viene dada por la siguiente tabla: fi [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) 5 18 42 27 8 100
2 Los intervalos tienen amplitudes distintas. En primer lugar tenemos que hallar las alturas. La clase modal es la que tiene mayor altura.
Ejemplo En la siguiente tabla se muestra las calificaciones (suspenso, aprobado, notable y sobresaliente) obtenidas por un grupo de 50 alumnos. Calcular la moda. fi [0, 5) [5, 7) [7, 9) [9, 10) 15 20 12 3 50 3 10 6 3 hi
Definicin de mediana Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 2, 3, 4, 4, 5, 5, 5, 6, 6Me= 5 3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales. 7, 8, 9, 10, 11, 12Me= 9.5
suma de las frecuencias absolutas. Es decir tenemos que buscar el intervalo en el que se encuentre . Li es el lmite inferior de la clase donde se encuentra la mediana. es la semisuma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase mediana. ai es la amplitud de la clase. La mediana es independiente de las amplitudes de los intervalos. Ejemplo Calcular la mediana de una distribucin estadstica que viene dada por la siguiente tabla: fi [60, 63) [63, 66) [66, 69) [69, 72) [72, 75) 100/2 = 50 Clase de la mediana: [66, 69) 5 18 42 27 8 100 5 23 65 92 100 Fi
Definicin de media aritmtica La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos. es el smbolo de la media aritmtica. Ejemplo Los pesos de seis amigos son: 84, 91, 72, 68, 87 y 78 kg. Hallar el peso medio.
Ejercicio de media aritmtica En un test realizado a un grupo de 42 personas se han obtenido las puntuaciones que muestra la tabla. Calcula la puntuacin media. xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60 [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi 15 200 350 405 440 260 150 1 820 xi fi
65 kg, 69kg , 65 kg, 72 kg, 66 kg, 75 kg, 70 kg, 110 kg. La media es igual a 74 kg, que es una medida de centralizacin poco representativa de la distribucin. 4. La media no se puede calcular si hay un intervalo con una amplitud indeterminada. xi [60, 63) [63, 66) [66, 69) [69, 72) [72, ) 61.5 64.5 67.5 70.5 5 18 42 27 8 100 En este caso no es posible hallar la media porque no podemos calcular la marca de clase de ltimo intervalo. Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana. fi
Li es el lmite inferior de la clase donde se encuentra el cuartil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase del cuartil. ai es la amplitud de la clase. Ejercicio de cuartiles Calcular los cuartiles de la distribucin de la tabla: Fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65 Clculo del primer cuartil 8 18 34 48 58 63 65 Fi
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos. D5 coincide con la mediana.
Li es el lmite inferior de la clase donde se encuentra el decil. N es la suma de las frecuencias absolutas. Fi-1 es la frecuencia acumulada anterior a la clase el decil.. ai es la amplitud de la clase. Ejercicio de deciles Calcular los deciles de la distribucin de la tabla: fi [50, 60) [60, 70) [70, 80) [80, 90) [90, 100) [100, 110) [110, 120) 8 10 16 14 10 5 2 65 Clculo del primer decil 8 18 34 48 58 63 65 Fi
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos. P50 coincide con la mediana.
65 Percentil 35
Percentil 60
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por
[10, 15) [15, 20) [20, 25) [25, 30) [30, 35)
3 5 7 4 2 21
La varianza es la media aritmtica del cuadrado de las desviaciones respecto a la media de una distribucin estadstica. La varianza se representa por .
Para simplificar el clculo de la varianza vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Calcular la varianza de la distribucin de la tabla: xi [10, 20) [20, 30) [30,40) 15 25 35 1 8 10 fi xi fi 15 200 350 xi2 fi 225 5000 12 250
45 55 65 75
9 8 4 2 42
Propiedades de la varianza
1 La varianza ser siempre un valor positivo o cero, en el caso de que las puntuaciones sean iguales. 2 Si a todos los valores de la variable se les suma un nmero la varianza no vara. 3 Si todos los valores de la variable se multiplican por un nmero la varianza queda multiplicada por el cuadrado de dicho nmero. 4 Si tenemos varias distribuciones con la misma media y conocemos sus respectivas varianzas se puede calcular la varianza total. Si todas las muestras tienen el mismo tamao: Si las muestras tienen distinto tamao:
La desviacin tpica es la raz cuadrada de la varianza. Es decir, la raz cuadrada de la media de los cuadrados de las puntuaciones de desviacin. La desviacin tpica se representa por .
Desviacin tpica para datos agrupados Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Ejercicios de desviacin tpica Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la desviacin tpica de la distribucin de la tabla: xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60) [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050
Desviacin tpica para datos agrupados Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Ejercicios de desviacin tpica Calcular la desviacin tpica de la distribucin: 9, 3, 8, 8, 9, 8, 9, 18 Calcular la desviacin tpica de la distribucin de la tabla: xi [10, 20) [20, 30) [30,40) [40, 50) [50, 60) [60,70) [70, 80) 15 25 35 45 55 65 75 1 8 10 9 8 4 2 42 fi xi fi 15 200 350 405 440 260 150 1 820 xi2 fi 225 5000 12 250 18 225 24 200 16 900 11 250 88 050
Coeficiente de variacin
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media. El coeficiente de variacin se suele expresar en porcentajes: El coeficiente de variacin permite comparar las dispersiones de dos distribuciones distintas, siempre que sus medias sean positivas. Se calcula para cada una de las distribuciones y los valores que se obtienen se comparan entre s. La mayor dispersin corresponder al valor del coeficiente de variacin mayor. Ejercicio Una distribucin tiene x = 140 y = 28.28 y otra x = 150 y = 25. Cul de las dos presenta mayor dispersin? La primera distribucin presenta mayor dispersin.
Puntuaciones tpicas
Puntuaciones diferenciales
Las puntuaciones diferenciales resultan de restarles a las puntuaciones directas la media aritmtica. xi = Xi X
Puntuaciones tpicas
Las puntuaciones tpicas son el resultado de dividir las puntuaciones diferenciales entre la desviacin tpica. Este proceso se llama tipificacin. Las puntuaciones tpicas se representan por z.
Observaciones sobre puntuaciones tpicas La media aritmtica de las puntuaciones tpicas es 0. La desviacin tpica de las puntuaciones tpicas es 1. Las puntuaciones tpicas son adimensionales, es decir, son independientes de las unidades utilizadas. Las puntuaciones tpicas se utilizan para comparar las puntuaciones obtenidas en distintas distribuciones.
Ejemplo En una clase hay 15 alumnos y 20 alumnas. El peso medio de los alumnos es 58.2 kg y el de las alumnas y 54.4 kg. Las desviaciones tpicas de los dos grupos son, respectivamente, 3.1 kg y 5.1 kg. El peso de Jos es de 70 kg y el de Ana es 65 kg. Cul de ellos puede, dentro del grupo de alumnos de su sexo, considerarse ms grueso? Jos es ms grueso respecto de su grupo que Ana respecto al suyo.
Definicin de Estadstica La Estadstica trata del recuento, ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer comparaciones y sacar conclusiones.
Individuo
Un individuo o unidad estadstica es cada uno de los elementos que componen la poblacin.
Muestra
Una muestra es un conjunto representativo de la poblacin de referencia, el nmero de individuos de una muestra es menor que el de la poblacin.
Muestreo
El muestreo es la reunin de datos que se desea estudiar, obtenidos de una proporcin reducida y representativa de la poblacin.
Valor
Un valor es cada uno de los distintos resultados que se pueden obtener en un estudio estadstico. Si
lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato
Un dato es cada uno de los valores que se ha obtenido al realizar un estudio estadstico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.
Variables estadsticas
Variable cualitativa
Las variables cualitativas se refieren a caractersticas o cualidades que no pueden ser medidas con nmeros. Podemos distinguir dos tipos:
Variable cuantitativa
Una variable cuantitativa es la que se expresa mediante un nmero, por tanto se pueden realizar operaciones aritmticas con ella. Podemos distinguir dos tipos:
Variable discreta
Una variable discreta es aquella que toma valores aislados, es decir no admite valores intermedios entre dos valores especficos.
Variable continua
Una variable continua es aquella que puede tomar valores comprendidos entre dos nmeros.
Distribucin de frecuencias
La distribucin de frecuencias o tabla de frecuencias es una ordenacin en forma de tabla de los datos estadsticos, asignando a cada dato su frecuencia correspondiente.
Diagrama de barras
Un diagrama de barras se utiliza para de presentar datos cualitativos o datos cuantitativos de tipo discreto.
Polgonos de frecuencias
Un polgono de frecuencias se forma uniendo los extremos de las barras mediante segmentos. Tambin se puede realizar trazando los puntos que representan las frecuencias y unindolos mediante segmentos.
Diagrama de sectores
Un diagrama de sectores se puede utilizar para todo tipo de variables, pero se usa frecuentemente para las variables cualitativas. Los datos se representan en un crculo, de modo que el ngulo de cada sector es proporcional a la frecuencia absoluta correspondiente.
Histograma
Un histograma es una representacin grfica de una variable en forma de barras. Se utilizan para variables continuas o para variables discretas, con un gran nmero de datos, y que se han agrupado en clases. En el eje abscisas se construyen unos rectngulos que tienen por base la amplitud del intervalo, y por altura, la frecuencia absoluta de cada intervalo.
Mediana
Es el valor que ocupa el lugar central de todos los datos cuando stos estn ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar slo para variables cuantitativas.
Clculo de la mediana
1 Ordenamos los datos de menor a mayor. 2 Si la serie tiene un nmero impar de medidas la mediana es la puntuacin central de la misma. 3 Si la serie tiene un nmero par de puntuaciones la mediana es la media entre las dos puntuaciones centrales.
Media aritmtica
La media aritmtica es el valor obtenido al sumar todos los datos y dividir el resultado entre el nmero total de datos. es el smbolo de la media aritmtica.
Medidas de posicin
Cuartiles
Los cuartiles son los tres valores de la variable dividen a un conjunto de datos ordenados en cuatro partes iguales. Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos.
Deciles
Los deciles son los nueve valores que dividen la serie de datos en diez partes iguales. Los deciles dan los valores correspondientes al 10%, al 20%... y al 90% de los datos.
Percentiles
Los percentiles son los 99 valores que dividen la serie de datos en 100 partes iguales. Los percentiles dan los valores correspondientes al 1%, al 2%... y al 99% de los datos.
Medidas de dispersin
Desviacin media
La desviacin media es la media aritmtica de los valores absolutos de las desviaciones respecto a la media. La desviacin media se representa por
Desviacin media para datos agrupados Si los datos vienen agrupados en una tabla de frecuencias, la expresin de la desviacin media es:
Varianza
La desviacin tpica es la raz cuadrada de la varianza. La desviacin tpica se representa por .
Desviacin tpica para datos agrupados Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Desviacin tpica
La desviacin tpica es la raz cuadrada de la varianza.
Desviacin tpica para datos agrupados Para simplificar el clculo vamos o utilizar las siguientes expresiones que son equivalentes a las anteriores.
Coeficiente de variacin
El coeficiente de variacin es la relacin entre la desviacin tpica de una muestra y su media.
Puntuaciones tpicas
Las puntuaciones tpicas son el resultado de dividir las puntuaciones diferenciales entre la desviacin tpica. Este proceso se llama tipificacin.
3. Clasificar las siguientes variables en cualitativas y cuantitativas discretas o continuas. 1 La nacionalidad de una persona. 2 Nmero de litros de agua contenidos en un depsito. 3 Nmero de libros en un estante de librera. 4 Suma de puntos tenidos en el lanzamiento de un par de dados. 5 La profesin de una persona. 6 El rea de las distintas baldosas de un edificio. 4. Las puntuaciones obtenidas por un grupo en una prueba han sido: 15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13. Construir la tabla de distribucin de frecuencias y dibuja el polgono de frecuencias. 5. El nmero de estrellas de los hoteles de una ciudad viene dado por la siguiente serie: 3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1. Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras. 6. Las calificaciones de 50 alumnos en Matemticas han sido las siguientes: 5, 2, 4, 9, 7, 4, 5, 6, 5, 7, 7, 5, 5, 2, 10, 5, 6, 5, 4, 5, 8, 8, 4, 0, 8, 4, 8, 6, 6, 3, 6, 7, 6, 6, 7, 6, 7, 3, 5, 6, 9, 6, 1, 4, 6, 3, 5, 5, 6, 7. Construir la tabla de distribucin de frecuencias y dibuja el diagrama de barras. 7. Los pesos de los 65 empleados de una fbrica vienen dados por la siguiente tabla: Peso fi [50, 60) 8 [60, 70) 10 [70, 80) 16 [80,90) 14 [90, 100) 10 [100, 110) 5 [110, 120) 2
1 Construir la tabla de frecuencias. 2 Representar el histograma y el polgono de frecuencias. 8. Los 40 alumnos de una clase han obtenido las siguientes puntuaciones, sobre 50, en un examen de Fsica. 3, 15, 24, 28, 33, 35, 38, 42, 23, 38, 36, 34, 29, 25, 17, 7, 34, 36, 39, 44, 31, 26, 20, 11, 13, 22, 27, 47, 39, 37, 34, 32, 35, 28, 38, 41, 48, 15, 32, 13. 1 Construir la tabla de frecuencias. 2 Dibujar el histograma y el polgono de frecuencias. 9. Sea una distribucin estadstica que viene dada por la siguiente tabla: xi fi 61 5 64 18 67 42 70 27 73 8
Calcular: 1 La moda, mediana y media. 2 El rango, desviacin media, varianza y desviacin tpica.
10.Calcular la media, la mediana y la moda de la siguiente serie de nmeros: 5, 3, 6, 5, 4, 5, 2, 8, 6, 5, 4, 8, 3, 4, 5, 4, 8, 2, 5, 4. 11 Hallar la varianza y la desviacin tpica de la siguiente serie de datos: 12, 6, 7, 3, 15, 10, 18, 5. 12 Hallar la media, mediana y moda de la siguiente serie de nmeros: 3, 5, 2, 6, 5, 9, 5, 2, 8, 6. 13. Hallar la desviacin media, la varianza y la desviacin tpica de la series de nmeros siguientes: 2, 3, 6, 8, 11. 12, 6, 7, 3, 15, 10, 18, 5. 14 Se ha aplicado un test a los empleados de una fbrica, obtenindose la siguiente tabla: fi [38, 44) [44, 50) [50, 56) [56, 62) [62, 68) [68, 74) [74, 80) 7 8 15 25 18 9 6
Dibujar el histograma y el polgono de frecuencias acumuladas. 15. Dadas las series estadsticas: 3, 5, 2, 7, 6, 4, 9. 3, 5, 2, 7, 6, 4, 9, 1. Calcular: La moda, la mediana y la media. La desviacin media, la varianza y la desviacin tpica. Los cuartiles 1 y 3. Los deciles 2 y 7. Los percentiles 32 y 85. 16. Una distribucin estadstica viene dada por la siguiente tabla: [10, 15) fi 3 [15, 20) 5 [20, 25) 7 [25, 30) 4 [30, 35) 2
Hallar:
La moda, mediana y media. El rango, desviacin media y varianza. Los cuartiles 1 y 3. Los deciles 3 y 6. Los percentiles 30 y 70. 17. Dada la distribucin estadstica: [0, 5) fi 3 [5, 10) 5 [10, 15) 7 [15, 20) 8 [20, 25) 2 [25, ) 6
Calcular: La mediana y moda. Cuartil 2 y 3. Media. 1. A un conjunto de 5 nmeros cuya media es 7.31 se le aaden los nmeros 4.47 y 10.15. Cul es la media del nuevo conjunto de nmeros? 2. Un dentista observa el nmero de caries en cada uno de los 100 nios de cierto colegio. La informacin obtenida aparece resumida en la siguiente tabla: N de caries 0 1 2 3 4 fi 25 20 x 15 y ni 0.25 0.2 z 0.15 0.05
1. Completar la tabla obteniendo los valores de x, y, z. 2. Hacer un diagrama de sectores. 3. Calcular el nmero medio de caries. 3. Se tiene el siguiente conjunto de 26 datos: 10, 13, 4, 7, 8, 11 10, 16, 18, 12, 3, 6, 9, 9, 4, 13, 20, 7, 5, 10, 17, 10, 16, 14, 8, 18 Obtener su mediana y cuartiles. 4. Un pediatra obtuvo la siguiente tabla sobre los meses de edad de 50 nios de su consulta en el momento de andar por primera vez: Meses Nios
9 10 11 12 13 14 15
1 4 9 16 11 8 1
1. Dibujar el polgono de frecuencias. 2. Calcular la moda, la mediana, la media y la varianza. 5. Completar los datos que faltan en la siguiente tabla estadstica: xi 1 2 3 4 5 6 7 8 Calcular la media, mediana y moda de esta distribucin. 6. Considrense los siguientes datos: 3, 8, 4, 10, 6, 2. Se pide: 1. Calcular su media y su varianza. 2. Si los todos los datos anteriores los multiplicamos por 3, cal ser la nueva media y desviacin tpica. 7. El resultado de lanzar dos dados 120 veces viene dado por la tabla: Sumas Veces 2 3 3 8 4 9 5 11 6 20 7 19 8 16 9 13 10 11 11 6 12 4 7 7 5 28 38 45 fi 4 4 16 0.16 0.14 Fi ni 0.08
1. Calcular la media y la desviacin tpica. 2. Hallar el porcentaje de valores comprendidos en el intervalo (x , x + ). 8. Las alturas de los jugadores de un equipo de baloncesto vienen dadas por la tabla: Altura [170, 175) [175, 180) [180, 185) [185, 190) [190, 195) [195, 2.00)
4. Cuntos jugadores se encuentran por encima de la media ms una desviacin tpica? 9. Los resultados al lanzar un dado 200 veces vienen dados por la siguiente tabla: 1 fi a 2 32 3 35 4 33 5 b 6 35
Determinar a y b sabiendo que la puntuacin media es 3.6. 10. El histograma de la distribucin correspondiente al peso de 100 alumnos de Bachillerato es el siguiente: 1. Formar la tabla de la distribucin. 2. Si Andrs pesa 72 kg, cuntos alumnos hay menos pesados que l? 3. Calcular la moda. 4. Hallar la mediana. 5. A partir de que valores se encuentran el 25% de los alumnos ms pesados? 11. De esta distribucin de frecuencias absolutas acumuladas, calcular: Edad [0, 2) [2, 4) [4, 6) [6, 8) [8, 10) Fi 4 11 24 34 40
1. Media aritmtica y desviacin tpica. 2. Entre qu valores se encuentran las 10 edades centrales? 3. Representar el polgono de frecuencias absolutas acumuladas. 12. Una persona A mide 1.75 m y reside en una ciudad donde la estatura media es de 1.60 m y la desviacin tpica es de 20 cm. Otra persona B mide 1.80 m y vive en una ciudad donde la estatura media es de 1.70 m y la desviacin tpica es de 15 cm. Cul de las dos ser ms alta respecto a sus conciudadanos? 13. Un profesor ha realizado dos tests a un grupo de 40 alumnos, obteniendo los siguientes resultados: para el primer test la media es 6 y la desviacin tpica 1.5.
Para el segundo test la media es 4 y la desviacin tpica 0.5. Un alumno obtiene un 6 en el primero y un 5 en el segundo. En relacin con el grupo, en cul de los dos tests obtuvo mejor puntuacin? 14 La asistencia de espectadores a las 4 salas de un cine un determinado da fue de 200, 500, 300 y 1000 personas. 1. Calcular la dispersin del nmero de asistentes. 2. Calcular el coeficiente de variacin. 3. Si el da del espectador acuden 50 personas ms a cada sala, qu efecto tendra sobre la dispersin?