Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ejercitación de
Matemáticas Marzo 16
2020
Grado:9°____ Jornada____________
Área : Matemáticas.
Localización.
Para tener éxito en el desarrollo de este tema, debemos tener en cuenta los conceptos: de Estadística
Descriptiva y la variable estadística así como así Medidas de Tendencia Central, Medidas de
Dispersión, Tablas y gráficos de frecuencias, manejo de la información,
Estadística Descriptiva
Aplicarás conceptos estadísticos: muestra, población y tipos de variables.
Caracterizaras variables cuantitativas para datos agrupados y no agrupados.
Ordenarás y organizarás la información.
Analizarás y construirás tablas y gráficos.
Determinarás medidas de tendencia central: media aritmética, moda y mediana.
Calcularás medidas de variabilidad: rango, desviación estándar y varianza.
Conocerás e interpretarás las medidas de posición: cuartiles, deciles y percentiles, rango intercuartilico.
CONTENIDO.
Introducción
En esta guía se pretende dar a conocer algunas nociones estadísticas que nos ayudarán a explorar y describir,
en un primer momento, nuestros datos.
Población y Muestras
Cuando se realiza un estudio de investigación, se pretende generalmente inferir o generalizar resultados de una
muestra a una población. Se estudia en particular a un reducido número de individuos a los que tenemos acceso
con la idea de poder generalizar los hallazgos a la población de la cual esa muestra procede. Este proceso de
inferencia se efectúa por medio de métodos estadísticos basados en la probabilidad.
La población representa el conjunto grande de individuos que deseamos estudiar y generalmente suele ser
inaccesible. Es, en definitiva, un colectivo homogéneo que reúne unas características determinadas.
La muestra es el conjunto menor de individuos (subconjunto de la población accesible y limitado sobre el que
realizamos las mediciones o el experimento con la idea de obtener conclusiones generalizables a la población). El
individuo es cada uno de los componentes de la población y la muestra. La muestra debe ser representativa de la
población y con ello queremos decir que cualquier individuo de la población en estudio debe haber tenido la misma
probabilidad de ser elegido.
Las razones para estudiar muestras en lugar de poblaciones son diversas y entre ellas podemos señalar:
d. Aumentar la calidad del estudio. Al disponer de más tiempo y recursos, las observaciones y mediciones
realizadas a un reducido número de individuos pueden ser más exactas y plurales que si las tuviésemos
que realizar a una población.
e. La selección de muestras específicas nos permitirá reducir la heterogeneidad de una población al indicar
los criterios de inclusión y/o exclusión.
Lo que estudiamos en cada individuo de la muestra son las variables (edad, sexo, peso, talla, tensión arterial
sistólica, etcétera). Los datos son los valores que toma la variable en cada caso. Lo que vamos a realizar es medir,
es decir, asignar valores a las variables incluidas en el estudio. Deberemos además concretar la escala de medida
que aplicaremos a cada variable.
Clasificaremos las variables, a grandes rasgos, en dos tipos: variables cuantitativas o variables cualitativas.
a. Variables cuantitativas. Son las variables que pueden medirse, cuantificarse o expresarse
numéricamente. Las variables cuantitativas pueden ser de dos tipos:
o Variables cuantitativas continuas, si admiten tomar cualquier valor dentro de un rango numérico
determinado (edad, peso, talla).
b. Variables cualitativas. Este tipo de variables representan una cualidad o atributo que clasifica a
cada caso en una de varias categorías. La situación más sencilla es aquella en la que se clasifica cada caso
en uno de dos grupos (hombre/mujer, enfermo/sano, fumador/no fumador). Son datos dicotómicos o
binarios. Como resulta obvio, en muchas ocasiones este tipo de clasificación no es suficiente y se requiere
de un mayor número de categorías (color de los ojos, grupo sanguíneo, profesión, etcétera).
o Escalas nominales: ésta es una forma de observar o medir en la que los datos se ajustan por
categorías que no mantienen una relación de orden entre sí (color de los ojos, sexo, profesión,
presencia o ausencia de un factor de riesgo o enfermedad, etcétera).
o Escalas ordinales: en las escalas utilizadas, existe un cierto orden o jerarquía entre las
categorías (grados de disnea, avance de un tumor, etcétera).
Estadística descriptiva
Para variables numéricas, en las que puede haber un gran número de valores observados distintos, se ha de optar
por un método de análisis distinto, respondiendo a las siguientes preguntas:
Las medidas de centralización vienen a responder a la primera pregunta. La medida más evidente que podemos
calcular para describir un conjunto de observaciones numéricas es su valor medio.
1.1 La media Aritmética o promedio, en una primera definición, es la suma de todos los valores de una variable
dividida entre el número total de datos de los que se dispone.
Como ejemplo, consideremos 10 pacientes en edades de 21 años, 32, 15, 59, 60, 61, 64, 60, 71, y 80. La media de
edad de estos sujetos será de:
Más formalmente, si nombramos por (X1, X2,...,Xn) los “n” datos que tenemos recogidos de la variable en
cuestión, el valor medio vendrá dado por:
Consultar cómo se determina la media aritmética para el caso de datos agrupados mediante intervalos.
1.2 La mediana, Es la observación equidistante de los extremos, esto es reparte la muestra en dos proporciones
iguales, o sea un 50% antes y el otro 50% después. Recordemos que los datos deben ordenarse en forma
ascendente.
La mediana del ejemplo anterior sería el valor que deja a la mitad de los datos por encima de dicho valor y a la
otra mitad por debajo. Si ordenamos los datos de mayor a menor observamos la secuencia:
Como quiera que en este ejemplo el número de observaciones es par (10 individuos), los dos valores que se
encuentran en el medio son 60 y 60. Si realizamos el cálculo del promedio de estos dos valores nos dará a su vez
60, que es el valor de la mediana. Me = ( 60 + 60 ) ÷ 2 = 60
La media es muy sensible a la variación de las puntuaciones en los extremos máximo y minino; Sin
embargo, la mediana es menos sensible a dichos cambios( no se afecta por valores extremos )
Cálculo de la mediana para datos agrupados
Lo primero que debemos hacer para poder calcular la mediana es identificar la clase mediana.
Para esto tenemos que buscar el intervalo en el que se encuentre N / 2. En este
caso N / 2 = 31 / 2 ⇒ 15,5
Ahora debemos buscar el intervalo donde la frecuencia absoluta acumulada (F i ) contenga el
valor anteriormente obtenido de 15,5., esto es aquella frecuencia absoluta acumulada que
resulta ser igual o ligeramente superior a 15,5.
Veamos:
1.3 La Moda es otra medida de tendencia central no tan usual como las anteriores, siendo éste el valor de la
variable que presenta la mayor frecuencia absoluta, esto es el valor que más se repite en la distribución de los
datos.
Ejemplo
En el ejemplo de la tabla de distribución de frecuencias de las edades en un grupo de personas
anterior, calcular la moda.
Lo primero que debemos hacer es identificar el intervalo modal:
Mo = 30 + = 30 + 3,5714 = 3, 6 años
2. Medidas de dispersión
Tal y como se adelantaba antes, otro aspecto a tener en cuenta al describir datos continuos es la dispersión o
variabilidad de los mismos. Existen distintas formas de cuantificar esa variabilidad.
2.1. La varianza (S2) de los datos en variable no agrupada es la media aritmética de los cuadrados de las
diferencias entre cada valor de la variable y la media aritmética del conjunto de datos .
Esta varianza muestral se obtiene como la suma de las de las diferencias de cuadrados de cada dato
respecto al promedio y por tanto tiene como resultado son unidades cuadradas de medida de la variable
estudiada.
Sx2=
1.2 La desviación Estándar o Desviación típica (S) en variable no agrupada es la raíz cuadrada de la
varianza. Expresa la dispersión de la distribución y se escribe en las mismas unidades de medida de la variable.
La desviación típica es la medida de dispersión más utilizada en estadística.
Aunque en muchos contextos se utiliza el término de desviación típica para referirse a ambas expresiones.
En los cálculos del ejercicio previo, la desviación típica muestral, que tiene como denominador n, el valor sería
20.678. A efectos de cálculo lo haremos como n-1 y el resultado seria 21,79.
El haber cambiado el denominador de n por n-1 está en relación al hecho de que esta segunda fórmula es una
estimación más precisa de la desviación estándar verdadera de la población y posee las propiedades que
necesitamos para realizar inferencias a la población.
Cuando se quieren señalar valores extremos en una distribución de datos, se suele utilizar El Rango o amplitud
como medida de dispersión.
1.3 La amplitud es la diferencia entre el valor mayor y el menor de la distribución, esto es,
Por ejemplo, utilizando los datos del ejemplo previo tendremos Rang= 80-15 = 65.
Como medidas de variabilidad más importantes, conviene destacar algunas características de la varianza y
desviación típica:
← Son índices que describen la variabilidad o dispersión y por tanto cuando los datos están muy alejados de
la media, el numerador de sus fórmulas será grande y la varianza y la desviación típica lo serán.
← Al aumentar el tamaño de la muestra, disminuye la varianza y la desviación típica. Para reducir a la mitad
la desviación típica, la muestra se tiene que multiplicar por 4.
← Cuando todos los datos de la distribución son iguales, la varianza y la desviación típica son iguales a 0.
← Para su cálculo se utilizan todos los datos de la distribución; por tanto, cualquier cambio de valor será
detectado.
CV de la variable peso =
CV de la variable TAS =
A la vista de los resultados, observamos que la variable peso tiene mayor dispersión.
Cuando los datos se distribuyen de forma simétrica (y ya hemos dicho que esto ocurre cuando los valores de su
media y mediana están próximos), se usan para describir esa variable su media y desviación típica. En el caso de
distribuciones asimétricas, la mediana y la amplitud son medidas más adecuadas. En este caso, se suelen utilizar
además los cuartiles y percentiles.
Los cuartiles y percentiles no son medidas de tendencia central sino medidas de posición.
3.1 El percentil ( Pi )es el valor de la variable que indica el porcentaje de una distribución que es igual o menor a
esa cifra, además divide el conjunto de los datos en 100 partes iguales.
Así, por ejemplo, el percentil 80 es el valor de la variable que es igual o deja por debajo de sí al 80% del total de
las puntuaciones, y a su vez hay un 20% de los datos por encima de tal cantidad. Por consiguiente encontraremos
los percentiles desde P1 hasta P99
3.2 Los cuartiles ( Q i ) son los valores de la variable que dejan por debajo de sí el 25%, 50% y el 75% del
total de las puntuaciones y así tenemos por tanto el primer cuartil (Q1), el segundo (Q2) y el tercer cuartil (Q3).
Ejercicios . Las presentes actividades deben enviarlas al correo email de su respectivo docente del
área , desarrollándoles durante el transcurso de esta semana .
Puedes enviarlas o entregarlas en la coordinación del Colegio, ya sea en medio físico como un taller en
hojas de examen o por la red, via email del docente.
a. Define la población.
b. Define la muestra.
c. Define la(s) variable(s) aleatoria(s).
a Comida Favorita.
b Profesión que te gusta.
c Número de goles marcados por tu equipo favorito en la última temporada.
d Número de alumnos de tu Instituto.
4 . Las puntuaciones obtenidas por un grupo de 20 estudiantes en una prueba han sido:
15, 20, 15, 18, 22, 13, 13, 16, 15, 19, 18, 15, 16, 20, 16, 15, 18, 16, 14, 13.
Construir la tabla de distribución de frecuencias en variable discreta agrupada y dibuja el gráfico más adecuado.
5 . El número de estrellas de los 38 hoteles de una ciudad viene dado por la siguiente serie:
3, 3, 4, 3, 4, 3, 1, 3, 4, 3, 3, 3, 2, 1, 3, 3, 3, 2, 3, 2, 2, 3, 3, 3, 2, 2, 2, 2, 2, 3, 2, 1, 1, 1, 2, 2, 4, 1.
Construir la tabla de distribución de frecuencias para la variable discreta agrupada y dibuja el gráfico más
adecuado.
7 . Los pesos en kilogramos de los 65 empleados de una fábrica vienen dados por la siguiente tabla:
Peso [50, 60) [60, 70) [70, 80) [80,90) [90, 100) [100, 110) [110, 120)
fi 8 10 16 14 10 5 2
a . Construir la t a b l a d e f r e c u e n c i a s m e d i a n t e v a r i a b l e a g r u p a d a e n i n t e r v a l o s .
b . Dibujar el h i s t o g r a m a y el p o l í g o n o d e f r e c u e n c i a s .
9 . Sea una distribución con variable discreta agrupada que viene dada por la siguiente tabla:
xi 61 64 67 70 73
fi 5 18 42 27 8
Calcular e interpretar:
a . La m o d a , m e d i a n a y m e d i a . Qué clase de simetría existe en la distribución?
b . El r a n g o , v a r i a n z a y d e s v i a c i ó n t í p i c a .
Sumas 2 3 4 5 6 7 8 9 10 11 12
Veces 3 8 9 11 20 19 16 13 11 6 4
Calcular la m e d i a y la d e s v i a c i ó n E s t á n d a r .
Edad Fi
[0, 2) 4
[2, 4) 11
[4, 6) 24
[6, 8) 34
[8, 10) 40
https://youtu.be/YqUU3R4mJM8
https://youtu.be/YqUU3R4mJM8
https://youtu.be/sND6SLtsrTQ
https://www.youtube.com/watch?v=fzPBAp14R98
DOCENTES RESPONSABLES