Sei sulla pagina 1di 13

Materia: Estadística Descriptiva Aplicada

Obtención de medidas de tendencia central


y medidas de dispersión

Rev. 0
INTRODUCCION; CUALES SON LOS OBJETIVOS DEL ENTREGABLE

La obtención de medidas de tendencia central y medidas de dispersión, para ello se nos pide que:
“Después de haber revisado los materiales e investigado los temas de medidas de tendencia central y medidas de dispersión, entrega
el documento con la resolución de los cuatro ejercicios solicitados.”

DESARROLLO
Las preguntas sobre los conceptos de estadística se responden basados en el documento, Contreras J. (2020 a).
CONCEPTO SIGNIFICADO
 Estadística “La Estadística trata del recuento, ordenación y clasificación de los datos obtenidos por las observaciones,
para poder hacer comparaciones y sacar conclusiones.” y un estudio estadístico tiene las siguientes fases;
 Recogida de datos.
 Organización y representación de datos.
 Análisis de datos.
 Obtención de conclusiones.
Población “Una población es el conjunto de todos los elementos a los que se somete a un estudio estadístico.”
Individuo “Un individuo o unidad estadística es cada uno de los elementos que componen la población.”
Muestra “Una muestra es un conjunto representativo de la población de referencia, el número de individuos de una
muestra es menor que el de la población.”
Espacio muestral Nos dicen Anderson D., Sweeney D., Williams T. (2012, p.150) que es el conjunto de todos los resultados del
experimento. Por ejemplo, si el experimento consiste en lanzar 100 veces un dado el espacio muestral será 1,
2, 3, 4, 5 o 6, y la muestra serán los 100resultados de cada lanzada del dado.
Cardinalidad del Cuando se ha identificado el espacio muestral podemos contar sus componentes, ese conteo numérico se le
espacio muestral conoce como Cardinalidad del espacio muestral. Por ejemplo, la cardinalidad del experimento de lanzar un
dado es 6. Si el experimento fuera lanzar una moneda, el espacio muestral seria sol o águila, y la cardinalidad
es 2.

Ejercicio 1; Utilizando los datos de las telas del ejercicio del foro 1, calcular los valores estadísticos solicitados.
Elaboramos esta tabla de frecuencias para el ejemplo de los 100 rollos de tela.
(Tomare como base los videos del Profe Alex descritos en la carta descriptiva semana 2)

Marcas de Frecuencia Frecuencia


Intervalos o clases clase absoluta acumulada xi * fi (xi**2)*fi
xi fi ascendente Fi

[10.504, 22.504) 16.50 1 1 16.50 272.38


[22.504, 34.504) 28.50 5 6 142.52 4,062.39
[34.505,46.504) 40.50 21 27 850.58 34,452.05
[46.504, 58.504) 52.50 27 54 1,417.61 74,430.09
[58.504, 70.504) 64.50 27 81 1,741.61 112,340.68
[70.504, 82.504) 76.50 12 93 918.05 70,234.34
[82.504, 94.504) 88.50 7 100 619.53 54,830.71
SUMAS 100 5,706.40 350,622.65

Entonces los cálculos solicitados son;


a. Media aritmética para datos agrupados

Si los datos vienen agrupados en una tabla de frecuencias, la expresión de la media es:

x 1 f 1+ x 2 f 2 +. . .+ xn f n
x́= = 5,706.40 / 100 = 57.06
N

Donde x1 corresponde a la primera marca de clase, en nuestro ejemplo es igual a 16.50


f1 es la frecuencia absoluta correspondiente a x1, en nuestro ejemplo es igual a 1
N es el numero de datos que es igual a 100 para nuestro ejemplo

b. Mediana para datos agrupados

En este caso la mediana (representada por Me) se calcula con la formula siguiente:

N
+ Fi−1
2
Me=Li + ∗a i
fi
En donde;

Li es el límite inferior de la clase modal (donde se encuentra la mayor frecuencia absoluta)


f i es la frecuencia absoluta de la clase modal
a i es la amplitud de la clase
F i−1 es la frecuencia acumulada inmediatamente inferior a la clase modal (donde se encuentra la mayor frecuencia absoluta)
N es el número de datos = 100
Los cálculos son;
Me= 46.504 + [(100/2)-27]*12/27= 56.73
c. Moda

La moda es el valor que tiene mayor frecuencia absoluta. Se representa por Mo y se calcula así;

f i−f i−1
Mo=Li + ∗ai
( f i−f i−1 ) + ( f i−f i+1 )

Donde;
Li es el límite inferior de la clase modal (donde se encuentra la mayor frecuencia absoluta)
f i es la frecuencia absoluta de la clase modal
f i−1 es la frecuencia absoluta inmediatamente inferior a la clase modal
f i+1 es la frecuencia absoluta inmediatamente superior a la clase modal
a i es la amplitud de la clase
El cálculo de la moda es ;

Mo= 46.504 + { (27-21) / [(27-21) - (27-27) }*12 = 58.504

d. Desviación típica o estándar

Se considera que la desviación típica o estándar σ , es la raíz cuadrada de la varianza. Esto es;

σ =√ σ 2
Entonces el cálculo queda;

σ = √(285.8) = 16.91

e. Varianza (utilizar fórmula para muestra, no para población)

La varianza σ 2 para datos agrupados se calcula con la siguiente formula;

x́ se había calculado en 57.06

N es igual a 100 en nuestro ejemplo.

Y la sumatoria de las xi (marcas de clase) al cuadrado multiplicada cada marca por la frecuencia absoluta fi correspondiente da =
350,622.65

Entonces el cálculo de la varianza queda;

σ 2 = (350,622.65 / 99 ) – (57.06)**2= 3,541.64 - 3,255.84 = 285.8


2. De la siguiente tabla encuentra los cuartiles y deciles:
Un censo que se registró en el año 1990,
muestra cuantos inodoros tienen cierto número
Inodoros
de casas, los resultados son los siguientes:
Casas
0 – 12 15
12 – 24 4
24 – 36 10
36 – 48 14
48 – 60 7
Total 50

¿Pero que es un cuartil?


Los cuartiles son los tres valores de la variable que dividen a un conjunto de datos ordenados en cuatro partes iguales.
Q1, Q2 y Q3 determinan los valores correspondientes al 25%, al 50% y al 75% de los datos. Q2 coincide con la mediana.

Con la información anterior hacemos una tabla de frecuencias con la siguiente información.

Frecuencia
Marcas de clase Frecuencia acumulada
Intervalos o clases absoluta
xi Fi
fi

[ 0, 12 ) 6 15 15
[ 12, 24 ) 18 4 19
[ 24, 36 ) 30 10 29
[ 36, 48 ) 42 14 43
[ 48, 60 ) 54 7 50
SUMAS   50
Para datos agrupados como es el caso que nos ocupa, primeramente, tendremos que encontrar la clase a que pertenece cada cuartil
basados en el valor resultante de la ecuación siguiente;

Se busca en la tabla de las en la columna de frecuencias acumuladas, donde se ubica la clase para cada cuartil.
Los cuartiles se calculan con la formula;

donde y a es la amplitud del intervalo, en nuestro caso 12.

Tomando la tabla de frecuencias, para N=50, los valores a considerar son;

Para Posición de Q El valor anterior Por lo que Fi-1 es; La frecuencia


k (k * N ) / 4 (k*N)/4, resultante se Li es; absoluta fi
ubica entre las correspondiente
frecuencias absolutas es;
F
1 Posición Q1=12.5 0 y 15 0 0 15
2 Posición Q2=25 19 y 29 24 19 10
3 Posición Q3=37.5 29 y 43 36 29 14

Sustituyendo los valores anteriores y tomando a=12, tendremos


 Primer cuartil Q1=0+[(12.5-0)/15]*12=10
 Segundo cuartil Q2=24+[(25-19)/10]*12=31.2
 Tercer cuartil Q3=36+[(37.5-29)/14]*12=43.3

Ahora calcularemos los deciles que dividen a un conjunto de datos ordenados en diez partes iguales
La fórmula correspondiente es;

Tomando la tabla de frecuencias, para N=50, los valores a considerar son;


Para k Posición de Q El valor anterior (k*N)/4, resultante se Por lo que Li Fi-1 es; La frecuencia absoluta fi
(k*N)/4 ubica entre las frecuencias absolutas F es; correspondiente es;
1 Posición D1=5 0 y 15 0 0 15
2 Posición D2=10 0 y 15 0 0 15
3 Posición D3=15 En 15 0 0 15
4 Posición D4=20 19 y 29 24 19 10
5 Posición D5=25 19 y 29 24 19 10
6 Posición D6=30 29 y 43 36 29 14
7 Posición D7=35 29 y 43 36 29 14
8 Posición D8=40 29 y 43 36 29 14
9 Posición D9=45 43 y 50 48 43 5

Con estos valores y aplicando la formula mencionada, los deciles quedan como sigue
 Primer decil D1=4
 Segundo decil D1=8
 Tercer decil D1=12
 Cuarto decil D1=25.20
 Quinto decil D1=31.20
 Sexto decil D1=36.86
 Séptimo decil D1=41.14
 Octavo decil D1=45.43
 Noveno decil D1=51.43

3. Realizar por Teorema de Chebyshev.

“Una expendedora de hamburguesas sirve a sus comensales diferentes paquetes, se da cuenta que el peso medio del trozo de carne
en la hamburguesa es de 80 gr., realizó los cálculos correspondientes y detectó que la desviación estándar es de 0.2 gramos, ¿Qué
porcentaje de los trozos de carne cómo mínimo debe contener entre 78 y 82 gramos?”
El teorema de Chebyshev menciona que en cualquier conjunto de observaciones (muestra o población), la proporción de valores
que se encuentran a k desviaciones estándares de la media es de por lo menos
1 – 1 / k**2
donde k es cualquier valor mayor a 1
Se nos dice que el límite superior es 82 gramos y el inferior es 78 gramos, tomemos el límite superior y establecemos que;
µ + k *σ = 82
µ es la media y tiene un valor de 80 gramos, σ es la desviación estándar y tiene un valor de 0.2 gramos por lo que:
80 +k * 0.2 = 82 , de aquí se obtiene k = 10
Es decir, tanto los 78 gramos como los 82 gramos están a k=10 veces desviación estándar de o.2 gramos.

Ahora utilizando el teorema de Chebyshev tendremos;


1 – 1 / 10**2= 1 – 1/100 = 0.99 lo que equivale al 99%
Esto significa para la expendedora de hamburguesas que el 99 % de los trozos de carne tendrán un peso entre 78 y 92
gramos, y solo el 1% tendrá un peso menor a 78 gramos o mayor a 72 gramos. Se anexa la curva de distribución.
CONCLUSIONES

González F. Escoto C., Chávez J. (2017), nos dice que la Asociación Americana de Estadística considera que “el análisis estadístico
de los datos permite realizar conclusiones científicas orientadas a la solución de problemas sociales, económicos, médicos, políticos,
ecológicos, entre otros”.

Aún más, González (op. cit.), nos dice que “la estadística permite organizar la información y emitir juicios sustentados en evidencia
sólida, de tal modo que se promueva el uso eficiente de los recursos económicos, legales, humanos, materiales y de cualquier
naturaleza.

Es muy común la aplicación de la estadística en varios ámbitos de la sociedad, por ejemplo;


En las industrias, el uso de las tomas continuas de muestras de productos en sus distintas etapas de producción permite
determinar a través de la medición de ciertas cualidades principalmente cuantitativas y su análisis estadístico (peso,
dimensiones, dureza, color, forma, alcalinidad, concentraciones etc.) si el proceso entero está dentro de las condiciones
adecuadas para asegurar lo que se quiere del producto, si no es así, si el análisis estadístico de las muestras arrojan
desviaciones de lo establecido como estándar, entonces los componentes de la producción deberán ajustarse para llevar la
producción a condiciones “normales” de manera que se obtenga un producto adecuado.
En mi trabajo anterior como responsable de un departamento de galvanizado de tubería deberíamos cuidar principalmente ese
proceso vigilando principalmente los parámetros principales como la temperatura del baño donde se sumergía la tubería, el contenido
de plomo y otros componentes que afectaban la calidad del tubo galvanizado.
Tenemos en este año (2020) la recogida de datos de la población mexicana y otros factores económicos, ambientales que
permitirán tomar una fotografía del estado de las cosas y compararlo con censos pasados del 2010 y 2020. Dichos datos
recolectados por el INEGI se vacían en tablas de frecuencias y su análisis estadístico arroja resultados que resultan muy
indicativos cuando se comparan con censos pasados. Por ejemplo, de la pagina oficial del INEGI (www.inegi.org.mx) extraje la
siguiente información acerca del numero de mexicanos en el lapso que se muestra;

Año Millones de personas Viviendas habitadas (millones) Suicidios (miles)


2000 97.48 21.94 3,475
2005 103.26 24.71 4,314
2010 112.34 28.61 5,012
2015 119.94 31.95 6,425

Además, se puede ver para cada año en particular y para la población mexicana, que religión profesaban, su rango de edades, los
índices de natalidad y mortalidad, etc.
Información importantísima para tomar decisiones gubernamentales y particulares en todos los ámbitos.
Por último, en la esfera personal más importante, lo referente a Psicología, me encuentro que a diferencia de las ciencias “duras” esta
ciencia la Psicología está inundada de lo que yo considero pseudociencias (Constelaciones familiares, Psicoanálisis, PNL, etc.) que
prometen terapias de tratamiento por ejemplo para la depresión y aseguran un éxito. Afortunadamente he visto que hay una Psicología
basada en evidencias que fundamentan en una forma científica su efectividad.
Labrador J. (2002) afirma que;
“Cuando uno toma un medicamento confía en que su eficacia haya sido sometida científicamente a prueba”
Y qué;
“Al igual que cualquier fármaco, un tratamiento psicológico debe pasar unas pruebas y controles científicos ”, esto para para determinar
si el tratamiento es mas contra no hacer nada o el utilizar otro tratamiento alternativo.
Las pruebas y controles científicos a las que se refiere Labrador (op. cit.) son las herramientas estadísticas que documentan la
efectividad de las terapias tomando en cuenta; el tipo de terapia, el diagnostico utilizado para el tratamiento, su duración, su
disminución de síntomas, su remisión, etc. todo elemento relevante es capturado para establecer muestras de tratamientos cada vez
mas completas.

REFERENCIAS
 Anderson D., Sweeney D., Williams T. (2012), Estadística para negocios y economía 11ª Ed. Cengage, México.
 Contreras J. (2020 a), Material de apoyo Probabilidad y Estadística. Semana 1, Ubicado en plataforma Blackboard de UNITEC
 Contreras J. (2020 b), Material de apoyo Probabilidad y Estadística. Semana 2, Ubicado en plataforma Blackboard de UNITEC
 Matemáticas profe Alex (2017, mar., 01), Media mediana y moda | Datos sin agrupar. Recuperado de:
https://www.youtube.com/watch?v=fOuRqk1nzgY
 Matemáticas profe Alex (2017, mar., 01), Media, mediana y moda | Datos agrupados en intervalos Ejemplo 1, Recuperado de:
https://www.youtube.com/watch?v=5bZXpfxwHqk
 Matemáticas profe Alex (2017, jun., 12), Varianza y desviación estándar | Introducción, Recuperado de:
https://www.youtube.com/watch?v=oZRaDwnpXkY
 Matemáticas profe Alex (2017, jun., 15), Varianza, Desviación Estándar y Coeficiente de Variación | Datos agrupados
puntualmente, Recuperado de: https://www.youtube.com/watch?v=fzPBAp14R98
 Matemáticas profe Alex (2017, ago., 07), Varianza, Desviación Estándar y Coeficiente de Variación | Datos agrupados en
intervalos | Ejemplo 2, Recuperado de: https://www.youtube.com/watch?v=MkmPmHTHyyk
 Daniela Uribe (2019, jul., 06), MEDIDAS DE TENDENCIA CENTRAL Y DISPERSIÓN - TEORÍA Y APLICACIÓN EN EXCEL,
Recuperado de :https://www.youtube.com/watch?v=7ySF926ZAvw&feature=youtu.be
 Matemáticas profe Alex (2017, jun., 02), Cuartiles, Deciles y Percentiles | Datos agrupados puntualmente, Recuperado de:
https://www.youtube.com/watch?v=sCeuhr0nF1w
 Matemáticas profe Alex (2017, jun., 06), Cuartiles, Deciles y Percentiles | Datos agrupados en intervalos | Ejemplo 1,
Recuperado de: https://www.youtube.com/watch?v=Eju_9eM4PZg
 Matemáticas profe Alex (2017, jun., 06), Cuartiles, Deciles y Percentiles | Datos agrupados en intervalos | Ejemplo 2,
Recuperado de: https://www.youtube.com/watch?v=fSOl8fYheMY
 Escuela de Bayes (2018, dic., 21), Teorema de Chebyshev, Recuperado de:, https://www.youtube.com/watch?v=JjBKON5F02I
 González F. Escoto C., Chávez J. (2017), Estadística aplicada en Psicología y Ciencias de la salud, Ed. El Manual Moderno,
México.
 Bologna E. (2011) Estadística para Psicología y Educación 1ª Ed., .Ed. Brujas, Argentina
 Labrador J. (2002), La eficacia de los tratamientos psicológicos, Sociedad Española para el avance de la Psicología Clínica y de
la Salud, Nov. 2002, Recuperado el 28 marzo 2020 del sitio web; http://www.sepcys.es/uploads/documentos/Documento-
Eficacia-Tratamientos-SEPCyS.pdf

Potrebbero piacerti anche