Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ESTADÍSTICA
DULCE MONICA FERNÁNDEZ TÉLLEZ
Secretaría de Educación de Veracruz
Probabilidad Y Estadística
Económico Administrativo
Página 1
Índice
Introducción…………………………………………………………. ................ 3
Estadística…………………………………………………………………… ….4
Tipos de estadística………………………………………………………… 10
Tipos de variables………………………………………………………………12
Tipos de medición………………………………………………………………13
Tipos de muestreo………………………………………………………………15
Tabla de frecuencias…………………………………………………………...19
Histograma………………………………………………………………………23
Polígono de frecuencias……………………………………………………….24
Ojiva……………………………………………………………………………...25
Datos agrupados………………………………………………………………..26
Distribuciones Simétricas………………………………………………..……30
Medidas de dispersión………………………………………………………...32
Conclusión………………………………………………………………......….36
Página 2
Introducción
Espero que éste proyecto sea de gran apoyo para la obtención de los
desempeños esperados.
Página 3
En nuestra vida diaria se presentan hechos que requieren del empleo de tablas,
medidas, gráficas, etc., así como de su análisis e interpretación para comprender
lo cual nos lleva a plantearnos una serie de interrogantes donde para describir y
responderlas necesitamos de la estadística, que día con día va ganando más
importancia, convirtiéndose en un método efectivo para describir con exactitud los
valores de situaciones problemáticas de las distintas ciencias.
Pero la estadística es mucho más que solo números apilados y graficas bonita. Es
una ciencia con tanta antigüedad como la escritura, y es por si misma auxiliar de
todas las demás ciencias. Los mercados, la medicina, la ingeniería, los gobiernos,
etc., son aproximadamente los más destacados clientes de esta.
Página 4
Una definición más completa de estadística es que es la ciencia que se encarga
de estudiar una determinada población por medio de la recolección, recopilación e
interpretación de datos, con el fin de deducir las características de una población.
Del mismo modo, también es considerada una técnica especial apta para el
estudio de datos cuantitativos y cualitativos lo que es de gran ayuda para que el
proceso no sea tan laborioso y complicado, porque gracias a estos métodos es
más fácil conocer las características, gustos, la edad, el peso, la estatura, las
preferencias, el ingreso mensual o anual de cada familia, el color de ojos, el color
de pelo, o cualquier otro dato que sea de nuestro interés.
Página 5
se va transmitiendo en esas áreas y no hay necesariamente comunicación con los
especialistas, además señalan que el reto que tiene esta ciencia es adaptar los
métodos estadísticos tradicionales , los cuales fueron diseñados para analizar
bases de datos pequeños, para hacerlos capaces de analizar y procesar grandes
volúmenes de información.
Debido al gran esfuerzo que realizan las personas en la estadística más de 1600
organizaciones en todo el mundo participan en la celebración del Año
Internacional de la Estadística, en el cual México, la UNAM, el Centro de
Investigación en Matemáticas, la Asociación Mexicana de Estadística, el INEGI y
el ITAM, entre otras instituciones, se han sumado a esta iniciativa.
Página 6
se hacen observaciones. El estudio y la aplicación de los métodos estadísticos son
necesarios en todos los campos del conocimiento, sean estos de nivel técnico o
científico.
Ahora bien, la estadística se utiliza en todas las ciencias y materias que pueda
haber.
Página 7
Estadística
Administración
Demografía Economía
Pública
Ciencias
Humanidades Psicología
Jurídicas
Educación
Página 8
Demografía: se ocupa del estudio de la población, a través de diversos censos, la
distribución por edades o sexo, localización geográfica, profesiones, religión,
nacionalidades, tasas de nacimiento o defunción y movimientos sociales
migratorios. La simple enumeración pone de relieve el importante papel de la
estadística para perfilar y desarrollar estas tareas.
Todos estos conocimientos son precisos para la planificación de las acciones que
son necesarias en cada zona, de forma eficaz estas tareas necesitan del apoyo de
la estadística.
Ciencias Jurídicas: uno de loso campos del Derecho en que encontramos alguna
de las aplicaciones de la estadística es de la Criminología, en los estudios de
prevención de delitos. En muchos juicios civiles se precisa el concurso de peritos
estadísticos para testificar y valorar algunos datos de interés para la justicia.
Página 9
Psicología: los estudios de naturaleza psicológica han contribuido han contribuido
al desarrollo de algunas técnicas estadísticas como el análisis factorial. El estudio
de tal comportamiento de los sujetos, las aptitudes, los rasgos de personalidad, los
factores de inteligencia, por mencionar algunos, se basan en el empleo de la
estadística. El estudio se traslada a campos como la Psicología Experimental,
Psicometría y la Psicología Diferencial.
Estadística
Descriptiva Inferencial
Estadística Descriptiva:
Página 10
obtenidos, con el fin de describir apropiadamente las diversas características de
un determinado conjunto, además es la encargada de calcular los parámetros
estadísticos. Estos pueden visualizarse de manera numérica y gráfica.
Sin embargo, su uso se acota solo al uso de la información obtenida. Es decir, que
a partir de la misma no se puede realizar ningún tipo de generalización.
Otro ejemplo sería, los resultados obtenidos de una encuesta fueron sobre l color
de ojos y de pelo que tiene una pequeña parte de la población.
Estadística Inferencial:
Ejemplo: se realiza una encuesta a una pequeña parte de la población sobre las
principales adicciones que se presentan en la comunidad, se concluye que el
tabaquismo es la principal adicción.
Por otro lado, si vemos una encuesta realizada a los habitantes de la cuidad de
Perote, por ejemplo, acerca sobre el uso diario del celular, por ejemplo, se sacan
conclusiones para todos y entonces se hace uso de la estadística inferencial.
Muchas veces oímos o decimos que nuestros gustos son variables o que nuestro
carácter es muy variable, ya que nos encontramos a veces contestos y en otros
momentos tristes o enojados. La variabilidad es la cualidad de las cosas que
tienden a cambiar o transformarse.
Por ejemplo, hoy podemos decir que nacieron 50 niños en la ciudad de Xalapa, y
mañana seguramente no será el mismo número de nacimientos que hoy, es decir,
se presenta una variabilidad en el número de nacimientos diarios de Xalapa. Los
datos que nunca son constantes y que siempre cambian se les conoce como
variables.
Página 11
Se le llama variable a la cualidad o cantidad medible de cualquier suceso o acción
que presente o experimente un cambio, y la podemos representar mediante un
símbolo, al cual se le puede asignar un valor cualquiera de un conjunto
determinado de datos.
Discretas
Cuantitativas
Variables Continuas
Cualitativas
Página 12
Además, las variables cuantitativas pueden ser:
Continuas
Discretas
Una variable continua es aquella que puede tomar cualquier valor dentro de un
intervalo dado. No importa que tan cerca puedan estar dos datos, si el instrumento
de medida es lo suficientemente preciso, puede hallarse un tercer dato que se
encuentre entre los dos primeros. Una variable continua generalmente resulta de
la medición.
Una variable discreta está limitada a ciertos valores, generalmente son números
enteros. Con frecuencia son el resultado de la enumeración del conteo. El número
de alumnos de un semestre y el número de autos vendidos por General Motors
son algunos ejemplos. En ningún caso se observaron valores fraccionarios.
Ejemplo:
Número de hijos.
Número de autos vendidos al mes.
Número de habitantes de una población.
Las variables se pueden clasificar de acuerdo con niveles de medición. Los niveles
de medición indican con frecuencia que cálculos se pueden realizar para resumir y
presentar los datos y qué pruebas estadísticas pueden llevarse a cabo.
Nominal
Ordinal
De intervalo
De razón
Página 13
Utiliza los números para identificar que un dato pertenece a un grupo o a una
categoría. Es aquella escala que no presenta un orden o dimensión particular, son
observaciones que pueden clasificarse o contarse.
En esta clase cada persona u objeto debe pertenecer a una y solamente una de
las categorías que tienen y el conjunto de estas categorías debe ser exhaustivo;
es decir, tiene que contener a todos los casos posibles.
En esta escala los números representan una clasificación (mayor que o menor
que), sin que represente una unidad de medida, quedando implícito que un
número de mayor cantidad tiene más alto grado de atributo medido en
comparación de un número menor.
Se establece una gradación u orden natural para las categorías, cada uno de los
datos puede localizarse dentro de alguna de las categorías disponibles.
Las medidas de nivel de intervalo son medidas en una escala numérica en la cual
el valor de cero es arbitrario pero la diferencia entre valores es importante.
Sin embargo, a diferencia de los ordinales, la diferencia aritmética entre cada valor
es importante.
Similar a la escala de intervalo, pero tiene un cero absoluto y por ello los múltiplos
de los valores de la escala serán significativos.
Página 14
tanto útil, debe de reflejar las similitudes y diferencias encontradas en la población,
es decir ejemplificar las características de esta.
Gracias a estos métodos hoy en día se nos hace más fácil poder conocer las
características de una determinada población.
Métodos de muestreo
Estratificado Sistemático
Aleatorio Simple
De juicio o criterio
Página 15
Probabilístico:
Tipo de muestreo que se obtiene mediante sorteo de los individuos que la forman,
teniendo así cada individuo la misma posibilidad de pertenecer a la muestra,
permitiendo calcular el posible error de la muestra; de entre los que más destacan,
el muestreo aleatorio simple, el sistemático, el estratificado y el de conglomerados.
No Probabilístico:
Aunque este tipo de muestreo no será objetivo, será de gran ayuda para facilitar
algunos procedimientos estadísticos.
Muestreo Sistemático:
Muestreo Estratificado:
Página 16
El muestreo por conglomerados consiste en seleccionar aleatoriamente un cierto
número de conglomerados (el necesario para alcanzar el tamaño muestral
establecido) y en investigar después todos los elementos pertenecientes a los
conglomerados elegidos.
Página 17
Muestreo Aleatorio Simple
Para poder llevar a cabo este muestreo, se tuvo que elegir un tema de interés para
poder realizar la muestra y hacer las respectivas preguntas, en este caso el tema
es “la edad”, en donde lo único que se tiene que preguntar a los alumnos es su
edad.
Para empezar se debía de tener una lista de todos los miembros del campo de
estudio que en este caso es el Telebachillerato “Las Vigas de Ramírez”, para
poder conseguir las listas acudí a la Dirección del plantel donde requerí el apoyo
de los ayudantes que trabajan ahí y que tienen el control de los papeles de los
estudiantes, así que ellos me dieron las listas que en total son 12, una de cada
salón, así que con el apoyo de las listas que son indispensables en este tipo de
muestreo, acudí a cada uno de los salones para preguntar qué alumnos dejaron
de venir para que no se tomen en cuenta al momento de sacar la muestra.
Lo primero que se hizo fue anotar en papelitos en este caso yo para no escribir
todo el nombre del alumno puse el número de lista del estudiante sobre el grupo
1
(1"A" 2
, 1"A" , 1"A"……….) poniendo a cada uno de los miembros del campo de
3
estudio, excepto a los alumnos que dejaron de ir a la escuela, los papelitos los
elaboré con papeles de colores que ya tenía que me sobraban de otros trabajos,
se puede decir que eran reciclados, cuando terminé de recortarlos los metí a una
botella vacía previamente lavada y limpiada de papas para así evitar gastos
adicionales, revolví todos los papelitos dentro y sin ver saqué uno por uno, así
hasta llegar a 120 que es la muestra deseada, éste proceso es considerado como
una rifa o sorteo, cuando ya estaba la muestra de 120 alumnos me apoyé de las
listas y me fijé cuales eran los alumnos que habían sido seleccionados y para
evitar confusiones los resalté en las listas con un plumón para después seguir con
el siguiente paso.
Posteriormente acudí a todos los salones para preguntar las edades, al día
siguiente me dí cuenta que no podía elaborar la tabla de frecuencias con los datos
obtenidos de la edad, ya que no era posible, ocurrió un error de muestreo, debido
a eso tuve que cambiar el tema de edad a gasto diario que con este último estaré
trabajando durante este proyecto.
Cuando iba a algunos salones algunos maestros no dejaban salir a los alumnos y
me llevó tiempo demás para elaborar la muestra.
Página 18
Cuando terminé de sacar la muestra seguí con el siguiente paso que fue elaborar
la tabla de frecuencias o también llamada tabla estadística.
El rango es el intervalo entre el valor máximo y el valor mínimo; por ello, comparte
unidades con los datos. Permite obtener una idea de la dispersión de los datos,
cuando mayor es el rango más dispersos están los datos de un conjunto.
Xmax-Xmin
Es decir, el dato mayor menos el dato menor, después se tiene que establecer el
número de clases o de intervalo (K), el número de clases es el número de
conjuntos en los que se agrupa los datos en una tabla de frecuencias, el número
de clases depende del número de datos y del rango de los datos, lo más común es
tener entre 5 a 20 clases.
K=1+3.322log(n)
Para facilitar la interpretación de los resultados cada intervalo debe tener la misma
amplitud, éste se obtiene dividiendo el número de datos potenciales el cual
corresponde al rango aumentado en 1 unidad entre el número de clases.
R+U
C= K
C= amplitud de intervalo
Página 19
frecuencia absoluta entre el número total de datos que es la población, la
sumatoria de ésta es igual a 1.
Los límites reales son los puntos localizados a la mitad de los espacios aparentes
de los intervalos, también se les llama fronteras. Para cada intervalo existe el
límite inferior real (LIR) y el límite superior real (LSR). Se obtienen promediando el
límite superior de una clase con el límite inferior de la siguiente, lo cual equivale a
restarle la mitad de la unidad de medida correspondiente al límite inferior y
sumársela al superior.
Para calcular la marca de clase (Xi) que se conoce como punto medio y es la
semisuma de los límites inferior y superior de cada clase. Ésta medida es de
utilidad para elaborar las gráficas y para calcular otras medidas estadísticas.
Li+Ls
Xi = 2
Las ventajas de utilizar las tablas estadísticas son que organiza todos los datos
recogidos en orden, al clasificar los datos es más comprensible la información
para poder analizarla más fácilmente.
Página 20
A continuación, realizaré la tabla estadística con los datos obtenidos sobre “Gasto
Diario”.
20 20 25 10 15 30 25 20 10 25 10 25
20 10 10 10 20 20 10 10 20 30 30 10
20 15 20 20 10 15 15 15 20 20 20 15
15 20 20 20 30 10 10 30 15 10 10 10
30 30 20 10 20 25 10 20 15 20 20 15
25 15 15 20 20 10 10 15 10 10 20 20
15 20 30 10 10 30 10 10 10 25 25 40
15 10 25 15 15 20 10 20 15 30 10 30
20 15 15 25 10 20 20 30 15 25 25 10
25 20 15 20 25 20 15 20 25 20 20 20
n=120
R+U
Amplitud de intervalo: c=
K
30+1
Amplitud de intervalo: c= = 3.8 4
8
Página 21
Clases Intervalo fi fr fr% Fi Fr Fr% Li Ls LIR LSR Xi
Un gráfico, al igual que una tabla consta de distintos elementos como son:
Página 22
sombreando u otra característica. El significado de esta diferenciación se
denomina leyenda y de ser necesario, puede incluirse en el gráfico.
En el pié del gráfico se indica la fuente de donde se tomaron los datos.
Partiendo de los datos resumidos en una tabla se puede representarlos por medio
de una gráfica.
Histograma.
Página 23
Polígono de frecuencias.
Página 24
Ojiva.
Una de las ventajas de esta gráfica es que facilita la comparación de dos grupos
de datos de forma visual y de manera mucho más efectiva que el polígono de
frecuencias, pues que permite comparar los porcentajes acumulados de dos
distribuciones, con respecto al mismo intervalo.
Para poder construir una gráfica ojiva se toman los valores de los límites inferiores
reales de cada clase y se aumenta el límite superior de la última clase.
La gráfica ojiva inicia en 0 y termina en 100.
Gasto
LIR Diario
Página 25
Las gráficas estadísticas como lo son los histogramas, polígonos de frecuencia,
ojiva, entre otros, son de gran importancia, ya que nos facilitan la comprensión de
los datos obtenidos de una muestra determinada y que son indispensables para la
comprensión de las características que presenta el campo de estudio.
Datos Agrupados
Los datos agrupados son una cantidad dada de datos que puede clasificarse, ya
sea por cualidades cualitativas o cuantitativas, y por tal agruparse para su análisis.
las medidas de tendencia central son aquellos valores numéricos que tienden a
localizarse en la parte central de un conjunto de datos, es decir, que se encuentran
en el centro de la distribución de frecuencias.
Página 26
Esta medida tiene la ventaja de poder llevar a cabo procedimientos estadísticos
como la comparación de medidas de varios conjuntos de datos además no se ve
afectada por los valores externos.
∑ fi•Xi
x̅ = N
N=¨Población
Mo=LIR+(2fmo-fmo-1-fmo+1) C
Mo=Moda LIR=Límite inferior real
Página 27
C=Amplitud de intervalo.
Entonces para calcular la moda, por jerarquía se resuelve primero lo que está
dentro del paréntesis, al resultado que dé se multiplica por la amplitud de intervalo
y se le suma el límite inferior real.
Mediana (Me): es el valor que ocupa el lugar central de todos los datos.
PMe-Fa me-1
LIR+( )C
fme
fme=Frecuencia de la media
C=Amplitud de intervalo.
Una vez descritas las medidas de tendencia central y conociendo también las
ventajas de cada una, empezaremos a calcularlas mediante las fórmulas que se
dieron a conocer anteriormente.
Página 28
Intervalo fi Fi Xi (fi•Xi)
(fi•Xi): Se obtiene multiplicando cada
10-13 31 31 11.5 356.5 frecuencia por la marca de clase.
∑=120 ∑=2224
0-15
2(0)-15-12
)4
Mo=25.5+(
Mo=27.72
PMe-Fa me-1
Mediana: Me=LIR+( )C
fme
N 120
PMe= = = 60
2 2
60-107
Me=29.5+ (
0
)4 = 29.5
Página 29
Ahora que ya tenemos calculadas la media, moda y mediana las podemos ubicar
en un histograma.
fi Gasto Diario
40
35 31 38 Mo x̅ Me
30
23 9.5-13.5
25
20 15 13.5-17.5
15 12
17.5-21.5
10
5 21.5-25.5
0 0 1
0 25.5-29.5
29.5-33.5
33.5-37.5
Límites Reales 37.5-41.5
Distribuciones Simétricas
Página 30
Por otro lado, la simetría positiva es cuando la moda y la mediana se ubican el
lado izquierdo de la media aritmética.
Me Mo x̅
x̅Mo Me
El ejercicio realizado anteriormente no posee distribución simétrica ya que la
media aritmética se encuentra en el punto medio de las otras dos medidas de
tendencia central.
Página 31
Medidas de Dispersión
Una vez encontrados los valores de la tendencia central solo nos resta entender
que tan dispersos están entre ellos mismos, entre más unidos se encuentren los
valores resultantes la dispersión es menor, entre más alejados se encuentre un
número de otro hablamos de mayor dispersión, más, sin embargo, cuando los tres
datos de tendencia central coinciden se habla de una dispersión nula.
2
Fórmula: Ds = √∑fi (Xi-x̅ )
N
N=Población.
Página 32
Fórmula: DM= f (Xi-x̅ )
N
N= Población
Varianza: mide que tan dispersos se encuentran los datos respecto a la media.
∑f(Xi-x̅) 2
Su fórmula es: Ds2 =
N
Ds2 = Varianza
∑f(Xi-x̅ )2 = La sumatoria de multiplicar cada marca de clase con la media
aritmética elevados al cubo multiplicándose por las frecuencias.
Página 33
Intervalo fi Xi (fi•Xi)
Xi-�
̅ fi(Xi-�
̅) ̅ )𝟐
fi(Xi-�
10-13 31 11.5 356.5 -17.03 527.93 8,990.64
Xi-�
̅: se obtiene restando la media aritmética a las marcas de clase.
fi(Xi-�
̅): se le resta la media aritmética a cada marca de clase y el resultado se
multiplica por las frecuencias.
�̅= 28.53
Página 34
Empezaremos calculando la desviación media:
√ ̅2
Ds = ∑fi (Xi-x) = Ds = √16,874.88 = √140.62 = 11.85
N 120
Las medidas de dispersión nos informan sobre cuanto se alejan del centro los
valores de la distribución y son medidas que se toman para tener la posibilidad de
establecer comparaciones de diferentes muestras.
Con este tema se cierra lo que viene siendo las diferentes ramas de la estadística.
Página 35
Conclusión
Una de sus características es que nos ayuda a entender mejor las características
de una población sin necesidad de hacer tantos procedimientos que resultan ser
demasiados laborosos.
Todo esto es posible gracias a que se pueden realizar gráficos y tablas los cuales
poseen muchas ventajas, ya que la información obtenida se vuelve más clara y
entendible.
Página 36