Sei sulla pagina 1di 13

U N I D A D 1

Estadstica Descriptiva
1.1 Conceptos bsicos de Estadstica
1.2 Medidas de Tendencia central y dispersin (media, moda, varianza y desviacin
estndar).
1.3 Distribuciones de frecuencias
1.3.1 Distribuciones numricas.
1.3.2 Distribuciones categricas.
1.3.3 Distribuciones acumuladas.
1.3.4 Distribuciones porcentuales.
1.3.5 Distribuciones porcentuales acumuladas.
1.4 Histogramas
1.5 Polgono de Frecuencias
1.6 Diagrama de Pareto.
1.7 Diagrama de Dispersi












INTRODUCCION

En el mundo actual, todos los sucesos, personas y elementos existentes tienden a ser
cuantificados, y su interaccin busca ser medida y cuantificada tratando de anticipar el
resultado de dicha interaccin.
Es as, como los apostadores, buscan una forma de anticipar el resultado de sus
acciones, basados en clculos matemticos que les permitan reducir el riesgo de fallar en
sus propsitos de apuesta y asegurar una retribucin financiera rpida y sin trabajo fsico
agotador.
Cada accin en el mundo de los negocios, busca reducir al mnimo el riesgo de error para
poder elegir que accin financiera a seguir.
La estadstica est en todas y cada una de las determinaciones sociales que buscan ser
medidas y dejar de lado la experimentacin. As, la estadstica busca formar una idea
numrica de las posibles variables reales de un acontecimiento medido expresado en
trminos numricos que finalmente son solo una estimacin.

RESUMEN
Un pequeo resumen de todo lo visto es como la estadstica va adquiriendo diferentes
significados, pero est relacionado con el estado, ya que de el se deriva esta palabra en
donde l se contempla grandes cantidades de informacin sobre una poblacin.
Pero simplificado de otra manera podemos decir que la estadstica es un recuento,
ordenacin y clasificacin de los datos obtenidos por las observaciones, para poder hacer
comparaciones y sacar conclusiones entre una poblacin.
Para poder calcular y obtener resultados tuvimos que aplicar conceptos de medida
tendencia central, en donde aplicamos conceptos de media mediana y moda entre otros.
Asi como tambin aprendimos mtodos que no ayudan a saber, tal vez no con exactitud,
los resultados de una poblacin y que los mtodos ms comunes tienden a arrojar
resultados poco confiables, tal es el caso de la mediana.
Aprendimos a representar los resultados en una grafica para ver el comportamiento de los
datos, y para representarlo existen diferentes formas las ms comunes son las famosas
graficas de barras, la grafica de pastel.


ABSTRACT


A brief summary of what is seen as statistics acquires different meanings, but is related to
the state because of the word is derived from where he is seen vast amounts of
information about a population.
But otherwise simplified we can say that the statistic is a count, sort and classify the data
obtained by observations, to make comparisons and draw conclusions from a population.
To calculate results and had to apply concepts of central tendency measure, where we
apply concepts of mean median and mode among others.
As well as learn methods that help you know, maybe not exactly, the results of a
population and that the most common methods tend to yield unreliable results, as in the
case of the median.
We learned to represent the results on a graph to see the behavior of the data, and there
are different ways to represent the most common are bar graphs famous, the pie chart.







Qu es la estadstica?
Es una tcnica utilizada para cuantificar fenmenos o acontecimientos y expresarlo de
forma numrica. A partir de esto se forma una idea numrica de las de posibles
soluciones.
Algunos cientficos como Allen, dicen que la estadstica es una ciencia, otros la
consideran como un conjunto de mtodos que se encarga de la recoleccin, clasificacin
y anlisis de un conjunto de fenmenos, ya sean naturales, econmicos o hasta polticos,
de manera metdica y numrica.
Por lo que decimos que la estadstica se basa en la observacin y medicin de hechos
reales, la cuantificacin de esos datos para formulacin de una estimacin,
La estadstica se divide en descriptiva e inferencial.

La Estadstica Descriptiva, pues como su nombre lo dice se encarga de describir y
analizar las caractersticas de un conjunto de datos, a fin de compararlas. En este tipo de
estadstica puede no solo referirse a la observacin de todos los elementos de una
poblacin, sino tambin a la descripcin de los elementos de una muestra de forma
parcial.
Entre sus objetivos, la estadstica recopila, analiza y presenta los datos obtenidos, lo que
nos lleva a obtener conclusiones y a tomar una decisin con respecto al fenmeno que se
est analizando.
Por otra parte la Estadstica inferencial se encarga de obtener las conclusiones, para
poder tomar decisiones sobre una poblacin, para despus analizar, con la diferencia que
solamente se basa parte representativa de ella, a esta parte se le conoce como muestra.
En la clasificacin de la estadstica tanto en la descriptiva como la inferencial hablamos de
una poblacin, bien esta poblacin es el conjunto de experimentos realizados en forma
aleatoria, de tal manera que puede ser realizado el nmero de veces que se desee, por lo
que no podemos predecir lo va a suceder.
Una caracterstica de la poblacin es que se presenta como un conjunto finito o infinito de
personas u objetos que presentan caractersticas comunes.
Su tamao es un factor de suma importancia durante el proceso de investigacin y este
dado por el nmero de elementos que la constituyen.
Si la poblacin est dada por un conjunto infinito, por lo que solo se considera una parte
conocida como muestra, debe estar definida por la poblacin y nos va a servir como
referencia del conjunto infinito.
Las muestras presentas ciertas variaciones, debido a esto es necesario utilizar variables
para representarla, y estas se dividen en cualitativas y cuantitativas.
La se representa con valores aproximados, por al contrario la segunda pasa por una serie
de procesos por lo que los resultados son casi confiables.

Ejemplo de variable cualitativas raza, sexo, profesin, estado civil, etc.

Ejemplos variables cuantitativos son el peso, talla, pulso, edad, etc.

Las variables estadsticas cuantitativas pueden ser: continuas o discretas.

Segn sea el caso las variables pueden ser

Discreta si toma valores finitos o infinitos nmeros.

Ejemplo: el nmero de libros en una estantera, las tiradas de un dado, el nmero de
ptalos de una flor, etc.

Continua: cuando puede tomar todos los valores posibles dentro de un cierto intervalo de
la recta numrica.

Ejemplo: la temperatura de los enfermos entre 35 y 40 grados.


La estadstica utiliza las medidas de tendencia central a la media aritmtica, la mediana,
la media geomtrica, la moda.
Media aritmtica (x ). Se le conoce como promedio es el valor obtenido por la suma de
todos sus valores dividida entre el nmero de sumandos.



Donde:

x = media aritmtica
x
i
= dato i
n = nmero de datos en la muestra

Media geomtrica (G). Es la raz en ensima del producto de los valores de los
elementos de la muestra, se calcula de la siguiente forma:



n
n
x * ... * x * x G
2 1
=

Donde:
G = media geomtrica
x
i
= dato i
n = nmero de datos en la muestra
Media aritmtica ponderada ( x
w
). A veces puede ser til otorgar pesos o valores a los
datos dependiendo de su relevancia para determinado estudio. En esos casos se puede
utilizar una media ponderada.
Siguiente forma:



Donde:
x
w
= media aritmtica ponderada
x
i
= dato i
w
i =
peso del dato i

Media armnica (H). La media armnica se define como el recproco del promedio de los
recprocos de cada uno de los datos que se tienen en la muestra, y se determina de la
siguiente manera:



Mediana (x
med
). La mediana es aquel valor que se encuentra en la parte central de los
datos que se tienen en la muestra una vez que estos han sido ordenados segn su valor o
magnitud. Para calcular la mediana se presentan dos casos:

a. Cuando el nmero de datos en la muestra es impar.- En este caso
despus de ordenar los datos de la muestra en cuanto a su magnitud, es decir
de mayor a menor valor o de menor a mayor valor, se procede a localizar aquel

=
=
=
k
i
i
k
i
i i
w
x w
w
x
1
1

= =
= =
n
i
n
i
xi /
n
xi / n /
H
1 1
1 1 1
1

dato que se encuentra justo en el centro de los datos o en la parte central de
los mismos, el valor de este dato ser el que d valor a la mediana.

b. Cuando el nmero de datos en la muestra es par.- En este caso despus
de ordenar los datos en cuanto a su magnitud, observamos que en la parte
central de los datos no se encuentra dato alguno, en este caso, la mediana
tomar el valor del promedio de dos datos; el que se encuentra antes de la
parte central y el que se encuentra despus de la parte central.
Moda (x
mod
). La moda es el dato ms repetido.

Medidas de Dispersin.- Son los datos adquiridos de una poblacin.
Rango o recorrido. se determina de la siguiente manera:

R = V
M
Vm
Donde:

R = rango o recorrido
V
M
= valor mayor en la muestra
V
m
= valor menor en la muestra

Desviacin absoluta media ( ). Esta medida de dispersin nos representa la diferencia
absoluta promedio que existe entre cada dato, se determina de la siguiente manera:


Donde:
x
i
= dato i
= media aritmtica de la muestra
n = nmero de datos en la muestra
_
d
n
x xi
d
n
i
_
_

=

=
1
_
x

Varianza o variancia (s
2
). Es el promedio de las diferencias elevadas al cuadrado entre
cada valor que se tiene en la muestra (x
i
) y la media aritmtica ( ) de los datos y se
determina de la siguiente manera:



Donde n es el nmero de datos en la muestra.
Desviacin estndar (s). Es la desviacin o diferencia promedio que existe entre cada
dato de la muestra y la media aritmtica de la muestra. Y se obtiene a partir de la
varianza, sacndole raz cuadrada.



Donde:
s
2
= varianza o variancia

En la distribucin de frecuencias se encuentra la absoluta, la relativa, la absoluta
acumulada y la relativa acumulada
Se denomina distribucin de frecuencias a la agrupacin de datos en categoras
mutuamente excluyentes que indican el nmero de observaciones en cada categora.
Esto proporciona un valor aadido a la agrupacin de datos. La distribucin de
frecuencias presenta las observaciones clasificadas de modo que se pueda ver el nmero
existente en cada clase.
Se agrupan los valores en intervalos que tengan la misma amplitud denominados clases.
A cada clase se le asigna su frecuencia correspondiente.
Lmites de la clase
_
x
1
1
2
2

\
|
|
.
|

=

=
n
x xi
S
n
i
_
2
s s =

Cada clase est delimitada por el lmite inferior de la clase y el lmite superior de la clase.
Amplitud de la clase
La amplitud de la clase es la diferencia entre el lmite superior e inferior de la clase.
Marca de clase
La marca de clase es el punto medio de cada intervalo y es el valor que representa a todo
el intervalo para el clculo de algunos parmetros.
Las distribuciones numricas se refiere al orden en se representan los datos dentro de
una tabla de frecuencia se encuentra ordenada en clase y con la frecuencia de cada
clase.
TRATAMIENTO PARA DATOS AGRUPADOS.

El tratamiento de datos es una tcnica para el ordenamiento de los mismos, ya que si
estos son mayores que 40 se pueden representar en forma de intervalos
Para lo que podemos determinar la amplitud de clase para agrupar agruparlos (C).







Distribuciones acumuladas
Una distribucin de frecuencias acumulada (ojiva) se usa para determinar cuntos o qu
proporcin de los valores de los datos es menor o mayor que cierto valor.
Una distribucin de frecuencias acumuladas identifica el nmero acumulado de
observaciones incluidas bajo el lmite exacto superior de cada clase de la distribucin. Las
frecuencias acumuladas de una clase pueden determinarse sumando las frecuencias
observadas de esa clase a las frecuencias acumuladas de la clase anterior.
k
Rango
C =

La grfica de una distribucin de frecuencias acumuladas se llama ojiva. En el caso de
distribuciones acumuladas del tipo y menor que, esta grfica indica las frecuencias
acumuladas bajo cada lmite exacto de clase de la distribucin de frecuencias. Si esa
grfica de lneas se suaviza, se obtiene la curva llamada ojiva.

Distribuciones porcentuales.
La frecuencia relativa de una clase es la frecuencia de la clase dividida por el total de
frecuencias de todas las clases y se expresa generalmente como porcentaje. Por ejemplo,
la frecuencia relativa de la clase 66 - 68 de la tabla 1 es 42/100 = 42 %. La suma de las
frecuencias relativas de todas las clases es evidentemente 1 100 %.
Si las frecuencias en la anterior tabla de frecuencias se sustituyen por las
correspondientes frecuencias relativas, la tabla resultante se llama distribucin de
frecuencias relativas, distribucin porcentual o tabla de frecuencias relativas.
Las representaciones grficas de distribuciones de frecuencia relativa pueden obtenerse
del histograma o del polgono de frecuencias, sin ms que cambiar la escala vertical de
frecuencia a frecuencia relativa, conservndose exactamente el mismo diagrama.
Los grficos que resultan se llaman histogramas de frecuencias relativas o histogramas
porcentuales y polgonos de frecuencias relativas o polgonos
porcentuales, respectivamente.

Distribuciones porcentuales acumuladas.
La frecuencia relativa acumulada o frecuencia porcentual acumulada es la frecuencia
acumulada dividida por la frecuencia total. Por ejemplo, la frecuencia relativa acumulada
de alturas menores que 68,5 pulgadas es 65/100 = 65 %, queriendo con ello decir que el
65 % de los estudiantes tienen alturas menores de 68,5 pulgadas.
Si se utilizan en la tabla 2, y fig. 2, las frecuencias relativas acumuladas en lugar de las
frecuencias acumuladas, los resultados se llaman distribuciones de frecuencias relativas
acumuladas o distribuciones porcentuales acumuladas y polgonos de frecuencias
relativas acumuladas u ojivas porcentuales, respectivamente.
Histogramas

En estadstica, un histograma es una representacin grfica de una variable en forma de
barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los
valores de las variables, normalmente sealando las marcas de clase, es decir, la mitad
del intervalo en el que estn agrupados los datos.
En trminos matemticos, puede ser definida como una funcin inyectiva (o mapeo) que
acumula (cuenta) las observaciones que pertenecen a cada subintervalo de una particin.
El histograma, como es tradicionalmente entendido, no es ms que la representacin
grfica de dicha funcin.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la
muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos.
En los casos en los que los datos son cualitativos (no-numricos), como sexto grado de
acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son ms frecuentes en ciencias sociales, humanas y econmicas que en
ciencias naturales y exactas. Y permite la comparacin de los resultados de un proceso.








Media aritmtica ponderada
A veces puede ser til otorgar pesos o valores a los datos dependiendo de su relevancia
para determinado estudio. En esos casos se puede utilizar una media ponderada. Si
X
1
,X
2
,...,X
n
es un conjunto de datos o media muestral y w
1
,w
2
,...,w
n
son nmeros reales
positivos, llamados "pesos" o factores de ponderacin, se define la media ponderada
relativa a esos pesos como:

La media es invariante frente a transformaciones lineales, cambio de origen y escala, de
las variables, es decir si X es una variable aleatoria e Y es otra variable aleatoria que
depende linealmente de X, es decir, Y = aX + b (donde a representa la magnitud del
cambio de escala y b la del cambio de origen) se tiene que:

Media geomtrica
La media geomtrica es un promedio muy til en conjuntos de nmeros que son
interpretados en orden de su producto, no de su suma (tal y como ocurre con la media
aritmtica). Por ejemplo, las velocidades de crecimiento.


Por ejemplo, la media geomtrica de la serie de nmeros 34, 27, 45, 55, 22, 34 (seis
valores) es
Media armnica
La media armnica es un promedio muy til en conjuntos de nmeros que se definen en
relacin con alguna unidad, por ejemplo la velocidad (distancia por unidad de tiempo).

Por ejemplo, la media armnica de los nmeros: 34, 27, 45, 55, 22, y 34 es:

Generalizaciones de la media
Existen diversas generalizaciones de las medias anteriores.
Media generalizada
Las medias generalizadas, tambin conocidas como medias de Hlder, son una
abstraccin de las medias cuadrticas, aritmticas, geomtricas y armnicas. Se definen y
agrupan a travs de la siguiente expresin:

Eligiendo un valor apropiado del parmetro m, se tiene:
- - mximo,
- - media cuadrtica,
- - media aritmtica,
- - media geomtrica,
- - media armnica,
- - mnimo.
Media-f generalizada
Esta media puede generalizarse para una funcin montona como la media-f
generalizada:

y una forma posible de de invertir f nos dar
- - media aritmtica,
- - media armnica,
- - media generalizada,
- - media geomtrica.
Media de una funcin
Para una funcin continua f sobre un intervalo [a,b], se puede calcular el valor medio de
funcin f sobre [a,b] como:


De hecho la definicin anterior vale an para una funcin acotada aunque no sea
continua.
Media estadstica
La media estadstica se usa en estadstica para dos conceptos diferentes aunque
numricamente similares:
- La media muestral, que es un estadstico que se calcula a partir de la media
aritmtica de un conjunto de valores de una variable aleatoria.
- La media poblacional, valor esperado o esperanza matemtica de una variable
aleatoria.
En la prctica dada una muestra estadstica suficientemente grande el valor de la media
muestral de la misma es numricamente muy cercano a la esperanza matemtica de la
variable aleatoria medida en esa muestra. Dicho valor esperado, slo es calculable si se
conoce con toda exactitud la distribucin de probabilidad, cosa que raramente sucede en
la realidad, por esa razn, a efectos prcticos la llamada media se refiere normalmente a
la media muestral.
Media muestral
La media resume en un valor las caractersticas de una constante teniendo en cuenta a
todos los casos. Solamente puede utilizarse con variables cuantitativas Media muestral:
Si se tiene una muestra estadstica de valores (X
1
,X
2
,...,X
n
) de valores para una variable
aleatoria X con distribucin de probabilidad F(x,) [donde es un conjunto de parmetros
de la distribucin] se define la media muestral n-sima como:

2 Diagrama de Pareto
El Diagrama de Pareto consiste en un Histograma cuyas frecuencias se encuentran en orden
descendente de izquierda a derecha, conteniendo en el mismo grfico una curva de frecuencias
acumuladas en porcentuales.
3 Agrupando en clases

Cuando los datos provenientes del estudio de un problema son agrupados, la visualizacin de la
distribucin de los mismos se vuelve ms clara.
Para ello los datos deben agruparse por clase y determinar cul es la frecuencia de ocurrencia para
cada intervalo de clase.
Una forma de determinar la amplitud de clase para un estudio en particular es la resultante de
dividir la diferencia entre el valor mximo y el valor mnimo por la raz cuadrada de la cantidad de
elementos que conforman el estudio.
4 Diagrama de Dispersin
El diagrama de correlacin es una representacin grfica en un eje de coordenadas de los datos que
se recogen sobre dos variables para poder estudiar si existe relacin de causa efecto entre ellas
(Kume 1985b).
Se utiliza para comprender si se encuentran vinculadas entre s dos magnitudes y en qu medida.
Sirve para verificar causas reales, definir y medir relaciones existentes entre dos variables. Se
instrumentaliza en cuatro fases (Kume 1985b):
GRFICO DE CONTROL NP
Es uno de los grficos para atributos ms utilizado, el cual permite monitorear la variacin del
nmero de tems defectuosos en una muestra de tamao constante.

Potrebbero piacerti anche