Sei sulla pagina 1di 48

Capitulo 1

GENERALIDADES Y
VARIABLES
ESTADSTICAS
Estadstica
Es un mtodo cientfico
para recolectar,
organizar, presentar,
analizar e interpretar
datos con el propsito
de ayudar a una toma
de decisiones ms
efectiva.
Estadstica
descriptiva
Tiene por fin elevar los aspectos caractersticos
del grupo de datos pero sin intentar obtener ms
conocimiento del que pueda adquirirse por s
mismos.
Recolectar Datos
Instrumentos, encuestas
Presentar Datos
Tablas y grficos
Resumir Datos
Media muestral
i
X
n

Estadstica
inferencial
Comprende en un todo articulado el mtodo y las
tcnicas necesarias para explicar el
comportamiento de un grupo de datos en un
nivel superior de lo que estos datos pueden dar a
conocer por s mismos.
Estimacin
Estimar el peso promedio de
la poblacin usando el peso
promedio de la muestra.
Prueba de Hiptesis
Probar que el peso promedio
de la poblacin es 65 kg.
Conceptos bsicos
Poblacin
TODOS los posibles
Individuos, objetos,
mediciones y conteos
Un PARMETRO describe
a una Poblacin.
Muestra
PARTE representativa
de la Poblacin.
Un ESTADSTICO describe
a una Muestra.
Conceptos bsicos
D
a
t
o
s

Experimentales
Encuesta
Clasificados
Originales
Primarios
Secundarios
Caractersticas o
valores
susceptibles de ser
observados,
clasificados y
contados
aplica un tratamiento
especial a las
unidades muestreadas
cuando son tomadas
sin ningn tratamiento
cuando estn
agrupados segn una
caracterstica
determinada
informacin que no ha
recibido ningn
tratamiento estadstico
cuando son recogidos,
anotados u
observados por
primera vez
cuando son recopilados
por otra persona o
entidad diferente al
investigador
Conceptos bsicos
Muestra
Simple
Sistemtica
Estratificada
De
conglomerados
Conjunto de elementos extrados de la poblacin.
La muestra asociada a un estudio debe ser representativa y aleatoria
igual
probabilidad
de ser
seleccionada
elementos son
seleccionados de
una manera
ordenada
la seleccin tiene en
cuenta los diferentes
grupos o estratos
se divide la poblacin en grupos
se selecciona una parte de los grupos al azar
se toman todos los elementos, o parte de ellos
Variables
estadsticas
Variable
Cualitativas
Cuantitativas
Continua
Discreta
Es una caracterstica que va a ser
estudiada en una poblacin
La caracterstica que se
va a estudiar busca
conocer gustos,
preferencias u
opiniones
La caracterstica que se
va a estudiar se puede
medir en una escala
numrica

Capacidad de tomar
cualquier valor que exista
entre dos magnitudes dadas

Slo puede tener una valor
de entre cierta cantidad de
valores dados
Escala de
medida
Relacin numrica entre la longitud real y
la longitud que se asigna en el plano en el
cual se va a representar su grfica
Caracterizacin de un variable
cualitativa
Herramientas
Tablas de
frecuencias
Represent
aciones
grficas
La moda
Describir su
comportamiento en la
poblacin, segn
algunos parmetros
establecidos.
Resumen de los datos en el cual,
cada opcin de respuesta de la
variable se relaciona con el
nmero de datos
correspondiente.
Clases
Frecuencia
Frecuencia
relativa
Resumen visual de la
tabla de frecuencias
Diagrama barras
Diagrama circular
Es el dato que tiene
mayor frecuencia, es
decir, el dato que mas
se repite.
Opiniones, gustos,
preferencias
Nmero de datos
que pertenece a
cada clase
Es el cociente entre la
frecuencia y el
nmero total de datos
Tablas de contingencia
Las filas corresponden a las clases de una variable
cualitativa y las columnas corresponden a las clases
de la otra variable cualitativa.
La informacin contenida en cada una de las casillas
corresponde a la cantidad de personas o individuos
que poseen ambas caractersticas.
Ofrece una completa distribucin de la informacin.
Capitulo 2

INVESTIGACIN
ESTADSTICA
I
n
v
e
s
t
i
g
a
c
i

n

E
s
t
a
d

s
t
i
c
a

Planeacin
Definicin
objeto
invest.
Unidad de
investig.
Clase
invest.
Fuentes
informacin
Recoleccin
Cobertura
Observaci
n
Organizacin
Combinacin
Tallos y
hojas
Tabulacin
Tablas distrib.
Frecuencias
Simple
Agrupadas
Relativa
Absoluta
Acumulada
Presentaci
n
Diagrama de
frecuencias
Histograma
Polgono
Ojiva
Lneas
Barras
Circular
Pictogramas
Cartograma
s
Planeacin
Definicin del
objeto de
investigacin
Debe responder el qu, el cmo y
establecer el momento correcto para
hacerse, debe tambin restringir el
espacio fsico o geogrfico donde se
llevar a cabo.
Unidad de
investigacin
Se trata del elemento de la
poblacin que origina la informacin
Debe determinarse la naturaleza
cuantitativa o cualitativa de esta
unidad
Clase de
investigacin
Descriptiva
Experimental
Explicada
Las fuentes
de
informacin
Directas (Hecho se
produce)
Indirectas (Hecho se refleja)
Recoleccin
Conjunto de
operaciones de
toma de datos
Segn la
cobertura
Segn la
forma de
observacin
Decidir si se va a estudiar a la poblacin en
su totalidad o slo una parte de ella.

El muestreo es el mtodo ms utilizado

Muestreo probabilstico y muestreo no
probabilstico
Forma de medicin del dato

Encuesta: la fuente de informacin se da
cuenta de la medicin.
Observacin: la fuente de informacin no
se da cuenta de la medicin.
Organizacin de la informacin
Conjunto de datos
en forma
ascendente o
descendente,
Combinacin
o arreglo
ordenado
Datos numricos
en dos columnas
divididas en
decenas y la otra
en unidades.
Arreglo de
tallo y hojas
Mejor tcnica
elaboracin de
tablas o
cuadros.
Tabulacin de
la informacin
serie cronolgica serie espacial serie cualitativa
serie cuantitativa

TABLAS DE DISTRIBUCION DE FRECUENCIAS
Nmero de veces que un dato se repite de un conjunto de datos se le
denomina frecuencia.
frecuencias
simple
frecuencias
agrupadas
Pocos datos
Rango
Diferencia entre los Valores
extremos
Nmero de clases
Clase
Grupo que presenta una
caracterstica comn cuantificable
k = 1+ 3.322 log n
Amplitud
A = R / k, Si cociente no es entero
redondear
Entonces Ra = A k

El exceso Ra R se distribuye entres los limites
Intervalos de clase
Se agrega A 1 al limite inferior
Limites reales Suma de cada lmite y dividirlo entre dos

TABLAS DE DISTRIBUCION DE FRECUENCIAS
Cuando se habla de la frecuencia de una clase, se refiere a la frecuencia
absoluta, pero si sta se da en trminos del total de frecuencias se tiene
entonces la frecuencia relativa. Esta se obtiene en porcentaje al dividir la
frecuencia de clase entre el nmero total de frecuencias (o tamao de la
muestra).
=

100
donde fr es la frecuencia relativa de clase, f es la
frecuencia absoluta de clase y n es el tamao de la
muestra.
La distribucin de frecuencias acumuladas se construye con el clculo de
la frecuencia absoluta acumulada y la frecuencia relativa acumulada.

TABLAS DE DISTRIBUCION DE FRECUENCIAS
EJEMPLO

Para los datos del ejemplo 8.1. Elabore una tabla de distribucin de
frecuencias agrupada. Para esto, se seguirn los pasos propuestos:

Rango = 110 58 = 52

Nmero de clases. Aplicando la Regla de Sturges:

k = 1+ 3.322 log n = 1+ 3,32230 log 30 = 6

Amplitud de los intervalos de clase.


Como se ha redondeado, debe hallarse el nuevo rango:


Existe pues un exceso de 2, [54 52 = 2]. Este exceso debe distribuirse
quitando 1 al lmite inferior y agregando 1 al lmite superior:


TABLAS DE DISTRIBUCION DE FRECUENCIAS
EJEMPLO cont.

Intervalos de clase. Se agrega A-1= 9 -1= 8 al lmite inferior de cada clase,
iniciando por el lmite inferior del rango. As:

57 + 8 = 65
66 + 8 = 74
75 + 8 = 83
84 + 8 = 92
93 + 8 =101
102+8 =110

Lmites reales. 56.5, 65.5, 74.5,, 110.5. Que se obtiene de calcular la
suma de cada lmite y dividirlo entre dos. As:


TABLAS DE DISTRIBUCION DE FRECUENCIAS
EJEMPLO cont.


PRESENTACION DE LA INFORMACION

Componentes de una grfica
Titulo
Identificar los ejes coordenados (X y Y) e indicar sus
magnitudes correspondientes.
fuente de informacin
convenciones
Deben estar numeradas

PRESENTACION DE LA INFORMACION

Diagrama de frecuencias
Se representan por medio de lneas
verticales, cuya altura est dada por los
valores de las frecuencias, ya sean
absolutas o relativas, los valores tomados
de la tabla.

PRESENTACION DE LA INFORMACION

Histograma
Se construyen representando los intervalos de clase en la es cala horizontal
y las frecuencias de clase (absolutas o relativas) en la escala vertical y
trazando rectngulos cuyas bases equivalen a la amplitud de los intervalos
de clase y sus alturas corresponden a las frecuencias de cada clase.

PRESENTACION DE LA INFORMACION

Polgono de frecuencias
Se grafican las marcas de clase de cada intervalo, generando una secuencia
de puntos que se unen en segmentos de recta para formar un polgono.

PRESENTACION DE LA INFORMACION

Ojiva
Es una curva suavizada puede ser descendente o ascendente. Permite
presentar en un mismo grfico, diferentes curvas lo que no permite el
histograma de frecuencias.

PRESENTACION DE LA INFORMACION

Grficos de lnea
Est compuesta de segmentos de lneas que unen los pares ordenados a
representar. Sirven para describir los cambios o fluctuaciones que sufre un
fenmeno, generalmente durante un tiempo. Pueden ser simples, cuando se
dibuja una sola serie de datos o compuestos, cuando se comparan dos o ms
series de datos,

PRESENTACION DE LA INFORMACION

Diagrama de barras
Las barras son rectngulos con alturas proporcionales a las frecuencias o
magnitudes correspondientes, pueden construirse en forma vertical u horizontal,
sin embargo son ms comunes las verticales; en este tipo de grficos se ubica la
variable o atributo en el eje horizontal y la altura est dada por los valores o
cantidades que toma dicha variable.

PRESENTACION DE LA INFORMACION

Diagrama circular
Permite observar los componentes de un total, como sectores de un crculo. Se
utiliza para representaciones grficas de distribuciones porcentuales. Es una
forma efectiva de representar distribuciones de frecuencias en las que la
caracterstica es cualitativa. Los ngulos de los sectores son proporcionales a los
componentes del total. Se construye subdividiendo los 360 de un crculo,
proporcionalmente al nmero o al porcentaje de cada una de las clases en que se
ha dividido la observacin.

PRESENTACION DE LA INFORMACION

Pictogramas
Es una forma de representar los datos por medio de smbolos o dibujos donde
cada uno representa la misma informacin con un valor fijo. Los pictogramas son
usados comnmente en el diseo publicitario, ya que se consideran ms
expresivos.

PRESENTACION DE LA INFORMACION

Cartograma
Muestra la informacin cuantitativa o cualitativa sobre bases geogrficas dentro de
las cuales se ubican smbolos o figuras como puntos, barras, crculos, colores.
Capitulo 3

MEDIDAS DE
TENDENCIA CENTRAL
O DE POSICION
MEDIDAS DE
TENDENCIA
CENTRAL
media
aritmtica
media
ponderada
media
geomtrica
media
armnica
Mediana
moda
Se define como la suma de los
valores de una cantidad dada de
nmeros dividido entre la cantidad de
nmeros.
Se define como el valor que divide una
distribucin de datos ordenados en dos
mitades, es decir, se encuentra en el
centro de la distribucin.
Se considera como el valor ms
representativo o tpico de una serie de
valores.
Se utiliza para promediar crecimientos
geomtricos de la variable, o cuando se
quiere dar importancia a valores
pequeos, o cuando se quiere determinar
el valor medio para un conjunto de
porcentajes.
Se halla al realizar el cociente entre la
suma de los productos de los valores por
sus respectivos pesos y la suma de los
pesos
Es el recproco de la media aritmtica de
los recprocos de los nmeros de la serie
de datos.

Comparacin entre la media, mediana y
moda


OTRAS MEDIDAS DE TENDENCIA
CENTRAL
Cuartiles
Se divide la distribucin en cuatro partes iguales, de manera
que cada una tendr el 25% de las observaciones. Los tres
puntos de separacin de los valores son los cuartiles.
Deciles
Se divide el conjunto de datos en 10 partes iguales, de
manera que se obtienen nueve valores que dividen la
frecuencia total en diez partes iguales.
Percentiles
Dividir en cien partes iguales la distribucin.


EJEMPLOS
El precio de la bolsa de un litro de leche en diferentes supermercados fue:
$1.300, $1.350, $1.250, $1.400 y $1.325. El valor promedio o media aritmtica
es entonces:
Un agricultor vende la cosecha de papas de la siguiente forma: 30 sacos a
$256.000, 18 sacos a $264.000 y 25 sacos a $261.500. Cul es el precio
promedio del saco de papa vendida por el agricultor?
Dados los valores: 19, 15, 23, 28, 14, 26, 18, 20, 30, determinar su media.
Lo primero que debe hacerse es ordenar los datos:
14 15 18 19 20 23 26 28 30
Como el nmero de datos es 9, el valor del medio de estos datos es la mediana,
puesto que deja cuatro valores por debajo y cuatro valores por encima. Este valor
es 20.


EJEMPLOS
En la tabla los datos se encuentran agrupados, la moda se encuentra en el
intervalo de clase 19.5 22.5 y corresponde a la marca de clase que es 21.
Adems, usando la ecuacin para el clculo de la moda, se tiene:
Donde:
fk-1 es la frecuencia absoluta de la clase
anterior en donde se encuentra el dato ms
frecuente.
fk+1 es la frecuencia absoluta de la clase
posterior en donde se encuentra el dato ms
frecuente.
.Ak es la amplitud de la clase en donde se
encuentra el dato ms frecuente.
Lk es el lmite real inferior de la clase en
donde se encuentra el dato ms frecuente.


EJEMPLOS
Hallar la media geomtrica de 2, 4, 6, 9, 12, 15
Un obrero se gasta 50 minutos en terminar un producto y otro lo hace en 40
minutos. Cul es el tiempo medio requerido para terminar dicho producto?


EJEMPLOS
Hallar los cuartiles de la distribucin de frecuencias de la tabla
Primero se identifica la clase en donde se encuentra el primer cuartil.
E l intervalo de clase donde se encuentra el primer
cuartil es (21-25), pues el nmero de frecuencias
acumuladas es el valor ms cercano a 6.25.
Hay 4 observaciones por debajo del lmite inferior de la clase del primer
cuartil.
El valor de 2.25 se interpola en la amplitud de la clase del primer cuartil
que es 4
As pues, el primer cuartil se encontrar 1.5
unidades ms del lmite inferior de la clase
correspondiente:


EJEMPLOS
El segundo cuartil corresponde al punto medio de la distribucin, esto es la
mediana del grupo de datos
Para el tercer cuartil se procede de la misma manera.
E l intervalo de clase donde se encuentra el tercer cuartil es (31-35) y hay
17 observaciones por debajo del lmite inferior de la clase de este cuartil
El tercer cuartil se encontrar 1.4
unidades ms del lmite inferior de
su clase:
Lo que quiere decir que el 25%
de los valores est por debajo de
22.5; el 50% est por debajo de
27.4 y el 75% est por debajo de
32.4.
Capitulo 4

MEDIDAS DE
DISPERSIN



MEDIDAS DE DISPERSIN Y ASIMETRA
Los datos extremos pueden estar bastante alejados de la tendencia
central. Medir esa variacin respecto a los promedios es un clculo
importante en el tratamiento estadstico de datos, medidas a las que se
les denomina de dispersin o de variacin.
Se trata de la diferencia entre el lmite
superior y el lmite inferior de un conjunto
de datos.
RANGO O
RECORRIDO
Se define como la media aritmtica de los
cuadrados de las desviaciones respecto a
la media aritmtica.
VARIANZA
Se obtiene extrayendo la raz cuadrada de
la varianza, tomando siempre el valor
positivo
Desviacin
tpica o
estndar


MEDIDAS DE DISPERSIN Y ASIMETRA
Para efectuar comparaciones entre series de observaciones
distintas.
COEFICIENTE DE
VARIACIN
Se define como la media aritmtica de las desviaciones
respecto a la media, tomadas en valor absoluto.
DESVIACIN
MEDIA
Mide la desviacin de una observacin con respecto a la
media aritmtica, en unidades de desviacin estndar,
determinndose as la posicin relativa de una observacin
dentro del conjunto de datos.
PUNTAJE TPICO O
ESTANDARIZADO
Coeficiente de Pearson
Media cuartil de asimetra o media de Bowley
MEDIDAS DE
ASIMETRA
Es la medida de la altura de la curva
APUNTAMIENTO
O CURTOSIS


EJEMPLOS
Un profesor de Estadstica tiene a su cargo dos grupos de 40 estudiantes
cada uno. La siguiente tabla de frecuencias reporta las calificaciones del
grupo A y grupo B de estudiantes, despus de la primera evaluacin. Hay
diferencia alguna entre estos dos grupos?
Lo primero que se hace para verificar
diferencias entre ambos grupos es calcular
su media aritmtica.
Analice qu tanto cambian los valores de la
media y el rango del grupo A de estudiantes
si se elimina la nota de 5.0
E n cambio, las calificaciones del grupo B se distribuyen mejor
alrededor de todo el rango de datos.


EJEMPLOS
Se quiere conocer la verdadera calidad de produccin en dos empresas
fabricantes de tornillos para fuselaje. La siguiente tabla indica las longitudes
de una muestra de tres tornillos tomados al azar. Haga un anlisis de
variabilidad de ambas empresas
Es fcil calcular que ambas empresas tienen una media de 2 pulgadas.
Pero las muestras difieren mucho en sus tamaos, para visualizar mejor
esto se analizan sus respectivas varianzas.
Esto quiere decir que la empresa B vara mucho, en su produccin, el
tamao de sus tornillos mientras que la empresa A mantiene un rango
constante en el tamao de los tornillos que produce.


EJEMPLOS
Los siguientes datos corresponden a los salarios de 10 empleados (en
miles de pesos) de dos empresas de alimentos. Calcular los coeficientes
de variacin y de desviacin media.

Empresa A: $420 $680 $690 $720 $720 $720 $730 $740 $740 $760
Empresa B: $415 $480 $510 $650 $700 $700 $730 $735 $750 $760


EJEMPLOS
El CVM es menor que el CV debido a que la desviacin media es menor
que la desviacin estndar.

El salario promedio de los 10 empleados de la empresa A es de $692.000,
mientras que en la empresa B el salario promedio es de slo $643.000.
En la empresa B los salarios varan grandemente respecto al media: en
14396 miles de pesos cuadrados, que en trminos de la desviacin
estndar esto es $119.980. En cambio, en la empresa A la variacin es de
$93.360.
El coeficiente de variacin y el coeficiente de variacin media de la
empresa B son menores a los coeficientes calculados para la empresa A,
esto indica la variacin relativa de los salarios en ambas empresas.

Potrebbero piacerti anche