Sei sulla pagina 1di 30

INDICE

Aleato

rios,

bucin hipergeomtrica,

is de datos,

bucin normal,

tra,

bucin uniforme,

as de probabilidad,

cuadrtico medio,

d,

estndar,

iente de correlacin,

o muestral,

iente de variacin,

stica descriptiva,

ados medios

stica inferencial,

caracterstica de operacin,

acin puntual,

de densidad

ador,

cualitativos,

ador insesgado,

g,

ador puntual,

acin estndar

ador sesgado,

ama de caja,

o compuesto,

ama de Pareto,

o disjuntos,

ama de puntos,

o independiente,

ama de tallo y hojas,

o Simple,

ama de Venn,

mento,

bucin conjunta,

bucin Bernoulli,

encia,

bucin Poisson,
bucin exponencial,

n de densidad,
Grado

Distri

Funci

Distri

Frecu

Distri

Factor

Distri

Experi

Diagr

Event

Diagr

Event

Diagr

Event

Diagr

Event

Diagr

Estim

Desvi

Estim

Demin

Estim

datos

Estim

Curva

Estim

Curva

Estad

Cuadr

Estad

Coefic

Espaci

Coefic

Error

Calida

Error

Axiom

Distri

Asime

Distri

Anlis

Distri

s de libertad,

Hipte

sis,

,
Histog

Indep

Indep

rama,

,
Intera

cancia,
Interv

ra,
Interv

de contingencia,
Marco

as de conteo,
Media

Mtod

Moda,

Teore
ma de Bayes,

os de Taguchi,

Tcnic

muestral,

Tabla

alo de confianza,

Simet

alo de clase,

Signifi

ccin,

Sesgo

endientes, variables aleatorias,

Regre
sin,

Indep

Regla
de multiplicacin,

endiente, eventos,

Recorr
ido,

endencia de pruebas,

Rango

Teore
ma del lmite central,
Transf
ormaciones,

Muest

ra,

miento,
Nivele

Perce

les aleatoria,
Varianza,

s,

Trata

Variab

ntil,
Poblac

in,
Porce

ntaje,
Proba

bilidad condicional,
Proce

so de Poisson,
Prome

dio,
Propo

rcin,
Rango

intercuartilico,

Qu es Python y usos? Python es un lenguaje de


programacin interpretado cuya filosofa hace hincapi
en una sintaxis que favorezca un cdigo legible.Se trata
de un lenguaje de programacin multiparadigma, ya que
soporta orientacin a objetos, programacin imperativa
y, en menor medida, programacin funcional. Es un
lenguaje interpretado, usa tipado dinmico y es
multiplataforma.

Qu es Six sigma y usos? Est definido como un


mtodo para resolver problemas. "Seis Sigma" se refiere
a la consecucin de situaciones deseables en la fraccin
qui de productos inaceptables producidos por un sistema
es menos de 3,4 por milln de oportunidades (PMO).
Qu es un sistema? Una entidad con variables de
entrada y variables de salida.
Poblacin: Es el universo de individuos al cual se refiere
el estudio que se pretende realizar.
Muestra: Subconjunto de la poblacin cuyos valores de
la variable que se pretende analizar son conocidos.
Variable: Rasgo o caracterstica de los elementos de la
poblacin que se pretende analizar.
Ejemplo 1: Se quiere analizar el nmero de horas de
estudio semanal que dedican los estudiantes de la
Titulacin de Ingeniera Qumica de esta Universidad.
Para ello se pregunta a 50 alumnos de esta titulacin.
Poblacin: Todos los estudiantes de Ingeniera Qumica
de esta Universidad.
Variable: Nmero de horas de estudio semanal.
Muestra: 50 alumnos encuestados.
Estadstica Descriptiva. Se ocupa de recoger, clasificar y
resumir la informacin contenida en la muestra.
Clculo de Probabilidades. Es una parte de la
matemtica terica que estudia las leyes que rigen los
mecanismos aleatorios.
Inferencia Estadstica. Pretende extraer conclusiones
para la poblacin a partir del resultado observado en la
muestra.
Tipos de variables:
Variables cualitativas: No aparecen en forma numrica,
sino como categoras o atributos. Ejemplos: sexo, color
de los ojos, profesin, potabilidad del agua, tipo de
carburante, origen animal de la leche, etc.
Se clasifican a su vez en:
Cualitativas nominales: Miden caractersticas
que no toman valores numricos. A estas
caractersticas se les llama modalidades.
Ejemplo: Si se desea examinar el origen animal de una
serie de productos lcteos considerados para un estudio,
las modalidades podran
ser:
Vaca,
Oveja,
Cabra,...
Cualitativas ordinales: Miden caractersticas que
no toman valores numricos pero s
presentan entre
sus posibles valores una relacin de orden. Ejemplos:
nivel de estudios:
sin
estudios,
primaria,
secundaria, etc.
Variables cuantitativas: Toman valores numricos
porque son frecuentemente el resultado de una medicin.
Ejemplos: peso (kg.) de una persona, altura (m.) de
edificios, temperatura (co) corporal, concentracin (g
100 ml1) de inmunoglobina en suero sanguneo,
porcentaje (0100%) de agua recuperada al centrifugar

piedra arsnica, nivel (mg Kg1) de cromo en hierba de


centeno, etc.
Se clasifican a su vez en:
Cuantitativas discretas: Toman un nmero
discreto de valores (en el conjunto de nmeros
naturales).
Ejemplos: nmero de hijos de una familia,
nmero de tomos que constituyen una molcula
gaseosa, etc.
Cuantitativas continuas: Toman valores
numricos dentro de un intervalo real. Ejemplos:
altura, peso, concentracin de un elemento,
tiempo de reaccin de un compuesto quimico,etc.
Distribucin de frecuencias
La primera forma de recoger y resumir la informacin
contenida en la muestra es efectuar un recuento del
nmero de veces que se ha observado cada uno de los
distintos valores que puede tomar la variable. A eso le
llamamos frecuencia. Daremos definiciones precisas del
concepto de frecuencia en sus distintas formas de
presentacin. Definimos previamente el tamao
muestral, al que denotamos por n, como el nmero de
observaciones en la muestra.
Descripcin de variables cualitativas.
Supongamos que los distintos valores que puede tomar
la variable son: c1; c2; : : : ; cm
Frecuencia absoluta: Se denota por ni y representa el
nmero de veces que ocurre el resultado ci .
Frecuencia relativa: Se denota por fi y representa la
proporcin de datos en cada una de las clases,

La frecuencia relativa es igual a la frecuencia absoluta


dividida por el tamao muestral.
Frecuencia absoluta acumulada: Es el nmero de veces
que se ha observado el resultado ci o valores anteriores.
La denotamos por :
Frecuencia relativa acumulada: Es la frecuencia
absoluta acumulada dividida por el tamao muestral. La
denotamos por:

Claramente, la suma de las frecuencias absolutas es el


nmero total de datos, n; y la suma de las frecuencias
relativas es 1

Gumbel:
En teora
de
probabilidad y estadstica la distribucin
de
Gumbel (llamada as en honor de Emil Julius
Gumbel (1891-1966) es utilizada para modelar la
distribucin del mximo (o el mnimo), por lo que se usa
para calcular valores extremos
Rango o recorrido: En la resolucin de los ejemplos
ser til ordenar la muestra de observaciones y despus
calcular el recorrido o rango, que definimos como la
diferencia entre el dato ms grande y el ms pequeo de
la muestra.
Representaciones grficas de variables cualitativas:
-Representaremos las frecuencias absolutas o relativas
mediante el diagrama de barras
Variables cuantitativas discretas
Igual que para las variables cualitativas, las frecuencias
de las variables cuantitativas discretas se representan
mediante el diagrama de barras. Asimismo,
representaremos las frecuencias acumuladas mediante el
diagrama de frecuencias acumuladas
Variables cuantitativas continuas
Las frecuencias de una variable cuantitativa continua
tambin se pueden representar grficamente. Sin
embargo, el diagrama de barras no parece adecuado para
este caso, pues lo que debemos representar son
frecuencias de intervalos contiguos.
Histograma: Es un grfico para la distribucin de una
variable cuantitativa continua que representa frecuencias
mediante reas. El histograma se construye colocando en
el eje de abscisas los intervalos de clase, como trozos de
la recta real, y levantando sobre ellos rectngulos con
rea proporcional a la frecuencia. Una vez ms, aqu
resulta irrelevante trabajar con frecuencias absolutas o
relativas. Destacamos que es el rea y no la altura de los
rectngulos lo que debe ser proporcional a la frecuencia.
As, el eje de ordenadas no refleja la frecuencia, sino que
la altura de cada rectngulo representa la densidad de
frecuencia sobre ese intervalo, definida como:
Densidad de frecuencia = (frecuencia)/ (Amplitud)
Presentacin
INDUSTRIAL

profesor:

LA

ESTADSTICA

Los mtodos propios de la estadstica estn ntimamente


relacionados con las caractersticas de un Mtodo
Cientfico. La estadstica con sus mtodos descriptivos,
permite la observacin de los hechos y con sus mtodos
inferenciales colabora con el proceso de transcenderlos,
de generalizar el comportamiento o relacin de
fenmenos, aportando adems formas de medir la
confianza y validez de tales generalizaciones, con base

en su soporte probabilstico. Se puede entonces ubicar a


la estadstica como un valioso auxiliar de un Mtodo
Cientfico, ubicacin esta que implica una visualizacin
de esta ciencia en el aspecto de su aplicacin prctica,
sin considerar su ubicacin formal, el objeto formal de
su conocimiento desde el punto de vista filosfico y por
ende epistemolgico.
La estadstica en la ingeniera
La importancia de la estadstica en la ingeniera, ha sido
encaminada por la participacin de la industria en el
aumento de la calidad... Mejorar los aspectos de calidad
conlleva al xito de la compaa. La estadstica es un
elemento decisivo en el incremento de la calidad, ya que
las tcnicas estadsticas pueden emplearse para describir
y comprender la variabilidad. Calculo de los percentiles
en Excel
Todos los procesos y sistemas de la vida real exhiben
variabilidad. Esta es el resultado de cambios en las
condiciones bajo las cuales se hacen las observaciones.
En el contexto de la manufactura, estos cambios pueden
ser diferencias en las propiedades de los materiales
utilizados, en la forma en que trabajan los obreros, en las
variables del proceso (tales como la temperatura, la
presin o el tiempo de ocupacin) y en los factores
ambientales (como la humedad relativa). La variabilidad
se presenta tambin debido al sistema de medicin
utilizado y al muestreo.
El campo de la estadstica y la probabilidad utiliza
mtodos tanto para describir y modelar la variabilidad,
como para tomar decisiones en presencia de sta.

DEFINICIN DE TRMINOS BSICOS


A continuacin se describen algunos trminos utilizados
en la estadstica utilizando definiciones no formales. En
posteriores captulos se definirn estos trminos de una
manera formal.
Definicin estadstica
Una de las tantas definiciones de la estadstica es
concebida como el conjunto sistemtico de
procedimientos para la observacin, registro,
organizacin, sntesis y anlisis e interpretacin de los

fenmenos y de las leyes que los regulan para poder as


predecir o concluir acerca de ellos. Esta definicin
claramente involucra las dos fases de la estadstica: la
descriptiva y la inferencial.

se utilizan los trminos citados como sinnimos, sin que


se tenga un consenso aceptado en general, sobre el uso
de los mismos.
Las Variables

Estadstica descriptiva (deductiva)


Es la fase de descripcin, organizacin, sntesis y
anlisis de la informacin de inters pero sin llegar a
conclusiones fuertes o profundas sobre la misma; es ms,
una fase de recoleccin y organizacin de informacin
para su examen cuidadoso.
Estadstica Inferencial (Inductiva)
Esta fase busca obtener conclusiones slidas y ms
profundas que una simple descripcin de la informacin,
basados en el trabajo con muestras y su posterior
generalizacin de resultados para la toma de decisiones y
conclusiones slidas.
El Colectivo, Agregado, Poblacin, Universo
El objeto de estudio de la Estadstica son los llamados
fenmenos colectivos para los cuales, el comportamiento
de una serie de caractersticas, est afectado por la
casualidad o la aleatoriedad; tambin se les conoce con
el nombre de agregados, poblaciones o universos.
Como COLECTIVO O AGREGADO deben
entenderse no solo los colectivos humanos, sino
cualquier conjunto de hechos numerosos de la misma
naturaleza, cualquiera que ella sea, que presentan ciertas
caractersticas o modalidades distintivas, cuyo
comportamiento generalizado y/o posible relacin son
objeto de estudio.
Como POBLACION, se define a un conjunto de
medidas obtenidas al observar alguna caracterstica de
inters en los elementos del colectivo, lo que indica que
con un mismo colectivo pueden, en general, estar
asociadas varias poblaciones.
Algunos autores definen el concepto de UNIVERSO,
como un colectivo terico, bsico para el desarrollo de la
Teora Estadstica. Es necesario anotar que casi siempre

Se define como una VARIABLE, a una caracterstica


observable o a un aspecto discernible en un objeto de
estudio, que puede adoptar diferentes valores o
expresarse en varias categoras, o a una caracterstica
observable ligada, con una relacin determinada, a otros
aspectos observables.
Desde el punto de vista de su naturaleza, se habla de
variables CUALITATIVAS para referirse a aquellas
cuyos elementos de variacin tienen un carcter
cualitativo, no susceptible de observacin medible
numricamente y de variables CUANTITATIVAS como
aquellas cuyas propiedades pueden presentarse en
diversos grados o intensidades de carcter numrico.
De acuerdo con su naturaleza matemtica, se diferencian
las variables cuantitativas en DISCRETAS Y
CONTINUAS, siendo las primeras aquellas que estn
definidas sobre recorridos finitos o infinitos numerables;
no pueden tomar valores intermedios entre dos valores
dados. Las continuas son aquellas definidas sobre
recorridos infinitos no numerables; pueden tomar
cualquier valor dentro de un recorrido dado.
Para clasificar o categorizar variables, se utilizan
diferentes tipos de escalas, siendo las ms comunes las
NOMINALES,
las
ORDINALES,
las
DE
INTERVALO, y las DE RAZON, cuyo uso depende
bsicamente de los objetivos del estudio y de la
naturaleza de la variable.
ESCALAS DE MEDICIN O CLASIFICACIN
La Medicin
En el sentido ms corriente y elemental, el concepto de
medir es utilizado para significar la asignacin de
valores numricos o dimensiones a un objeto u objetos
mediante la utilizacin de determinados procedimientos.
En trminos ms estrictamente metodolgicos, la

medicin consiste sustancialmente en una observacin


cuantitativa, atribuyendo un nmero a determinadas
caractersticas o rasgos del hecho o fenmeno
observado. Esto no presenta mayores inconvenientes si
se trata de medir aspectos materiales y morfolgicos de
los objetos de estudio; la dificultad aparece cuando se
desean expresar numricamente aspectos ms
evanescentes e intangibles.
El proceso de medicin tiene como propsito inicial
distinguir y por ende clasificar objetos, casos, fenmenos
y debe responder a una serie de principios o requisitos
que se enuncian a continuacin.
1. En primer lugar el proceso de medicin debe ser
vlido, entendindose que cumple este requisito
cuando mide de alguna manera demostrable
aquello que trata de medir, libre de distorsiones
sistemticas. Cabe anotar que existen diferentes
mtodos de validacin, a saber: La validez
pragmtica, consistente en encontrar un criterio
exterior al instrumento de medida, para
relacionarlo con las puntuaciones obtenidas. La
validez predictiva, que se comprueba por los
resultados obtenidos en el futuro, y la validez
concurrente, que contrasta resultados de otros
elementos de juicio, con tipos de validez
pragmtica. Otro procedimiento de validacin es
el anlisis factorial, aunque su aplicacin se
limita
principalmente
a
los
aspectos
psicosociales.
2. El segundo principio deseable en la medicin es
la fiabilidad. Una medicin es confiable o segura
cuando aplicada repetidamente a un mismo
individuo o grupo, o al mismo tiempo por
investigadores diferentes, proporciona resultados
iguales o por lo menos parecidos. La
determinacin de la confiabilidad consiste pues,
en establecer si las diferencias de resultados se
deben a inconsistencias en la medida.
El problema de la fiabilidad se presenta en el
instrumental que se utiliza, cuando la validez de las
mediciones ofrece dudas en relacin con lo que se quiere
medir. Los procedimientos ms usuales para la

determinacin de la fiabilidad son el anlisis de la


estabilidad de los resultados, mediante la aplicacin de
mediciones repetidas y la equivalencia de los resultados
cuando los instrumentos son administrados por
diferentes personas.
3. Finalmente se tiene el principio de la
precisin. Se puede decir que una medicin es precisa
cuando localiza con exactitud satisfactoria, en relacin
con el propsito que se busca, la posicin del fenmeno
que se estudia.
El nivel de medida o escala de medida, expresiones
aceptadas casi universalmente, est formado por un
conjunto de numerales distintos y un conjunto de
modalidades distintas relacionadas biunvocamente. Se
suelen distinguir cuatro niveles de medicin que dan
lugar a cuatro niveles de escalas: nominal, ordinal o
de orden jerrquico, de intervalos y de razn o
cociente. Ahora bien, el tipo de escala estar dado, segn
sea verificable uno u otro tipo de relacin.
La Escala Nominal
Consiste en clasificar objetos o fenmenos, segn ciertas
caractersticas, tipologas o nombres, dndoles una
denominacin o smbolo, sin que implique ninguna
relacin de orden, distancia o proporcin entre los
objetos o fenmeno. La medicin se da a un nivel
elemental cuando los nmeros u otros smbolos se usan
para la distincin y clasificacin de objetos, persona o
caractersticas. Cuando se utilizan nmeros para
representar las diferentes clases de una escala nominal,
estos no poseen propiedades cuantitativas y sirven
solamente para identificar las clases. En una escala
nominal, la operacin de escalamiento consiste en partir
de una caracterstica dada y formar un subconjunto de
clases que se excluyen mutuamente. La nica relacin
implicada es la de equivalencia. Esto es, los miembros
de cualquier clase deben ser equivalentes en la propiedad
medida. La relacin de equivalencia es reflexiva (x = x
para todo x), simtrica (x = y luego y = x) y transitiva (x
= y et y = z luego x = z).
Puesto que en una escala nominal la clasificacin puede
presentarse igualmente por cualquier conjunto de

smbolos, se dice que es "nica hasta una transformacin


de uno a uno". Los smbolos que representan a las
diversas clases de la escala pueden intercambiarse,
llevando esto a cabo en forma consistente y completa.
Tales transformaciones son llamadas a veces "grupos
simtricos de transformaciones". Los smbolos que
designan a los diferentes grupos en una escala nominal
pueden intercambiarse sin alterar la informacin esencial
de la escala; debido a esto, las estadsticas de tipo
descriptivo admisibles son aquellas que no se alteran por
este proceso: el modo, la frecuencia, el conteo, la
proporcin, etc. Se pueden desarrollar procesos
analticos acerca de la distribucin de las categoras, as
como la posible relacin entre dos o ms caractersticas
clasificadas mediante este tipo de escala que llamaremos
"variables no-cuantitativas".
Ejemplo:
Cuando un producto se rotula de acuerdo al
cumplimiento de las especificaciones de diseo como
"conforme y no conforme". O "crtico, grave, y menor".
No se obtienen valores numricos y no se puede realizar
un orden de las observaciones con sentido.

La Escala Ordinal
Llamada tambin escala de orden jerrquico, con ella se
establecen posiciones relativas de los objetos o
fenmenos en estudio, respecto a alguna caracterstica de
inters, sin que se reflejen distancias entre ellos. Puede
suceder que los objetos de una categora de las escala no
sean precisamente diferentes a los objetos de otra
categora de la escala, sino que estn relacionados entre
s. Los numerales empleados en las escalas ordinales no
son cuantitativos, sino que indican exclusivamente la
posicin en la serie ordenada y no "cual es" la diferencia
entre posiciones sucesivas de la escala.
Las relaciones entre los elementos en clasificacin,
pueden formularse con el signo >, mayor que, o sea que
axiomticamente la diferencia fundamental entre una
escala nominal y una ordinal es que esta ltima
incorpora no solamente la relacin de equivalencia (=)

sino tambin la relacin "ms grande que" (>). Esta


relacin es irreflexiva (no es verdad para ninguna x tal
que x > x), asimtrica (x > y luego x < y) y transitiva (x
> y et y > z luego x > z).
Puesto que cualquier transformacin tendiente a
conservar el orden no altera la informacin contenida en
una escala ordinal, se dice que la escala es "nica hasta
una transformacin monotnica". Esto es, no importa
que nmeros se den a una pareja de clases o a los
miembros de esas clases, siempre que el nmero mayor
sea dado a los miembros de la clase mayor o ms
preferida. Por supuesto, pueden usarse nmeros menores
para grados ms preferidos (...de primera clase, de
segunda clase, etc.); en tanto se sea consecuente, es
indiferente el uso del nmero mayor o menor para
denotar "mayor" o "ms preferido". Fundamentalmente,
las escalas ordinales se estudian en Estadstica, con base
en las llamadas "estadsticas de orden" o "estadsticas de
rango".
Ejemplo:
Suponga que a los clientes en un almacn se les hace
unas preguntas para valorar la calidad del servicio. Los
clientes valoran la calidad de acuerdo a las siguientes
respuestas: 1 (excelente), 2 (bueno), 3 (regular), 3 (malo)
4 (psimo). Estos datos son ordinales. Note que una
valoracin de 1 no indica que el servicio es dos veces
mejor que cuando se da una valoracin de 2. Sin
embargo podemos decir que la valoracin de 1 es
preferiblemente mejor que 2, y as en los dems casos.
La Escala de Intervalo
Representa un nivel de medicin ms preciso,
matemticamente hablando, que las anteriores; no solo
se establece un orden en las posiciones relativas de los
objetos o individuos, sino que se mide tambin la
distancia entre los intervalos o las diferentes categoras o
clases. En este caso, la medicin se ejecuta en el sentido
de una escala de intervalo; esto es, si la asignacin de
nmeros a varias clases de objetos es tan precisa que se
sabe la magnitud de los intervalos (distancias) entre
todos los objetos de la escala, se ha obtenido una medida
de intervalo. Una escala de intervalo est caracterizada

por una unidad de medida comn y constante que asigna


un nmero real a todos los pares de objetos en un
conjunto ordenado. En esta clase de medida, la
proporcin de dos intervalos cualesquiera es
independiente de la unidad de medida y del punto cero.
En una escala de intervalo, el punto cero y la unidad de
medida son arbitrarios.
Axiomticamente se puede ver que las operaciones y las
relaciones en que se origina la estructura de una escala
de intervalo son tales que las diferencias en la escala son
isomrficas a la estructura de la aritmtica. Los nmeros
pueden asociarse con las posiciones de los objetos de tal
manera que las operaciones de la aritmtica puedan
realizarse significativamente con las diferencias entre los
nmeros.
La consecuencia de cualquier cambio de los nmeros
asociados con los objetos medidos en una escala de
intervalo debe preservar no solamente el orden de los
objetos sino tambin las diferencias relativas entre ellos.
Esto es, la escala de intervalo es "nica hasta una
transformacin lineal". La escala de intervalo es la
primera escala verdaderamente cuantitativa. Las
estadsticas paramtricas, son las aplicables a estudios en
estas escalas.
Ejemplo:
Suponga que se est interesado en la temperatura del
fundido de acero. Se toman cuatro lecturas cada dos
horas:
,
,
, y
F. Obviamente
los datos pueden ser ordenados (semejante a los datos
ordinales) en orden ascendente de temperatura indicando
temperatura ms fra, menos fra, y as sucesivamente.
Adems, las diferencias entre los valores ordenados
pueden ser comparadas. Aqu el intervalo entre los
valores de los datos

representan un

incremento en la temperatura de
F, y as los dems
intervalos. Hay que tener en cuenta que en esta escala no
hay un cero absoluto o real, el cero es arbitrario; por
tanto no se puede decir que
temperatura que

F.

F es el doble de

La Escala de Razn
Cuando una escala tiene todas las caractersticas de una
escala de intervalo y adems un punto cero real en su
origen, se llama escala de razn. Adems de distincin,
orden y distancia, sta es una escala que permite
establecer en qu proporcin es mayor una categora de
una escala que otra. El cero absoluto o natural representa
la nulidad de lo que se estudia. Las operaciones y
relaciones hechas con los valores numricos en una
escala de razn son correspondientes a una escala
isomrfica de la estructura de la aritmtica. Por
consiguiente las operaciones de la aritmtica son
permisibles en los valores numricos asignados a los
objetos mismos, as como tambin en los intervalos entre
los nmeros como sucede en las escalas de intervalo.
Implican que las relaciones de equivalencia, relacin de
mayor a menor, proporcin conocida de dos intervalos y
proporcin conocida de dos valores de la escala, sean
posibles de obtener operacionalmente. Los nmeros
asociados con los valores de la escala de razn son
"verdaderos" nmeros con un verdadero cero; solo la
unidad de medida es arbitraria. As la escala de razn es
"nica hasta la multiplicacin por una constante
positiva". Adems de los procesos paramtricos bsicos
de las escalas de intervalo, en las de razn pueden
utilizarse estadsticas como la media geomtrica, el
coeficiente de variacin, las que requieren el
conocimiento del verdadero valor cero
Ejemplo:
Suponga que el peso de cuatro piezas fundidas de metal
son 2.0, 2.1, 2.3 y 2.5 kg. El orden (ordinal) y la
diferencia (intervalo) en los pesos pueden ser
comparados. As, el incremento de peso de 2.0 a 2.1 es
de 0.1 kg, el cual es el mismo que el que existe entre 2.3
y 2.4 kg. Tambin, cuando comparamos los pesos de 2.0
a 2.4 kg, se encuentra una razn significativa: el peso de
una pieza de metal de 2.4 kg es un 20% ms pesada que
una que pese 2.0 kg. Existe un cero natural o real para la
escala, as 0kg implica no peso.
Situaciones propuestas

1. Clasificar cada una de las siguientes variables de


acuerdo a la escala de medicin: Temperatura
(en grados centgrados), tiempo calendario
(gregoriano, hebreo o islmico), estatura, peso,
edad, sueldo.
2. Escriba 10 variables utilizadas en la ingeniera.
Luego clasifique las variables anteriores en
cualitativa o cuantitativa (discreta o continua)
segn sea el caso y determine las escalas de
medicin.

Los objetivos y preguntas de investigacin deben ser


congruentes entre si e ir en la misma direccin. Deben
expresarse en forma clara y establecer qu pretende la
investigacin. Las preguntas de investigacin nos
indican qu debe encontrarse mediante la investigacin.
La justificacin nos indica por qu debe hacerse la
investigacin.

ETAPAS DE UNA INVESTIGACIN


En esta seccin se describe un punto de vista sobre las
etapas en una investigacin. Las cuales pueden ser
descritas como sigue: Elaboracin del plan o proyecto,
preparacin, recoleccin de informacin, crtica y
correccin de la informacin recolectada, anlisis y
presentacin de resultados.

Cada etapa del proceso de investigacin debe considerar


algunos elementos o pasos tradicionalmente reconocidos
y definidos(o recomendados).

Plan proyecto
Las investigaciones se originan en ideas, las cuales
pueden provenir de distintas fuentes. Generalmente las
ideas son vagas por lo cual se requiere una revisin
bibliogrfica de la idea para luego planear la
investigacin. En el plan se consigna la respuesta a
cuanto interrogante se presente sobre el proceso
investigativo (qu, cmo, cundo, dnde, etc.). Es gua
del proceso prctico de investigacin. Este plan debe
contener generalmente: planteamiento del problema, el
marco terico, la metodologa, cronograma de
actividades y presupuesto.

Planteamiento del problema. Plantear el


problema de investigacin es afinar y estructurar la
idea de investigacin, desarrollando tres elementos:
objetivos
de
investigacin,
preguntas
de
investigacin y justificacin de sta.

Marco terico. El marco terico se integra con


las teoras, enfoques tericos, estudios y antecedentes
en general que se refieran al problema de
investigacin. Para elaborar el marco terico es
necesario detectar, obtener y consultar la literatura y
otros documentos pertinentes para el problema de
investigacin, as como extraer y recopilar de ellos la
informacin de inters.
Metodologa. En esta se describe la manera
como se abordar la investigacin, incluyendo
generalmente: Poblacin, muestra, hiptesis,
variables, mtodo estadstico, procedimiento de
laboratorio.
Cronograma de actividades y presupuesto.

Recoleccin, correccin y anlisis de datos


En esta etapa se incluyen aspectos o labores como:
preparacin y elaboracin de material, seleccin y
adiestramiento del personal ejecutor de la investigacin,
realizacin de muestra (ensayo) piloto en condiciones
establecidas en el plan de investigacin, eleccin
definitiva de instrumentos y fuentes de informacin
adecuadas para la toma de la informacin final,
presupuesto asignado.
Recoleccin de la informacin
Preparada la investigacin, corregidos posibles fallos
con base en muestra piloto y sus resultados, se procede a
la fase siguiente de recoleccin definitiva de la
informacin. Recolectar informacin implica aplicar el
instrumento de medicin y presentar las mediciones
obtenidas para que puedan analizarse correctamente,
reduciendo al mximo el error de medicin.

Crtica, correccin y codificacin de la informacin


Recolectada la informacin se procede a fase de crtica,
correccin y codificacin de la misma, esto permite
clasificar la informacin como: correcta, incorrecta pero
corregible e inservible.
Anlisis de datos
El anlisis se efecta con los datos obtenidos. El tipo de
anlisis o mtodos estadsticos a aplicar depende de las
variables, las hiptesis y los objetivos de la
investigacin.
Presentacin de resultados o elaboracin del
reporte de investigacin
Antes de elaborar el reporte de investigacin, debe
definirse el usuario, ya que el reporte debe adaptarse a
ste. Los reportes de investigacin pueden presentarse en
un contexto acadmico o no acadmico.
Los elementos ms comunes de un reporte acadmico
son: portada, ndice, resumen, introduccin, marco
terico, mtodo, resultados, conclusiones, bibliografa y
apndices.
Los elementos ms comunes en un contexto no
acadmico son: portada, ndice, resumen, introduccin,
mtodo, resultados, conclusiones y apndices.
Si desea puede ver una breve descripcin de cada
elemento.
La portada. Incluye el ttulo de la investigacin, el
nombre del autor o autores (cdigo), nombre de la
institucin que patrocina el estudio y fecha en que se
presenta el reporte.
ndice o tabla de contenido. Es una relacin de los
temas y subtemas abordados en el informe
Resumen. Constituye el contenido esencial del reporte
de investigacin en forma resumida, usualmente
contiene el planteamiento del problema, la metodologa,

los resultados ms importantes y las principales


conclusiones.
Introduccin. Incluye el planteamiento del problema
(objetivos y preguntas de investigacin, as como la
justificacin del estudio), el contexto general de la
investigacin (cmo y dnde se realiz), las variables,
trminos de la investigacin y sus definiciones, as como
las limitaciones de sta.
Marco terico o Revisin de literatura o Marco de
referencia. En este se incluyen los estudios e
investigaciones que sirven de antecedentes a la
investigacin, y las teoras a utilizar.
Metodologa. Esta parte del reporte describe cmo fue
llevada a cabo la investigacin e incluye: hiptesis y
especificaciones de las variables, diseo estadstico,
sujetos, universo y muestra (caractersticas de los sujetos
o unidades experimentales y procedimiento de seleccin
de la muestra), instrumentos de medicin aplicados
(descripcin precisa, confiabilidad y validez de variables
medidas), procedimiento (un resumen de cada paso en el
desarrollo de la investigacin); en investigaciones
experimentales, se describe el mtodo de aleatorizacin,
materiales, manipulaciones experimentales y el
desarrollo del experimento.
Resultados. stos son los productos del anlisis de los
datos. Normalmente resumen los datos recolectados y el
tratamiento estadstico. Los resultados se pueden
describir utilizando tablas y grficas debidamente
numeradas y tituladas. Wiersma (1986, p.390)
recomienda al elaborar tablas:
El ttulo debe especificar el contenido de la tabla.
Debe tener un encabezado y los subencabezados
necesarios.
Limitar cada tabla a menos de una pgina.
Al incluir pruebas de significancia: F, chi-cuadrado y
otras, debe incluirse informacin respecto a la magnitud
o el valor obtenido de la prueba, los grados de libertad,

el nivel de significacin. As mismo, debe especificarse


si se rechaza o no la hiptesis en cada caso.
A veces los resultados se presentan en el mismo orden en
que fueron formuladas las hiptesis o las variables, y
frecuentemente se presenta primero la estadstica
descriptiva y luego el resto del anlisis. Es importante
destacar que aqu no se incluyen conclusiones ni
sugerencias y no se discuten las implicaciones.
Conclusiones, recomendaciones e implicaciones
(discusin). En esta parte se derivan conclusiones, se
hacen recomendaciones para otras investigaciones, se
analizan las implicaciones de la investigacin y se
establece como se respondieron las preguntas de
investigacin y se cumplieron o no los objetivos.
Bibliografa. Se incluyen las referencias utilizadas en la
investigacin y se ordenan alfabticamente. Algunos
ejemplos se ilustran a continuacin:
PRESENTACIN DE DATOS CUANTITATIVOS
Cuando se recogen datos ya sean de una muestra o
poblacin se deben presentar en forma resumida,
elaborando tablas y grficas apropiadas. As, de stas se
pueden extraer las principales caractersticas de los
datos. En esta sesin se mostrar cmo se pueden
organizar y presentar conjuntos de datos, tanto
cuantitativos como cualitativos en forma de tablas y
grficas apropiadas para su anlisis.
El diagrama de puntos
El diagrama de puntos es una grfica muy til para
visualizar un conjunto pequeo de datos; por ejemplo, de
unas 20 observaciones. La grfica permite ver
rpidamente la tendencia y variabilidad de los datos.
Para su elaboracin dibuje una lnea horizontal
demarcada con los valores encontrados en los datos,
luego coloque tantos crculos pequeos rellenos (o
esfera) encima uno de otro sobre el nmero del eje
correspondiente al dato.

Ejemplo
Se toman 10 mediciones del dimetro interno de los
tornillos para los pistones del motor de un automvil.
Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000,
74.002, 74.005, 74.001, 74.001, 74.002 y 74.004. El
diagrama de puntos correspondiente se presenta en la
figura 1.

Haga comentarios con respecto a los datos.


Un artculo del Journal of Structural Engineering (Vol.
115, 1989) describe un experimento para probar la
resistencia de tubos circulares con tapas soldadas en los
extremos. Los primeros resultados obtenidos (en KN)
son los siguientes: 96, 96, 102, 102, 102, 104, 104, 108,
126, 126, 128, 128, 140, 156, 160, 160, 164 y 170.
Construya el diagrama de puntos para estos datos.
Sera recomendable el diagrama de puntos si se tiene
muchos datos y cada uno aparece una sola vez?
El diagrama de tallos y hojas
Dado un conjunto de datos formado por
observaciones, las cuales pueden ser representadas
mediante

donde

cada
tiene por lo menos dos
dgitos. Una forma rpida de obtener una representacin
visual del conjunto de datos es construir un diagrama de
tallos y hojas. Este diagrama es usado cuando hay un
nmero no muy pequeo de datos. Los siguientes son los
pasos para construir un diagrama de tallos y hojas:
1. Seleccionar uno o ms dgitos iniciales para los
valores de tallo. El dgito(s) final(es) se
convierte (n) en hojas. Para facilitar la
determinacin de la forma de la distribucin de
los datos se necesitan al menos 5 tallos.

2. Hacer una lista de valores de tallo en una


columna vertical.
3. Registrar las hojas por cada observacin junto al
valor correspondiente del tallo.
4. Indicar las unidades para tallos y hojas en algn
lugar del diagrama.
Muchos de los procedimientos estadsticos que se
desarrollarn en las siguientes unidades suponen que la
variable aleatoria estudiada tiene al menos una
distribucin aproximadamente normal, para la cual el
diagrama de tallos y hojas tiene forma de campana.
Los diagramas de tallos y hojas nos dan una idea de la
localizacin de los datos y de la forma de la distribucin.
Esta tcnica funciona bien para los conjuntos de datos
que no tienen una dispersin muy grande.
Ejemplo
La siguiente tabla representa el porcentaje de algodn en
un material utilizado para la fabricacin de camisas para
caballeros.
Tabla 1. Datos del porcentaje de algodn
33. 35. 34. 33. 33. 33. 37. 33.
1 3 2 6 6 1 6 6
34. 34. 33. 32. 35. 34. 37. 34.
5 7 4 5 4 6 3 1
35. 35. 34. 34. 34. 35. 34. 34.
6 0 7 1 6 9 6 7
36. 35. 34. 35. 33. 34. 35. 35.
3 4 6 1 8 7 5 7
35. 36. 35. 36. 37. 33. 32. 36.
1 2 2 8 1 6 8 8
34. 36. 35. 37. 34. 32. 32. 34.
7 8 0 9 0 9 1 3
33. 35. 34. 36. 34. 33. 34. 32.
6 1 9 4 1 5 5 7
32. 33. 33. 34. 34. 34. 35. 37.
6 6 8 2 6 7 8 8
El diagrama de tallos y hojas para los anteriores datos
aparece a continuacin.

Stem-and-leaf of PORCENTAJE DE ALGODON N =


64 Leaf Unit = 0.10 (el nmero 1 despus del punto
significa que se usa una sola cifra decimal).
Tal
Hojas
lo
6 32 156789
18 33 114566666688
(2
01112235566666
34
1)
7777779
25 35 00111234456789
11 36 234888
5 37 13689
Algunas veces, la utilizacin del primero o de los dos
primeros dgitos de los datos puntuales como tallos no
proporcionan suficientes tallos como para permitirnos
detectar la forma de su distribucin. Una manera de
solucionar esto es utilizar tallos dobles. Es decir, utilizar
cada tallos dos veces: una vez para trazar las hojas
inferiores 0, 1, 2, 3, 4, y a continuacin nuevamente para
trazar las hojas superiores 5, 6, 7, 8, 9. El siguiente
grfico ilustra lo anterior
Histogramas
El histograma es una tcnica grfica utilizada para
presentar gran cantidad de datos. Se le atribuye a Karl
Pearson en 1895. El histograma puede ser: de
frecuencias absolutas, de frecuencias relativas, de
frecuencias absolutas acumuladas y de frecuencias
relativas acumuladas. Para la construccin del
histograma se requiere elaborar una tabla de distribucin
de frecuencias, lo cual se desarrollar a continuacin.
El grfico de la distribucin de frecuencias, se
llama histograma. El histograma de frecuencias es una
representacin visual de los datos en donde se
evidencian fundamentalmente tres caractersticas: forma,
acumulacin o tendencia posicional y dispersin o
variabilidad.
El histograma (de frecuencias) en si es una sucesin de
rectngulos construidos sobre un sistema de coordenadas
de la siguiente manera:

1. Las bases de los rectngulos se localizan en el


eje horizontal. La longitud de la base es igual al
ancho del intervalo.
2. Las alturas de los rectngulos se registran sobre
el eje vertical y corresponden a las frecuencias
de los intervalos.
3. Las reas de los rectngulos son proporcionales
a las frecuencias de las clases.
Polgono
Otro recurso grfico para ilustrar el comportamiento de
los datos es el polgono de frecuencias. Este se construye
sobre el sistema de coordenadas cartesianas, al colocar
sobre cada marca de clase un punto a una altura igual a
la frecuencia asociada a esa clase; luego se unen dichos
puntos por segmentos de recta.
Para elaborar el Polgono en Excel, haga click derecho
sobre el histograma y elija Tipo de grfico, lo cual
despliega una ventana, donde usted debe elegir la
opcin Lneas (Elija como subtipo de grfico el que
aparece por defecto). Luego haga click en Aceptar.
Otra forma de polgono es la Ojiva, la cual es el
polgono que se obtiene de unir por segmentos de recta
los puntos situados a una altura igual a la frecuencia
acumulada a partir de la marca de clase como se hace
con el polgono de frecuencia.
Ejemplo
La siguiente tabla resume la demanda diaria de cierto
producto durante 40 das seguidos
Tabla 2. Distribucin de frecuencias de la demanda
diaria de un producto.
Intervalo
4.5-9.5

9.5-14.5

11

14.5-19.5

13

19.5-24.5

10

24.5-29.5

La tabla anterior corresponde a una frecuencia para datos


cuantitativos. Los distintos intervalos son: (4.5, 9.5],
(9.5, 14.5], (14.5, 19.5], (19.5, 24.5], (19.5, 24.5], (24.5,
29.5]. La longitud de los intervalos es 5; los nmeros 4,
11, 13, 10 y 2, representan las respectivas frecuencias.
Procedimiento para la elaboracin del histograma en
Excel
Organice todos los datos en una columna
Elabore una columna que contenga los lmites de clase
(extremos de los intervalos en los que se desea agrupar
los datos). Para determinar los lmites haga lo siguiente:
Primero determine el nmero de intervalos, una manera
aproximada de este valor es obtenido por la regla de
Sturges: No. Intervalos
el nmero de datos. En nuestro caso

, donde

es

, y as el

nmero de intervalos se puede aproximar a


Otra
manera de aproximar el nmero de intervalos es dada
por
En nuestro ejemplo utilizaremos la regla de
Sturges.
Obtenga el rango como la resta entre el dato mayor y el
dato menor. En nuestro caso es 5.8
Obtenga el ancho del intervalo calculando el cociente
entre el rango y el nmero de intervalos. En nuestro caso
es 0.96 y se puede aproximar a 1.0, lo cual ocasiona un
incremento en el rango de 0.2. Por ello debemos restar al
dato menor 0.1 y al dato mayor sumar 0.1 (la mitad del
incremento del rango).
Elija en el men principal (barra superior de la ventana
principal de Excel), la opcin: Herramientas. Y en esta
seccione Anlisis de datos (sino aparece actvela
entrando por complementos y activando Herramientas
para anlisis).
En Anlisis de datos seleccione la opcin Histograma,
la cual despliega una ventana en la que aparecen las
siguientes opciones para entrar: Rango de entrada,
Rango de clases, Rtulos, Rango de salida, En una hoja
nueva, En un libro nuevo, Pareto (histograma ordenado),
Porcentaje acumulado y Crear grfico.
Rango de entrada: Dentro del rectngulo, haga click en
el cuadrado pequeo que tiene una flecha roja. Esto
ocasiona que la ventana de histograma se minimice.
Luego haga click en la celda del ttulo de la variable y
oprima la tecla Shift y flecha hacia abajo hasta el ltimo

dato para indicar el rango de entrada. Nuevamente haga


click en el cuadrado pequeo que tiene una flecha roja
(esto hace que la ventana de histograma se maximice) y
ubquese en Rango de clases.
Rango de clases: proceda como en el caso anterior pero
en la columna de las clases. Sino entra el rango de clases
pero si las dems opciones de histograma, Excel
determina por defecto las clases en que se agrupan los
datos.
Rtulos: haga click en el cuadrado de rtulos cuando al
entrar el rango de entrada se incluya el ttulo de la
variable.
Rango de salida: haga click en el crculo de rango de
salida y luego en el cuadrado pequeo que tiene una
flecha roja (la ventana de histograma se minimiza)
cuando usted quiera que la grfica aparezca en la hoja de
Excel que contiene su variable. Despus haga click en
una celda vaca.
En una hoja nueva: Elija esta opcin (haciendo click en
el crculo) cuando quiera que los resultados del
histograma aparezcan en una hoja nueva. Escriba en el
rectngulo de esta opcin el nombre que quiera darle a la
hoja que contiene los resultados de histograma.
En un libro nuevo: Elija esta opcin (haciendo click en
el crculo) cuando quiera que los resultados del
histograma aparezcan en un libro nuevo
Pareto (histograma ordenado): Seleccione esta opcin
para crear el diagrama de Pareto.
Porcentaje acumulado: Esta opcin permite crear
una Ojiva, para lo cual se debe hacer click en el crculo
de porcentaje acumulado y en el crculo de Crear
grfico. Luego aparece la siguiente grfica y tabla de
frecuencias acumuladas.

Tabla 3. Distribucin de frecuencias acumuladas para


los datos del porcentaje de algodn.

Clases

Frecuencias

% acumulado

33

9.38%

34

13

29.69%

35

22

64.06%

36

12

82.81%

37

92.19%

38

100.00%

Y mayor...

100.00%

Crear grfico: Si solo activa esta opcin y no activa


Pareto y Porcentaje acumulado se crea el histograma
como aparece en la figura 3.

Tambin aparece la siguiente tabla de distribucin de


frecuencias absolutas

Tabla 4. Distribucin de frecuencias para los


porcentajes de algodn.
Clases

Frecuencias

33

34

13

35

22

36

12

37

38

y mayor

Para eliminar "y mayor


, se debe hacer click en el
nmero de la fila que contiene la anterior expresin y
luego hacer click derecho y seleccionar Eliminar.
A continuacin se presenta el porcentaje de algodn en
un material utilizado para la fabricacin de camisas para
caballeros.

1. Construya: el diagrama de tallos y hojas, el


histograma, el polgono y la ojiva.
2. A qu valor se puede aproximar la tendencia de
los datos?
3. Parecen ser los datos muy variables?
4. Los datos son ms frecuentes cuando los
valores son pequeos?

Definicin 5
La frecuencia relativa de la clase
entre la frecuencia de la clase
total, se denota por

es el cociente

y el nmero de datos

Definicin 6
Tabla de frecuencias
Una tabla de frecuencias es un arreglo tabular de las
frecuencias con que ocurre cada caracterstica en que se
han dividido los datos. A continuacin se dan algunas
definiciones relacionadas en la construccin de la tabla
de frecuencias
Definicin 1
Un intervalo de clase, es cada uno de los rangos de
valores en que se ha decidido agrupar parcialmente los
datos con el propsito de hacer un resumen de ellos.
Definicin 2
El nmero de mediciones que quedan dentro del
intervalo se llama frecuencia del intervalo y se denota
por . La diferencia entre el extremo mayor y el extremo
menor del intervalo se llama longitud o ancho del
intervalo.
Definicin 3
La marca de clase, es el punto medio del intervalo de la
clase, se denota por
Su valor es obtenido al
promediar los extremos del intervalo.
Definicin 4
La frecuencia absoluta acumulada de la clase , es el
nmero resultante de sumar la frecuencia de la clase
con la frecuencia de las clases antecedentes y se
denota

La frecuencia acumulada relativa, de la clase

es el

cociente entre la frecuencia acumulada de la clase

y el

nmero de observaciones, se denota por


Todas las anteriores clases de distribuciones reciben el
nombre de distribuciones empricas.
Sugerencias para la construccin de la tabla de
distribucin de frecuencias
La construccin de una tabla de frecuencias para datos
cuantitativos presenta como su punto de mayor
importancia la determinacin del nmero de intervalos
(clases) que la conformaran. Este nmero depende de la
cantidad y de la naturaleza de los datos a resumir y del
propsito que se busca con el resumen. A continuacin
se presentan ciertas pautas para la construccin de una
tabla de frecuencias.
1. El nmero de intervalos debe escogerse de
acuerdo con el nmero de datos.
2. Una vez escogido el nmero de intervalos, se
determina la longitud que deben tener los
intervalos, dividiendo el rango en el nmero de
clases o intervalos.
rango/Nmero de
clases.
3. El primer intervalo debe contener el menor de
los datos y el ltimo el mayor.
Para los datos del ejemplo 1, constryase una tabla de
frecuencias.
Es posible conocer con la ojiva el valor aproximado del
nmero para el cual el 50% del porcentaje de algodn es
inferior a ese nmero?

Tipo de Motocicleta

Nmero de personas

Suzuki

Yamaha

Total

20

Diagramas circulares

Sera recomendable el diagrama de puntos si se tiene


muchos datos y cada uno aparece una sola vez?

PRESENTACIN DE DATOS CUALITATIVOS


Cuando se manejan variables cualitativas, las respuestas
categricas se pueden presentar en tablas de frecuencia o
tablas resumen y despus presentarlas en forma grfica.
En esta seccin se presentan algunas grficas de
frecuente uso en la presentacin de datos cualitativos.

Son utilizados en aquellos casos donde nos interesa no


slo mostrar el nmero de veces que se da una
caracterstica o atributo de manera tabular sino ms bien
de manera grfica, de tal manera que se pueda visualizar
mejor la proporcin en que aparece esa caracterstica
respecto del total.
Ejemplo
Continuando con el ejemplo de las motocicletas, el
grfico de pastel o torta o circular es dado en la figura 5.

Tabla de frecuencia o tabla resumen


La construccin de una tabla de frecuencia para datos
cualitativos requiere solo del conteo del nmero de
elementos o individuos que caen dentro de cierta clase o
categora.
Ejemplo
Se pidi a cada miembro de una muestra de 20 personas,
dueos de motocicletas, que dieran el nombre del
fabricante de su mquina. Los datos aparecen registrados
en la siguiente tabla
La tabla de distribucin de frecuencias se presenta a
continuacin.

Figura 5. Diagrama circular para los datos de las


motocicletas
Para construir el diagrama circular anterior, se parte del
hecho de que el crculo encierra un total de 360 grados.
Luego a cada categora se le asigna sus grados en el
crculo, mediante una regla de tres simple, por ejemplo
para la caracterstica Harley-Davinson, el sector
correspondiente es:

Tabla 6. Distribucin de frecuencias de los tipos de


motocicleta
Tipo de Motocicleta

Nmero de personas

Harley-Davinson

Honda

Kawasaki

Otra

Procedimiento para construir diagramas circular o


de pastel en Excel
Elabore la tabla de frecuencias como se hizo
anteriormente.

Sombrear la tabla de frecuencias editada y escoger el


icono de barras en el men principal (barras superiores
de la ventana de Excel). Esto muestra inmediatamente
una ventana titulada Asistente para grficos. Paso 1 de
4: tipo de grfico. Aqu elija circular y luego el tipo de
diagrama circular deseado. Haga click en Siguiente y se
presentan nuevas ventanas en la cuales debe entrar la
informacin necesaria. Por ltimo en la ventana de paso
4 hacer click en Finalizar.
Ejercicios
El nmero de empleados de una empresa se distribuye
porcentualmente de acuerdo con su tiempo de
vinculacin.
Tiempo de vinculacin
Porcentaje (%)
Menos de 5 aos
20
Entre 5 y menos de10 aos
50
Entre 10 y menos de 15 aos
15
Entre 15 y menos de 20
10
Ms de 20 aos
5
Construya el diagrama circular o de pastel y haga algn
comentario de la grfica
Situaciones Propuestas
En cada una de las siguientes situaciones del ejercicio
anterior adems de realizar lo solicitado en el ejercicio,
responda las siguientes preguntas:

Cul es el valor aproximado al cual tienden los


datos?

Cul es el comportamiento de la distribucin de


los datos?

Parece ser que los datos son muy variables?

Cul grfico es ms recomendado para


presentar los datos?
Solucione las siguientes situaciones:

Ejercicio 2.1 de Mendenhall. Pgina 20 (grficas


de datos cualitativos)

Ejercicio 1.16 pgina 15 de Montgomery.


Propone la elaboracin de un diagrama de Pareto

Ejercicio 2.7 pgina 23 de Mendenhall. Propone


la elaboracin de un diagrama de Pareto.

Elabore un diagrama de flujo y un diagrama de


causa-efecto para alguna situacin de inters de tal
manera que le permita identificar problemas.

Diagrama de barras
Este grfico consiste de una serie de barras horizontales
verticales asignadas a cada categora de la variable
cualitativa cuyas alturas son dadas por la frecuencia de la
categora. A continuacin se dan algunas sugerencias
para la elaboracin de grficas de barras.
1. Para respuestas categricas cualitativas, las
barras se deben disear en forma horizontal y
para respuestas categricas numricas, en forma
vertical.
2. Todas las barras deben ser del mismo ancho para
no confundir al lector.
3. Los espacios entre barras deben ser igual a la
mitad del ancho de las barras.
4. Se deben incluir las escalas y algunas
indicaciones para que ayuden a la lectura de las
grficas.
5. Los ejes de las grficas se deben identificar en
forma clara.
6. Se deben incluir dentro del cuerpo de la grfica,
o debajo, todo tipo de ``claves'' para la
interpretacin de las grficas.
7. El ttulo de la grfica debe aparecer debajo del
cuerpo.
8. Las notas de pie de pgina, o sobre fuentes,
cuando sean necesarias, se deben colocar
despus del ttulo.
OTRAS REPRESENTACIONES GRFICAS
Existen otras grficas para presentar datos, las cuales no
se abordaran en este curso. A continuacin trataremos
una de estas.
Diagrama de Pareto
Los diagramas de Pareto son una importante herramienta
en los procesos de mejoramiento de la calidad. Alfredo
Pareto, un economista italiano en la era 1848-1923,
encontr que la riqueza se encuentra en pocas personas.
Esta observacin le llevo a formular el principio de
Pareto " Un pequeo segmento de la poblacin es dueo
de la mayora de las riquezas". Este principio aplica al
mejoramiento de la calidad. En las organizaciones de
manufactura o servicios, por ejemplo el problema de

reas o tipos de defectos siguen de distribuciones


similares. De todos los problemas que ocurren,
solamente unos pocos son realmente frecuentes, los otros
raramente ocurren. As, agrupando las reas de esos
problemas en dos categoras, ellas son denominadas
como la poco vital y la muy trivial. El principio de
Pareto tambin imparte soporte para la regla de
que dice que el

de los problemas (inconformidad

o defectos) son ocasionados por el

de las causas.

Los diagramas de Pareto ayudan a identificar


rpidamente las reas crticas (aquellas que causan ms
problemas) que merecen inmediata atencin. La
identificacin de esos problemas cuya resolucin puede
llevar a un sustancial mejoramiento en la calidad. Los
diagramas de Pareto arreglan los problemas en orden de
importancia, la "importancia", por ejemplo, puede
referirse al impacto financiero de un problema o el
nmero relativo de ocurrencia del problema. Los pasos
para construir un diagrama de Pareto son:
Paso 1: Determine la categorizacin del sistema de
datos, es decir, por tipo de problema, tipo de
inconformidad (crtica, grave, menor), o cualquier otra
que tambin veamos apropiada.
Paso 2: Determine como ser juzgada la importancia
relativa. Esto es, si se debera basar sobre valores
monetarios o la frecuencia de ocurrencia.
Paso 3: Establezca el rango de las categoras de la ms
importante a la menos importante.
Paso 4: Calcule la frecuencia acumulativa de las
categoras de los datos en el orden seleccionado.
Paso 5: Dibuje un grfico de barras, mostrando la
importancia relativa de cada problema en orden
descendente. Identificando lo poco vital que merece
inmediata atencin.
Ejemplo
Un problema de inters para la Divisin de Economa
Comercial (DEC) del Departamento de Trabajo de
Estados Unidos. Cada ao, la DEC monitorea la

empresas que fracasan y clasifica cada fracaso en una de


las seis siguientes categoras: (1) falta de experiencia en
la lnea de produccin, (2) falta de experiencia gerencial,
(3) experiencia desequilibrada, (4) incompetencia, (5)
otras causas (como negligencia, fraude y desastres
naturales) y (6) causas desconocidas. Estas
informaciones se basan en las opiniones de acreedores
informados y los informes de la DEC. En fechas
recientes, la DEC determin la causa de 1463 fracasos
de empresas constructoras. Los fracasos se muestran en
la siguiente tabla.
Tabla 7. Distribucin de frecuencias de los fracasos
de empresas constructoras
Causas
subyacentes

Frecuencia Proporcin
Frecuencia relativa
acumulativa

Incompetencia 698

0.477

0.477

Experiencia
314
desequilibrada

0.215

0.692

Falta
de
experiencia
236
gerencial

0.161

0.853

Falta
de
experiencia de 111
lnea

0.076

0.929

Causa
desconocida

83

0.057

0.986

Otras causas

21

0.014

1.000

TOTALES

1463

1.000

Figura 6. Diagrama de Pareto para la tabla

Ejemplo

Diagrama de causa y efecto

La resistencia de una viga de cemento para la


construccin de un puente podra ser la caracterstica de
calidad que representa el efecto principal. Las
proporciones de varios ingredientes usados para hacer el
cemento son causas, en la categora de material, que
tiene impacto sobre la resistencia de la viga. Ver la figura
2

Los diagramas de causa efecto fueron desarrollados por


Kaoru Ishikawa en 1943 y son frecuentemente llamados
Diagramas de Ishikawa o diagramas de espina por su
apariencia grfica. Bsicamente los diagramas de causa
y efecto son usados para identificar y listar
sistemticamente las diferentes causas que pueden ser
atribuidas a un problema (o un efecto). Esos diagramas
ayudan a determinar cules de las causas tienen mayor
efecto. Existen tres aplicaciones principales de los
diagramas de causa y efecto: enumeracin de causa,
anlisis de dispersin y anlisis de procesos.
Enumeracin de causas
Es una de las tcnicas grficas ms ampliamente usada
en el control de calidad y el mejoramiento. Es
usualmente desarrollada a travs de una sesin de ideas
geniales en la cual todos los posibles tipos de causas (por
ms remotas que sean) son listadas para mostrar su
influencia sobre los problemas (o efectos) en cuestin.
Los procedimientos consisten en primero definir el
problema o la caracterstica de calidad seleccionada para
el estudio de tal manera que cada uno conozca que inicia
la lnea. Luego se registra la causa ms grave que influye
sobre la caracterstica. En un proceso de manufactura,
por ejemplo, la causa ms grave para una irregularidad
(por decir la longitud no rene las especificaciones)
podran ser el equipo, operador, mtodos, ambientes y
otras como estas. Posteriormente se listan las su causas
dentro de las ms graves. Antes de evaluar cada causa se
deben definir, identificar claramente y evaluar mtodos
apropiados de medida. Seguidamente, una causa es
escogida y analizada. Esto se hace sistemticamente, de
tal manera que la causa predominante es analizada
primero.
Una ventaja obtenida al usar el diagrama de causa y
efecto, es que el mtodo de su construccin permite un
mejor entendimiento de los componentes de los procesos
y sus relaciones, y as un mejor entendimiento del
mismo.

Figura 7. Diagrama de causa-efecto


resistencia de la viga de un puente

para la

Diagrama de flujo
El diagrama de flujo muestra la secuencia de eventos en
un proceso. Ellos son usados para operaciones de
manufactura y servicio. Los diagramas de flujos son
frecuentemente usados para diagramar procedimientos
operacionales que simplifican el sistema. Ellos pueden
identificar embotellamientos, pasos redundantes,
actividades que no adicionan valor. Un diagrama de flujo
real puede ser construido usando el conocimiento del
personal que est directamente relacionado con un
proceso particular. Informacin importante de los
procesos es obtenida a travs de la construccin de los
diagramas de flujo. En la figura 3, se presenta un
diagrama de flujo para el procesamiento de nuevos
pedidos. El diagrama de flujo identifica donde pueden
ocurrir demoras, por ejemplo, cuando una orden de
compra no ha sido recibida.

Donde

son respectivamente el punto medio y la

frecuencia del

intervalo.

Ejemplo
Se toman 10 mediciones del dimetro interno de los
tornillos para los pistones del motor de un automvil.
Los datos (en mm) son: 74.001, 74.003, 74.015, 74.000,
74.002, 74.005, 74.001, 74.001, 74.002, 74.004. La
media muestral del dimetro interno de los tornillos es

Figura 8. Diagrama de flujo


para el procesamiento de un orden de pedido

Ejemplo

MEDIDAS DE TENDENCIA

La media aritmtica para la siguiente tabla de


frecuencias est dada por

Una medida de posicin o de tendencia es un nmero


que se toma como orientacin para referirnos a un
conjunto de datos.

Clases Marca de clase (

Media Aritmtica muestra


La media aritmtica muestra representa el centro fsico
del conjunto de datos y se define como la suma de los
valores observados, dividido por el total de
observaciones. Si

son

Frecuencias (

33-34

33.5

34-35

34.5

13

35-36

35.5

22

36-37

36.5

12

37-38

37.5

38-39

38.5

observaciones

numricas, entonces la media aritmtica de estas


observaciones, se define como:

Caso de datos agrupados


Cuando se trata de datos agrupados (tabla de
frecuencias) la media aritmtica se puede aproximar
mediante la expresin:

Caso de datos agrupados


Suponga que la distancia recorrida por un automvil
marca A, antes de que presente la primera falla mecnica
es dada en la siguiente tabla.
Distancia recorrida
Frecuencia
(miles de millas)
0-20

20-40

11

40-60

16

60-80

25

80-100

34

Distancia recorrida
(miles de millas)

Frecuencia

100-120

46

120-140

33

140-160

16

160-180

12

un estudiante que haya obtenido una calificacin de 4 en


la asignatura A y de 5 en la asignatura B, la nota
promedio ponderado est dada por

180-200
2
Calcule la media aritmtica e interprtela.
Ejemplo
Media ponderada
En algunos casos cada una de las observaciones tiene
una importancia relativa (peso) respecto de los dems
elementos. Cuando esto sucede la media est dada por:

Suponga que en el ao 2000 los empleados de una


empresa industria tienen salario promedio de $2.500.000
y para el ao 2001 se les hizo un aumento de 15 %.
Adems se les da una bonificacin mensual de $50.000
por aniversario de la empresa. Cul es el salario
promedio del ao 2001?
Solucin

En donde son los pesos o ponderaciones de las


observaciones. Esta media se llama media aritmtica
ponderada.

Suponga que es la variable salario del ao 2000,


luego el salario promedio se denota por
.

Propiedades de la Media Aritmtica


Ahora sea el salario del ao 2001 dado por la variable
1. Una de las ms importantes es que la suma de las
desviaciones respecto de la media es igual a cero, esto es

que es el resultado de la transformacin de la variable .

Y as el salario promedio del ao 2001 es


2. Otra propiedad importante es que si se tiene la
media

de un conjunto de datos y a cada observacin

se multiplica por una constante

y se le suma una

constante , entonces la nueva media de los datos se


obtiene multiplicando a la media de los datos por

sumndoles
Se suele interpretar esta propiedad como
el hecho de que la media no se altera por una
transformacin lineal de escala.
Ejemplo
Si la asignatura A tiene un valor de 2 crditos y la
asignatura B tiene un valor de 3 crditos. Entonces, para

Ejercicios
A continuacin se muestran las ponderaciones de las
evaluaciones en los cursos de probabilidad y estadstica
y las notas de un estudiante durante el semestre.
Evaluacin
Nota
Porcentaje
Parcial 1
4.5
20
Parcial 2
3.5
20
Parcial 3
4.0
20
Examen final
4.0
20
Tema especial
4.5
10

Evaluacin
Otras evaluaciones

Nota
4.2

Porcentaje
10

Se ha calculado que, durante el primer ao de uso, cierta


mquina sufre una depreciacin del 16% respecto a su
valor de costo, y que, durante el segundo ao, la
depreciacin es del 9% del valor que tena al comenzar
dicho segundo ao. Encuntrese un tanto por ciento
promedios de depreciacin anual.

Determine la nota promedio del estudiante.


Media geomtrica
La media geomtrica (MG), de un conjunto de
nmeros positivos se define como la

n-

del

producto de los nmeros. Por tanto, la frmula para la


media geomtrica es dada por

Media armnica
La media armnica se define como el recproco de la
media aritmtica de los recprocos:

Existen dos usos principales de la media geomtrica:


1. Para promediar porcentajes, ndices y cifras
relativas y
2. Para determinar el incremento porcentual
promedio en ventas, produccin u otras
actividades o series econmicas de un periodo a
otro.
Ejemplo

Este valor se emplea para promediar variaciones con


respecto al tiempo.
Observaciones sobre la media Geomtrica y la media
Armnica
El empleo de la media geomtrica o de la armnica
equivale a una transformacin de la variable en log

Supngase que las utilidades obtenidas por una


compaa constructora en cuatro proyectos fueron de 3,
2, 4 y 6%, respectivamente. Cul es la media
geomtrica de las ganancias?
En este ejemplo
determinada por

y as la media geomtrica es

, respectivamente, y el clculo de la media


aritmtica de la nueva variable; por ejemplo, si la
variable abarca un campo de variacin muy grande, tal
como el porcentaje de impureza de un producto qumico,
por lo general alrededor del 0.1%, pero que en ocasiones
llega incluso al 1% o ms, puede ser ventajoso el empleo
de log en lugar de para obtener una distribucin
ms simtrica y que se aproxime ms a una distribucin
normal. La media aritmtica de log

es el logaritmo de

la media geomtrica de , de forma que la media


empleada es equivalente al empleo de la media
Y as la media geomtrica de las utilidades es el 3.46%.

geomtrica como valor medio de .

La media aritmtica de los valores anteriores es 3.75%.


Aunque el valor 6% no es muy grande, hace que la
media aritmtica se incline hacia valores elevados. La
media geomtrica no se ve tan afectada por valores
extremos.

1. Construya la columna con los datos en Excel.

Ejercicios

Nmero 1: ingrese el rango de los datos

2. Ingrese a f y seleccione estadsticas y luego


active MEDIA. GEOM o MEDIA. ARMO, entonces
aparecer una ventana en la que se le pide

Nmero 2: ingrese el rango de otro conjunto de datos


Ejemplo
Supngase que una familia realiza un viaje en automvil
a un ciudad y cubre los primeros 100 km a 60 km/h, los
siguientes 100 km a 70 km/h y los ltimos 100 km a 80
km/h. Calcular, en esas condiciones, la velocidad media
realizada.
Medidas de posicin relativa

La mediana
Sea

una

muestra

observaciones. Mediante la escritura


elemento menor de la muestra; por

aleatoria

de

se indica el
el elemento que

le sigue al menor y as sucesivamente hasta llegar a


que representa al elemento mayor.
La Mediana, de un conjunto de observaciones es el valor
para el cual, cuando todas las observaciones se ordenan
de manera creciente, la mitad de stas es menor que este
valor y la otra mitad mayor.
Sea
una muestra aleatoria de
observaciones, la Mediana de estos datos se denota y se
define de la siguiente manera:

Estas medidas son tambin llamadas cuantilas, cuantiles


o fractiles y cuyo objetivo es describir el
comportamiento de una variable dividiendo la serie de
valores en diferente nmero de partes porcentualmente
iguales, las ms usadas son: los cuartiles (cuartas partes),
los deciles (decimas partes) y los centiles o percentiles
(centsimas partes).

Son aquellos nmeros que dividen a stas en cuatro


partes porcentualmente iguales. Hay tres cuartiles, Q1,
Q2 y Q3. El primer cuartil Q1, es el valor en el cual o
por debajo del cual queda aproximadamente un cuarto
(25%) de todos los valores de la sucesin (ordenada); El
segundo cuartil Q2 es el valor por debajo del cual queda
el 50% de los datos (Mediana), el tercer cuartil Q3 es el
valor por debajo del cual quedan las tres cuartas partes
(75%) de los datos.

Ejemplo
Suponga que se tienen las duraciones en horas de un
cierto tipo de lmparas incandescentes
612,623, 666, 744, 883, 898, 964, 970, 983, 1003, 1016,
1022, 1029, 1058, 1085, 1088, 1122, 1135, 1197, 1201.
Como hay 20 datos y se encuentran ordenados, entonces
la mediana es dada por

Los Cuartiles

Los Deciles

Son ciertos nmeros que dividen el conjunto de


observaciones (ordenadas) en diez parte porcentualmente
iguales. Los deciles se denotan por D1, D2,. . ., D9. El
decir 5 corresponde al cuartil 2 (mediana).

Los Percentiles

Son ciertos nmeros que dividen el conjunto de datos


ordenados en cien partes porcentualmente iguales. El
percentil 50 equivale a la mediana.
Considerando la definicin de la mediana, esta ser el
segundo cuartil, el quinto decir o el 50avo percentil o
cantil. En cualquiera de estas medidas el valor

matemtico que se obtenga ser representativo del


nmero de datos o menos que corresponde al valor
relativo planteado. (Ejemplo: el primer cuartil es un
valor representativo del 25% o menos de los valores de
una distribucin, es decir, los valores inferiores de la
distribucin).
El procedimiento para encontrar el valor de cualquier
percentil
siguiente:

a partir de datos clasificados, es el

1. Encontrar la

posicin

del

mediante el clculo de

percentil
.

2. Si
no es un entero, entonces la posicin es
el siguiente entero ms grande y entonces el
valor de
es el dato ordenado en la posicin de
este entero ms grande.
3. Si

es un entero, entonces la posicin del

percentil ser
y as el valor del
percentil es el promedio de las observaciones
ordenadas
Ejemplo

de fallas del material elctrico


aproximadamente inferior a 3192 horas.

aislante

es

1. Suponga que las notas de los estudiantes de un


curso en un examen parcial tuvo una media
aritmtica de 3.5, pero el profesor decide colocar
como nueva nota, el 80% de su nota anterior ms
uno. Cul es la nueva nota promedio del curso?
(esta transformacin es conocida como la curva
del ocho).
2. Cmo se encuentran ubicados la media, la
mediana y la moda cuando la distribucin es
simtrica, sesgada a la derecha o sesgada a la
izquierda?
3. Determine un conjunto de datos tales que:
o
La media, mediana y moda sean iguales
o
La mediana sea mayor que la media
o
La media sea mayor que la mediana.
4. Durante determinado ao, los precios de tres
artculos de primera necesidad aumentaron en el
3%, el 8% y el 9% de su respectivo precio
promedio del ao anterior. Determnese el tanto
por ciento medio del aumento en el precio de
dichos artculos.
5. Para cada uno de los conjuntos de datos del
numeral 3, encuentre los cuartiles 1, 2 y 3 e
interprtelos

A continuacin se presentan 20 observaciones en orden


del tiempo de falla, en horas, de un material aislante
elctrico (adaptadas del trabajo de Nelson, App lied Life
Data Analysis, 1982):

MEDIDAS DE VARIABILIDAD

204 228 252 300 324 444 624 720 816 912

Medidas de variabilidad - introduccin

1176 1296 1392 1488 1512 2520 2856 3192 3528 3710
Para encontrar el percentil 10,
0.10,

, el valor de

es

es un entero, el nmero de

la posicin es
, el cual es el promedio de
las observaciones segunda y tercera. Por tanto, el
percentil 10 es
, lo
cual significa que el 10% de los tiempos de fallas del
material elctrico aislante es aproximadamente inferior a
240 horas.
El percentil 88 se encuentra de manera similar. Puesto
que ahora k=0.88, nk=20

, que no es

un entero, y el nmero de la posicin es


. Por
tanto, el percentil 88 es la observacin ordenada nmero
18, esto es

=3192; es decir el 88% de los tiempos

Una medida de dispersin o variabilidad nos determina


el grado de acercamiento o distanciamiento de los
valores de una distribucin frente a su promedio de
localizacin, sobre la base de que entre ms grande sea
el grado de variacin menor uniformidad tendrn los
datos (sinnimo de heterogeneidad) y por lo tanto menor
representatividad o confiabilidad del promedio de
tendencia central o localizacin por haber sido obtenido
de datos dispersos. Por el contrario, si este valor es
pequeo (respecto a la unidad de medida) entonces hay
una gran uniformidad entre los datos. Cuando es cero
quiere decir que todos los datos son iguales.
Hay bsicamente dos tipos de medidas de dispersin:
Medidas Absolutas y Medidas Relativas. Las absolutas
se caracterizan por ser nmeros concretos, es decir,

valores expresados en las mismas unidades de la variable


en estudio y que por lo tanto no permiten comparaciones
o anlisis respecto a la mayor o menor dispersin de
series expresadas en diferentes unidades. Estas medidas
son: la varianza, la desviacin estndar y el rango
intercuartilico.
Las medidas relativas de dispersin son valores
abstractos, es decir, medidas adimensionales y por lo
tanto no expresadas en ninguna unidad especfica,
obviando as el inconveniente sealado para las medidas
absolutas. La principal medida es el coeficiente de
variacin.

Ejemplo propiedades de la varianza


Retomando el ejemplo 4 de la clase 04 y suponiendo que
la varianza de los salarios del ao 2000 fue 100.000, se
tiene que la varianza para los salarios del ao 2001 es

La varianza muestral

Mediana de las desviaciones absolutas (la


media)

Se puede definir como el "casi promedio" de los


cuadrados de las desviaciones de los datos con respecto a
la media muestral. Su frmula matemtica para el caso
de datos referentes a una muestra es:

Cuando la mediana es la medida de tendencia que mejor


representa los datos, la Meda es la medida ms
apropiada. Se calcula mediante:

Y para el caso de datos de una poblacin es dada por:

Es decir, contiene la mediana de las diferencias, en valor


absoluto, respecto a la mediana. El proceso de clculo
supone que se debe obtener, en primer lugar, el valor de
la mediana de la muestra y, a continuacin, obtener las
diferencias en valor absoluto de cada uno de los valores
con la mediana. Luego se ordenan estas diferencias y se
determina la mediana.

Propiedades de la varianza
Ejemplo
Dos propiedades importantes de la varianza son:
1. La varianza de una constante es cero
2. Otra propiedad importante es que si se tiene la
varianza

10, 10, 11, 12, 12, 13, 14, 15, 15, 15, 16, 18, 19

de un conjunto de datos y a cada

observacin se multiplica por una constante ,


entonces la nueva varianza de los datos se
obtiene multiplicando a la varianza de los datos
por
Ejemplo

Suponga que se tiene la siguiente muestra

La varianza muestral para los datos del ejemplo 1 de la


clase 04, se determina de la siguiente manera

Aqu la mediana es 7
Las respectivas desviaciones en valor absoluto de cada
dato con respecto a la mediana son:
4, 4, 3, 2, 2, 1, 0, 1, 1, 1, 2, 4, 5
Reordenando se tiene
0, 1, 1, 1, 1, 2, 2, 2, 3, 4, 4, 4, 5

Y as la meda es 2
Existen dos maneras para obtener las medidas de
tendencia en Excel:
1. Ingrese a herramientas, luego a anlisis de datos
y en este elija la opcin Estadstica descriptiva.
Luego ingrese el rango de entrada y active la
opcin resumen de estadsticas.

Es una medida de variabilidad que no se deja influenciar


por medidas extremas grandes o pequeas
El coeficiente de variacin
Es una medida que se emplea fundamentalmente para:
1. Comparar la variabilidad entre dos grupos de
datos referidos a distintos sistemas de unidades
de medida. Por ejemplo, kilogramos y
centmetros.
2. Comparar la variabilidad entre dos grupos de
datos obtenidos por dos o ms personas
distintas.
3. Comparar dos grupos de datos que tienen
distinta media.
4. Determinar si cierta media es consistente con
cierta varianza. end(enumrate)

2. Ingrese f (pegar
funcin)
y
en
esta
seleccione Estadsticas y luego haga clic sobre
la medida deseada.

La desviacin estndar muestral


Al tomar el cuadrado de las desviaciones con respecto a
la media para el clculo de la varianza, las unidades en
que estn dados los datos tambin se expresaran en
unidades al cuadrado. Esto puede no tener sentido. Por
otra parte, al tomar el cuadrado, la diferencia real entre
el dato particular y la media se magnifica. Estas
circunstancias condujeron a que se le hiciera una
modificacin a la anterior medida y se lleg de esta
manera al concepto de desviacin estndar, la cual se
define como la raz cuadrada de la varianza, esto es,

Ejemplo
La desviacin estndar para los datos del ejemplo 1 de la
clase 04 es

El Coeficiente de Variacin muestral se denota y se


define como:
(
Ejemplo
Con un micrmetro, se realizan mediciones del dimetro
de un balero, que tienen una media de 4.03 mm y una
desviacin estndar de 0.012 mm; con otro micrmetro
se toman mediciones de la longitud de un tornillo que
tiene una media de 1.76 pulgadas y una desviacin
estndar de 0.0075 pulgadas. Cul de los dos
micrmetros presenta una variabilidad relativamente
menor? Los coeficientes de variacin son:
CV
CV

El rango intercuartilico
Es la distancia entre los cuartiles superior e inferior y se
define como:

y
=

En consecuencia, las mediciones hechas por el primer


micrmetro exhiben una variabilidad relativamente
menor con respecto a su media que las efectuadas por el
otro.
MEDIDAS DE FORMA

Son medidas que determinan numricamente algunas


caractersticas de la forma en que estn distribuidos los
datos. Entre estas medidas se tiene: el coeficiente de
asimetra o coeficiente de sesgo y el coeficiente de
curtosis.

distribucin se denominan coeficientes de curtosis, o


simplemente curtosis. Una medida que se usa con
frecuencia est dada por

Coeficiente de asimetra
Con frecuencia una distribucin no es simtrica
alrededor de ningn valor, pero en lugar de ello se tiene
que los datos estn ms aglomerados o distribuidos hacia
los extremos. Si hay pocos datos distribuidos hacia el
extremo derecho se dice que la distribucin es sesgada a
la derecha, mientras que si hay pocos datos distribuidos
hacia la izquierda, se dice que la distribucin es sesgada
hacia la izquierda. Las medidas que describen esta
asimetra se denominan coeficiente de sesgo, o
simplemente sesgo. Una de dichas medidas es

Cuando el valor de
se dice que los datos se
distribuyen forma normal, o de campana o mesocrtica.
Si
entonces la distribucin es ms empinada
que la curva normal y se dice que es leptocrtica.
Si
entonces la distribucin es ms aplanada
que la curva normal y se llama platicrtica.
Observaciones:
Cuando se desea calcular el coeficiente de sesgo o de
curtosis en una muestra slo se necesita reemplazar en la
expresin anterior el valor de la media poblacional por la
media muestral y el tamao de poblacin por el tamao
de la muestra.
Si los datos estn agrupados o ponderados por
se
multiplicara la expresin del parntesis en el numerador

Donde

y el denominador por

Es un valor de la variable de estudio

Diagrama de cajas
Es el valor de la media poblacional de la variable de
estudio.
Es el total de datos en la poblacional.
La medida
ser positiva o negativa si la distribucin
es sesgada a la derecha o a la izquierda, respectivamente.
Para una distribucin simtrica,

Coeficiente de curtosis
En algn caso unos datos pueden estar concentrados
alrededor de la media, de manera que la distribucin
tiene un pico grande. En otros casos, la distribucin
puede ser relativamente plana. Las medidas que
determinan que tan empinada se encuentra una

Los diagramas de tallo y hoja y los histogramas


proporcionan impresiones ms bien generales acerca de
un conjunto de datos, mientras que la media y la
desviacin estndar se concentra en un solo aspecto de la
informacin. En aos recientes, un resumen grfico
llamado Diagrama de Bloque se ha empleado de manera
satisfactoria para describir varias de las ms destacadas
caractersticas de un conjunto de datos. Estas
caractersticas incluyen: centro, dispersin, naturaleza y
magnitud de cualquier desviacin de la simetra e
identificacin de "puntos inusuales"; es decir,
observaciones que estn desafortunadamente lejos del
cuerpo principal de los datos. Debido a que incluso un
solo punto inusual puede afectar de manera drstica el
valor de algunas medidas numricas (como la media y la

desviacin estndar), un diagrama de bloque est basado


en medidas que son "resistentes" a la presencia de unos
cuantos puntos inusuales, la mediana y los cuartiles.

controlar un conjunto de variables para llegar a obtener


una caracterstica de calidad deseada.
Ejemplo

Un diagrama de bloque se puede construir mediante la


siguiente secuencia de pasos:
1. Dibujar y marcar un eje de medida horizontal.
2. Construir un rectngulo cuyo borde izquierdo
est arriba del primer cuartil y cuyo borde
derecho est arriba del tercer cuartil.
3. Dibujar un segmento de recta vertical dentro del
bloque o caja arriba de la mediana.
4. Prolongar rectas desde cada extremo del bloque
o de la caja hasta las observaciones ms lejanas
que estn todava a menos de 1.5 veces el rango
intercuartlico de los bordes correspondientes.
5. Dibujar un circulo vaco para identificar cada
observacin que caiga entre 1.5 y 3.0 veces el
rango intercuartlico a partir del borde del
rectngulo; stos se llaman puntos inusuales
suaves.
6. Dibujar un circulo relleno para identificar cada
observacin que caiga a ms de del borde ms
cercano; stos se llaman puntos inusuales
extremos.

Supongamos que se est interesado en determinar la


relacin entre la profundidad de corte en una operacin
de fabricacin y la cantidad de desgaste de la
herramienta. Suponga que se toman 40 observaciones
del proceso tal que la profundidad de corte (en
milmetros) varia en un rango de valores y el
correspondiente desgaste de la herramienta (en
milmetros) sobre 40 ciclos de operaciones.
El coeficiente de correlacin
La fuerza de asociacin entre las dos variables puede
obtenerse descriptivamente por medio del coeficiente de
correlacin muestral, denotado por R, esta medida es
calculada por la expresin

Para los datos del ejemplo anterior el Coeficiente de


correlacin es 0,917
DATOS PARA DOS VARIABLES
En muchos casos industriales se requiere conocer la
relacin de dos variables ya sean categricas o
cuantitativas, caso en el cual es necesario primero
presentar una anlisis descriptivo de la informacin, para
lo cual es recomendable inicialmente realizar grficos
como el diagrama de dispersin o los diagramas de
barras. En esta seccin se estudian estos dos tipos de
grficos.
Diagrama de dispersin
La forma simple de un diagrama de dispersin consiste
de un grfico en el plano cartesiano para mostrar la
relacin entre dos variables. Cuando se analizan
procesos, la relacin entre una variable controlable y una
caracterstica de calidad es de frecuente importancia.
Conociendo esta relacin se puede llegar a decidir cmo

Los valores de r oscilan entre -1 y 1. Entre ms cercano


sea el valor a 1 o -1 mejor es el ajuste de la recta de
regresin. Un valor de r = 0 indica que no existe relacin
lineal entre las dos variables pero puede existir otro tipo
de relacin (curvilnea). Un valor positivo de r indica
que la recta sube hacia la derecha; un valor negativo, que
la recta baja hacia la derecha. En la figura 2 se presentan
algunas situaciones relacionados con el tipo de relacin
entre dos variables y el coeficiente de correlacin.

Mquinas
1

El nmero de fallas es independiente del turno?

Figura 2. Algunos diagramas de dispersin tpicos


con valores aproximados de r.
Ejercicios
La resistencia del papel utilizado en la fabricacin de
cajas de cartulina est relacionada con la concentracin
de madera dura en la pulpa original. Bajos condiciones
controladas, una planta piloto fabrica 16 muestras, cada
una con un lote de diferente pulpa, y mide la resistencia
a la tensin. Los datos obtenidos se presentan a
continuacin:
y 101.4 117.4 117.1 106.2 131.9 146.9 146.8 133.9
x 1.0
1.5 1.5 1.5 2.0
2.0 2.2 2.4
y 11.0 123.0 125.1 145.2 134.3 144.5 143.7 146.9
x 2.5 2.5
2.8
2.8
3.0
3.0
3.2
3.3
a) Elabore el grfico de dispersin
b) Qu tipo de relacin parece existir entre las dos
variables?
Tablas de contingencia

El inters en una tabla de contingencia es probar la


hiptesis de que los mtodos de clasificacin renglncolumna son independientes. Si se rechaza la hiptesis
entonces se concluye que existe alguna interaccin entre
los dos criterios de clasificacin. Los procedimientos de
prueba pueden verse en la bibliografa citada.
Procedimiento en Excel para tablas de contingencia
Cmo presentar grficamente una tabla de
contingencia?
Existen diversos grficos utilizados para la presentacin
de tablas de contingencia, a continuacin se presenta el
grfico de barras y el grafico de barra combinadas.
Diagramas de barras
En algunos casos es conveniente para propsitos
comparativos representar mediante un mismo grfico
dos caractersticas que estn relacionadas. Estas grficas
se llaman grfico de barras. Para su elaboracin se
requiere primero elaborar la tabla de contingencia. A
continuacin se ilustra el diagrama de barras para los
datos del ejemplo 2.

En ciertas ocasiones, los elementos de una muestra


tomada de una poblacin pueden clasificarse de acuerdo
con dos criterios diferentes. Por tanto, es importante
conocer si estadsticamente los dos mtodos de
clasificacin son estadsticamente independientes.
Ejemplo
Una compaa opera cuatro mquinas tres turnos al da.
De los registros de produccin, se obtienen los siguientes
datos sobre el nmero de fallas
Figura 4. Nmero de fallas en cada una de las
mquinas por turno

Mquinas
Turno

De la grfica se puede observar que parece ser que


durante el turno 3 se present el mayor nmero de fallas
en la mayora de la grfica.
1. Elabore tabla de contingencia como se describi
anteriormente
2. Con los resultados del paso anterior elabore una
nueva tabla en otras celdas de Excel.

3. Seleccione el icono de barras en la barra de


men principal o seleccione la Insertar la
opcin Grfico. Usted puede cambiar este tipo,
haciendo click derecho sobre la grfica y
seleccionando tipo de grfico.

Potrebbero piacerti anche