Sei sulla pagina 1di 15

CONTENIDOS TEMTICOS DE LA UNIDAD

Generalidades
Definicin y campos de la estadstica
Poblacin, Muestra, Datos y Evento.
Fuentes de Informacin.
Planeacin y preparacin de una investigacin estadstica.

Distribucin de Frecuencias, tablas y graficas:


Sumatoria, Propiedades.
Productoria, Propiedades.
Variable, Tipos.
Tablas de distribucin de frecuencia.
Representaciones grficas

BIBLIOGRAFA GENERAL DEL CURSO


Probabilidad y estadstica para ingenieros. Walpole myers. Pearson education
Probabilidad y estadstica para ingeniera y ciencias. Mendenhall sincich. Prentice hall
Estadstica para las ciencias sociales. Ritchey, f..mc graw hill
Probabilidad y estadstica para ingenieros .miller freund .prentice hall
Estadstica y muestreo. Ciro martinez. Ecoe

CIBERGRAFIA
Qu es la estadstica?
http://www.youtube.com/watch?v=zoAdhtNltkw&feature=related
Estadstica descriptiva. I Datos estadsticos.
http://www.youtube.com/watch?v=vOPpHtqOFHo&feature=endscreen&NR=1
Grficos estadsticos
http://roble.pntic.mec.es/igam0034/estadistica/graficos-estadisticos.pdf
http://www.ine.es/explica/docs/pasos_tipos_graficos.pdf
http://www.udb.edu.sv/udb/archivo/guia/informatica-ingenieria/emprematica/2014/i/guia-8.pdf
Tabla de frecuencias
http://es.slideshare.net/Gerardo1977/intervalos-de-clase-estadstica
DEFINICIONES BSICAS DE ESTADSTICA

ESTADSTICA.
es la rama de las matemticas, y una herramienta que utiliza un conjunto de mtodos, normas, reglas
y principios para la observacin, recoleccin, organizacin, descripcin, presentacin y anlisis del
comportamiento de un grupo de datos para la conclusin sobre un experimento o fenmeno. La
estadstica se divide en dos partes, estadstica descriptiva y estadstica inferencial.

Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen de datos originados a


partir de los fenmenos de estudio. Estudia las tcnicas y mtodos que sirven para la observacin,
recoleccin, organizacin, descripcin, presentacin y anlisis de datos.

Estadstica Inferencial: Se dedica a la generacin de los modelos, inferencias y predicciones


asociadas a los fenmenos en cuestin teniendo en cuenta la aleatoriedad de las observaciones.
Intenta dar explicacin, concluir o inferir sobre los experimentos y fenmenos observados, mediante
el auxilio de la probabilidad, estadstica descriptiva y distribucin de probabilidad, por lo que resulta
una herramienta de suma utilidad para la toma de decisiones.

Poblacin (N): es la cantidad total de cualquier conjunto de datos, objetos, individuos o resultados que
tengan alguna caracterstica en comn que se va a observar o analizar en un problema o experimento.
Denotaremos al tamao de la poblacin por N.

Muestra (n): es cualquier subconjunto de elementos de la poblacin. Los elementos de la muestra


deben tener todas las caractersticas de la poblacin. para que una muestra sea representativa de la
poblacin, sta deber contener aproximadamente entre el 5% y el 10 % de los datos de la poblacin
cuando sta es finita, adems los elementos de la muestra deben ser escogidos al azar (a la suerte).

Variable: es la cualidad o cantidad medible de cualquier suceso o accin que presente o experimente
un cambio, la podemos representar mediante un smbolo (X, Y, Z, , , , ) y al cual se le puede
asignar un valor cualquiera de un conjunto determinado de datos. Las variables pueden clasificarse
segn la naturaleza de los valores que toman en: cuantitativas y cualitativas.

Variables Cuantitativas: son aquellas que se les puede asignar un valor numrico o que son medibles.
Ejemplo: Tiempo, precio, tamao, velocidades, nmero de hijos de una familia, nmero de carros,
alturas, pesos, tallas, temperaturas, cantidad, entre otros.
Las variables cuantitativas se dividen en: discretas y continuas.

Discretas: son aquellas que solamente toman valores enteros.


Ejemplo: Nmero de hijos, cantidad de textos escolares, la cantidad de alumnos por grupo, entre otros.

Continua: son aquellas que pueden tomar cualquier valor entre dos valores dados. Es decir, en un
intervalo (finito o infinito) de valores reales (fraccionario, decimal o irracional).
Ejemplo: El tiempo, la cantidad, la temperatura. La edad, el peso, la velocidad, entre otros.

Variables Cuantitativa: son aquellas a las que no se les puede asignar un valor numrico, sino con un
aspecto, cualidad o caracterstica que las distinga y que no se pueden medir sino solo observar.
Ejemplos: Marca, grupo sanguneo, deporte preferido, idioma, nacionalidad, colores, himnos
nacionales, sexo, estado de nimo, clima entre otro.
Las variables cualitativas se dividen en: nominales y ordinales.

Nominales: son aquellas a las que no se les puede asignar un orden, es decir que slo permite
clasificacin en categoras por mencin.
Ejemplo: nacionalidad, estado civil, idioma, genero, entre otros.

Ordinales: son aquellas que adems de clasificar a los elementos en distintas categoras les podemos
ordenar de acuerdo a cierta caracterstica.
Ejemplo: El estado de salud de una persona, el color, el grado militar, cargo en la empresa, meses del
ao, entre otros.

Datos: son las agrupaciones de cualquier nmero de observaciones relacionadas. Para que se
considere un dato estadstico debe tener dos caractersticas: que sean comparables entre si y que
tengan alguna relacin. La recoleccin de informacin o recopilacin de datos estadsticos se divide
en: datos internos y datos externos.

Datos Internos: son aquellos datos que no necesitan de observaciones adicionales al experimento; es
decir, no es necesario buscar caractersticas que proporcionen informacin adicional acerca del
experimento. Ejemplo: Las calificaciones de un grupo, un experimento qumico, entre otros. estos datos
pueden ser de dos tipos: bibliogrficos y originales

Bibliogrficos: son aquellos ya conocidos y que podemos encontrar fcilmente utilizando bibliografa,
registros, actas, etctera, como los datos histricos, censos y otros.

Originales: son aquellos que podemos obtener mediante mtodos de recoleccin, como las encuestas,
plebiscitos, referndum, y nos proporcionan datos reales y certeros.

Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser determinados
de acuerdo a cuatro elementos que son: Tiempo, lugar, cantidad y cualidad.

DISTRIBUCIN O TABLA DE FRECUENCIAS


Es la representacin conjunta de los datos en forma de tabla o subgrupo de datos correspondientes a
un fenmeno en estudio y su ordenamiento en base al nmero de observaciones que corresponden a
cada dato o a cada grupo de datos, adecuados segn cronologa, geografa, anlisis cuantitativo o
cualitativo.

Una tabla de este tipo dar, en forma abreviada, una informacin completa acerca de la distribucin de
los valores observados.

Frecuencia Absoluta ( ) : Es el nmero de veces que se repite el dato, en un intervalo es el nmero


de datos que pertenecen a ese intervalo. La suma de las frecuencias absolutas debe ser igual al nmero
total de datos. Cuando los datos son cuantitativos se ordenan en forma ascendente o descendente.
Frecuencia Absoluta Acumulada ( ) : es la suma de las frecuencias absolutas de todos los datos
anteriores, incluyendo tambin la del dato mismo del cual se desea su frecuencia acumulada. En un
intervalo es la suma de las frecuencias absolutas de todos los intervalos anteriores, incluyendo la
frecuencia del intervalo mismo del cual se desea su frecuencia acumulada. La ltima frecuencia
absoluta acumulada deber ser igual al nmero total de datos.

Frecuencia Relativa ( ) : se obtiene al dividir la frecuencia absoluta de cada dato entre el nmero
total de datos. En un intervalo, se obtiene al dividir la frecuencia absoluta de cada intervalo entre el
nmero total de datos. Es decir:
=

Donde n es el nmero total de datos
Las sumas de las frecuencias relativas deben ser igual a 1.

Frecuencia Relativa Acumulada ( ) : es la suma de las frecuencias relativas de todos los datos
anteriores, incluyendo tambin la del dato mismo del cual se desea su frecuencia relativa acumulada
de un intervalo es la suma de las frecuencias relativas de todos los intervalos anteriores incluyendo la
frecuencia del intervalo mismo del cual se desea su frecuencia relativa acumulada. La ltima frecuencia
relativa acumulada debe ser igual a uno

Frecuencias Porcentuales (%) : se obtiene al multiplicar cada una de las frecuencias relativas y de
las relativas acumuladas por 100 respectivamente.

CONSTRUCCIN DE DISTRIBUCIN O TABLAS DE FRECUENCIAS

DATOS NO AGRUPADOS
Datos diferentes: Consideraremos como un dato diferente, a cada uno de los distintos datos que se
presentan en la muestra, los denotaremos por y al nmero total de datos diferentes lo denotaremos
por . Datos no agrupados: Cuando el tamao de la muestra (n) es finito y el nmero de datos
diferentes es pequeo y no estn dispersos entre s, es fcil hacer un anlisis de los datos tomando
cada uno de los datos diferentes y ordenndolos.
Ejemplo:

1. Se pregunt a un grupo de alumnos de primer semestre de administracin en servicios de salud de


la CUN, por la asignatura de su preferencia, arrojndose los siguientes resultados:

Matemticas, Sociales, Castellano, Biologa, Informtica, Matemticas, Ingls, Matemticas,


Biologa, Informtica, Ingls, tica, Ingls, Sociales, Ingls, tica, Matemticas, Castellano, Biologa
Matemticas, Castellano, Sociales, Matemticas, Ingls, Informtica, Ingls, tica, Informtica
Matemticas, Ingls, Informtica, tica, Biologa, Castellano, Ingls, Sociales, Ingls, tica
Castellano, Informtica, Biologa, Castellano, Castellano, Informtica, Matemticas, Biologa
Informtica, Matemticas, Informtica, Ingls.

Determinar la poblacin, la muestra, la variable y el tipo de variable


Construir una tabla de frecuencias.
Solucin.

Poblacin: los estudiantes de primer semestre de administracin en servicios de la salud de la CUN.

Muestra: 50 estudiantes de administracin en servicios de la salud

Variable: asignatura de preferencia

Tipo de variable: cualitativa nominal.

En la columna colocamos los datos, en este caso las asignaturas.

En la columna ubicamos el nmero de veces que se repite cada asignatura.

En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.

En la columna , en () aplicamos la frmula de frecuencia relativa, la suma de los valores


de la columna debe ser igual a 1 y en (%) multiplicamos los datos de la columna () por
100.

En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100
2. La universidad de nueva granada realiz un experimento sobre el coeficiente intelectual (C.I.) de
sus alumnos, para lo cual aplic un examen de C.I. a un grupo de 30 alumnos escogidos al azar,
obteniendo los siguientes resultados

106 109 109 112 119 119 106 109 109 119
112 124 106 109 112 112 112 124 106 109
109 112 112 124 106 124 112 112 119 124

Determinar la poblacin, la muestra, la variable y el tipo de variable


Construir una tabla de frecuencias.

Solucin.

Poblacin: los estudiantes de la universidad nueva granada

Muestra: 30 estudiantes de la universidad nueva granada

Variable: coeficiente intelectual

Tipo de variable: cuantitativa discreta

En la columna colocamos los datos, en este caso los coeficientes intelectuales.

En la columna ubicamos el nmero de veces que se repite cada coeficiente en orden


ascendente o descendente.

En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.

En la columna , en () aplicamos la frmula de frecuencia relativa, la suma de los valores


de la columna debe ser igual a 1 y en (%) multiplicamos los datos de la columna () por
100.

En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100
DATOS AGRUPADOS
Cuando el tamao de la muestra es considerable o grande y los datos numricos son muy diversos y
dispersos, conviene agrupar los datos de tal manera que permita establecer patrones, tendencias o
regularidades de los valores observados.

Para construir una tabla de frecuencias debemos seguir los siguientes pasos:

1. Determinar la cantidad de intervalos apropiada. Para determinar el nmero de intervalos, aunque


es responsabilidad y criterio de quien est realizando la investigacin, se utilizan algunas reglas
empricas que ayudan al proceso, donde la ms utilizadas son:

Regla de Velleman
Regla de Sturges
= + , =
= =
log = 10 =
= =

La ms utilizada es la regla de Sturgens, la cantidad de intervalos debe ser un nmero entero, en


caso de resultar decimal se aproxima al entero ms cercano

2. Calcular el rango o recorrido de los datos. El rango es nmero de unidades de variacin presente
en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor. Se
representa con la letra R.
=
=
3. Determinar la amplitud. La amplitud es el acho del intervalo y se obtiene dividiendo el rango entre
el nmero de intervalos, se representa con la letra A. la amplitud debe ser un nmero entero en
caso de dar decimal se aproxima al entero ms cercano.

= =

4. Construccin de intervalos. Los intervalos de clase son conjuntos numricos y deben ser
excluyentes y exhaustivos; es decir, es excluyente si un dato pertenece a un intervalo
determinado, ya no podr pertenecer a otro, y adems es exhaustivos si todos y cada uno de los
datos estn contenidos en alguno de los intervalos. Las dos caractersticas mencionadas
anteriormente se logran construyendo intervalos cerrados por la izquierda y abiertos por la derecha;
esto se simboliza a travs del uso de corchetes y parntesis respectivamente

El primer intervalo se construye de la siguiente manera: Habr de iniciar con el dato menor, el cual
ser el extremo inferior del intervalo; el otro extremo se obtiene de la suma del dato menor y la
amplitud, con este mismo valor iniciamos el segundo intervalo, del cual el segundo extremo se
encuentra sumando al valor anterior la amplitud y este proceso se repite sistemticamente hasta
completar el total de intervalos indicado por la regla elegida.

Los intervalos de clase deben estar definidos por lmites que permitan identificar plenamente si un
dato pertenece a uno u otro intervalo. Estos lmites son los valores extremos de cada intervalo.

Lmite inferior ( ) : Es el valor menor de cada intervalo


Lmite superior ( ) : Es el nmero mayor de cada intervalo

Es de gran importancia conocer y calcular la marca de clase. La cual es el punto medio de cada
intervalo y representa todo el intervalo, se representa como ( ) y calcula mediante la frmula
+
=

Ejemplo:

1. Un grupo de investigadores pertenecientes a la secretara de trnsito municipal, tom una muestra


aleatoria de las velocidades (km/h) registradas por 30 vehculos en el trayecto Sincelejo a Corozal,
con el fin de establecer nuevos lmites mximos de velocidad para una carretera. La muestra arrojo
los siguientes resultados:

90 99 104 99 119 98 100 106 114 100


95 112 95 120 100 90 100 115 111 105
116 96 114 108 98 118 112 106 114 97

Determinar la poblacin, la muestra, la variable y el tipo de variable


Construir una tabla de frecuencias.
Solucin.

Poblacin: todos los vehculos que transitan el trayecto Sincelejo Corozal

Muestra: 30 vehculos en el trayecto Sincelejo Corozal

Variable: Velocidad de los vehculos

Tipo de variable: Cuantitativa continua.

Calculamos el nmero de intervalos

= 1 + 3,3 = 1 + 3,3 30 = 1 + 3,3 (1,48) = 1 + 4,88 = 5,88 6

=6

Calcular el rango. Calcular la amplitud

= = 120 90 = 30 30
= = =5 =5
6
= 30

Construimos los intervalos, ubicamos los intervalos en la tabla y construimos la tabla de


frecuencias

[90 95), [95 100), [100 105), [105 110), [110 115), [115 120]

En la columna aplicamos la frmula de la marca de clase.

En la columna ubicamos el nmero de datos de cada intervalo, para esto debemos de


ordenar los datos en forma ascendente, de menos a mayor.

90 90 95 95 96 97 98 98 99 99
100 100 100 100 104 105 106 106 108 111
112 112 114 114 114 115 116 118 119 120

Puesto que cada intervalo est cerrado a la izquierda y abierto a la derecha, entran todos los
datos entre los dos extremos excepto el dato extremo de la derecha por estar abierto, en el caso
del ultimo intervalo si ambos extremos estn cerrados, entran todos los datos incluyendo ambos
extremos. La suma de todos los datos de la columna debe ser igual al total de datos.
En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.

En la columna , en () aplicamos la frmula de frecuencia relativa, la suma de los valores


de la columna debe ser igual a 1 y en (%) multiplicamos los datos de la columna () por
100.

En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100.

REPRESENTACIN GRAFICA
Una vez que se ha hecho el anlisis de frecuencias, existe en estadstica, un conjunto de imgenes
grficas, las cuales, combinando distintos tipos de colores, sombreados, puntos, lneas, smbolos,
nmeros o texto, entre otras, y un sistema de referencia (coordenadas), nos permite la representacin
en forma ms resumida y total del experimento o fenmeno en estudio.

Despus de la Organizacin de los datos y su presentacin en tablas estadsticas, la informacin


contenida en una tabla estadstica tambin se puede presentar mediante grficas, siendo las ms
comunes para variables discretas (datos no agrupados) las de: Barras, lnea y circulares o de pastel;
y para variables continuas (datos agrupados) el histograma, polgono de frecuencias y ojiva. Estos
grficos no son los nicos para la presentacin y anlisis de datos estadsticos, pero si los ms
comunes y utilizados.
Grfica de Barras: Es un diagrama que consiste en levantar barras verticales en forma rectangular
sobre una lnea horizontal dentro de un sistema de referencia (coordenadas). Para realizar un grfico
de barras se procede de la siguiente manera.
1. Se traza el sistema de referencia (coordenadas), con dos ejes perpendiculares entre s, uno
horizontal donde se ubican los datos y uno vertical donde se ubican las frecuencias respectivas de
cada dato.

2. Se trazan sobre el eje horizontal barras verticales del mismo ancho y a la misma distancia unas de
otras cuya altura depende de la frecuencia correspondiente a cada dato. Para distinguirlas puede
utilizarse distintos colores o entramados segn se considere.
Ejemplo:

1. Realizar un grfico de barras del ejemplo de las asignaturas de preferencia

2. Realizar un grfico de barras del ejemplo de lo coeficiente intelectuales


Grfica de lnea: Es un diagrama que consiste en trazar puntos unidos por lneas rectas, dentro de un
sistema de referencia (coordenadas). Para realizar un grfico de lnea se procede de igual manera de
grafico de barras, solo que en vez de barras se ubican puntos en las intersecciones de los datos con
sus respectivas frecuencias y luego se unen con lneas recatas.
Ejemplo:

1. Realizar un grfico de lnea del ejemplo de las asignaturas de preferencia

2. Realizar un grfico de lnea del ejemplo de lo coeficiente intelectuales

Grfica circular: tambin llamado grafico de pastel, es un diagrama que consiste en trazar un circulo
dividido en porciones proporcionales a los porcentajes de cada dato. Este grfico se utiliza
fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes % o
proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del ngulo en
grados. Para realizar un grfico circular se procede de la siguiente manera.
1. Se traza un circulo, luego aplicamos una regla de tres simple, para saber que porcin del circulo le
corresponde a cada dato, se trata entonces de encontrar el ngulo de abertura correspondiente, si
el 100% del circulo corresponde a 360 entonces a 1% le corresponde 3,6, luego a cada frecuencia
relativa porcentual la multiplicamos por 3,6. es decir
= ,
2. Se divide el circulo, con las medidas de los ngulos encontrados, correspondientes a cada dato,
para esto se ordenan los sectores siguiendo el orden que se les d a los datos o empezando del
mayor al menor segmento, iniciando a partir de las 12 horas y en el sentido de las manecillas del
reloj. Para distinguirlas puede utilizarse distintos colores o entramados segn se considere.

3. Se asignan los porcentajes correspondientes a cada sector, si el porcentaje que representa a cada
sector no cabe dentro de este, se coloca fuera y se une con una flecha, por ltimo, se realiza un
cuadro de convencin donde se hace corresponder el color de cada porcin del circulo con el dato
correspondiente.
Ejemplo:

1. Realizar un grfico circular del ejemplo de las asignaturas de preferencia

2. Realizar un grfico circular del ejemplo de lo coeficiente intelectuales


Histograma: Es un diagrama que consiste en levantar barras verticales en forma rectangular sobre
una lnea horizontal dentro de un sistema de referencia (coordenadas). A diferencia del grfico de
barras, las barras van unidas y estn limitadas por dos puntos extremos llamados lmites. Para graficar
un histograma, se procede de igual manera que el grafico de barras, la diferencia es que en el eje
horizontal se ubican son los intervalos de clase.
Ejemplo:

1. Realizar un histograma de frecuencia para el ejemplo de los lmites de velocidad

Polgono de frecuencias: Es un diagrama que consiste en trazar puntos unidos por lneas rectas,
dentro de un sistema de referencia (coordenadas). Para realizar un polgono de frecuencia, se procede
de igual manera que el histograma, solo que en vez de barras se ubican puntos en las intersecciones
de los datos que tampoco son intervalo si no la marca de clase, con sus respectivas frecuencias y luego
se unen con lneas rectas.
Ejemplo:

1. Realizar un polgono de frecuencias para el ejemplo de los lmites de velocidad


Grfica de Ojiva: tambin se conoce como grafico de las frecuencias relativas acumuladas. Es un
grfico que igual al histograma y polgono de frecuencias se utiliza para el anlisis y representacin de
variables cuantitativas continuas y consiste en trazar puntos unidos por lneas rectas, dentro de un
sistema de referencia (coordenadas) solo que, en vez de las frecuencias absolutas, se utilizan las
frecuencias relativas acumuladas. Para realizar una ojiva se procede de la siguiente manera

1. Se traza el sistema de referencia (coordenadas), con dos ejes perpendiculares entre s, uno
horizontal donde se ubican los limites superiores de cada intervalo y uno vertical donde se ubican
las frecuencias relativas absolutas de cada intervalo.

2. Se ubican los puntos donde se intersectan los limites superiores de cada intervalo con sus
respectivas frecuencias relativas acumuladas, final mente se unen los pontos con lneas rectas.
Ejemplo:

1. Realizar un grfico de ojiva del ejemplo de los lmites de velocidad

Potrebbero piacerti anche