Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Generalidades
Definicin y campos de la estadstica
Poblacin, Muestra, Datos y Evento.
Fuentes de Informacin.
Planeacin y preparacin de una investigacin estadstica.
CIBERGRAFIA
Qu es la estadstica?
http://www.youtube.com/watch?v=zoAdhtNltkw&feature=related
Estadstica descriptiva. I Datos estadsticos.
http://www.youtube.com/watch?v=vOPpHtqOFHo&feature=endscreen&NR=1
Grficos estadsticos
http://roble.pntic.mec.es/igam0034/estadistica/graficos-estadisticos.pdf
http://www.ine.es/explica/docs/pasos_tipos_graficos.pdf
http://www.udb.edu.sv/udb/archivo/guia/informatica-ingenieria/emprematica/2014/i/guia-8.pdf
Tabla de frecuencias
http://es.slideshare.net/Gerardo1977/intervalos-de-clase-estadstica
DEFINICIONES BSICAS DE ESTADSTICA
ESTADSTICA.
es la rama de las matemticas, y una herramienta que utiliza un conjunto de mtodos, normas, reglas
y principios para la observacin, recoleccin, organizacin, descripcin, presentacin y anlisis del
comportamiento de un grupo de datos para la conclusin sobre un experimento o fenmeno. La
estadstica se divide en dos partes, estadstica descriptiva y estadstica inferencial.
Poblacin (N): es la cantidad total de cualquier conjunto de datos, objetos, individuos o resultados que
tengan alguna caracterstica en comn que se va a observar o analizar en un problema o experimento.
Denotaremos al tamao de la poblacin por N.
Variable: es la cualidad o cantidad medible de cualquier suceso o accin que presente o experimente
un cambio, la podemos representar mediante un smbolo (X, Y, Z, , , , ) y al cual se le puede
asignar un valor cualquiera de un conjunto determinado de datos. Las variables pueden clasificarse
segn la naturaleza de los valores que toman en: cuantitativas y cualitativas.
Variables Cuantitativas: son aquellas que se les puede asignar un valor numrico o que son medibles.
Ejemplo: Tiempo, precio, tamao, velocidades, nmero de hijos de una familia, nmero de carros,
alturas, pesos, tallas, temperaturas, cantidad, entre otros.
Las variables cuantitativas se dividen en: discretas y continuas.
Continua: son aquellas que pueden tomar cualquier valor entre dos valores dados. Es decir, en un
intervalo (finito o infinito) de valores reales (fraccionario, decimal o irracional).
Ejemplo: El tiempo, la cantidad, la temperatura. La edad, el peso, la velocidad, entre otros.
Variables Cuantitativa: son aquellas a las que no se les puede asignar un valor numrico, sino con un
aspecto, cualidad o caracterstica que las distinga y que no se pueden medir sino solo observar.
Ejemplos: Marca, grupo sanguneo, deporte preferido, idioma, nacionalidad, colores, himnos
nacionales, sexo, estado de nimo, clima entre otro.
Las variables cualitativas se dividen en: nominales y ordinales.
Nominales: son aquellas a las que no se les puede asignar un orden, es decir que slo permite
clasificacin en categoras por mencin.
Ejemplo: nacionalidad, estado civil, idioma, genero, entre otros.
Ordinales: son aquellas que adems de clasificar a los elementos en distintas categoras les podemos
ordenar de acuerdo a cierta caracterstica.
Ejemplo: El estado de salud de una persona, el color, el grado militar, cargo en la empresa, meses del
ao, entre otros.
Datos: son las agrupaciones de cualquier nmero de observaciones relacionadas. Para que se
considere un dato estadstico debe tener dos caractersticas: que sean comparables entre si y que
tengan alguna relacin. La recoleccin de informacin o recopilacin de datos estadsticos se divide
en: datos internos y datos externos.
Datos Internos: son aquellos datos que no necesitan de observaciones adicionales al experimento; es
decir, no es necesario buscar caractersticas que proporcionen informacin adicional acerca del
experimento. Ejemplo: Las calificaciones de un grupo, un experimento qumico, entre otros. estos datos
pueden ser de dos tipos: bibliogrficos y originales
Bibliogrficos: son aquellos ya conocidos y que podemos encontrar fcilmente utilizando bibliografa,
registros, actas, etctera, como los datos histricos, censos y otros.
Originales: son aquellos que podemos obtener mediante mtodos de recoleccin, como las encuestas,
plebiscitos, referndum, y nos proporcionan datos reales y certeros.
Para Organizar los datos: existen muchas formas de clasificarlos, en general pueden ser determinados
de acuerdo a cuatro elementos que son: Tiempo, lugar, cantidad y cualidad.
Una tabla de este tipo dar, en forma abreviada, una informacin completa acerca de la distribucin de
los valores observados.
Frecuencia Relativa ( ) : se obtiene al dividir la frecuencia absoluta de cada dato entre el nmero
total de datos. En un intervalo, se obtiene al dividir la frecuencia absoluta de cada intervalo entre el
nmero total de datos. Es decir:
=
Donde n es el nmero total de datos
Las sumas de las frecuencias relativas deben ser igual a 1.
Frecuencia Relativa Acumulada ( ) : es la suma de las frecuencias relativas de todos los datos
anteriores, incluyendo tambin la del dato mismo del cual se desea su frecuencia relativa acumulada
de un intervalo es la suma de las frecuencias relativas de todos los intervalos anteriores incluyendo la
frecuencia del intervalo mismo del cual se desea su frecuencia relativa acumulada. La ltima frecuencia
relativa acumulada debe ser igual a uno
Frecuencias Porcentuales (%) : se obtiene al multiplicar cada una de las frecuencias relativas y de
las relativas acumuladas por 100 respectivamente.
DATOS NO AGRUPADOS
Datos diferentes: Consideraremos como un dato diferente, a cada uno de los distintos datos que se
presentan en la muestra, los denotaremos por y al nmero total de datos diferentes lo denotaremos
por . Datos no agrupados: Cuando el tamao de la muestra (n) es finito y el nmero de datos
diferentes es pequeo y no estn dispersos entre s, es fcil hacer un anlisis de los datos tomando
cada uno de los datos diferentes y ordenndolos.
Ejemplo:
En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.
En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100
2. La universidad de nueva granada realiz un experimento sobre el coeficiente intelectual (C.I.) de
sus alumnos, para lo cual aplic un examen de C.I. a un grupo de 30 alumnos escogidos al azar,
obteniendo los siguientes resultados
106 109 109 112 119 119 106 109 109 119
112 124 106 109 112 112 112 124 106 109
109 112 112 124 106 124 112 112 119 124
Solucin.
En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.
En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100
DATOS AGRUPADOS
Cuando el tamao de la muestra es considerable o grande y los datos numricos son muy diversos y
dispersos, conviene agrupar los datos de tal manera que permita establecer patrones, tendencias o
regularidades de los valores observados.
Para construir una tabla de frecuencias debemos seguir los siguientes pasos:
Regla de Velleman
Regla de Sturges
= + , =
= =
log = 10 =
= =
2. Calcular el rango o recorrido de los datos. El rango es nmero de unidades de variacin presente
en los datos recopilados y se obtiene de la diferencia entre el dato mayor y el dato menor. Se
representa con la letra R.
=
=
3. Determinar la amplitud. La amplitud es el acho del intervalo y se obtiene dividiendo el rango entre
el nmero de intervalos, se representa con la letra A. la amplitud debe ser un nmero entero en
caso de dar decimal se aproxima al entero ms cercano.
= =
4. Construccin de intervalos. Los intervalos de clase son conjuntos numricos y deben ser
excluyentes y exhaustivos; es decir, es excluyente si un dato pertenece a un intervalo
determinado, ya no podr pertenecer a otro, y adems es exhaustivos si todos y cada uno de los
datos estn contenidos en alguno de los intervalos. Las dos caractersticas mencionadas
anteriormente se logran construyendo intervalos cerrados por la izquierda y abiertos por la derecha;
esto se simboliza a travs del uso de corchetes y parntesis respectivamente
El primer intervalo se construye de la siguiente manera: Habr de iniciar con el dato menor, el cual
ser el extremo inferior del intervalo; el otro extremo se obtiene de la suma del dato menor y la
amplitud, con este mismo valor iniciamos el segundo intervalo, del cual el segundo extremo se
encuentra sumando al valor anterior la amplitud y este proceso se repite sistemticamente hasta
completar el total de intervalos indicado por la regla elegida.
Los intervalos de clase deben estar definidos por lmites que permitan identificar plenamente si un
dato pertenece a uno u otro intervalo. Estos lmites son los valores extremos de cada intervalo.
Es de gran importancia conocer y calcular la marca de clase. La cual es el punto medio de cada
intervalo y representa todo el intervalo, se representa como ( ) y calcula mediante la frmula
+
=
Ejemplo:
=6
= = 120 90 = 30 30
= = =5 =5
6
= 30
[90 95), [95 100), [100 105), [105 110), [110 115), [115 120]
90 90 95 95 96 97 98 98 99 99
100 100 100 100 104 105 106 106 108 111
112 112 114 114 114 115 116 118 119 120
Puesto que cada intervalo est cerrado a la izquierda y abierto a la derecha, entran todos los
datos entre los dos extremos excepto el dato extremo de la derecha por estar abierto, en el caso
del ultimo intervalo si ambos extremos estn cerrados, entran todos los datos incluyendo ambos
extremos. La suma de todos los datos de la columna debe ser igual al total de datos.
En la columna
ubicamos en la primera casilla el primer dato de la columna luego
seguimos sumando en diagonal los datos de la columna con los de la columna hasta
completar la columna, el ltimo dato debe ser igual al nmero total de datos.
En la columna ,
en () ubicamos en la primera casilla el primer dato de la columna
luego seguimos sumando en diagonal los datos de la columna con los de la columna
hasta completar la columna, el ltimo dato debe ser igual a 1 y en (%) multiplicamos los datos
de la columna () por 100.
REPRESENTACIN GRAFICA
Una vez que se ha hecho el anlisis de frecuencias, existe en estadstica, un conjunto de imgenes
grficas, las cuales, combinando distintos tipos de colores, sombreados, puntos, lneas, smbolos,
nmeros o texto, entre otras, y un sistema de referencia (coordenadas), nos permite la representacin
en forma ms resumida y total del experimento o fenmeno en estudio.
2. Se trazan sobre el eje horizontal barras verticales del mismo ancho y a la misma distancia unas de
otras cuya altura depende de la frecuencia correspondiente a cada dato. Para distinguirlas puede
utilizarse distintos colores o entramados segn se considere.
Ejemplo:
Grfica circular: tambin llamado grafico de pastel, es un diagrama que consiste en trazar un circulo
dividido en porciones proporcionales a los porcentajes de cada dato. Este grfico se utiliza
fundamentalmente, para representar distribuciones de frecuencias relativas (es decir, porcentajes % o
proporciones) haciendo corresponder la medida de la frecuencia relativa con la medida del ngulo en
grados. Para realizar un grfico circular se procede de la siguiente manera.
1. Se traza un circulo, luego aplicamos una regla de tres simple, para saber que porcin del circulo le
corresponde a cada dato, se trata entonces de encontrar el ngulo de abertura correspondiente, si
el 100% del circulo corresponde a 360 entonces a 1% le corresponde 3,6, luego a cada frecuencia
relativa porcentual la multiplicamos por 3,6. es decir
= ,
2. Se divide el circulo, con las medidas de los ngulos encontrados, correspondientes a cada dato,
para esto se ordenan los sectores siguiendo el orden que se les d a los datos o empezando del
mayor al menor segmento, iniciando a partir de las 12 horas y en el sentido de las manecillas del
reloj. Para distinguirlas puede utilizarse distintos colores o entramados segn se considere.
3. Se asignan los porcentajes correspondientes a cada sector, si el porcentaje que representa a cada
sector no cabe dentro de este, se coloca fuera y se une con una flecha, por ltimo, se realiza un
cuadro de convencin donde se hace corresponder el color de cada porcin del circulo con el dato
correspondiente.
Ejemplo:
Polgono de frecuencias: Es un diagrama que consiste en trazar puntos unidos por lneas rectas,
dentro de un sistema de referencia (coordenadas). Para realizar un polgono de frecuencia, se procede
de igual manera que el histograma, solo que en vez de barras se ubican puntos en las intersecciones
de los datos que tampoco son intervalo si no la marca de clase, con sus respectivas frecuencias y luego
se unen con lneas rectas.
Ejemplo:
1. Se traza el sistema de referencia (coordenadas), con dos ejes perpendiculares entre s, uno
horizontal donde se ubican los limites superiores de cada intervalo y uno vertical donde se ubican
las frecuencias relativas absolutas de cada intervalo.
2. Se ubican los puntos donde se intersectan los limites superiores de cada intervalo con sus
respectivas frecuencias relativas acumuladas, final mente se unen los pontos con lneas rectas.
Ejemplo: