Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
Ing. Soto
INDICE
1.
INTRODUCCIN............................................................................................. 2
1.1.
2.
3.
4.
5.
CONCEPTOS BASICOS............................................................................ 3
MEDIA ARITMETICA.................................................................................. 8
2.2.
MODA...................................................................................................... 9
2.3.
MEDIANA............................................................................................... 10
MEDIDAS DE DISPERSION........................................................................... 12
3.1.
RANGO ESTADISTICO............................................................................ 12
3.2.
3.3.
VARIANZA.............................................................................................. 13
3.4.
DESVIACION TIPICA............................................................................... 13
3.5.
COVARIANZA......................................................................................... 14
MEDIDAS DE ASIMETRIA............................................................................. 14
4.1.
4.2.
4.3.
TABLAS................................................................................................. 16
5.2.
GRAFICAS............................................................................................. 20
Ing. Soto
1. INTRODUCCIN
Segn (Wikipedia, 2015) La estadstica es una ciencia formal y una herramienta
que estudia el uso y los anlisis provenientes de una muestra representativa
de datos, busca explicar las correlaciones y dependencias de un fenmeno fsico o
natural, de ocurrencia en forma aleatoria o condicional.
Sin embargo, la estadstica es ms que eso, es decir, es la herramienta
fundamental que permite llevar a cabo el proceso relacionado de la estadstica con
la investigacin cientfica.
Es transversal a una amplia variedad de disciplinas, desde la fsica hasta
las ciencias sociales, desde las ciencias de la salud hasta el control de calidad.
Se usa para la toma de decisiones en reas de negocios o
instituciones gubernamentales.
La estadstica se divide en dos grandes reas:
1. Estadstica descriptiva: Se dedica a la descripcin, visualizacin y resumen
de datos originados a partir de los fenmenos de estudio. Los datos
pueden ser resumidos numrica o grficamente. Ejemplos bsicos de
parmetros estadsticos son: la media y la desviacin estndar. Algunos
ejemplos grficos son: histograma, pirmide poblacional, grfico circular,
entre otros.
2. Estadstica inferencial: Se dedica a la generacin de los modelos,
inferencias y predicciones asociadas a los fenmenos en cuestin teniendo
en cuenta la aleatoriedad de las observaciones. Se usa para modelar
patrones en los datos y extraer inferencias acerca de la poblacin bajo
estudio. Estas inferencias pueden tomar la forma de respuestas a
preguntas s/no (prueba de hiptesis), estimaciones de unas caractersticas
numricas (estimacin), pronsticos de futuras observaciones,
descripciones de asociacin (correlacin) o modelamiento de relaciones
entre variables (anlisis de regresin). Otras tcnicas
de modelamiento incluyen anlisis de varianza, series de tiempo y minera
de datos.
Ambas ramas (descriptiva e inferencial) comprenden la estadstica aplicada. La
estadstica inferencial, por su parte, se divide en estadstica paramtrica y
estadstica no paramtrica.
Ing. Soto
Hay tambin una disciplina llamada estadstica matemtica, la que se refiere a las
bases tericas de la materia.
La palabra estadsticas tambin se refiere al resultado de aplicar un algoritmo
estadstico a un conjunto de datos, como en estadsticas econmicas, estadsticas
criminales, entre otros.
aquella que est formada por un limitado nmero de elementos, por ejemplo; el
nmero de estudiante del Ncleo San Carlos de la Universidad Nacional
Experimental Simn Rodrguez.
Cuando la poblacin es muy grande, es obvio que la observacin de todos los
elementos se dificulte en cuanto al trabajo, tiempo y costos necesario para
hacerlo. Para solucionar este inconveniente se utiliza una muestra estadstica.
Es a menudo imposible o poco prctico observar la totalidad de los individuos,
sobre todos si estos son muchos. En lugar de examinar el grupo entero
llamado poblacin o universo, se examina una pequea parte del grupo llamada
muestra.
Muestra:
"Se llama muestra a una parte de la poblacin a estudiar que sirve para
representarla". Murria R. Spiegel (1991).
"Una muestra es una coleccin de algunos elementos de la poblacin, pero no de
todos". Levin & Rubin (1996).
"Una muestra debe ser definida en base de la poblacin determinada, y las
conclusiones que se obtengan de dicha muestra solo podrn referirse a la
poblacin en referencia", Cadenas (1974).
Ejemplo;
El estudio realizado a 50 miembros del Colegio de Ingenieros del Estado.
El estudio de muestras es ms sencillo que el estudio de la poblacin completa;
cuesta menos y lleva menos tiempo. Por ltimo se aprobado que el examen de
una poblacin entera todava permite la aceptacin de elementos defectuosos, por
tanto, en algunos casos, el muestreo puede elevar el nivel de calidad.
Una muestra representativa contiene las caractersticas relevantes de la poblacin
en las mismas proporciones que estn incluidas en tal poblacin.
Los expertos en estadstica recogen datos de una muestra. Utilizan
esta informacin para hacer referencias sobre la poblacin que est representada
por la muestra. En consecuencia muestra y poblacin son conceptos relativos.
Una poblacin es un todo y una muestra es una fraccin o segmento de ese todo.
Muestreo:
Esto no es ms que el procedimiento empleado para obtener una o ms muestras
de una poblacin; el muestreo es una tcnica que sirve para obtener una o ms
muestras de poblacin.
Este se realiza una vez que se ha establecido un marco muestral representativo
de la poblacin, se procede a la seleccin de los elementos de la muestra aunque
hay muchos diseos de la muestra.
Al tomar varias muestras de una poblacin, las estadsticas que calculamos para
cada muestra no necesariamente seran iguales, y lo ms probable es que
variaran de una muestra a otra.
Tipos de muestreo
Existen dos mtodos para seleccionar muestras de poblaciones; el muestreo no
aleatorio o de juicio y el muestreo aleatorio o de probabilidad. En este ltimo todos
los elementos de la poblacin tienen la oportunidad de ser escogidos en la
Ing. Soto
observados por un tercero (persona o entidad). Con el fin de deducir otros hechos
o fenmenos.
2. Atendiendo a la periodicidad, puede ser continua, peridica o
circunstancial.
Censo:
Se entiende por censo aquella numeracin que se efecta a todos y cada uno de
los caracteres componentes de una poblacin.
Para Levin & Rubin (1996) "Algunas veces es posible y prctico examinar a cada
persona o elemento de la poblacin que deseamos describir. A esto lo llamamos
una numeracin completa o censo. Utilizamos el muestre cuando no es posible
contar o medir todos los elementos de la poblacin.
Ing. Soto
Ing. Soto
Media
Media ponderada
Media geomtrica
Media armnica
Mediana
Moda
Alumno
1
2
Ing. Soto
Calificacin
6,0
5,4
3
4
5
3,1
7,0
6,1
Inconvenientes de su uso:
Ing. Soto
2.2. MODA
En las palabras de (Diaz) La moda es el dato ms repetido de la encuesta, el valor
de la variable con mayor frecuencia absoluta. Su clculo es extremadamente
sencillo, pues solo necesita un recuento. En variables continuas, expresadas en
intervalos, existe el denominado intervalo modal o, en su defecto, si es necesario
obtener un valor concreto de la variable, se recurre a la interpolacin.
Por ejemplo, el nmero de personas en distintos vehculos en una carretera: 5-7-46-9-5-6-1-5-3-7. El nmero que ms se repite es 5, entonces la moda es 5.
Hablaremos de una distribucin bimodal de los datos, cuando encontremos dos
modas, es decir, dos datos que tengan la misma frecuencia absoluta mxima.
Cuando en una distribucin de datos se encuentran tres o ms modas, entonces
es multimodal. Por ltimo, si todas las variables tienen la misma frecuencia
diremos que no hay moda.
Propiedades:
Clculo sencillo.
Inconvenientes de su uso:
Ing. Soto
Usa muy pocas observaciones, de tal modo que grandes variaciones en los
datos fuera de la moda, no afectan en modo alguno a su valor.
No siempre se sita hacia el centro de la distribucin.
Puede haber ms de una moda en el caso en que dos o ms valores de la
variable presenten la misma frecuencia (distribuciones bimodales o
multimodales).
2.3. MEDIANA
La mediana es un valor de la variable que deja por debajo de s a la mitad de los
datos, una vez que stos estn ordenados de menor a mayor.7 Por ejemplo, la
mediana del nmero de hijos de un conjunto de trece familias, cuyos respectivos
hijos son: 3, 4, 2, 3, 2, 1, 1, 2, 1, 1, 2, 1 y 1, es 2, puesto que, una vez ordenados
los datos: 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 3, 3, 4, el que ocupa la posicin central es 2:
Ing. Soto
3. MEDIDAS DE DISPERSION
Segn la (Universidad de Cadiz) Las medidas de dispersin, tambin llamadas
medidas de variabilidad, muestran la variabilidad de una distribucin, indicando
por medio de un nmero si las diferentes puntuaciones de una variable estn muy
alejadas de la media. Cuanto mayor sea ese valor, mayor ser la variabilidad, y
cuanto menor sea, ms homognea ser a la media. As se sabe si todos los
casos son parecidos o varan mucho entre ellos.
Para calcular la variabilidad que una distribucin tiene respecto de su media, se
calcula la media de las desviaciones de las puntuaciones respecto a la media
aritmtica. Pero la suma de las desviaciones es siempre cero, as que se adoptan
dos clases de estrategias para salvar este problema. Una es tomando las
desviaciones en valor absoluto (desviacin media) y otra es tomando las
desviaciones al cuadrado (varianza).
Ing. Soto
Ejemplo
Para la muestra (8, 7, 6, 9, 4, 5), el dato menor es 4 y el dato mayor es 9. Sus
valores se encuentran en un rango de:
Ejemplo
Para una muestra de valores (3, 3, 5, 6, 8), el dato de menor valor Min= 3 y el dato
de mayor valor Max= 8. El medio rango resolvindolo mediante la correspondiente
frmula sera:
Ing. Soto
3.3. VARIANZA
La varianza es una medida estadstica que mide la dispersin de los valores
respecto a un valor central (media), es decir, es el cuadrado de las desviaciones.
Propiedades
Propiedad distributiva:
siempre y cuando las variables
,
y
sean independiente
3.5. COVARIANZA
La covarianza entre dos variables es un estadstico resumen indicador de si las
puntuaciones estn relacionadas entre s. La formulacin clsica se simboliza por
Ing. Soto
4. MEDIDAS DE ASIMETRIA
Segn el libro 'Introduccin a la Estadstica Econmica y Empresarial. Teora y
Prctica.' de (Lpez, 2007) Las medidas de asimetra son indicadores que
permiten establecer el grado de simetra (o asimetra) que presenta
una distribucin de probabilidad de una variable aleatoria sin tener que hacer su
representacin grfica.
Como eje de simetra consideramos una recta paralela al eje de ordenadas que
pasa por la media de la distribucin. Si una distribucin es simtrica, existe el
mismo nmero de valores a la derecha que a la izquierda de la media, por tanto, el
mismo nmero de desviaciones con signo positivo que con signo negativo.
Decimos que hay asimetra positiva (o a la derecha) si la "cola" a la derecha de la
media es ms larga que la de la izquierda, es decir, si hay valores ms separados
de la media a la derecha. Diremos que hay asimetra negativa (o a la izquierda) si
Ing. Soto
en donde
representa la marca de la clase -sima y denota la frecuencia
relativa de dicha clase. Por ello, lo ms sencillo es tomar las desviaciones al
cubo.
El coeficiente de asimetra de Fisher, representado por
Donde
es el tercer momento en torno a la media y
estndar.
, se define como:
es la desviacin
Si
Si
Ing. Soto
Ing. Soto
Frecuencia f(xi)
Frecuencia relativa
f(xi)/N= ni/N
X1
f(X1 )= n1
X2
f(X2 )= n2
Ing. Soto
X3
f(X3 )= n3
Xn-1
f(Xn-1 ) = nn-1
Xn
f(Xn)= nn
f(Xn)/N= nn/N
Ing. Soto
Variable (Ci)
C i= calificaciones
obtenidas
Frecuencia relativa
h(xi)
Ing. Soto
10
1/20
3/20
2/20
3/20
4/20
2/20
1/20
2/20
1/20
1/20
En el caso de las variables continuas se debe de dividir los intervalos en los que
debe de distribuirse la informacin, en este caso existen varios criterio sobre los
que debemos de plantear la distribucin. Uno de ellos, de los ms comunes,
consiste en determinar la cantidad de parmetros.
Dentro de las frecuencias que aparecen en las tablas, las ms comunes, son
frecuencia absoluta, la frecuencia absoluta acumulada y la frecuencia relativa.
Ing. Soto
5.2. GRAFICAS
Citando al sitio web (Plan Ceibal) Cuando se hace un estudio estadstico se
obtiene una gran cantidad de datos numricos. Para tener una informacin clara y
rpida de lo obtenido en el estudio se han creado las grficas estadsticas.
Hay muchos tipos de grficas estadsticas. Cada una de ellas es adecuada para
un estudio determinado, ya que no siempre se puede utilizar la misma para todos
los casos.
Diagrama de barras
Histograma
Polgono de frecuencias
Diagrama de sectores
Pictograma
Ing. Soto
Ing. Soto
Todas las barras deben ser del mismo ancho para no confundir al lector.
Los espacios entre barras deben ser igual a la mitad del ancho de las
barras.
Se deben incluir las escalas y algunas indicaciones para que ayuden a la
lectura de las grficas.
Los ejes de las grficas se deben identificar en forma clara.
Se deben incluir dentro del cuerpo de la grfica, o debajo, todo tipo de
"claves" para la interpretacin de las grficas.
El ttulo de la grfica debe aparecer debajo del cuerpo.
Las notas de pie de pgina, o sobre fuentes, cuando sean necesarias, se
deben colocar despus del ttulo.
5.2.3 HISTOGRAMA
Un histograma es una representacin grfica de una variable en forma de barras,
donde la superficie de cada barra es proporcional a la frecuencia de los valores
representados. En el eje vertical se representan las frecuencias, y en el eje
horizontal los valores de las variables, normalmente sealando las marcas de
clase, es decir, la mitad del intervalo en el que estn agrupados los datos.
Se utiliza cuando se estudia una variable continua, como franjas de edades o
altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir,
valores continuos. En los casos en los que los datos son cualitativos (nonumricos), como sexto grado de acuerdo o nivel de estudios, es preferible un
diagrama de sectores.
Ing. Soto
sectores cuya amplitud es proporcional a las frecuencias de los valores. Sirve para
representar cualquier tipo de variable.
Ejemplo:
En la clase se realiz la siguiente encuesta: Qu libros prefieres leer?
Los resultados se ordenaron en esta tabla
Tipos de libros
De Misterio
N de alumnos
De Aventuras
15
Historietas
Total
30
ngulo sector Misterio = 360 X 15 alumnos / 30 alumnos = 180 (la mitad del
crculo)
ngulo sector Aventuras = 360 X 9 alumnos / 30 alumnos = 108
ngulo sector Historietas = 360 X 6 alumnos / 30 alumnos = 72
Si sumamos la amplitud de los tres sectores nos tiene que dar el crculo completo:
180 + 108 + 72 = 360
Ing. Soto
5.2.6. PICTOGRAMAS
Es un grfico con dibujos alusivos al carcter que se est estudiando y cuyo tamao es proporcional a la
frecuencia que representan; dicha frecuencia se suele indicar, ejemplo:
Ing. Soto
5.2.8. CARTOGRAMAS
Los cartogramas son grficos realizados sobre mapas, en los que aparecen
indicados sobre las distintas zonas cantidades o colores de acuerdo con el
carcter que representan
En el siguiente cartograma observamos la urbanizacin en el mundo atendiendo a
la industrializacin:
BIBLIOGRAFIA
Diaz, F. R. (s.f.). Bioestadistica. Metodos y aplicaciones.
Lpez, F. J.-P. (2007). Introduccin a la Estadstica Econmica y Empresarial.
Teora y Prctica. Madrid: Editorial Thomson.
Plan Ceibal. (s.f.). Ceibal. Recuperado el 08 de Octubre de 2015, de
http://www.ceibal.edu.uy/contenidos/areas_conocimiento/mat/estadistica
/grficas_estadsticas.html
Santiago Fernandez Fernandez, Alejandro Cordoba, Jose Maria Cordero
Sanchez. (2002). Estadistica Descriptiva 2 Edicion. ESIC Editorial.
Ing. Soto
Ing. Soto