Sei sulla pagina 1di 10

UNIDAD: ESTADISTICA

La estadstica se ocupa de recopilar datos, organizarlos en tablas y grficos y analizarlos con un


determinado objetivo.
La estadstica puede ser descriptiva o inferencial. La estadstica descriptiva tabula, representa y
describe una serie de datos que pueden ser cuantitativos o cualitativos, sin sacar conclusiones. La
estadstica inferencial infiere propiedades de gran nmero de datos recogidos de una muestra
tomada de la poblacin.
Nosotros slo estudiaremos la estadstica descriptiva. n ella debemos tener en cuenta las
siguientes etapas!
a" #ecoleccin de datos
b" $rganizacin de datos
%"& 'abulacin
%"( )raficacin
c" *nlisis y medicin de datos
a) Recoleccin de datos
+ara esta etapa tomaremos los siguientes conceptos bsicos!
Poblacin! conjunto de observaciones efectuadas
Individo! cada elemento de la poblacin.
Atribto! caracterstica investigada en la observacin. stos pueden ser cualitativos %se,o,
religin, nacionalidad" o cuantitativos %estatura, peso, rea -estos son continuos, se miden en
nmeros reales./ nmero de 0ijos, nmero de goles -discretos, se miden en nmeros enteros."
+or ejemplo! si se desea realizar un estudio estadstico de las estaturas de los alumnos de tercer a1o,
+oblacin! conjunto de estaturas
2ndividuo! cada estatura
*tributo! la estatura
'eniendo presente la clasificacin, clasifica los siguientes atributos
&. *filiacin poltica de los 0abitantes de la 3apital de 30ile.
(. 3antidad de ganado vacuno en las provincias de la #o 4ueno y La 5nin.
6. #eligin de los padres de familia de la comunidad educativa 7anta 3ruz.
8. 2ngresos de los obreros.
9. 3antidad de alumnos de las diferentes carreras de la :acultad de 3iencias ,acta en la 5.L.*.
;. 7e,o de los alumnos de una escuela.
<. stado civil de los 0abitantes de la ciudad de #o 4ueno.
=. 3antidad de pelculas nacionales estrenadas durante un a1o.
>. 3olor de cabellos de los alumnos de un curso.
&?. +untaje obtenido por los alumnos que ingresan a la carrera de @edicina.
b) !r"ani#acin de los datos
$%) Tablacin! puede ser a travAs de una serie simple, con la presentacin de los datos recogidos
en forma de tabla ordenada, o a travAs de la agrupacin de datos, este mAtodo se utiliza cuando el
nmero de observaciones es muy grande.
1
jemplo! n un curso de 8? alumnos, se desea estudiar el comportamiento de la variable estatura,
registrndose los siguientes valores!
&,9( &,;8 &,98 &,;8 &,<6 &,99 &,9; &,9< &,9= &,9=
&,9> &,96 &,;? &,;? &,;& &,;& &,;9 &,;6 &,<> &,;6
&,;( &,;? &,;8 &,98 &,;9 &,;( &,;; &,<; &,<? &,;>
&,<& &,<( &,<( &,99 &,<6 &,<6 &,<9 &,;< &,<= &,;6
i& Serie si'ple!
3ompleta los cuadros siguientes, ordenando los datos obtenidos.
*lumno 'alla *lumno 'alla *lumno 'alla *lumno 'alla
& &,9( && (& 6&
( &,96 &( (( 6(
6 &,98 &6 (6 66
8 &,98 &8 (8 68
9 &,99 &9 (9 69
; &,99 &; (; 6;
< &,9; &< (< 6<
= &,9< &= (= 6=
> &,9= &> (> 6>
&? &,9= (? 6? 8?
ii& A"rpacin de datos por serie o distribcin de frecencias! se registra la frecuencia de cada
valor de la variable. La frecuencia puede ser absoluta %f", nmero que indica la cantidad de veces
que la variable toma un cierto valor, relativa %fr", cociente entre la frecuencia absoluta de cada
valor de la variable y el nmero total de observaciones/ relativa porcentual que es el porcentaje de
la fr/ frecuencia *cumulada la suma de la fi y la acumulada porcentual, que el la suma de frB .
Colviendo al ejemplo anterior, completa la tabla de serie de frecuencias.
, %tallas" *bsoluta
fi
#elativa
fr D fEn
#. +orcentual
%&??.fr" B
*cumulada
:a
*c. +orcentual
:a B
&,9( & &E8? D ?,?(9 (,9 B & (,9B
&,96 & &E8? D ?,?(9 (,9B ( 9B
&,98 ( (E8? D ?,?9 9B 8 &?B
&,99
&,9;
&,9<
&,9=
&,9>
&,;?
&,;&
&,;(
&,;6
&,;8
&,;9
&,;;
&,;<
&,;=
&,;>
2
&,<?
&,<&
&,<(
&,<6
&,<8
&,<9
&,<;
&,<<
&,<=
&,<>
F* cunto es igual el total de la columna de frecuencias absolutasG F+or quAG
...................................................................................................................................
F* cunto es igual el total de la columna de frecuencias relativasG F+or quAG
...................................................................................................................................
FH el total de la columna de porcentajesG
...................................................................................................................................
A"rpacin de datos por intervalos de clase! intervalos iguales en los que se divide el nmero
total de observaciones. s conveniente utilizar los intervalos de clase cuando se tiene un gran
nmero de datos de una variable continua&
F3mo saber cuntos intervalos considerarG F3mo determinar su amplitudG
+rimero debemos determinar el rango de los datos, que es la diferencia entre el mayor y el
menor de los valores obtenidos.
Ran"o ( )'*) + )'n
3alcula el rango de los datos de nuestro ejemplo.
....................................................................................................................................
Luego debemos establecer el nmero de intervalos %N" y determinar la amplitud %*" de los mismos.
A ( ran"o , N %N tu lo eliges, pero es conveniente que no sea muy peque1o"
7i queremos trabajar con &? intervalos, Fcul es, para nuestro caso, la amplitud de cada uno de
ellosG Ie ser necesario, podemos apro,imar el valor 0allado
......................................................................................................................................
7iendo el primer intervalo J&,9( / &.99" completa la tabla con todos los restantes. $bserva que el
e,tremo izquierdo del intervalo se usa un corc0ete K J K, lo que indica que tomamos este valor, en
cambio en el derec0o usamos K " K que nos indica que el intervalo es abierto, o sea, no se toma este
valor. La -arca de clase es el promedio aritmAtico de los e,tremos del intervalo.
'allas @arca de clase
%@3"
fi fr frB :a :aB
J&,9( / &.99" &,969
J&,99 / &,9=" &,9;9
J&,9= / &,;&" &,9>9
3
'otales
2nvestiga sobre el nmero de 0ermanos de cada alumno de tu curso y dispone los datos
obtenidos en una serie o distribucin de frecuencias.
stas son las notas obtenidas por los &?? candidatos que se presentaron a un concurso!
6= 9& 6( ;9 (9 (= 68 &( (> 86
<& ;( 9? 6< = (8 &> 8< =& 96
&; ;( 9? 6< 8 &< <9 >8 ; (9
99 6= 8; &; <( ;8 ;& 66 9> (&
&6 >( 6< 86 9= 9( == (< <8 ;;
;6 (= 6; &> 9; =8 6= ; 8( 9?
>= 9& ;( 6 &< 86 8< 98 9= (;
&( 8( 68 ;= << 89 ;? 6& <( (6
&= (( <? 68 9 9> (? ;= 99 8>
66 9( &8 8? 6= 98 9? && 8& <;
+resenta dic0os datos en una tabla de intervalos de clase.
n una cierta ciudad de la provincia de Caldivia, se registra el nmero de nacimientos ocurridos
por semana durante las 9( semanas del a1o, siendo los siguientes los datos obtenidos!
; 8 ( = &= &; &? ; < 9 &( = >
&( &< && > &; &> &= &= &; &8 &( < &?
6 && < &( 9 > && &9 > 8 & ; &&
< = &? &9 6 ( &6 > && &< &6 &( =
3onfecciona una tabla de intervalos de clase.
Las edades de veinte c0icos son &(, &6, &8, &?, &&, &(, &&, &6, &8, &(, &?, &(, &&, &6, &(, &&, &6,
&(, &? y&9. $rganiza los datos en una tabla de frecuencias.
FLuA porcentaje de c0icos tienen &( a1osG
F3untos c0icos tienen menos de &8 a1osG
n cada da del mes de enero, en el camping 2gl 0ubo la siguiente cantidad de turistas! &(, &8,
&<, &;, &>, &9, &9, (&, (8, (;, (=, (8, (9, (;, (?, (&, 68, 69, 66, 6(, 68, 6=, 8?, 86, 8&, 89, 9?, 96,
9=. 3onstruye una tabla de frecuencias para estos datos.
$.) /r*ficos! la recopilacin de datos y la tabulacin pueden traducirse grficamente mediante
representaciones convenientemente elegidas! barras, sectores circulares, mapas curvas, etc.
Los grficos permiten visualizar e interpretar el fenmeno que se estudia, en forma ms clara.
Las barras se utilizan generalmente para representar atributos cualitativos o cuantitativos discreto. La
longitud es igual a la frecuencia de cada observacin. +ueden ser barras simples o mltiples, segn
se trate de representar uno o ms atributos.
Las barras pueden ser 0orizontales o verticales.
4
/r*fico de barras co'pesto: Re'neraciones 'edias $a0o 1)
Los "r*ficos circlares o "r*ficos de torta son tiles para comparar datos pues, en general,
trabajan con porcentuales. l rea de cada sector representa el porcentaje que corresponde a la
frecuencia de un cierto valor de la variable. sta representacin es conveniente cuando el nmero de
sectores es peque1o y sus reas estn bien diferenciadas.
valuacin del gobierno M
5
2
%22
322
.22
422
522
622
Enero 7ebrero -ar#o
Indstrial
8ancario
Ad'& P9blica
Edcativo
Co'ercio
2 32 42 62
/r*f& de barras: Evalacin del "obierno :
netra
ne"ativa
positiva
positiva
ne"ativa
netra
positiva
ne"ativa
netra
l ;isto"ra'a se utiliza para representar una tabla de frecuencias de intervalos de clase.
7obre el eje 0orizontal se representan los intervalos de clase y sobre el eje vertical, las frecuencias de
los intervalos.
l grfico consiste en un conjunto de rectngulos adyacentes cuya base representa un intervalo de
clase y cuya altura representa la frecuencia del intervalo.
l pol"ono de frecencias se construye uniendo los puntos medios de los lados opuestos de las
bases de cada rectngulo. 7i se quiere cerrar el rectngulo, se agregan dos intervalos! uno anterior y
otro posterior al ltimo y se prolonga el polgono 0asta los puntos medios de estos intervalos.
Las crvas se utilizan generalmente para representar la variacin de una variable a travAs del tiempo
%a1os, meses, 0oras, etc.". 7obre el eje 0orizontal figuran los perodos de tiempo.
<ariacin del valor de las i'portaciones = e)portaciones de la Ar"entina en 'illones de
dlares
stas son slo algunas de las formas posibles de graficacin y las que encontrars con ms
frecuencia.
3onstruye el 0istograma y el polgono de frecuencias para la tabla del ejercicio de intervalos de
clase, de la pgina 6, de las tallas...
c) An*lisis = 'edicin de datos
+ara describir un conjunto de datos, se calculan algunas medidas que resumen la informacin y que
permiten realizar comparaciones.
-edidas de posicin! se utilizan para encontrar un valor que represente a todos los datos. Las ms
importantes son! la 'edia arit'>tica, la 'oda y la 'ediana.
La 'edia arit'>tica o pro'edio $ x ) de varios nmeros se calcula como el cociente entre la
suma de todos esos nmeros y la cantidad de nmeros que sumamos.
La 'oda $-o) es el valor que ms se repite. +uede suceder que 0aya ms de una moda o
ninguna %si todos los valores tienen igual frecuencia".
6
2
322
422
622
?22
%222
%322
%422
%622
%?22
%
@
6
5
%
@
6
6
%
@
6
A
%
@
6
?
%
@
6
@
i'portacin
de la
Ar"entina
e)portacin
de la
Ar"entina
La 'ediana $-e) es el valor que ocupa el lugar central al ordenar los datos de menor a mayor. 7i
la cantidad de datos es par, la mediana es el promedio entre los dos valores centrales.
Los sueldos de cinco empleados de una empresa son! N 8?????, N9?????, N89????, N;????? y
N69?????. 3alcula el sueldo medio, la moda, si es que e,iste, y la mediana e indica cul
representa mejor a los datos.
l entrenador de un equipo de natacin debe elegir a uno de sus integrantes para la pr,ima
competencia de estilo libre. 7egn los tiempos en segundos que obtuvieron los postulantes de las
cinco ltimas carreras de &?? m de estilo libre, FquA nadador le conviene elegirG
Iiego ;&,< ;&,< ;(,6 ;(,> ;6,&
'oms ;&,9 ;(,> ;(,> ;6,< ;6,<
7ergio ;?,< ;(,8 ;(,< ;(,< ;6,(
+ara poder decidir, calcula las medidas de posicin de cada uno.
promedio moda mediana
Iiego ;(,68 ;&,< ;(,6
'oms
7ergio
n promedio, los nadadores ms rpidos son ................................ y ................................., pero esto
no significa que 0ayan tenido el mismo rendimiento/ por eso necesitamos las otras medidas de
posicin! de ellos dos, tanto la moda como la mediana indican que ................................ fue ms
veloz. 7in embargo, para elegir el nadador adecuado, no basta con considerar las medidas de
posicin, ya que tambiAn es necesario que su rendimiento sea parejo, es decir, que los tiempos de
sus &?? m libres no tengan mucha dispersin.
-edidas de dispersin! nos informan cmo estn distribuidos los datos. La ms importante es el
desviacin est*ndar $)B que mide la dispersin de los datos con respecto al promedio. 3uanto
menor es el desvo estndar, menos dispersos estn los datos con respecto al promedio.
+ara calcular el desvo estndar, seguimos los siguientes pasos!
3alculamos la diferencia entre cada uno y el promedio.
levamos al cuadrado cada una de las diferencias anteriores.
7umamos todos los valores 0allados en el paso anterior y dividimos el resultado por la cantidad
de datos. *s obtenemos la varian#a.
3alculamos el desviacin est*ndar $) como la ra# cadrada de la varian#a.
( )
n
x x
n
i
i
=

=
1
2

n! nmero de datos
Iiego y 7ergio, dos de los nadadores del ejercicio anterior, obtuvieron el mismo promedio y sin
embargo sus tiempos estn distribuidos de manera diferente.
3alcula los desvos estndares de los tiempos de los nadadores!
7
'iempos de Iiego
,i %,i - ," %,i - ,"
(
;&,< .?,;8
;&,< .?,;8
;(,6 .?,?8
;(,> ?,9;
;6,& ?,<;
total
ntonces!
+odemos ver que el desvo estndar de ................................... es menor que el
de ................................., lo cual indica que el promedio representa mejor los datos
de ................................., porque sus tiempos fueron menos dispersos.
ntonces, aunque cinco datos son muy pocos para 0acer estadstica, si con esa informacin 0ay que
elegir un nadador de ese equipo para la pr,ima competencia, conviene que
sea .......................................
CACCUC!S DE ESTADI/RA7!S EN DAT!S TA8UCAD!S

7i los datos estn agrupados ya sea en tablas de frecuencias simples o en intervalos de clase,
debemos utilizar un criterio diferente para calcular los distintos estadgrafos. *nalicemos el siguiente
ejemplo!
3onsideremos la siguiente distribucin de frecuencias que corresponden a los puntajes de 9?
alumnos en una prueba.
2ntervalos @.3.
%,"
fi fO, :a
J;? - ;9" ;(,9 9 6&(.9 9
J;9 - <?" ;<,9 9 66<.9 &?
J<? - <9" <(,9 = 9=? &=
J<9 - =?" <<,9 &( >6? 6? 2ntervalo mediano
J=? - =9" =(,9 &; &6(? 8; 2ntervalo modal
J=9 - >?" =<,9 8 69? 9?
'$'*L7 52 .?.2
La -edia Arit'>tica:

=
f
x f
x

6 . 76
50
3830
= = x ptos. << ptos.
8
=
5
Diego

=
Sergio

'iempos de 7ergio
,i %,i - ," %,i - ,"
(
total
+ara calcular Ca -ediana necesitamos la siguiente frmula!
i
a
f
A F
n
L Me

+ =
en el ejemplo, la cantidad de datos es 9?, luego 9? ! ( D (9, y la :a (9 se encuentra en el intervalo
J<9 - =?" ya que el (9 esta aqu, en cambio en la anterior %&=" no esta. Luego el intervalo mediano es
J<9 - =?"
ntonces! L D <9 %lmite inferior"
fi D =
* D 9 %=? - <9 D 9"
:a D &= %frecuencia acumulada del intervalo anterior"
375 . 79 375 . 4 75
8
5 7
75
8
5 18
2
50
75 = + = + =

+ = Me
<> ptos.
y finalmente, para calcular la -oda en datos agrupados, utilizamos la siguiente frmula, teniendo
presente que la clase 'odal es la que tiene mayor frecuencia, y esta es la :recuencia @odal.
A
d d
d
L Mo
2 1
1
+
+ =
L D =? %intervalo modal J=? - =9", ya que la frecuencia es &;, que es la mayor"
d&D &; - &( D 8 %diferencia con la frecuencia anterior"
d(D &; - 8 D &( %diferencia con la frecuencia siguiente"
* D 9
Luego, 25 , 81
16
20
80 5
12 4
4
80 = + =
+
+ = Mo puntos. =& puntos.
7e estima que el valor ms repetido de los puntajes de esta prueba fue el =&.
EDercicios
&" Los siguientes datos numAricos corresponden a la cantidad de veces que cada alumno de un
grupo 0a ido a un recital o concierto.
( - 8 - 6 - ( - & - & - ; - 6 - ? - 6 - ( - 8 - ; - > - 6 - ( - & - ;
3alcula, sin tabular, @edia, moda, mediana, desviacin, n, rango.
9
Donde: L es el lmite inferior del intervalo mediano.
a es la fre!"en!ia a!"m"lada #asta antes del
intervalo mediano.
fi es la fre!"en!ia a$sol"ta del intervalo mediano.
% es la %m&lit"d del intervalo.
L: Lmite real inferior de la !lase modal.
d1: es la diferen!ia entre la fre!"en!ia modal ' la fre!"en!ia anterior.
d2: es la diferen!ia entre la fre!"en!ia modal ' la fre!"en!ia si("iente.
%: am&lit"d del intervalo
(" n un diagnostico de educacin fsica se pidi a los alumnos de los cuartos medios que 0icieran
abdominales durante 6 minutos. 7e obtuvieron los siguientes resultados!
8P *! 89 6= 86 (> 68 ;? 98 (< 6( 66 (6 68 68 (= 9; ;( 9; 9< 89 8< 8= 98
66 89 88 8& 68 6; 68 98
8P 4! 86 89 88 6= 68 8; 86 8( 86 89 9< 88 6= 6= 6< 86 ;& 6= 6< 89 (= 8(
8& 8> 8? 6< 68 88 8& 86
Fcul de los dos cursos tiene el rendimiento ms parejoG FquA distribucin estadstico permite
comparar la distribucin de este tipo de datosG
6" * continuacin se presentan los resultados de ambos cursos en la prueba de diagnstico de salto
largo.
8P * ! 6.( 6.9 8.> 9.? 6.& 8.& (.> (.= 6.= 8.9 8.6 8.9 8.& 9.= 6.> 6.; 8.( 8.; &.>
(.= (.> 6.6 6.> 8.( 8.& 8.6 8.; 8.8 6.= 6.;
8P 4 ! 6.9 (.> &.6 &.< 6.; 9.; (.= 9.( 9.6 8.& 8.& 8.8 &.; 9.& 8.6 9.? 9.6 6.( (.=
(.; 9.9 9.8 8.= 8.> 8.6 (.> 6.> 9.8 9.6 8.(
a" 3alcula el promedio de ambos cursos.
b" 3onstruye una tabla de frecuencias para cada curso
c" 3ul de los dos cursos tuvo un rendimiento mas parejoG
8" 7e 0an medido <9 alumnos, en centmetros, obteniAndose los siguientes datos!
&<9 &9; &<( &9> &;& &=9 &=; &>( &<> &;6 &;8 &<? &;8 &;< &;= &<8 &<( &;= &<; &;;
&;< &;> &=( &<? &;> &;< &<? &;( &<( &<& &<8 &<& &99 &<& &<& &<? &9< &<? &<6 &<6
&<8 &;= &;; &<( &<( &9= &9> &;6 &;6 &;= &<8 &<9 &9? &98 &<9 &;? &<9 &<< &<= &=?
&;> &;9 &=? &;; &=8 &=6 &<8 &<6 &;( &=9 &=> &;> &<6 &<& &<6
*grupa estos resultados en = intervalos y confecciona una tabla de frecuencias y calcula las medidas
de tendencia central y de dispersin. *dems, grafica esta tabla.
9" * los mismos alumnos anteriores se les aplico una prueba de inteligencia, estos 0an sido!
=< &?9 == &?6 &&8 &(9 &?= &?< &&= &&8 &(> &?? &?; &&6 &?9 &&& >8 &&9 => =(
&8& >( &6( &&( >< &69 &?& &?8 &6? >> &&8 >& &89 >9 &?& &&9 &?8 =< &?= &&9
&?6 &6( &&? &&6 &?( &?> &(8 >= &8? &?< >6 &?= &(( &&< &&8 &8& &&; &?= &?( &?&
&&= &6= >> &?9 &&( >8 >; &6( &&= &(6 &?= &6& &(< &?? >&
*grupa los datos en intervalos de amplitud =. y 0az lo mismo que en problema anterior.
10

Potrebbero piacerti anche