Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
--{--i{¡Gg='ji'*',tsiá5r€i}bl{iil¡
tl
:
.¡{
i-,
r'-
i-r
a
'*i
iJ
É
F-,
H
r-.i
"¡
n
É:r
$
br
re
g
#
it
*
#
H
H
¡E
Eü
ñ
üF
i{t ,¡-. r :.: '. ...*+r*i*t¡;'-'i/
ffisfmdTsf6ctr
y prffihmb*fr$Cad
T*sry:as de Ia unidod
,' Estadística
Probabilidad
a. A1 elegir aleatoriarnente un número firenor o
iguai q'le iC{}, ¿es ;lás probable ol-.tener un nir-
inero prillo o r,;n mtriiipio de 5?
..!
?:i:.i:::=
F-. ::
ftE
. Es irnposible elegir una / cle corazones.
úÉr.--,,-*.d
* Es seguro l'iegit itna carta de corazones.
.: |' ":. , Es irrrpositrie elegir: un as de tréboles.
r!. '
n 1)o.'i-.t.,i.. . - -:
.i.:,:
a::.a:-a.,,..
'1'-.
¿
f.i . 4 i'
ht rft#T*ffi#Tre#
y e! *r*p#r#d#r
lJ azar, o quizás ¿ Prorridencia, f¡e qlien en 1785 Dlez ¿ñcs ces¡rués de esle sucesa -:i-r ::,-' - , l
puso anie l'-le¡ie Simon laplace, sjenclo piolesoi'en ia obra ,-'ecrriri a¡aiiiicct ¡le lcs orcbariiii.;i.,¡,, ,.-. . -l
Escreia Vli irar de Paris, ¿ Jn Joven de l6 años qle de s maba Lc geornerria del azor.
tacaba en matemátrcas y que, en e f ¡tL.-lro, se ccn\,'eT
tiria en e homcr.o más poderoso de Fui'opa, Napo eón
A t-.cLbir e lbi'o, L¡p ¿rae se paró a pensar preais¿¡'ri-- r.:
en el azar, es¡ cralidad que i. enen os erperimentos aa
Bo na pa rie.
no 5er predeterrnrnados, y cómo é los habia at¿c. i
Ahora Las tor¡as habian cambiado, era Lapl:c. qr e.r eyes ¡-raterréiicas.
presentaba un trabalo sobr'e mecéitic¿ ce esie a !ol't-i- Tor¡¿do ¡-. iLtic¡:r,rri¡irc:r i ¡!il. :: ¡:
perador de Fraicia. F-dltorlal 5¿t.t .¡rr:. l
Monsieur la¡lace ¡¿ escrito este libro sobre las iet¡es
de universo slr- h¿bet'i¡encionado ¡i uira sola t,ez a
su creador.
La respuesta hrzo que e empei'ador mostt¿se une p.o ,:." .d,0 00",q
de sus escasas sonrisas )¡, después, contlnló con a
;,oirp o iC"p'¡io ""' g.
a ud iencia.
Hstadís?ietr
Conceptos fu nda menta les
La estadística es la ciencia que se encarga de diseñar, recolectar y analizar
información
para encontrar las principales características de un grupo de individuos a partir de
una o más variables.
En un estudio de estadística, en algún contexto determinado, es necesario definir
al-
gunos conceptos fundamentales pára gatanltzar que los resultados sean interpretados
y validados correctamente.
o indi-
En cualquier estudio que se quiera realizar se debe tener claro a qué personas
viduos ," di.ig" y qué característica o características se quieren explorar.
'o .l ¿io dp ¡0)0 o.t., r' En la mayoría de casos la población es muy grande y obtener los datos de todos
'P re¿L.zo
Por
regifro para saber a cant!dad de Po
los elementos de la población resulta un trabajo largo, costoso e innecesario'
esta razón es conveniente tomar un grupo más pequeño de Ia población
sobre ei
blación y de ganancias en [gipto, efe
es el primer censo del que se teng¿ cual se realizará el estudio.
ro nocr m iefto.
. Una muestra de la población es un grupo de individuos sobre los cuales se toma
la información Para analizarla.
Al realizar un estudio de una población usando elementos estadísticos, es necesa-
rio determinar qué tipo de información se va a recolectar. Para tal fin, se elabora
una serie de preguntas que responden a los objetivos del estudio y que permiten
obtener los datos de la muestra.
. Una variable estadística es una pregunta concebida para estudiar una caracterís-
tica en la población. La pregunta se debe formular de tal forma que las respuestas
correspondan a una escala numérica o se puedan contar'
Las variables estadísticas se clasifican en: cualitativas si lo que se quiere medir
en cada individuo de la muestra es una cualidad, un gusto, una preferenci'a o una
opinión; y cuantitativas si la información que se obtiene es numérica y se puede
asociar a una escala.
*: ffij*mp[*
Determinar la población y la muestra en este caso' La muestra corresponde a las 30 familias encuesta-
Luego, identificar las variables y clasificarlas en das, ya que, de allí se obtendrán los datos para anali-
cuantitativas o cualitativas' zarlos.
El administrador del conjunto residencial quiere Como el administrador formula dos preguntas, enton-
saber si la implementación de bicicleteros en cada ces, las variables correspondientes son:
. S¿rtrlLa:i¿
Corocterizoción
de uno vorioble cuolitotivo
Cuando se ha obtenido la información de la muestra en cada una de las variables, es
necesario organizar los datos y procesarlos para obtener conclusiones que permitan
identificar las características de la población. A este proceso se le denomina carac-
terización.
Para caractertzar wavariable de cualidad se tienen en cuenta tres aspectos funda-
mentales: Ias tablas de frecuencias, la representación gráfica y la moda.
Toblos de frecuencios
Una tabla de frecuencias es un resumen de los datos en la cual se agrupan las res-
puestas a la variable teniendo en cuenta las preguntas.
Por ejemplo, el director de la emisora del colegio preguntó a 20 estudiantes del grado
séptimo acercadel tipo de servicio de televisión que tienen en su casa. Las respuestas
que se obtuvieron son:
¡
r N N C C S C S C S S
d C C S C N S C S N C
[r Representoción g rófico
n Diagrama ci¡cular
para tipo de televisión
de Una vez se ha elaborado la tabla de frecuencias es necesario utilizar diferentes re-
presentaciones que permitan visualizar la tendencia de las respuestas a la pregunta.
Las principales representaciones gráficas de una variable cualitativa son: el diagrama
circular y el diagrama de barras. Para el caso del ejemplo anterior, las representacio-
nes gráficas correspondientes se pueden observar en la figura Iylafigura2.
Para elaborar el diagrama circular, se divide 360o en partes proporcionales a los va- Cable
lores de las frecuencias dadas. En este caso es: Figura 1
Ee-
360o por tanto, x : 72o.
ü- Para Nacional, cuya frecuencia es 4, se tiene: 4 - , Diagrama de barras para
4x tipo de televisién
Para Cable, cuya frecuencia es 9, se tiene: : 360" , por tanto, x: 162". o/o
osantillana
lZ¿9
Lo moda
La moda es una medida de tendencia central que se puede calcular e interpretar
cuando se caracteriza una variable cualitativa.
lq#Á L: r. íiril: I i
@ t" cada una de las siguientes situaciones deter- El director de una programadora de televisión na-
mina la población, la muestra y las variables rela, cional realizó una convocatoria de nuevos actores
cionadas al estudio. parala última temporada de una serie. Para cada
a. Mario quiere indagar acerca de Ia cantidad de actor tomó la información del género: hombre o
tiempo que debe estudiar un alumno del cole- mujer, y de la contextura física: delgado, normal u
gio en casa. Para ello pregunta a 10 compañeros obeso. Los resultados de los actores que se presen-
del curso cuánto tiempo dedica cada uno taron el primer día son:
a
esludiar en su casa. Actor G Cont. Actor G Cont. Actor G. Cont.
b. El dueño de la papelería del barrio quiere saber
si es lucrativo implementar el servicio de foto-
H D 9 M D 17 l\l NI
..*i+¡., .,.r@..
Corocterizoción
de dos v0riobles cuolitotivos
En la mayoría de estudios estadísticos se relaciona más de una variable cualitativa.
Por esta razón se hace necesario determinar algunos criterios que permiten relacionar
dos variables cualitativas, para elio se tienen en cuenta dos herramientas de análisis:
tablas de doble entrada o tablas de contingencia y representaciones gráficas.
Toblos de contingencio
Una tabla de contingencia o tabla de doble entrada está conformada por filas y
columnas. Las filas están formadas por los rangos de respuesta de una variable y las
columnas, por los rangos de respuesta de la otra variable. En cada una de las casillas
formadas se ubica la cantidad de datos que tienen ambas características simultánea-
mente.
M E 11 F P 21 F_iB
) N4 P 12 F P )) F;P
3 F t 13 l\4 B 23 IV B
4 i\^ B l4 M P )4 NA E
5 I P
( F B 25 F B
6 \4 B 6 t\l P 26 \t B
t)
7 F P 7 F B ?7 F
B F B 8 M B 28 F B Est.: Estudiante
o NI B 9 F B 29 N/ P G : Género
10 l- E. "20 F P, .30 F E
S: Sección
La tabla de frecuencias está formada en las filas por los rangos de una de las dos varia-
bles. Para este caso se utiliza la variable género. Por tanto, en las columnas se ubican
los rangos de respuesta de la variable sección a la que pertenece.
En cada una de las casillas se ubica el número de estudiantes que tienen ambas ca-
racterísticas simultáneamente.
La tabla de frecuencias final es:
Masculino (M)
Femenino (F)
, s¿ntitl¿na I P31
t--'
lr
Toblo de contingencio de frecuencios relqtivqs
Una tabla de doble entrada o de contingencia también puede representar las frecuen-
cias relativas o porcentajes.
Para el caso de la tabla de frecuencias relativas basta con dividir cada frecuencia
entre el total de los datos. La tabla de frecuencias relativas para el ejemplo de género
y sección escolar correspondiente es:
Representoción g rófico
La representación gráfica puede ser elaborada con diversos propósitos. Uno de ellos
es comparar los rangos de respuesta de una variable con respecto a la otra o viceversa.
150
60
50 100
40
30 50
20
10
0 0
Total
l-igura 3 Figura 4
En este caso, la gráfr,ca compara las secciones escolares a las cuales pertenecen los
estudiantes con respecto a su género.
?3¿ I o santillana
I
Estándar : pensa m ie nto a I eatori o
ffiTrÉi,ffifffi5ff;ffi1l#{Hffi8fr#;: a
11
I
::
3 S 28 3 S 6 A M 21 A M
i:
4 2 N 29 2 S 7 F 22 A F ::
30 I N )3 M ::
5 3 S 8 A F
6 0 N 31 l S 9 B F 24 F
7 3 N 32 I N 0 E M 25 A F
8 2 S 33 2 1 A F 26 F
* 9 1 S 34 3
)
S 2 F 27
28
B F
T 0 3
0
N
S
35
36 1
N
S 4
3
A M 29
I
I F
2 2 N 37 3 S B F 30 A F
3
)
J 3B 3 S
La nota reportada para cada estudiante es E: exce-
4 1 S 39 2 N
5 0 N 40 4 N lente, B: bueno, A: aceptable e 1: insuficiente.
6 3 N 41 2 S El género de cada estudiante es M: masculino o F:
7 2 S 42 3 N femenino.
B N 43 4 S
9 4 5 44 N
a. Elabora una tabla cruzada para esta informa-
)0 0 S 45 N ción.
21 4 S 46 2 S b. Determina si se puede afirmar que la mayoría
22 3 N 47 3 S de estudiantes que perdieron la asignatura son
23 s 48 2 N
mujeres.
24 ) S 49 2 N
c. Construye una gráfica que represente la infor-
_25 0 N, .50 2 S
mación anterior.
Donde E: estrato y puede ser'. I,2,3 y 4;la varia-
** au siguiente gráfrcaapareció en la sección de Datos f.i
a. Elabora una tabla de doble entrada para esta a?"Ji.í,, nrc Fw rotallffi
situación. :.
Total
b. Construye la correspondiente tabla de doble en-
Negros
trada de porcentajes. Escribe tus conclusiones. Jscuras
c. Elabora una representación gráfica de esta si- Claros
No. de
tuación. estudiantes
d. Responde: Si la Junta Administradora Local
quiere mostrar que la mayoría de familias La gráfi,ca muestra la relación porcentual entre el ;
cuentan con los servicios, ¿qué valor debe usar género de 100 estudiantes y su color de ojos.
y por qué? á. Construye la tabla de contingencia correspon- .:
lias de estrato uno no tiene los servicios públi- b. ¿Se puede afirmar que la mayoría de estudian- !!
osantillana
l¿33
:=+=:É;E.ffi#+eElri¿ElaEEs3É11
Coracterizoción
de uno vcriable cuontitotivo
La caracterización de variables cuantitativas se debe realizar aplicando dos criterios:
para datos agrupados y pari- datos no agrupados.
Dotos cgrupodos
El criterio de agrupación de datos corresponde a un análisis semejante al elaborado
para variables cualitativas. Consiste en elaborar una tabla de frecuencias y construir
algunas gráficas que representen el comportamiento de la variable.
Un diagrama de tallo y hojas es una representac¡ón gráfica de los datos que se c asifican
de acuerdo con la expresión decimal de cada uno de ellos.
El diagrama consta de dos columnas: una el tallo y la otra las hojas. Para la cons-
trucción de este tipo de diagrama se ordenan los datos y luego se divide cada dato
en tallo y hoja.
En la mayoría de los casos, la hoja corresponde a la última cifra del dato y el tallo, a
las demás cifras.
¡
ffib*¡pÉLs.awñ:¡ailffi]}!+iffi'"sr¡¡.1HFq4+Bqt$gaq/4++@+crtül1ffiqrq+.q|4É{aba.ql]]]11jj1wqtrrq
Toblqs de frecuenciq
Las tablas de frecuencia, para el caso de las variables cuantitativas, no son únicas y
dependen de los grupos que se conformen. Para un grupo de datos se pueden cons-
truir varias tablas distintas. En la mayoría de los casos, la persona encargada de ana-
lizar los datos determina el número de grupos que desea conformar. El único criterio
de garantizar que los datos queden bien resumidos cuidando de no construir
es el
pocos iniervalos con frecuencias muy altas o, al contrario, muchos intervalos con
frecuencias m uy pequeñas.
Los pasos que se siguen para construir una tabla de frecuencias de un conjunto de
datos son:
. Primero, se determina el número de grupos que se debe construir' Para este fin se
recurre a algunas aproximaciones cuando no se tiene conocimiento previo de las
variables y no se tiene un criterio adicional para determinarlo.
una de las aproximaciones más usadas y generalmente más confiable es:
Número de intervalo t:
"li
Donde n eslacantidad de datos. Generalmente se recomienda que la aproxima-
ción se haga al entero menor del resultado dela raí2.
para el caso número de comparendos por día, el número de intervalos que se debe
construir es:
Número de intervalo r: Ji: ¡30* : 5,477 = 5
. Segundo, se determina el tamaño de cada intervalo. Para hallar este valor se utiliza
la siguiente fórmula:
Tamaño de cada intervalo
Dato mayor Dato menor _ -
Número de interYalos
Para el ejemplo, el tamaño de cada uno de 1os cinco intervalos es:
. Santillana I l3
Toblo de frecuencios
Para el ejemplo que venimos analizando la tabla de frecuencias correspondiente es:
Total 30
Donde:
. .;[es la frecuencia del intervalo y corresponde al número de datos que están en este
rango.
. fr es la frecuencia relativa o proporción y corresponde a la frecuencia comparada
con el total.
. F es la frecuencia acumulada y corresponde a la sumatoria de las frecuencias de
Ios intervalos anteriores incluyendo su frecuencia. Es por esto que el valor de F en
el tercer intervalo corresponde a la suma de2 -l 6 * 8 : 16.
. Fr es la frecuencia acumulada relativa y corresponde a la frecuencia acumulada
comparada con el total.
En la tabla se puede ver que el 23,3o/o de los días fueron impuestos entre 364 y 385
comparendos, mientras que el 6,70/o de los días se impusieron entre 298 y 319 com-
parendos.
Según la columna de frecuencias acumuladas se puede decir que el76,70/o de los días
se impusieron 385 o menos comparendos.
Histogromos
lJn histograma corresponde al diagrama de barras de la tabla de frecuencia. En este
diagrama, las barras deben construirse pegadas ya que se trata de variables cuanti-
tativas.
5
20
4 15
J
10
2
5
1
0 0
Comparendos Comparendos
En el histograma de frecuencias se puede ver que las frecuencias entre los intervalos
dos, tres, cuatro y cinco son parecidas y que las de los intervalos cuatro y cinco son
iguales.
¿36lGsantillana
Estánd a r: pen s {t rn t ento c i eata r o t
Polígono de frecuenc¡os
El polígono de frecuencias corresponde al diagrama de líneas elaborado con los
puntos medios de cada intervalo.
En el ejemplo anterior, los polígonos de frecuencias y de frecuencias acumuladas son:
v
t0 v
9 ¡sl
8
,nI
7
6 ,']-
5
4
3
i:l
r0L
2
1 ,l-
h
n $ luru pertenecer al grupo de rockde la ciudad se # fuan ha hecho un estudio acerca del número de
convocó a 40 cantantes. Sus edades son: películas que han visto sus compañeros de curso
en el último mes. juan presentó los resuitados en
la
17 22 26 15 29 el siguiente diagrama de talio y hojas:
15 24 21 25 18
¡5
34 23 25 36 13 Tallo Hojas
22 22 25 19 32 0 1338545
1-
34 17 14 14 23 I r34673567
32 36 25 32 20 945200
33 28 22 31 14 2
irs
42 35 37 17 24 ) 4830
a. Realiza el diagrama de tallo y hojas de las eda- a. Determina cuántos estudiantes hay en el curso
des de los cantantes. de luan.
b. Elabora la tabla de frecuencias correspon- b. Elabora una tabla de frecuencias para este caso'
ite diente. c. Realiza un diagrama de barras de acuerdo con
ri- Escribe las conclusiones que se pueden plan- el diagrama de tallo y hojas.
tear con los datos de la tabla. d. Elabora un histograma de acuerdo con la tabla
Construye los histogramas y los polígonos de de frecuencias del literal b.
u-
frecuencias corresPondientes. e. Compara las gráficas. ¿Existen diferencias en-
Responde: ¿Se puede afirmar que hay una ten- tre ellas? Justifica tus respuestas.
dencia en las edades de los futuros cantantes
pagaron 48 familias
del grupo de la ciudad? € tt valor en miles de pesos quepúblicos se relaciona
Elabora una tabla de frecuencias con base en por concepto de servicios
los siguientes intervalos. con la siguiente tabla.
63 69 55 58 52
50 59 54 79 62 156
tl-15 55 51 61 60 69 151
t6-20 47 54 J 49 71 147
21-25 57 164
6A 64 49 53
26-30 58 52 57 161
60 55
31-35 62 50 162
48 67 51
36-40 52 63 162
47 5B 51
4t-45.
a. Elabora un diagrama de tallo y hojas.
g. Compara la tabla de frecuencias del literal b
b. Escribe una conclusión que se puede sacar con
los con la tabla del literal f. ¿Existen diferencias
base en esta representación.
;¡f,n significativas entre ellas? fustifica tu respuesta' j
- :¡ -.:a.:a -: ::..-.' :.::-.:'.a:-:.:--:::=,,a.=,=
:
=--a-i-
osantillana lP3,
I
Dotos no ogrupados
Para caracterizar unavariable cuantitativa sin agrupar los datos es necesario recurrir
al cálculo de algunas medidas que permitan describir su comportamiento. Las me-
didas que se utilizan para caracterizar una variable cuantitativa son: las medidas de
tendencia central y las medidas de posición.
x f;jernpto
El número de minutos que usan cada uno de los l0 estudiantes de un colegio de
la ciudad para prepararse para una evaluación de matemáticas programadá son,
30156045100153025
Hallar las medidas de tendencia central.
t
Estándar: pensan¡ento ciec:¿: : ,--{
' {-t'
'-n*wffi-ffiffi@-* -
Medidos de posición
Las medidas de posición son medidas que dividen a los datos en partes porcentual-
mente iguales. Las medidas de posición son: cuartiles y deciles'
Los cuartiles son las medidas que dlviden un conjunto de datos en cuatro partes. Cada
una represent a el 25a/o del total de los datos. Se slmbolizan Q1 Q2Y Q:
Q, Q2 Q3
250/olZSV'lZSrolZSr"
i---t^t
& ". - ' o li,, *.*,S{** *L"
/* lle *kist"*
iltlt
Sepuede ver que el valor del cuartil dos corresponde al valor de la mediana. Atrás de1
pri-.r cuartil se encuentra el 25o/o de los datos, entre el primer y segundo cuartil se
encuentra el25o/o de los datos y así sucesivamente.
Para calcular el valor de los cuartiles se ordenan los datos de menor a mayor y se
Los deciles son valores que dividen en 1O partes iguales el conjunto de datos. Cada parte
. D t: Valor que deja por debajo el i 0% de los datos y por encim a el 90o/o restante.
. D, Valor que deja por debajo e7 20o/o de los datos y por encima el 80% restante.
Y así sucesivamente hasta el Dn que deja por debajo el90o/o de los datos y por encima
I el 10% restante.
@lal'"r¡i@
{& Ut número de hermanos que tienen los 25 estu- ! # Las estaturas de nueve alumnos son 159, 168,I73,
diantes del curso se relacionan a continuación: i 168, 173,159,165' I73 y 182.
tudiantes del curso ttene 2 hermanos o menos. ¡ Sin embargo, se sabe que el promedio es 41 cm,
Justifica tu respuesta.
, ¿cuál es el dato que falta?
osant¡llana
|
¿lg
¡¡