Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
MARCO REFERENCIAL
En la Estadística vemos como se ha convertido en un método para ordenar,
agrupar, describir y analizar los diferentes datos, sea de cualquier rama. No sólo
consiste en recoger datos, sino que con ellos buscar y dar posibles soluciones y
tomar decisiones acertadas y oportunas, Es así que, con el desarrollo de esta
actividad, vemos la aplicación de los temas presentes en la unidad 1 del curso de
estadística descriptiva.
OBJETIVO GENERAL
Objetivos Específicos
DIA
Frecuencia Frecuencia
Frecuencia Frecuencia
Datos Absoluta porcentual
Absoluta Relativa
Acumulada (%)
lunes 7 7 0,1400 14,00
martes 4 11 0,0800 8,00
miércoles 8 19 0,1600 16,00
jueves 6 25 0,1200 12,00
viernes 5 30 0,1000 10,00
sábado 10 40 0,2000 20,00
domingo 10 50 0,2000 20,00
TOTAL 50 1,0000 100,00
Rural o Urbana
Frecuencia Frecuencia
Frecuencia Frecuencia
Datos Absoluta porcentual
Absoluta Relativa
Acumulada (%)
RURAL 25 25 0,5000 50,00
URBANA 25 50 0,5000 50,00
TOTAL 50 1,0000 100,00
10
0
lunes martes miercoles jueves viernes sabado domingo
Rural o Urbana
RURAL URBANA
Frecuencia
Frecuencia
Frecuencia relativa
Categoría Frecuencia acumulada
relativa (%) acumulada
Ascendente
ascendente (%)
0 8 16 8 16
1 7 14 15 30
2 14 28 29 58
3 5 10 34 68
4 8 16 42 84
5 1 2 43 86
6 2 4 45 90
8 3 6 48 96
9 1 2 49 98
11 0 0 49 98
15 1 2 50 100
Q1 1 12,5 no Entero
Q2 2 25 Entero
Q3 4 37,5 no Entero
1
Q4 5 50 Entero
Rango=R=15−0=15
VARIANZA
s2=
∑ f∗x 2 −x́ 2= 831 −32=7,62
n 50
DESVIACIÓN TÍPICA
∑ f∗x 2 −x́ 2
s=
√ n
s=2.76
COEFICIENTE DE VARIACIÓN
s
CV = ×100 %
x́
2.76
CV = × 100 %=92.01 %
3
Interpretar los resultados obtenidos y asociarlos con el problema objeto de
estudio.
Cuando el coeficiente de variación es muy alto se dice que la media aritmética no
es lo suficientemente representativa en la distribución. Este es nuestro caso, la
media no es lo suficientemente representativa debido a que esta es muy sensible a
los valores extremos del conjunto de datos.
El cuartil 1 representa el 25% de los datos que para este caso es 1
El cuartil 2 representa el 50% de los datos que para este caso es 2 además, este
coincide con la mediana.
El cuartil 3 representa el 75% de los datos que para este caso es 4
Para la variable continúa elegida, se deberán calcular las medidas univariantes de tendencia central: Media, Mediana, Moda.
Todos los cuartiles Así mismo deberán calcular las medidas univariantes de dispersión: Rango, Varianza, Desviación típica y
Coeficiente de variación.
VARIABLE CONTINUA: Pesos
n 50
Min 2555896,5000
Max 95517213,500
Rango 92961317,0
K= N°
Intervalos 8,644021646
A 10754405,855
Frecuencia Frecuencia
Frecuencia
Límite Límite relativa
x Frecuencia acumulada f*x
inferior superior relativa acumulada
ascendente
(%) ascendente (%)
13310302,35
2555896,500 7933099,428 22 44,00 22 44,00
5 174528187,4
24064708,21 18687505,28
13310302,355 5 10,00 27 54,00
1 3 93437526,42
34819114,06 29441911,13
24064708,211 6 12,00 33 66,00
6 9 176651466,8
45573519,92 40196316,99
34819114,066 1 2,00 34 68,00
2 4 40196316,99
56327925,77 50950722,85
45573519,922 2 4,00 36 72,00
7 0 101901445,7
67082331,63 61705128,70
56327925,777 3 6,00 39 78,00
3 5 185115386,1
77836737,48 72459534,56
67082331,633 2 4,00 41 82,00
8 0 144919069,1
88591143,34 83213940,41
77836737,488 5 10,00 46 92,00
4 6 416069702,1
99345549,19 93968346,27
88591143,344 4 8,00 50 100,00
9 1 375873385,1
Media aritmética
Formula usada
n
∑ f i Xi
x́= i=1n
∑ fi
i=1
Resultados
Media 34173849,72
Mediana
Formula usada
n/2 25
n 50
Fk-1 22
fk 5
Ak 10754405,8554
Lk 13310302,36
Mediana 19762945,87
Moda
Formula usada
f k−1
Mo= A +L
f k −1 + f k+1 k k
Resultados
Fk-1 0
fk+1 5
Ak 10754405,8554
Lk 2555896,50
Moda 2555896,50
CUARTILES
Formula usada
n
k −F k−1
4
Qk = ∗A k + Lk
fk
Primer cuartil
Resultados
cuartil 1
n 50
Posición 12,5
Fk-1 0
fk 22
Ak 10754405,855
Lk 2555896,50
Q1 8666354,372
Segundo cuartil
cuartil 2
n 50
Posición 25
Fk-1 22
fk 5
Ak 10754405,855
Lk 13310302,35545
Q2 19762945,869
Tercer cuartil
cuartil 3
n 50
Posición 37,5
Fk-1 36
fk 3
Ak 10754405,855
Lk 56327925,78
Q3 61705128,705
Cuarto cuartil
cuartil 4
n 50
posicion 50
Fk-1 46
fk 4
Ak 10754405,855
Lk 88591143,34
Q4 99345549,1990
Interpretación de resultados
El cuartil 1 representa el 25% de los datos que para este caso es 6867706,571
El cuartil 2 representa el 50% de los datos que para este caso es 14224683,301
además, este coincide con la mediana.
El cuartil 3 representa el 75% de los datos que para este caso es 43437053,796
MEDIDAS UNIVARIANTES DE DISPERSION.
Varianza 8,21062E+14
Desviación 28654173,72
Coeficiente de
variación 101,4036326
120
100
f(x) = 0.04 x + 95.35
80 R² = 0
Axis Title
60
40
20
0
0 50 100 150 200 250
Axis Title
∑x ∑y ∑ xy ∑ x2 ∑ y2 Ymedia= ý
442,00 477921,0
4783,0 43680 43544,00 0 95,66
n b a Se S y2 R2
50 0,0353 95,348 20,580073 407,5844 0,039
5
Y^ =a+bx=95,348+ 0,0353 x
R2=0,039
r =0,197851774
Lo cual nos permite concluir que el modelo de regresión lineal ajustado no tiene un
alto grado de confiabilidad. Se recomienda no utilizar el modelo de regresión
estimado
Y^ =a+b1 x 1+ b2 x 2
Donde:
b 1 , b2: Pendientes asociadas de la recta
a: Intercepto de la variable Y
x 1 x 2: Valores de la variable independiente
Y^ : Valores de la variable dependiente
n: Tamaño de la muestra
∑ x1 ∑ x2 ∑y ∑ x1 y
442 397 4783 43680
∑ x2 y ∑ x 21 ∑ x 22 ∑ x1 x2
38139 43544 3551 4895
∑ y2 ymedia= ý n R2
477921 95,66 50 0,00421195
∑ y=na+b 1 ∑ x 1 +b2 ∑ x 2
∑ x 1 y=a ∑ x 1 +b1 ∑ x 21+ b2 ∑ x 1 x2
∑ x 2 y=a ∑ x 2 +b1 ∑ x 1 x 2+ b2 ∑ x22
Por tanto
Coeficiente
s
Intercepción 92,8849271
Usuario de moto (X1) 0,02399406
Usuario T.Pasajeros (X2) 0,32279162
PROPUESTA INDIVIDUAL
La cultura que se tiene y que en la actualidad la fuerza pública está combatiendo
fuertemente es la del conducir en estado de embriaguez, esta afirmación la
acredita la tabla de frecuencias de la variable: día, la moda representa un 20% de
los datos en la categoría sábado y domingo, día que normalmente una gran
cantidad de población toman ese día como día de celebración y fiestas.
Otra información relevante que se obtuvo del análisis estadístico es que en la tabla
de frecuencias de la variable: peatones el cuartil 3 que representa 75% de la
información muestra que en los accidentes hay 4 peatones involucrados, lo cual,
se puede ver que es una cifra demasiado alta.
Una vez visto los resultados, la solución que se podría implementar para mejorar
la movilidad vial y bajar esos porcentajes estimados es lo siguiente:
La persona que quiera ser conductor deberá asistir a una escuela de
aprendizaje, de un periodo estimado a tres meses, esto con el fin de que se
le enseñe las buenas prácticas de conducción, de que se culturice que
conducir es una responsabilidad que conlleva a tener la vida propia y de
otros sobre el volante.
Realizar campañas que involucren la educación del peatón, donde se tome
conciencia que no se debe cruzar la calle sin revisar que no venga un
vehículo y el no uso de dispositivos mientras se está transitando por la
carretera.
CONCLUSIONES
Se logró profundizar sobre el comportamiento de las variables, que tan lejos están
dispersas, Se vio en los temas anteriores la tendencia que tiene un conjunto de
datos dado a agruparse hacia el centro, pero también se descubrió que los datos
extremos podían estar bastante alejados de esa tendencia central. Conocer esto
implica que se puede estudiar el comportamiento de las variables ya sean
discretas o continuas cuan podía estar sus datos del centro, esto permitió ampliar
el campo de las aplicaciones de la estadística, que es muy usada en el campo
profesional.
Con el presente trabajo se logró evidenciar el proceso para saber que tanto se
encuentran relacionadas dos o más variables linealmente, con la base datos dada
lastimosamente no se pudo encontrar linealidad en las correlaciones, lo que
indicaría que se debe aplicar otro tipo de método para encontrar relaciones entre
las variables.
REFERENCIAS
Ortegón Pava, M. (2010). Estadística Descriptiva. Ver. 2. Ibagué: Universidad
Nacional Abierta y a Distancia.