Documenti di Didattica
Documenti di Professioni
Documenti di Cultura
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
LENGUAJE R.
Las representaciones graficas dentro de la estadstica, resultan muy prcticas ya que son una
fotografa de la informacin que a simple vista no se podra identificar tan fcilmente. Existen
diferentes graficas que van en varias formas de agrupar la informacin y de cmo se puede
manipular.
En wikipedia encontramos la siguiente definicin:
Un grfico o representacin grfica es un tipo de representacin de datos,
generalmente numricos, mediante recursos grficos (lneas, vectores, superficies o smbolos),
para que se manifieste visualmente la relacin matemtica o correlacin estadstica que guardan
entre s. Tambin es el nombre de un conjunto de puntos que se plasman en coordenadas
cartesianas y sirven para analizar el comportamiento de un proceso o un conjunto de elementos o
signos que permiten la interpretacin de un fenmeno. La representacin grfica permite
establecer valores que no se han obtenido experimentalmente sino mediante
la interpolacin (lectura entre puntos) y la extrapolacin (valores fuera del intervalo
experimental).
Los grficos nos permiten a, simple vista, hacer un anlisis de datos aun los muy complejos e
interpretarlos, determinar su comportamiento, analizarlos de manera ms fcil, de igual manera
facilita el sacar conclusiones, implican un ahorro significativo de tiempo, como son:
Variabilidad
Escala
Patrones
Tendencias de los datos
Ttulo principal.
Ttulo secundario (opcional)
Descripcin del grfico.
Regin de datos y smbolos (grfico)
Escalas en los ejes
Pie del grfico.
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
MATRICULA: es1410915689
Fernando Luis Mrquez Portillo MATRICULA: es1410913422
e. Sobreponer datos.
f. Hacer que los datos sobresalgan.
g. Sobreponer grficos.
h. Presentar muchos nmeros en un espacio reducido.
i. No poner ttulo.
j. No indicar escalas.
Grficas en R.
I.
Este grfico fue propuesto por Tukey (1977) y a pesar de no ser un grfico para presentacin
definitiva se utiliza a la vez que el analista recoge la informacin ve la distribucin de los mismos.
Estos grficos son fciles de realizar a mano y se usan como una forma rpida y no pulida de mirar
los datos.
Tomamos como ejemplo un horario de trenes confeccionado a partir de un dptico de la lnea
Castelldefels-Barcelona/Sants recogido en la estacin de Renfe. Originalmente el horario ocupa
una tabla de 10 filas y 9 columnas ms una columna "viuda" con el tren de las 22:38. Un total
de 91 campos con formato hh.mm cada uno, 455caracteres.
Dptico original Trayecto Castelldefels -> Barcelona-Sants
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
Por otra parte, dado que a algunas horas se repite exactamente el horario de los trenes se puede
reducir an ms el tamao del grfico, sin perder informacin y ganando en claridad.
Castelldefels -> Barcelona-Sants Diagrama Stem & Leaf reducido
Al final tenemos 59 campos de 2 dgitos, 118 caracteres ms los separadores, es decir 4 veces
menos dgitos que con el horario original, menos espacio y ms claridad.
Esto nos da idea de que una disposicin apropiada de los datos puede ser doblemente
informativa y que la representacin grfica puede contribuir enormemente a la percepcin de
patrones y a la comprensin de la naturaleza de los fenmenos.
II.
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
Ordenar los datos y obtener el valor mnimo, el mximo, los cuartiles Q1, Q2 y Q3 y el Rango
Inter Cuartilico (RIC)
En el ejemplo, para trazar la caja:
a.
b.
c.
d.
Los bigotes, las lneas que se extienden desde la caja, se extienden hasta los valores mximo y
mnimo de la la serie o hasta 1.5 veces el RIC.
Cuando los datos se extienden ms all de esto, significa que hay valores atpicos en la serie y
entonces hay que calcular los lmites superior e inferior, Li y Ls.
Para ello, se consideran atpicos los valores son aquellos inferiores a Q1-1.5*RIC o
superiores a Q3+1.5*RIC.
En el ejemplo:
inferior: 7-1.5*2=4
superior: 9+1.5*2=12
Ahora se buscan los ltimos valores que NO son atpicos, que sern los extremos de los
bigotes.
En el ejemplo: 4 y 10
Marcar como atpicos todos los datos que estn fuera del intervalo (Li, Ls).
En el ejemplo: 0.5 y 2.5
Adems, se pueden considerar valores extremadamente atpicos aquellos
que exceden Q1-3*RIC o Q3+3*RIC.
De modo que, en el ejemplo:
inferior: 7-3*2=1
superior: 9+3*2=15
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
III.
MATRICULA: es1410915689
MATRICULA: es1410913422
Histograma hist().
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
MATRICULA: es1410915689
Fernando Luis Mrquez Portillo MATRICULA: es1410913422
2. La seleccin del nmero de clases y su amplitud que adecuadamente representen la distribucin
puede ser complicado.
Un histograma con muy pocas clases agrupa demasiadas observaciones y uno con muchas deja
muy pocas en cada clase. Ninguno de los dos extremos es adecuado.
Figura 2.4: Se muestra la distribucin del tiempo utilizado por los atletas masculinos clasificados
en el grupo elite en la media maratn de CONAVI. El histograma A tiene solo 2 barras. El grfico B,
con 4 barras, y el C, con 8 barras, muestra ms claramente la asimetra (este es el que la mayora
de los programas produce por defecto, ya que la regla de Sturges, para este conjunto de datos
aproxima a 8 barras). Si consideramos ms barras por ejemplo 16, como tenemos en D, se refina
ms la informacin y empezamos a notar multimodalidad.
IV.
Es tal vez el ms antiguo de los grficos multivariables. Est limitado a la presentacin de dos
variables, aunque se pueden realizar modificaciones de tal forma que nos permita incluir ms. En
R obtenemos este grfico mediante la funcin plot:
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
MATRICULA: es1410915689
Fernando Luis Mrquez Portillo MATRICULA: es1410913422
usados para comparar dos o ms valores. Las barras pueden orientarse verticalmente u
horizontalmente.
Este diagrama de ejemplo est basado en los resultados de la Eleccin del Parlamento Europeo en
el 2004 y en el de 1999. La tabla siguiente lista el nmero de asientos asignadas a cada partido. Los
resultados de 1999 han sido multiplicados por 1.16933, para compensar el cambio en el nmero
de asientos entre estos aos.
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
Fernando Luis Mrquez Portillo
MATRICULA: es1410915689
MATRICULA: es1410913422
points()
Es una funcin para dibujar una secuencia de puntos en las coordenadas especificadas.
Los puntos agregados estn en verde
Conclusin.
La presentacin de datos estadsticos por medio de grficos es considerada una tarea importante
en el proceso de comunicacin de los datos. El software R nos ayuda para que los datos
estadsticos, observaciones o funciones de una o ms variables, podamos elaborarlos con gran
calidad.
Referencias.
https://mariellalimn.wordpress.com/tag/representacion-grafica-en-estadistica-lenguaje-r/
http://es.wikipedia.org/wiki/Gr%C3%A1fica
HERRAMIENTAS COMPUTACIONALES.
ALUMNOS:
Norma Anglica Trujillo Jurez
MATRICULA: es1410915689
Fernando Luis Mrquez Portillo MATRICULA: es1410913422
http://www.estadisticaparatodos.es/taller/graficas/tallos_hojas.html
http://es.wikipedia.org/wiki/Diagrama_de_caja
http://en.wikipedia.org/wiki/Dot_plot_(statistics)
http://es.wikihow.com/hacer-un-grafico-circular-%28gr%C3%A1fico-de-pay%29
http://es.wikipedia.org/wiki/Diagrama_de_barras
http://es.wikipedia.org/wiki/Gr%C3%A1fico_Q-Q#Representaci.C3.B3n_gr.C3.A1fica
http://es.wikipedia.org/wiki/Histograma