Sei sulla pagina 1di 10

ESTADSTICA COMPUTACIONAL

TRABAJO DE INVESTIGACIN
####################################################################### ALUMNO: CSAR PEDRO MANRIQUE PACHAS #######################################################################

INTRODUCCIN:
Las computadoras, Internet, y la Web generan continuamente una cantidad de datos que crece dramticamente. Ante esta cantidad abrumadora de informacin surge la necesidad de transformar los datos en informacin que sea til para quien debe usarla. De la necesidad de estudiar y obtener tcnicas efectivas para comunicar informacin a traves de imgenes nace la Visualizacin. Una herramienta de Visualizacin ampliamente utilizada para estudiar las relaciones entre los diferentes atributos de los tems presentes en un conjunto de datos es el Scatter Plot. Un Scatter Plot 2D consiste en una representacin grafica utilizada en estadstica para mostrar y comparar dos o ms conjuntos de datos en cantidades finitas, teniendo una coordenada en el eje horizontal (X) y otra en el eje vertical (Y), presentando la informacin a partir de una distribucin bivariada. Resulta importante poder representar tems de datos definidos a partir de tuplas cuya dimensionalidad sea superior a dos, en cuyo caso surge la necesidad de contar con un mapeo visual ms rico para poder soportar los atributos de los tems de datos. En base a lo expuesto resulta til disear una tcnica de Scatter Plot 3D capaz de representar una mayor cantidad de valores por dato haciendo, por un lado, uso de la tercera dimensin para mapear un valor al tercer eje y enfatizando la explotacin de las propiedades grficas del elemento de de representacin utilizado. Se propone entonces el uso de Glifos como elemento de representacin en un Scatter Plot 3D, aumentando potencialmente la dimensionalidad del mapeo visual.

SCATTERPLOT2D
Entre las tcnicas ms populares de visualizacin se encuentra el Scatter Plot 2D, que visualiza datos multidimensionales mapeando dos dimensiones a las coordenadas X e Y, y mapeando otras dimensiones a atributos visuales como color, tamao, intensidad o forma. En un estudio experimental, cada dato es representado por un punto en el espacio bidimensional, con el objetivo de estudiar la posible relacin entre dichas variables. Entre las relaciones ms conocidas se encuentran la lineal y la cuadrtica, las cuales nos pueden ayudar a identificar patrones o clster en los datos. Como herramienta de visualizacin, el Scatter Plot 2D presenta varias ventajas, que se mencionan a continuacin: Una rpida observacin del grafico revela algunas caractersticas del espacio de informacin analizado. Proveen patrones que pueden contener informacin importante y ayudar a focalizar la atencin en areas que necesitan especial consideracin. Una rpida inspeccin de los grficos permite detectar velozmente los valores extremos y agrupamientos de puntos. No requiere que el usuario especifique variables dependientes e independientes. Cualquier tipo de variable puede ser ploteada independientemente del eje que se le asigne. En contrapartida, esta herramienta presenta ciertas limitaciones: Los Scatter Plots se exploran desde el exterior hacia el interior. La facilidad de navegacin a travs a los elementos visuales depende enormemente de la cantidad y complejidad de los mismos. Para poder ver un gran nmero de elementos es necesario reducir su complejidad. En general, en un Scatter Plot simple, los puntos ( o elemento de representacin) se representan independientemente unos de otros, lo cual podra implicar que no se detecte visiblemente una conexin entre ellos. En un Scatter Plot, la posicin, el color y el tamao del elemento grfico se basan completamente en los valores de los atributos de los datos. Si un tem de datos est ausente o perdido (no tiene ningn valor asociado), se le podra asignar un valor por defecto, pero puede llevar a conclusiones errneas), ya que no existe nada en el grfico que indique la existencia de valores de datos ausentes.

SCATTERPLOT3D
Los Scatter Plots 3D corresponden a una extensin conceptualmente simple de los Scatter Plot 2D. Los Scatter Plots 3D visualizan una relacin entre tres o ms variables, explotando la tercera dimensin, representando las coordenadas X, Y y Z en el espacio tridimensional. Eventualmente se podran agregar ms coordenadas al modelo, llevndolo al espacio n-dimensional. En versiones ms complejas, los scatter plots 3D pueden incluir atributos especficos para los elementos de representacin segn el dato representado (color, tamao, orientacin, forma, etc.), guas (lneas de referencia desde los datos hasta algn punto de referencia) y combinaciones de datos scatter con objetos adicionales como superficies de ajuste. Una aplicacin comn de los Scatter Plots 3D es mostrar tanto los datos relevados de manera experimental como aquellos de ajuste terico, a fin de poder determinar los puntos de concordancia de aquellos que no lo son. En la figura 1(b) se puede observar un Scatter Plot en tres dimensiones que hace uso del tamao variable de las esferas para mapear un atributo adicional. Los Scatter Plots 3D presentan ciertas ventajas y limitaciones respecto a los modelos en 2D. A continuacin se detallan algunas de ellas.

VENTAJAS:
En un Scatter Plot 3D mantener la misma densidad de puntos que en un Scatter Plot 2D implica aumentar el nmero de datos experimentales a mostrar (mayor espacio muestral). Si mantengo el nmero de puntos del scatter plot inicial (2D), existe mayor discriminacin de las relaciones existentes entre variables, dado que se incorpora una caracterstica ms de los datos. El uso de visualizaciones de volumen de Scatter Plots 3D con glifos para representar los datos brinda la posibilidad de utilizar tcnicas de generacin procedural de formas [5]. Estas tcnicas permiten aumentar el nmero de dimensiones de los datos a mostrar explotando la forma de los glifos, aprovechado as la habilidad pre-atentiva del sistema visual humano para discriminar formas. Si se logra un mapeo de atributos eficiente, y se proveen las interacciones necesarias para la navegacin y consulta, el poder expresivo de un Scatter Plot 3D podra permitir el rpido anlisis de relaciones complejas entre mltiples variables.

LIMITACIONES
No es recomendable abusar de la multidimensionalidad si no es absolutamente necesario y el resultado no es visualmente ilustrativo. Trasladar representaciones de informacin en 2-dimensiones a 3dimensiones no es una tarea simple, ya que la dimensin extra afecta enormemente el modo en que la informacin puede ser presentada e interpretada. La visualizacin debe realizar un uso eficiente de la nueva dimensin y evitar que la nueva representacin sea mal interpretada por el usuario como consecuencia de un mapeo inapropiado. Es necesario tener especial consideracin respecto de la percepcin de la distancia espacial. El tamao de los objetos puede provocar que el usuario no perciba la perspectiva correcta de la informacin mostrada; es decir, se dificulta la discriminacin entre las distintas profundidades de los objetos, por lo cual resulta necesario proveer las interacciones adecuadas.

Una desventaja proveniente del uso de objetos tridimensionales es la oclusin, que se da cuando un objeto tapa a otro ocultndolo en el espacio muestral. Este tipo de problema se presenta principalmente cuando la densidad de tems de datos a mostrar es grande, o cuando simplemente un objeto muy grande se posiciona por delante de objetos ms pequeos.

SCATTERPLOT3D SPG
En base a todo lo expuesto surgi la necesidad de disear una tcnica de Scatter Plot 3D capaz de visualizar datos representados por tuplas de gran dimensionalidad. Para lograr esto se estudio la posibilidad de introducir los Glifos como elementos de representacin dentro de la tcnica Scatter Plot. Los glifos [Figura 1(a)] son objetos grficos en tres dimensiones que representan uno o ms valores en una nica locacin del espacio. Son formas o imgenes generadas por mapeo de componentes de datos a atributos grficos. Un nico glifo puede utilizarse para representar muchas propiedades o atributos de los datos en un punto dado del espacio, de forma tal que resultan ser herramientas muy tiles a la hora de interpretar una gran cantidad de informacin a primera vista. Se est desarrollando una aplicacin, llamada SPG, que permite visualizar un conjunto de datos representados por tuplas de dimensionalidad mayor a 3 mediante el uso de la tcnica Scatter Plot aplicada a tres dimensiones utilizando glifos como elemento de representacin. Dicha aplicacin permiti en primera instancia visualizar tems de datos multidimensionales. El SPG toma un conjunto de datos de entrada que puede residir en un archivo o ser generado proceduralmente y genera una visualizacin en 3D basada en glifos, tal como puede observarse en la figura 1(c). En una primera instancia, el SPG permite mapear datos a 6 atributos grficos, con posibilidad de extender el mapeo a 8 atributos si se agregan ciertas interacciones sobre la vista que permitan revelar detalles que de otro modo no seran claramente perceptibles por el usuario. Una tcnica como la propuesta exige el diseo de las interacciones adecuadas para asegurar la provisin de informacin contextual y detalle bajo demanda.

EJEMPLO:

# 3D Scatterplot library(scatterplot3d) attach(mtcars) scatterplot3d(wt,disp,mpg, main="3D Scatterplot")

# 3D Scatterplot CON COLORES Y GRAFICO DE LINEAS VERTICALES library(scatterplot3d) attach(mtcars) scatterplot3d(wt,disp,mpg, pch=16, highlight.3d=TRUE, type="h", main="3D Scatterplot")

# 3D Scatterplot with Coloring and Vertical Lines # and Regression Plane library(scatterplot3d) attach(mtcars) s3d <-scatterplot3d(wt,disp,mpg, pch=16, highlight.3d=TRUE, type="h", main="3D Scatterplot") fit <- lm(mpg ~ wt+disp) s3d$plane3d(fit)

#SPINNING 3D SCATTERPLOTS

# Spinning 3d Scatterplot #cargar la librera rgl library(rgl) plot3d(wt, disp, mpg, col="red", size=3)

# Otro Spinning 3d Scatterplot #cargar la librera Rcmdr #se le va a solicitar instalar una serie de libreras, acepte slo si est conectado a internet. library(Rcmdr) attach(mtcars) scatter3d(wt, disp, mpg)

Potrebbero piacerti anche