Sei sulla pagina 1di 24

Ao de la Consolidacin del Mar de Grau

Ingeniera de Sistemas

EL PROGRAMA R Y SU APORTE EN LA EDUCACION DE LOS


UNIVERSITARIOS,2016

Trabajo de investigacin realizado por

Castillo Ordinola Adriana

Cunya Abad Rebeca

Dirigido por

Edgar Luis Cceres

Noviembre 2016
ndice:

RESUMEN
INTRODUCCIN
1. PLANTEAMIENTO DEL PROBLEMA
1.1. Problema general
1.1.1. Problemas especficos
1.2. Objetivos de la investigacin
1.2.1. Objetivo general
1.2.2. Objetivo especfico
1.3. Justificacin del estudio
1.4. Limitaciones de la investigacin.
1.5. Viabilidad del estudio
2. FUNDAMENTO TERICO
2.1. Inicios con R
2.1.1. Instalacin
2.1.2. Interfaz
2.1.3. Bsqueda de paquetes
2.1.4. Instalar y cargar paquetes
2.1.5. Ayuda en R
2.2. Lenguaje orientado a objetos
2.3. Estructura de Datos
2.3.1. Vector
2.3.2. Matrices
2.3.3. Conjunto de datos
2.4. Exportacin de datos en R
2.5. Lectura e importacin de datos en R
3. METODOLOGA
3.1. Tipo y Diseo de Investigacin
3.2. Nivel y diseo de la investigacin
3.3. Poblacin y muestra
3.4. Tcnicas e instrumentos para la recoleccin de Datos
4. PRESENTACIN, ANLISIS E INTERPRETACIN DE RESULTADOS
5. CONCLUSIONES Y RECOMENDACIONES
5.1. Conclusiones
5.2. Recomendaciones
6. REFERENCIAS BIBLIOGRAFICAS
7. ANEXOS
RESUMEN

R es un programa derivado del lenguaje de programacin S, este software est

dedicado al anlisis de datos y a la elaboracin de grficos. Adems, es un software

libre y se puede obtener gratuitamente ya que no necesita de licencias.

El programa R funciona en Windows, Mac y UNIX, una de las caractersticas ms

importante de este programa es que permite elaborar grficos de gran calidad.

Adems, este se est convirtiendo en la lengua franca del mundo de la estadstica, una

de sus ventajas es que R utiliza lnea de comandos y no una interfaz grfico

Lo que queremos llegar con esta investigacin es que los universitarios encuentren una

forma ms fcil al momento de elaborar un proyecto estadstico.


PALABRAS CLAVE: Programa, Software, Comando, Interfaz grfico.

ABSTRACT

"R" is a program derived from the "S" programming language, this software is

dedicated to data analysis and graphing. In addition, it is free software and can be

obtained for free as it does not require licenses.

The "R" program works on Windows, Mac and UNIX, one of the most important

features of this program is that it allows you to produce high quality graphics.

In addition, this is becoming the lingua franca of the statistical world, one of its

advantages is that "R" uses command line and not a graphical interface

What we want to achieve with this research is for university students to find an easier

way when designing a statistical project.

KEY WORDS: Program, Software, Command, Graphic interface.

INTRODUCCIN

El siguiente proyecto de investigacin: El uso del programa R en los universitarios,

2016, tal y como indica su ttulo, presenta como tema central el anlisis de una

metodologa desarrollada de S ya que deriva del su lenguaje de programacin y resalta

siendo este un analizador de datos y elaboracin de grficos, dirigidas a los

profesionales y estudiantes de dichas universidades.

A travs de mi investigacin y colaboracin de mi docente, comenc a tener un mayor

conocimiento referente a mi tema planteado por la informacin encontrada para realizar

un mayor aporte a mi proyecto


El espritu crtico transmitido por estas aportaciones me hizo reflexionar acerca del poco

impacto que tiene en los universitarios que ocasiona el problema planteado y que es un

tema enfocado en mi carrera, el cual como futura profesional debo poner en marcha un

planteamiento de solucin.

Este trabajo se estructura en diversos puntos. El primero de ellos, el planteamiento del

problema, donde realizo un acercamiento a la situacin del mismo, determino los

propsitos generales y los objetivos especficos de la investigacin, sealo la

justificacin para la realizacin de este estudio, e indico las limitaciones y viabilidad del

estudio de investigacin.

En el segundo punto, el marco terico llevo a cabo la contextualizacin terica desde

donde parte mi trabajo, hago un recorrido de algunas de las influencias tericas que ha

recibido, seguidamente, trato la cuestin de la problemtica del programa R, como

tambin intento visibilizar las consecuencias y los efectos positivos, sociales como a los

universitarios y econmico como a las empresas.

El tercer punto, hiptesis y variables: doy a conocer mi hiptesis general planteada, y

las especficas

En el cuarto punto, metodologa: diseo, procedimiento y desarrollo, expongo las bases

generales de la metodologa utilizada, en este caso, la cualitativa. Despus doy paso a la

tcnica de recogida de datos utilizada, el procedimiento a seguir para la bsqueda de

informacin especfica sobre el tema, para terminar con una breve explicacin del tipo

de anlisis que se ha llevado a cabo.

En el quinto punto, presentacin de resultados, enseo los datos empricos resultantes

del anlisis realizado.


En el sexto punto, conclusiones y recomendaciones, doy por finalizado mi investigacin

con 5 conclusiones y 5 recomendaciones para poder disminuir el problema planteado.

Dentro del sptimo punto, referencias bibliogrficas, las cuales se agrupan en

referencias bibliogrficas de documentos especficos sobre el funcionamiento del

programa R

, y otro que son las referencias de los portales de internet consultados.

1. PLANTEAMIENTO DEL PROBLEMA

Hoy en da la tecnologa est avanzando a gran escala, gracias a esto da a da se genera

nuevos programas que facilitan el trabajo en la vida cotidiana, sin embargo, estos no son

muy conocidos; esto genera que sus beneficios sean desaprovechados, un ejemplo claro

es el programa R, este no es muy conocido y debido a eso muchos universitarios no

saben cmo utilizarlo, estos parecen tener un concepto nico de programas que la

mayora conoce y sabe manipular, pero tienen un costo muy elevado.

Actualmente existen programas libres, sin costos y R es uno de ellos, forma parte del

porcentaje que muchos de los universitarios pueden utilizar, pero este no es muy

aprovechado debido a su bajo nivel al respecto de sus conocedores. Adems R

presenta diversos inconvenientes: requiere de un cierto esfuerzo para aprender las

reglas fundamentales para su sintaxis orientada a objetos (Domingo, 2014, pp. 18).

1.1. Problema general

Cul es su beneficio del programa R y cul es su aporte con los universitarios?

1.1.1. Problemas especficos

Cul es su beneficio del uso de comandos de os diversos lenguajes de programacin y

cul es su aporte con los universitarios?

1.2. Objetivos de la investigacin


1.2.1. Objetivo general
Aportar informacin sobre los beneficios de la utilidad del programa R a los

universitarios y poner en prctica su uso para un mejor desarrollo en sus

estudios.

1.2.2. Objetivos especficos


Aportar informacin sobre los beneficios del uso de comandos de los

diversos lenguajes de programacin a los universitarios y poner en prctica

su uso para un mejor desarrollo en sus estudios.


Aportar informacin sobre los beneficios de un buen diseo estadstico a

los universitarios y poner en prctica su uso para un mejor desarrollo en

sus estudios.
1.3. Justificacin del estudio

Justificndose esta investigacin en la necesidad de dar a conocer una nueva tendencia

tecnolgica para los universitarios, esto contribuir a la facilidad de clculo de datos

estadsticos. La implementacin de una nueva filosofa en el mundo de la programacin

que se denomina R busca, de una manera favorable y amigable integrar e incorporar

nuevos mtodos de clculos estadsticos, dichos clculos prometen viabilidad en sus

resultados. As, este programa sera como modelo aplicable al resto de los

universitarios, como un primer paso hacia el desarrollo de la zona de estudio, basndose

en el hecho de que el tema es importante.

1.3.1. Justificacin terica

Un buen conocimiento al respecto del uso del programa R como aporte para el clculo

estadstico, la decisin poltica por parte de las autoridades de dicha universidad y la

participacin organizada de los docentes implementando, harn que la toma de

decisiones sea oportuna, como tambin las medidas correctivas que conlleven a elevar

la calidad de vida y progreso del desarrollo del estudiante.

Una vez analizado el propsito de R y habiendo estudiado las caractersticas del

programa, se realiza el proyecto adaptado a las necesidades reales para el buen


desempeo en los universitarios. El porcentaje del crecimiento de su uso es

prcticamente como los estudiantes seleccionados dependan de l y que tan rpido

puedan llegar a conocerlo y a entenderlo para que este se expanda y apoye en el

contexto laboral ya que ahora el proyecto solo se enfoca en estudiantes universitarios y

gracias a como estos se desenvuelvan con el programa este pueda incluirse en el mbito

profesional.

1.3.2. Justificacin prctica

La investigacin ser realizada con un anlisis de estudio que principalmente se enfoca

en los estudiantes de la universidad Cientfica Del Sur, las herramientas que poseen el

programa y su modo de uso, para buscar una mejora en el desempeo que este plantea

en el entorno a desarrollarse. el programa R puede disponer de una amplia librera que

forma parte de sus ventajas que este tiene.

1.3.3. Justificacin social:

Porque esta actividad involucra a la poblacin estudiantil y a las autoridades que

pertenecen y son parte del desarrollo de la universidad, toma de decisiones y en

elaboracin de proyectos conducentes a un desarrollo del programa.

Las ventajas que brinda el programa R se centran en un mayor desempeo de los

estudiantes, lo que conlleva a un mayor impacto es la calidad de sus trabajos y una

reduccin del tiempo en sus entregas.

1.4. Limitaciones de la investigacin

Tiempo: debido a la dedicacin otorgada a la toma de fotos, realizacin de

observaciones, entrevistas y encuestas en los estudiantes, simultneamente con la


bsqueda de informacin bibliogrfica, as como el procesamiento de la informacin

reunida.

Esto no fue fcil coordinarlo con actividades ajenas al estudio, razn por la cual la

planificacin de tareas fue un pilar dentro del armado del presente trabajo.

1.5. Viabilidad del estudio

Recursos Financieros: enmarcado por los costos de imprenta, el revelado de fotos,

impresin en general del trabajo

Recursos Materiales: enmarcado en los vehculos, herramientas, equipo electrnico y

tecnolgicos.

Recursos Humanos: enmarcado en la calidad de los profesionales que apoyarn la

investigacin.

2. Fundamento Terico:

R es un software libre y gratuito con cdigo fuente de libre acceso a diferencia de otros
programas; este software utiliza un lenguaje de programacin orientada a objetos es
decir nosotros vamos a tener una consola en la que tendremos que introducir cdigos,
estos objetos se definen como variables, datos, resultados o funciones que se almacenan
en nuestra rea de trabajo.
Adems, en este software toda la informacin esta estructurada en paquetes y libreras y
dado que est orientado al anlisis estadstico, nos va a permitir desde manejo de bases
de datos a la realizacin de los pertinentes anlisis, as como tambin representaciones
grficas.

2.1. Inicios con R

2.1.1. Instalacin

Este programa es muy fcil de descargar a travs de la pgina del mismo (http://www.r-
project.org), podemos instalarlo para varios sistemas operativos como Windows, Linux
o Mac, una vez finalizada la instalacin podemos ejecutar nuestro programa de
cualquiera de los iconos que se han creado.

2.1.2. Interfaz

Una vez que abrimos la interfaz vemos que lo que aparece es como es la consola
tambin conocida como ventana de comandos, en esta consola es donde mediante
instrucciones obtendremos nuestros resultados.
Sin embargo, ste no resulta til puesto que no podemos guardar todas estas
instrucciones ni modificarlas, para ello existe un editor de R tambin conocido como
script, para abrir este script daremos clic en archivo y luego en nuevo script, y se nos
abrir automticamente una ventana que ser el script o fichero de trabajo esto es
recomendable para guardar todas mis instrucciones y poder despus modificarlas, para
guardarlo simplemente clicamos en el segundo botn de guardar script.
Si queremos acceder una vez que lo hemos guardado basta con dar clic en abrir script y
lo buscamos en la ruta donde lo hemos guardado. Una vez que hayamos hecho esto
como las instrucciones que escribimos en el script cmo pasan a la venta de comandos
pues para eso corremos lnea y ejecutamos lnea con el tercer botn que nos aparece en
la interfaz y as todas las instrucciones que tengamos en el script pasarn a darnos
resultados en la consola o ventana de comandos.

2.1.3. Bsqueda de Paquetes

Los paquetes son los que tienen toda la informacin que queramos realizar. En la pgina
web del programa encontramos todos los paquetes distribuidos y listos para ser
descargados, tambin podemos buscar ayuda por si surge un inconveniente.

2.1.4. Instalar y cargar paquetes

Desde la interfaz de R hacemos clic en paquetes y luego en instalar paquetes, desde ah


se nos abrir una ventana en donde tendremos que elegir un pas y una vez que lo
hayamos elegido nos aparecer un listado de todos los paquetes disponibles y luego lo
instalaremos y en la consola aparecer informacin sobre el proceso de instalacin, pero
no basta con instalar un paquete, sino que cuando lo queremos utilizar tenemos que
cargarlo y para cargar los paquetes nos dirigimos a la interfaz damos clic en paquetes y
cargar paquete. Una vez que hayamos hecho esto nos aparecer una ventana con todo el
listado de paquetes que tengamos instalados volvemos a dar clic en el que el paquete
que deseamos.
Ahora esto tambin se puede hacer mediante lnea de comandos con las instrucciones:
o Para instalar paquete:
Install.packages(Nombre del paquete)
o Para cargar paquete:
Library(Nombre paquete)
Ejemplo:

Imagen1: Instalar y cargar paquetes

2.1.5. Ayuda en R

Para obtener ayuda sobre cada comando o conjunto de datos:


Esta se realiza mediante la instruccin: help(nombre del comando) o ?
nombre del comando
Para obtener ejemplos de uso del comando:
Solo se coloca la instruccin example(nombre del comando)
Para obtener una lista de comandos relacionados con el tema:
Solo se coloca la instruccin help.search(tema)
Para abrir una ventana de ayuda HTML:
Solo se ejecuta la sentencia help.start()

2.2. Lenguaje orientado a objetos

El operador de asignacin de valores a un objeto determinado es con el signo igual =


o con el signo menor con un guion <- .
Como caracterstica los nombres de los objetos debern empezar por una letra y aunque
puedan contener nmeros o smbolos tenemos que tener cuidado porque no podemos
utilizar nmeros aritmticos o lgicos. Adems, R diferencia entre maysculas y
minsculas.
Sobre los objetos, estos pueden actuar como operadores y funciones.
Luego de asignar valores a un objeto si queremos ver el listado de objetos que tenemos
disponible basta con ejecutar la instruccin: >ls() o >object(), para borrar un objeto
especifico que hayamos creado ejecutamos la instruccin >rm(nombre del objeto) y
para borrar todos los objetos que tengamos disponibles en el rea de trabajo con la
sentencia >rm(list=ls()).
Los tipos de objetos que debemos crear

Tipo de objeto Definicin ejemplo


Integer Nmeros enteros (, -1, 0, 1, ) >v1<-4

numeric Nmeros reales (2.5, 1.8, 3.1, ) >v2<-3.2

logical TRUE, FALSE >v3<-FALSE


character Cadena de caracteres >v4<-gato

Adems, cada objeto tiene atributos que van a determinan sus propiedades como pueden
ser:
o El tipo de objeto de los elementos:
Mode(objetos) >mode(v2)
o Nmero de elementos de un objeto:
Length(objeto) >length(v2)

2.3. Estructura de Datos


Tipos de instrucciones que permiten almacenar al mismo tiempo ms de 1 valor:

Vector vector() Todos los elementos son del


mismo tipo
Matriz matriz()

Conjunto de datos data.frame() Cualquier tipo y la misma


longitud

2.3.1. Vector (>? vector):


Un vector puede tener todos los elementos del mismo tipo y adems tenemos asociado
una cierta longitud.

Mode: tipo de los elementos del vector: logical, numeric,


carcter,
Length: longitud del vector

2.3.2. Matrices (>? matrix):

Es la extensin propia de los vectores estructurada en filas y en columnas para


especificar la matriz utilizaremos la instruccin: (>? matrix) y especificaremos los
datos, el nmero de columnas y el nmero de filas.

Matrix (data = NA, nrow =1, ncol =1, byrow = FALSE, dimnames =
NULL)
Data: son los datos para formar la matriz. Puede ser por filas y columnas, en forma de
vector y debe contener todas las celdas de la matriz.
Nrow: nmero de filas de la matriz.
Ncol: nmero de columnas de la matriz.
Byrow: controla la forma en que los datos se distribuyen en la matriz. Por defecto se
distribuyen en columnas.

2.3.3. Conjunto de datos: (data.frame())


Con el comando especifico (data.frame()) realizamos ficheros o bases de datos, en el la
informacin est estructurada en filas y en columnas:
o Filas: cada registro
o Columnas: cada variable

2.4. Exportacin de datos en R


Exportar los datos significa que estos puedan ser ledos por otro programa, el formato
ms sencillo de exportacin es el formato tipo texto, es decir archivos (.txt), para esto
tenemos la instruccin:
Write.table(hoja, file = fichero.txt, sep = \t, na = NA, dec = ., row.names =
TRUE, col.names = TRUE)

Argumentos:
Hoja: en este caso ser el nombre asociado a los datos que queremos exportar, es decir
el objeto que queremos exportar.
File: en este daremos el nombre del fichero al que queremos exportar nuestros datos
Sep = \t: estos especifican qu tipo de separacin queremos entre los datos en este
caso por defecto es una tabulacin.
Na= NA: argumento que especifica como son guardados los datos faltantes bien sea
con NA mayscula o en vaco es decir que aparezcan en blanco.
Dec = .: indica el carcter con el que se separan los decimales puede ser un punto o
una coma
Otros comandos disponibles para la exportacin de datos pueden ser:
Write.csv()
Write.csv2()
Estas sentencias se utilizan para la exportacin de datos a archivos csv.
2.5. Lectura e Importacin de datos en R

Depende del formato del fichero a importar, si es un fichero (.txt), son ficheros que se
crean desde el bloc de notas y desde ah veremos la ruta especificada en el que est
guardado, esto es muy Importante porque para leer los datos desde nuestra interfaz de R
tendremos que especificar esta ruta, para ello entraremos en archivo y en cambiar dir
especificaremos la ruta en donde estn guardados.

Una vez que tengamos especificada la ruta podremos acceder a ella con la instruccin:

>getwd()

Si queremos fijarla para despus utilizarla en posibles ocasiones podremos utilizar la


sentencia:

>setwd(C:/Users/Biostatech/Desktop)

as podremos guardarla en un script y utilizarla posteriormente.

Para leer los ficheros de datos desde un punto txt se utiliza el comando >read.table, para
ello podemos consultar la ayudad de dicha instruccin y cmo vemos es similar a las
instrucciones o los argumentos que se utilizan para la exportacin, tenemos el file que
es el nombre del fichero que queremos leer tenemos, el set que nos indica el tipo de
separador entre las variables, dec el separador decimal y por ultima el NA.string que
indicar cmo est especificada en la base en los datos faltantes.

Adems, podemos leer datos desde un fichero Excel, es decir aqu entraremos
directamente en nuestro paquete de office en Excel y guardaremos los archivos como
(.csv), luego que utilizaremos el comando (>? Read.csv2) donde especificara qu el
separador de variables en este caso es el punto y coma y el separador decimal son
comas; los otros argumentos son similares a los utilizados en (read. table).

Tambin podremos leer ficheros SPSS estos ficheros son guardados con formato (. sav)
e igual que utilizbamos en las instrucciones anteriores especificaremos el nombre del
fichero con un file. Adems, ste tiene como la especial caracterstica que tenemos que
cargar la librera foreign, entonces para eso utilizaremos el proceso instalacin del
paquete.

3. Metodologa
3.1. Tipo de la investigacin

La presente investigacin es de tipo correlacional porque se establece la relacin entre


la variable independiente: Programa R y la variable dependiente: Educacin
Universitaria. Es un tipo de estudio descriptivo porque busca describir las variables
anteriormente citadas.

3.2. Nivel y diseos de la investigacin

Es de nivel aplicativo porque la implementacin del curso a las distintas carreras de la


universidad seran una solucin para los dficits de los estudiantes.

El diseo de investigacin transversal que se aplicar consiste en la recoleccin de


datos. Su propsito es describir las variables y analizar cmo es que los estudiantes
estn a nivel de programacin y como manejan el software R en la universidad
Cientfica del Sur.

3.3. Poblacin y muestra

Poblacin:

La poblacin investigada se encuentra constituida por estudiantes de la Universidad


Cientfica del Sur entre hombres y mujeres.

Muestra

Para definir el tamao de la muestra se ha utilizado el muestreo aleatorio simple, siendo


la muestra de 16 estudiantes.

3.4. Tcnicas e instrumentos para la recoleccin de Datos

Tcnica de Encuesta:

Esta tcnica consiste en un cuestionario de preguntas, dirigida a los estudiantes


universitarios y fue realizada haciendo uso del internet con preguntas virtuales.
4. PRESENTACIN, ANLISIS E INTERPRETACIN DE RESULTADOS
Los estudiantes respondieron sobre si conocan el programa, si saban programar o
como eran los cdigos para programar en la herramienta estadstica R.

Segn la encuesta realizada, los resultados son los siguientes:

Segn las estadsticas solo un estudiante de la muestra conoce el programa R

Segn las estadsticas solo el 43.75% de los encuestados sabe programar


Segn las estadsticas los estudiantes no tienen ninguna relacin de como
programar en R.

Segn las estadsticas solo el 6.25% de los encuestados sabe como son los
cdigos en dicho programa, debido a que son algo similares a los de otro
software.
Segn
las

estadsticas solo 5 de los encuestados considera que si es una buena herramienta


estadstica y el resto de los encuestado respondieron no s, debido a que no
conocen la herramienta.

Segn las estadsticas solo 3 de los encuestados consideran que brinda una ayuda
entendible.
Segn las estadsticas solo 5 de los encuestados conocen otros programas
estadsticos de los cuales se encuentran Excel, SPSS, entre otros.
Segn las estadsticas solo 5 de los encuestados respondieron que debera
mejorar, lo dems respondieron No s, debido a que no tienen mucho
conocimiento con el programa.

5. Conclusiones Y Recomendaciones
5.1. Conclusiones
En conclusin, dada a las personas encuestadas se determina que tal como lo explicado
anteriormente muchos de los universitarios no conocen y no estn informados sobre los
benficos que tiene el programa R.

5.2. Recomendaciones
1. Una recomendacin importante a la hora de realizar stas lneas de trabajo o
instrucciones es ir escribiendo comentarios esto se hace con la almohadilla y
tiene como especial caracterstica que estas lneas cuando se ejecutan la
instruccin no se ejecutarn en la ventana de comandos.

6. Referencias Bibliogrficas:
R Core Team (2014). R: A language and environment for statistical
computing. R Foundation for Statistical Computing, Vienna, Austria. URL
http://www.R-project.org/

Domingo, M (2014). Desarrollo de un entorno grfico para R y


ULLRtoolbox. Escuela Tcnica Superior de Ingeniera Informtica, La
Laguna. URL
http://riull.ull.es/xmlui/bitstream/handle/915/166/Desarrollo+de+un+entorno
+grafico+para+R+y+ULLRToolbox.pdf?sequence=1
7. Anexos.

Potrebbero piacerti anche