Instalación de R, Rstudio y librerías adicionales.

 

 

Introducción.

R es un lenguaje y un entorno de trabajo orientado a la realización de estudios estadísticos. El manejo de R entraña sobre todo la dificultad de tener que conocer y manejar un lenguaje de programación que a muchos usuarios del mundo de la medicina, de la biología o de las ciencias sociales le puede resultar extraño y complejo. No obstante, para hacer un uso razonablemente eficiente de este lenguaje no es necesario convertirse en un programador avanzado; basta con conocer algunos elementos básicos y, sobre todo, ser capaz de trabajar de manera ordenada documentando adecuadamente la actividad realizada. De esta forma, en la realización de un nuevo trabajo o estudio será posible reutilizar con facilidad los procedimientos empleados en estudios anteriores.

Ello se consigue fundamentalmente a través de la utilización del programa Rstudio (http://www.rstudio.com) que integra diversas herramientas que facilitan la edición de informes que combinan texto, imágenes, tablas, gráficos y resultados del análisis de manera sencilla y fluida. Estas herramientas son básicamente:

Aunque el uso de estas herramientas pueda sonar complicado es en realidad muy sencillo, ya que se encuentran integradas en Rstudio de manera absolutamente transparente. Esto significa que el usuario puede concentrarse perfectamente en el texto que está redactando y en los resultados que obtiene sin tener que preocuparse de qué herramienta se utiliza en cada momento.

 

 

Instalacion de R y Rstudio

Para trabajar con R necesitaremos dos programas: el propio R, que nos proporciona el lenguaje y el entorno de trabajo (el motor de nuestras tareas estadísticas), y Rstudio que añade a R todas las herramientas citadas en la introducción.

La instalacion de ambos programas es muy sencilla. Basta con visitar sus respectivas paginas web (https://www.r-project.org/ y https://www.rstudio.com/), descargar los instaladores y ejecutarlos. Pueden encontrarse instrucciones detalladas para la instalación en https://dl.dropboxusercontent.com/u/7610774/cursoR4ULPGC/03-Instalacion.html

 

 

Librerías

La instalación básica de R viene equipada con múltiples funciones para la importación de datos, la realización de transformaciones, el ajuste y evaluación de modelos estadísticos, las representaciones gráficas, etc. Sin embargo, la enorme potencia de R deriva de su capacidad de incorporar en cualquier momento nuevas funciones capaces de realizar nuevas tareas.

Una librería o paquete (package) es una colección de nuevas funciones, datos y código que se añaden a R. En junio de 2016 hay más de 8600 paquetes disponibles para su descarga e instalación en la web de R: hay paquetes para el análisis de datos genéticos, para epidemiología, para farmacología, psicometría, econometría, datos espacio-temporales y un largo etcétera.

En la dirección https://dl.dropboxusercontent.com/u/7610774/cursoR4ULPGC/06-librerias.html se muestra con detalle como se pueden instalar nuevos paquetes de R en nuestro ordenador. De manera resumida, dicha tarea se puede llevar a cabo en Rstudio de dos formas:

  • Accediendo a la pestaña “Packages” en la ventana inferior derecha de Rstudio, a continuación pinchando en el icono “Install” (en la parte superior izquierda de dicha ventana), y escribiendo el nombre del paquete que queremos descargar en el menú desplegable que aparece.

  • Escribiendo install.packages("nombre-del-paquete") en la consola (ventana inferior izquierda).

 

Comenzaremos este curso instalando los siguientes paquetes:

  • openxlsx (para la lectura de archivos excel)
  • ggplot2 (para la elaboración de gráficos)
  • pander (para la elaboración de tablas)
  • devtools (para la instalación de paquetes aún en desarrollo)
  • ULPGCmisc (que contiene una miscelánea de funciones que facilitan la presentación de algunas tablas y gráficos). El paquete ULPGCmisc se encuentra aún en desarrollo y debe instalarse de manera ligeramente distinta al resto.

Para descargar e instalar todos estos paquetes podemos utilizar la siguiente sintaxis (deben ejecutarse todas las líneas en el orden especificado):

install.packages("openxlsx")
install.packages("ggplot2")
install.packages("digest")
install.packages("pander")
install.packages("devtools")

Por último, para instalar ULPGCmisc:

library(devtools) 
install_github("angeloSdP/ULPGCmisc") 

 

 

Antes de empezar a trabajar con R: cuestiones importantes a tener en cuenta.

  • R es un lenguaje, y como tal, tiene sus reglas gramaticales y de sintaxis. Si estas reglas no se cumplen, el procesador de R será incapaz de entender nuestras instrucciones. Cosas muy sencillas que hay que vigilar son:

    • Las comillas: siempre van en pares, unas comillas de apertura y otras de cierre.
    • Los paréntesis: también van por pares, todo paréntesis que se abra debe cerrarse.
    • Los corchetes, las llaves, etc: también van por parejas.
    • Símbolos especiales: la barra inclinada de derecha a izquierda “\” tiene un significado especial en R, ya que sirve (según la letra que la acompañe) para especificar saltos de línea, retornos de carro, etc. Si se desea incluir esa barra en un texto, debe escribirse dos veces.
  • Cuando en un documento se combina texto con código R, el código R ejecutable debe ir dentro de un “Chunk” (que presenta la apariencia de una cajita gris, precedida por tres tildes inversas y el símbolo {r}, y terminada también con tres tildes inversas (Ojo con no borrar las tres tildes, pues el código R no sería adecuadamente interpretado).

  • Procurar dejar espacios y separar bien los párrafos y los “chunks” para que el texto quede lo más claro posible.