2 Configuración de computadoras

El trabajo práctico del curso MCV502 se realizará usando los softwares R y Rstudio. El primer paso es conocer e instalar R y RStudio, para luego configurar el ambiente de trabajo en estos softwares.

El término R se refiere tanto al lenguaje de programación como al software que interpreta los scripts escritos usándolo. R es un software de libre acceso para computar análisis estadísticos y construir gráficos representativos. RStudio es la forma más popular y reconocida para escribir R scripts e interactuar con el software, funciona como interfaz gráfica de R, para hacer su uso más fácil e interactivo. Ambos están disponibles para Linux, MacOS y Windows.

2.1 ¿Ya tienes R y/o RStudio instalados?

  • Abre RStudio, haz clic en “Help” -> “Check for updates”. Si hay una nueva versión disponible, cierra RStudio y descarga e instala la última versión (página de descarga de RStudio).
  • Para saber qué versión de R estás usando, simplemente inicia RStudio y lo primero que verás en la consola es la versión de R, o bien, puedes escribir sessionInfo() en la consola de R o RStudio. Ve a la página de CRAN para ver si hay una versión más reciente de R disponible, si es así descarga e instala la última versión.

2.2 Instala R y RStudio

Necesitas instalar R antes de instalar RStudio.

  • Dirígete a la página de CRAN y descarga e instala R, según corresponda para tu sistema operativo.
  • Dirígete a la página de descarga de RStudio y descarga e instala RStudio, según corresponda para tu sistema operativo. Una vez instalado, abre RStudio y asegúrate de que no aparece algún mensaje de error en la consola.

¿Tienes algún problema o duda? Dale un vistazo a la página “Frequently Asked Questions” (FAQ) de R, o para Windows R for Windows FAQ.

¿MacOS? Te recomendamos instalar previamente Xcode y XQuartz.

2.3 ¿Por qué R?

Tus análisis serán una serie de comandos escritos (R script), lo que es muy conveniente porque:

  • Conlleva a tener el control y completo entendimiento de qué estás haciendo (adiós a la caja negra en tus análisis in silico).
  • ¡Reproducibilidad! Si necesitas repetir el análisis, agregar más datos o corregir un error, sólo necesitas correr tu script nuevamente y tus tests estadísticos y gráficos se actualizarán automáticamente.
  • Tus análisis son claros y transparentes, cualquier colega o tú en el futuro pueden leerlo para encontrar errores y/o hacer mejoras.
  • Puedes comentar tu script. Agregar comentarios, explicaciones o relatos en tu código facilitará entender, paso a paso, el por qué de tus análisis a tus colegas, e incluso a ti mísmo en el futuro.

Otras importantes ventajas de usar R son:

  • ¡Escalabilidad! R está diseñado para el análisis de datos. Las habilidades que vayas aprendiendo en R se pueden escalar fácilmente con el tamaño de tus datos (set de datos con cientos a miles, incluso millones de líneas).
  • ¡Gráficos de alta calidad! R tiene innumerables funcionalidades para todo tipo de gráficas a tu disposición para lograr una efectiva visualización de tus resultados. Visita The R Graph Gallery para ver ejemplos de lo que puedes llegar a hacer.
  • ¡Amplia documentación! R cuenta con una basta documentación y la web está minada de tutoriales, sólo debes buscar. Por ejemplo, Cookbook for R que provee de soluciones a tareas y problemas básicos en análisis de datos.

Aprender R puede ser difícil y tomar tiempo en un principio, pero ¡no te preocupes, no estás sólo! R cuenta con una amplia comunidad de usuarios dispuestos a ayudar a través de mailing-lists y websites como Stack Overflow y RStudio community. Sin embargo, lo más probable es que tus dudas ya se encuentren resueltas en la web, asi que primero haz una búsqueda en Google usando palabras clave o copia y pega en el buscador el mensaje de error que te aparezca en la consola de R. Consejo: haz tus búsquedas y consultas en inglés, tendrás acceso a más y mejor información.

2.4 Conociendo RStudio

¡Todo lo que necesitas en una ventana! Como puedes ver en la imagen a continuación, RStudio se divide en 4 paneles principales:

  1. Panel superior izquierdo: editor de texto para escribir comandos/instrucciónes en R (R script), aquí puedes agregar comentarios.
  2. Panel inferior izquierdo: consola de R, donde se ejecutan las líneas de comando en tu script.
  3. Panel superior derecho: aquí puedes visualizar los datos presentes en la memoria de R.
  4. Panel inferior derecho: aquí encuentras 5 pestañas Files/Plots/Packages/Help/Viewer en las que puedes navegar por tus archivos, visualizar tus gráficos en tiempo real, administrar paquetes de R, y pedir ayuda.

RStudio RStudio interfaz.

Básicamente, lo que haremos es escribir instrucciones (a lo que llamamos comandos) en el lenguaje de programación R, y luego le indicaremos al computador que ejecute la instrucción (a lo que llamamos ejecutar o correr). En RStudio puedes escribir los comandos en el editor de texto y luego ejecutarlos, una línea de código a la vez, presionando Ctrl + Enter (cmd + return en Mac). Cuando ejecutas comandos, es importante poner atención a la consola. Si hubo algún problema con la ejecución de la instrucción, aparecerá un mensaje de error en la consola. Cuando el computador finaliza la instrucción, un nuevo > aparece en la consola indicando que a finalizado de ejecutar el último comando y está listo para correr el siguiente.