About

Introducción al análisis de datos biológicos con R

Sobre el curso

¿De qué se trata el curso?

Este es un curso de un mes y medio en programación R para análisis de datos biológicos. Se realiza de forma virtual y contará con una combinación de clases sincrónicas y asincrónicas, con ejercicios que se entregarán semanalmente y una presentación final. Es un curso intensivo y desafiante que invita al estudiante a pensar y desarrollar algoritmos para el análisis de datos biológicos. Específicamente, el curso tiene como objetivo enseñar a los participantes a:

(a) desarrollar e interpretar scripts R

(b) importar y manipular datos

(c) describir y visualizar datos

(d) crear informes con RMarkdown

Subiremos los videos de las clases al canal de youtube @somaquadrados. Los videos se pueden ver de forma asincrónica. El material escrito, diapositivas, scripts y tareas estarán disponibles en el repositorio de “Soma dos Quadrados”. Las clases sincrónicas se llevan a cabo semanalmente los viernes, de 2:00 pm a 5:00 pm y se utilizarán para resolver dudas y ejercicios.

El curso se ofrece de forma gratuita y la preinscripción estará abierta entre los días 12 y 31 de julio. El curso comienza el día 16 de agosto hasta el dia 27 de septiembre de 2021.

Público

El curso está dirigido a estudiantes de pós-grado, técnicos y investigadores interesados en aprender a utilizar R para el análisis de datos biológicos. Es un curso introductorio que trabajará con la importación, manipulación y análisis descriptivo y visual de datos biológicos.

El cupo máximo es de 20 personas.

Dedicación

Los estudiantes deben ver las lecciones en video y resolver los ejercicios disponibles. La duración estimada de las clases es de ~2h + ejercicios. Los ejercicios semanales son obligatorios.

El viernes habrá clases virtuales obligatorias y sincrónicas, donde se hará un repaso de la clase teórica y resolución de dudas. Los ejercicios de tareas también se revisarán con los participantes. La duración media de estas clases es de 3h. También habrá un grupo de Telegram (mensajería on-line) para consultas y discusiones entre estudiantes en tiempo real.

El curso requiere de ~6 horas de dedicación a la semana.

Responsables

Eliana F. Burgos 👩‍💻

Marília Melo Favalesso 👩‍💻

Carga horaria

48 h

Enmienda

Clase 0

  • Introducción al curso

  • Programación

  • IDE

  • RStudio

Clase 1

  • Objetos y atribuciones

  • Estructuras de objetos: qué son y cómo construir en R

  • Funciones

  • Estructuras de Control

Clase 2

  • Datos biológicos

  • Importación de bases de datos para el R

  • Manipulación de la base de datos en R

Clase 3

  • Variables estadística

  • Distribución de probabilidad

  • Estadística descriptiva: medidas de posición

  • Estadística descriptiva: medidas de dispersión

Clase 4

  • Estadísticas descriptivas: las frecuencias

  • Gráficos

Clase 5

  • Informes dinámicos con RMarkdown

Clase 6

  • Presentación del proyecto desarrollado

Inscripción

La inscripción al curso comienza el lunes 12 de julio a las 9 am y se extiende hasta el día 31 a las 00 am. Para aquellos interesados en registrarse, solo complete el siguiente formulario: https://forms.gle/1Y6rR8VbfCE214nw8.

Referencias

(Todos los libros de referencia de este curso tienen copias para distribución gratuita).

Aragón TJ. (2017) Population Health Data Science with R: Transforming data into actionable knowledge.

Chang W. (2013) R Graphics Cookbook: Practical Recipes for Visualizing Data. O’Reilly Media.

DiMaggio C. (2014) Spatial Epidemiology Notes: Applications and Vignettes in R. Columbia University, NY

Gillespie C, Lovelace R. (2021) Efficient R Programming: A pratical guide to smarter programming. O’Reilly Media.

Grolemund G. (2014) Hands-On Programming with R. O’Reilly Media.

Healy K. (2018) Data visualization: A practical introduction. Princeton University Press.

Holmes S, Huber W. (2018) Modern Statistics for Modern Biology. Cambridge.

Irizarry RA. (2021) Introducción a la ciencia de datos: Análisis de datos y algoritmos de predicción con R. CRC Press.

Irizarry RA, Love MI. (2015) Data analysis for the life sciences. Leanpub.

Peng RD. (2016a) Exploratory Data Analysis with R. Leanpub.

Peng RD. (2016b) Report Writing for Data Science in R. Leanpub.

Venables WN, Smith DM. (2021) An introduction to R. R Core Team.

Xie Y, Allaire JJ, Grolemund G. (2021) R Markdown: The Definitive Guide. CRC Press.

Wickham H. (2016) ggplot2: Elegant Graphics for Data Analysis (Use R). Spring.

Wickham H, Grolemund G. (2014) R for Data Science: Import, Tidy, Transform, Visualize, and Model Data. O’Reilly Media.

Wilke CO. (2019) Fundamentals of Data Visualization.O’Reilly Media.

Wright C, Ellis SE, Hicks SC, Peng RD. (2021) Tidyverse Skills for Data Science in R. Johns Hopkins University.