Introdução à Linguagem R
Disciplina de pós-graduação — PPG em Ecologia e Conservação, UFMS (30 h, intensiva)
Ementa
Introdução à linguagem de programação R: sintaxe e lógica. Técnicas de visualização e manuseio de dados com o pacote tidyverse. Introdução a algoritmos. Rudimentos de programação: controle de fluxo. Como melhorar o próprio código utilizando grandes modelos de linguagem (LLMs, como ChatGPT). Ferramentas de reprodutibilidade. Boas práticas em documentação, compartilhamento e apresentação de análises. Rudimentos de modelos lineares generalizados. Introdução às ferramentas de reprodutibilidade em pesquisa (Markdown e Quarto). Introdução ao controle de versão (git e GitHub).
Objetivos
Apresentar a linguagem R como uma plataforma para realização e documentação de análises estatísticas, incluindo manuseio e exploração de dados comumente utilizados em ecologia. Ao fim da disciplina o(a) aluno(a) terá familiaridade e independência com a linguagem R e estará preparado(a) para cursar disciplinas específicas em estatística — por exemplo, modelos lineares e métodos multivariados — bem como para implementar análises reproduzíveis em seu próprio trabalho.
Cronograma
| Aula | Tópico | Conteúdo |
|---|---|---|
| 1 | Aula 01 — Apresentação e introdução ao R | Histórico da linguagem R, instalação, RStudio, importação de dados, tipos de objetos, pacotes. Fundamentos sobre os quais o resto do curso é construído. |
| 2 | Aula 02 — Curadoria de dados e boas práticas | Como organizar planilhas e diretórios de projeto, nomenclatura de arquivos, plano de gerenciamento de dados. Princípios FAIR e por que importam para reprodutibilidade. |
| 3 | Aula 03 — Controle de versão com git e GitHub | Por que controle de versão é fundamental para pesquisa reprodutível. Conceitos básicos de git (commit, branch, push, pull). Integração git/GitHub com RStudio. |
| 4 | Aula 04 — Manuseio de dados com o tidyverse |
Filosofia tidy. Os pacotes principais (dplyr, tidyr, purrr, broom, forcats, stringr). Pipe nativa (|>) vs magrittr (%>%). Verbs principais de manipulação de dados.
|
| 5 | Aula 05 — Visualização de dados com ggplot2 |
A gramática de gráficos de Wilkinson e a implementação no ggplot2. Camadas, geoms, aesthetics, scales, themes, facets. Princípios de visualização honesta.
|
| 6 | Aula 06 — Análises com modelos lineares simples |
Teste de hipótese e regressão linear no R. Sintaxe formula. Diagnóstico de resíduos: detecção de outliers, normalidade, heterocedasticidade. Quando linear é apropriado.
|
| 7 | Aula 07 — Rudimentos de programação |
Como escrever funções no R. Controle de fluxo (if, for, while). Programação funcional com purrr::map e purrr::pmap. Estratégias para evitar copiar-e-colar.
|
| 8 | Aula 08 — Reprodutibilidade com Markdown e Quarto |
Documentos dinâmicos como prática-padrão em pesquisa: análise + texto + gráficos em um único arquivo. R Markdown, knitr e Quarto. Saídas em HTML, PDF, Word, slides.
|
Pré-requisitos
Nenhum. A disciplina é projetada para quem está chegando ao R, e cobre do conceito mais básico (o que é um objeto, o que é um pacote) até ferramentas de fluxo de trabalho profissional (git, Quarto).
Metodologia e avaliação
A disciplina combina aulas expositivas e exercícios práticos feitos em sala. A avaliação é um trabalho final apresentando uma análise de dados à escolha do(a) aluno(a), em formato Markdown ou Quarto, contendo:
- pergunta de pesquisa;
- estratégia de análise;
- manipulação de dados;
- visualização gráfica;
- breve descrição e interpretação dos resultados.
O trabalho é o exercício prático completo do fluxo aprendido na disciplina — da curadoria do dataset à entrega de um documento dinâmico reproduzível.
Bibliografia
Livros principais (acesso aberto)
- Wickham, H.; Çetinkaya-Rundel, M. & Grolemund, G. R para Ciência de Dados (2ª ed.) — livro-texto principal.
- Mello, M.P. & Peternelli, L.A. 2013. Conhecendo o R: uma visão mais que estatística. Editora UFV.
- Faria, P.D. Introdução à Linguagem R: seus fundamentos e sua prática.
- da Silva, F.R.; Gonçalves-Souza, T.; Paterno, G.; PROVETE, D.B. & Vancine, M.A. 2022. Análises ecológicas no R. NUPEEA.
- Landeiro, V.L. 2011. Introdução ao uso do programa R. (CRAN).
Livros complementares
- Adler, J. 2010. R in a nutshell: a desktop quick reference. O’Reilly.
- Beckerman, A.P. & Petchey, O.L. 2012. Getting started with R: an introduction for biologists. Oxford University Press.
- Crawley, M.J. 2012. The R-Book. 2ª ed. Wiley.
- Gandrud, C. 2013. Reproducible Research with R and RStudio. CRC Press.
- Gotelli, N.J. & Ellison, A.M. 2015. Princípios de estatística em ecologia. Porto Alegre: Artmed.
- Loeliger, J. & McCullough, M. 2012. Version Control with Git: Powerful tools and techniques for collaborative software development. O’Reilly.
- Zuur, A.; Ieno, E.N. & Meesters, E. 2009. A Beginner’s Guide to R. Springer.
Recursos online complementares
- Quarto — site oficial e tutoriais
- Happy Git with R (Jenny Bryan) — git
- R + GitHub para pesquisadores.
- The Carpentries — R for Reproducible Scientific Analysis
- Advanced R (Hadley Wickham) — para depois do curso.
Edições anteriores
- 2026/1 — UFMS, PPG em Ecologia e Conservação. Edição intensiva (9–13 de março de 2026). Materiais desta edição estão arquivados abaixo.