Importar
Nesta parte do livro, você aprenderá como importar uma vasta variedade de dados para o R, assim como deixá-los em uma forma útil para suas análises. Algumas vezes, isto é apenas uma questão de chamar uma função de um pacote de importação de dados apropriado. Mas em casos mais complexos, será necessário tanto a organização e transformação dos dados para se obter o formato retangular (tidy) que você gostaria de trabalhar.
Nesta parte do livro você aprenderá como acessar dados armazenados das seguintes maneiras:
No 20 Planilhas, você aprenderá como importar dados de planilhas do Excel e do Planilhas Google (Google Sheets).
No 21 Bancos de dados, você aprenderá sobre obter dados de um banco de dados (databases) e importar para o R (e você também aprenderá um pouco sobre como exportar dados do R para um banco de dados).
No 22 Arrow, você aprenderá sobre o Arrow, uma poderosa ferramenta para trabalhar com volume de dados que não cabem na memória do seu computador, particularmente quando são armazenados em formato parquet.
No 23 Dados hierárquicos (rectangling), você aprenderá como trabalhar com dados hierárquicos, incluindo as listas profundamente aninhadas produzidas por dados em formato JSON.
No 24 Raspagem de dados (Web scraping), você aprenderá sobre raspagem de dados (web scraping), a arte e a ciência de extrair dados de páginas web.
Existem dois pacotes tidyverse importantes que não são apresentados aqui: haven e xml2. Se você está trabalhando com dados de arquivos do SPSS, Stata ou SAS, veja o pacote haven , https://haven.tidyverse.org. Se você está trabalhando com dados XML, veja o pacote xml2 , https://xml2.r-lib.org. Caso contrário, você precisará pesquisar qual pacote você deverá utilizar; o Google será seu amigo neste caso 😃.