Visão geral

O nosso objetivo nesta parte do livro é oferecer uma visão geral rápida das principais ferramentas da ciência de dados: importação, organização, transformação e visualização de dados, como mostrado na Figura 1. Queremos apresentar para você uma visão geral da ciência de dados, fornecendo apenas o suficiente de todos os principais elementos para que você possa lidar com conjuntos de dados reais, ainda que simples. As partes posteriores do livro abordarão cada um desses tópicos com mais profundidade, ampliando o leque de desafios da ciência de dados que você pode enfrentar.

Um diagrama que exibe o nosso modelo do processo de ciência de dados: Importar -> Organizar -> Compreender (que inclui as fases Transformar -> Visualizar -> Modelar em um ciclo) -> Comunicar. Em torno de tudo isso está Programar. Importar, Organizar, Transformar e Visualizar são destacados.
Figura 1: Nesta parte do livro, você aprenderá como importar, organizar, transformar e visualizar dados.

Quatro capítulos se concentram nas ferramentas da ciência de dados:

Entre esses capítulos, há outros quatro capítulos que se concentram no fluxo de trabalho no R. Em 2  Fluxo de Trabalho: básico, 4  Fluxo de trabalho: estilo de código e 6  Fluxo de trabalho: scripts e projetos, você aprenderá boas práticas de fluxo de trabalho para escrever e organizar seu código R. Isso te preparará para o sucesso a longo prazo, pois fornecerá as ferramentas necessárias para manter a organização ao enfrentar projetos reais. Por fim, no 8  Fluxo de trabalho: obtendo ajuda, você aprenderá como obter ajuda e continuar aprendendo.