2 Introducción

El objetivo de la primera parte del libro es conducirte a las herramientas básicas de exploración de datos de la manera más veloz posible. La exploración de datos es el arte de mirar tus datos, generar hipótesis rápidamente, testearlas con celeridad y luego repetir el proceso iterativamente. El objetivo de la exploración de datos es generar muchos hallazgos prometedores que luego puedes retomar para explorarlos en mayor profundidad.

En esta parte del libro aprenderás algunas herramientas que traen un beneficio inmediato: * Visualización es una buena arista para comenzar a programar en R, ya que el retorno es claro: puedes crear gráficos elegantes e informativos que te ayudan a entender los datos. En visualización de datos vas a profundizar en visualización y aprenderás la estructura básica de gráficos en ggplot2 junto con transformar datos en gráficos.

  • Visualización por si sola a menudo no es suficiente, por lo que en transformación de datos aprenderás los verbos clave que te permitirán seleccionar variables importantes, filtrar observaciones, crear nuevas variables y sintetizar la información.

  • Finalmente, en [análisis exploratorio de datos], vas a combinar visualización y transformación con tu curiosidad y escepticismo para formular y responder preguntas en torno a los datos.

Modelar es un aspecto importante del proceso exploratorio, pero no tienes las habilidades para aprenderlo con efectividad o aplicarlo de momento. Volveremos a dicho tópico en [modelamiento], una vez que ya tengas las herramientas de manipulación de datos y programación.

Entre estos tres capítulos que enseñan las herramientas de exploración de datos hay otros tres capítulos que se enfocan en el flujo de trabajo en R. En [flujo de trabajo: básico], [flujo de trabajo: scripts] y [flujo de trabajo: proyectos] aprenderás buenas prácticas para escribir y organizar código R. Tales prácticas te preparan para el éxito en el largo plazo, en cuanto te entregan las herramientas para organizarse y abordar proyectos reales.