Sobre este libro
¿A quién está dirigido?
Este libro está dirigido a estudiantes de grado y posgrado, docentes, investigadores, profesionales y a todo aquel interesado en incorporar R y su entorno de trabajo al análisis de datos.
No se requieren conocimientos previos de programación ni de estadística avanzada: el único requisito es la curiosidad y las ganas de aprender una herramienta que puede transformar la manera en que trabajamos con datos.
¿Qué vas a encontrar en este libro?
Este libro recorre de manera progresiva y práctica las herramientas fundamentales del entorno R, desde los primeros pasos en la plataforma hasta la generación de informes reproducibles. Cada capítulo está diseñado para construir sobre lo aprendido en el anterior, siguiendo el flujo natural del análisis de datos: importar, ordenar, transformar, visualizar y comunicar.
El hilo conductor del libro es la práctica. Todos los conceptos se ilustran con ejemplos de código reales y sets de datos concretos, de manera que el lector pueda reproducir cada análisis en su propio entorno de trabajo desde el primer momento.
¿Qué necesitás para seguirlo?
Los requisitos para seguir este libro son mínimos:
Una computadora con conexión a internet.
Correo electrónico -preferentemente de Google- para acceder a Posit Cloud.
Ganas de aprender. No se requieren conocimientos previos de programación ni del software R.
Herramientas utilizadas
Para el desarrollo de los contenidos de esta obra, se ha seleccionado un conjunto de herramientas de código abierto que garantizan la reproducibilidad y el acceso libre:
R (Versión 4.x): Es el lenguaje de programación y motor estadístico base sobre el cual funciona todo el análisis.
RStudio: Es el entorno de desarrollo integrado (IDE) que facilita la escritura de código, la visualización de gráficos y la gestión de proyectos.
Posit Cloud: Es la plataforma basada en la nube que permite ejecutar RStudio desde un navegador web sin necesidad de realizar instalaciones locales, facilitando el acceso desde cualquier dispositivo con conexión a internet.
RPubs: plataforma utilizada para la publicación y difusión de los documentos finales generados en formato HTML.
Reconocimiento de paquetes y tecnologías
Este libro se apoya en la potencia de diversos paquetes desarrollados por la comunidad de R, los cuales deben ser cargados según la necesidad de cada análisis:
tidyverse: conjunto de paquetes que comparten una filosofía de diseño para la ciencia de datos.readxl: paquete específico para la importación de datos desde archivos de Excel (.xlsy.xlsx).rmarkdown: permite la integración de código, texto y resultados para generar documentos dinámicos y reproducibles.knitrykableExtra: herramientas fundamentales para la creación de tablas dinámicas y estéticas en los informes.Bookdown: la tecnología que permite la estructura y compilación de este mismo libro digital.
¿Cómo está organizado?
El libro se organiza en capítulos que siguen un recorrido lógico y progresivo. Los primeros capítulos presentan el entorno de trabajo: qué es R, cómo funciona RStudio y cómo utilizar Posit Cloud para trabajar en la nube sin necesidad de instalaciones locales. A continuación se introduce R Markdown como herramienta para la generación de documentos reproducibles, que será el formato de trabajo a lo largo de todo el libro.
Los capítulos centrales abordan el flujo de trabajo en R: la importación de datos desde archivos Excel y CSV, la manipulación y transformación de datos con el tidyverse, y la visualización mediante el paquete ggplot2.
Finalmente, el último capítulo integra todo lo aprendido en la generación de informes reproducibles en formato HTML y Word, que es el producto final del análisis de datos en R.
Convenciones de este libro
A lo largo del texto, utilizaremos ciertas reglas visuales para facilitar la identificación de los elementos de programación:
Las funciones se escriben con paréntesis al final, por ejemplo:
read_csv().Los paquetes aparecen en fuente monoespaciada:
readxl.Los bloques de código se presentan en recuadros grises. Los comentarios dentro del código (que R no ejecuta) comienzan con el símbolo
#.Los nombres de los archivos y rutas de carpetas se escriben entre comillas:
"datos/MANDARINAS.xlsx".
Materiales de práctica
Para poder seguir los ejemplos propuestos, este libro cuenta con un repositorio de datos.
Encontrará archivos en formato .csv y .xlsx, así como acceso a bases de datos alojadas en la nube. Es importante mencionar que en algunos capítulos utilizaremos bases de datos que ya vienen integradas en R base, por lo que no requerirán una descarga previa.
Podrá acceder y descargar todos los materiales externos desde el siguiente enlace:
Se recomienda descargar estos archivos y guardarlos en una carpeta denominada datos dentro de su computadora o subirlos directamente a su proyecto de Posit Cloud, tal como se explicará en el Capítulo 5.
Agradecimientos
El autor desea expresar su agradecimiento a la Facultad de Ciencias Agrarias de la Universidad Nacional de Catamarca por brindar el espacio y el apoyo institucional necesario para la creación de este material pedagógico.
Asimismo, se extiende un reconocimiento especial a los colegas docentes y profesionales del área, como así también a los estudiantes de la FCA, especialmente a aquellos que transitaron por la cátedra de Biometría. Sus dudas, desafíos y aportes cotidianos fueron la principal fuente de inspiración para estructurar este libro de la manera más clara y aplicada posible a la realidad profesional que deben enfrentar.
Finalmente, y de manera muy especial, deseo agradecer a mi familia. Su paciencia, aliento constante y el tiempo cedido de nuestros momentos compartidos fueron el motor indispensable para que este proyecto pudiera concretarse. Sin su apoyo incondicional, esta obra no sería una realidad.
Sobre el autor
El autor de esta obra es ingeniero agrónomo y especialista en Docencia Universitaria en Disciplinas Tecnológicas, con experiencia en los sectores privado y público. Lleva 14 años como docente en la Facultad de Ciencias Agrarias de la Universidad Nacional de Catamarca, donde se desempeña actualmente como profesor adjunto en la Cátedra de Biometría. En dicho espacio realiza actividades de docencia, investigación y extensión. Además, es director de la Diplomatura en Bioestadística de la FCA - UNCA y se encuentra finalizando la Maestría en Docencia Universitaria para Disciplinas Tecnológicas.
Este libro nació de la convicción de que R es una herramienta poderosa y accesible, y de que la comunidad académica —particularmente del ámbito agropecuario— merece contar con material en español, claro y aplicado a su realidad.
Contacto y sugerencias
Para el autor, la mejora continua de este material es una prioridad. Por dudas, sugerencias o aportes, por favor no dude en contactarnos a través del siguiente correo electrónico:
Licencia
Este libro se publica bajo una licencia Creative Commons Atribución-NoComercial-CompartirIgual 4.0 Internacional (CC BY-NC-SA 4.0).
Usted es libre de:
Compartir: copiar y redistribuir el material en cualquier medio o formato.
Adaptar: remezclar, transformar y construir a partir del material.
Bajo los siguientes términos:
Atribución: Debe dar crédito de manera adecuada, brindar un enlace a la licencia e indicar si se han realizado cambios. Puede hacerlo en cualquier forma razonable, pero no de forma tal que sugiera que usted o su uso tienen el apoyo de la licenciante.
No Comercial: No puede hacer uso del material con propósitos comerciales.
Compartir Igual: Si remezcla, transforma o crea a partir del material, debe distribuir su contribución bajo la misma licencia que el original.
Para más detalles, puede consultar el texto completo de la licencia en: https://creativecommons.org/licenses/by-nc-sa/4.0/deed.es

