Importar datos en R suele ser el primer paso en cualquier proyecto de análisis. R dispone de varias funciones específicas para cada formato de archivo, lo que al principio puede resultar confuso. Sin embargo, una vez que conoces qué funciones y paquetes usar según el tipo de archivo, el proceso es rápido y fiable. En esta guía encontrarás un resumen práctico para importar los formatos más comunes con ejemplos y comandos básicos.
Preparar el entorno en R Antes de importar datos conviene organizar el entorno de trabajo. Para comprobar el directorio de trabajo actual usa getwd() y para establecer uno nuevo utiliza setwd(ruta_del_proyecto). Usar un directorio de proyecto permite trabajar con rutas relativas en lugar de rutas absolutas largas.
Limpiar el entorno Antes de empezar borra objetos residuales que puedan causar conflictos con rm(list = ls()). También puedes optar por no guardar el espacio de trabajo al cerrar R. Empezar con un entorno limpio reduce errores al importar datos.
Importar archivos TXT, CSV y otros delimitados Archivos de texto suelen venir separados por tabuladores, comas o punto y coma. Para archivos delimitados por tabulador emplea read.table(archivo, header = TRUE, sep = tab). Para archivos CSV existen atajos que ajustan opciones por defecto: read.csv(archivo) para CSV con coma y read.csv2(archivo) para CSV con punto y coma. Si necesitas una solución rápida para probar datos copia al portapapeles y carga con read.table(clipboard, header = TRUE) para análisis ad hoc.
Uso de paquetes para formatos complejos Para formatos más complejos instala y carga paquetes con install.packages(nombre_paquete) y library(nombre_paquete). Esto te permitirá manejar JSON, XML, Excel y otros formatos sin complicaciones.
Leer archivos JSON Con el paquete rjson puedes cargar datos JSON. Usa install.packages(rjson) y library(rjson). Para leer desde archivo emplea fromJSON(file = ruta_archivo) y desde una URL utiliza fromJSON(file = url). Los datos JSON se importan como listas; convierte a data frame con as.data.frame(lista_json) si la estructura lo permite.
Importar XML y tablas HTML Para datos en XML o HTML el paquete XML junto con RCurl son muy útiles. Carga library(XML) y library(RCurl). Para parsear XML usa xmlTreeParse(ruta_o_contenido) y convierte en tabla con xmlToDataFrame(objeto_xml). Para extraer tablas de HTML puedes combinar getURL(url) con readHTMLTable(contenido_html) y obtener data frames directamente.
Leer libros de Excel El paquete readxl es rápido y sencillo para hojas de cálculo. Instala con install.packages(readxl) y carga library(readxl). Para leer la primera hoja usa read_excel(archivo). Para elegir hoja por nombre o índice emplea read_excel(archivo, sheet = nombre_hoja) o read_excel(archivo, sheet = indice_hoja).
Importar desde software estadístico R puede leer directamente formatos de SAS, SPSS y Stata con el paquete haven. Instala y carga haven con install.packages(haven) y library(haven). Usa read_sas(archivo_sas), read_sav(archivo_spss) y read_dta(archivo_stata) para importar cada tipo. Para archivos de MATLAB emplea install.packages(R.matlab) y library(R.matlab) seguido de readMat(archivo_mat), y para Octave puedes usar funciones del paquete foreign cuando proceda.
Conexión a bases relacionales Para conectar R a bases de datos relacionales emplea RODBC. Instala con install.packages(RODBC) y carga library(RODBC). Conecta con odbcConnect(dsn = nombre_dsn, uid = usuario, pwd = contrasena). Recupera tablas con sqlFetch(conexion, nombre_tabla) o consulta con sqlQuery(conexion, consulta_sql). No olvides cerrar la conexión con odbcClose(conexion). Si trabajas con infraestructuras cloud considera integrar la carga con servicios gestionados y pipelines en la nube para mayor escalabilidad y seguridad y consulta nuestros servicios cloud en Servicios cloud AWS y Azure.
Consejos para importar sin problemas Usa la primera fila como cabecera de columnas Asegura nombres de columna únicos y respeta mayúsculas y minúsculas Emplea convenciones simples para nombres de variables por ejemplo var_name o varName Sustituye valores faltantes por NA Limpia comentarios y símbolos extra en los archivos Mantén un estilo de código consistente para facilitar la legibilidad
Pro Tip Empieza siempre con un entorno limpio y prueba la importación con pequeñas muestras de datos antes de procesar archivos grandes.
Conclusión Importar datos en R es el punto de partida del análisis y, con las funciones y paquetes adecuados, puedes trabajar con casi cualquier formato: CSV, TXT, JSON, Excel, XML/HTML y datos procedentes de SAS, SPSS, Stata, Matlab o bases relacionales. Explora las alternativas y elige la que mejor se adapte a tu flujo de trabajo. Si tu objetivo es convertir datos en información accionable y visualizaciones para toma de decisiones, también puedes integrar los datos importados con soluciones de inteligencia de negocio como Power BI y servicios de análisis para obtener informes y paneles avanzados.
Este artículo ofrece una referencia rápida para que no tengas que buscar cada vez cómo cargar un formato específico en R. Con práctica, la importación de datos pasará a ser una tarea rutinaria en tu flujo de trabajo de análisis.