Un gran proyecto con Spring Batch es robusto, escalable y tolerante a fallos. En este artículo explicamos los componentes clave y las ideas principales para construir aplicaciones batch desde la configuración básica del job hasta funcionalidades avanzadas como procesamiento paralelo y gestión de errores, con ejemplos y buenas prácticas aplicables a soluciones empresariales y a servicios de software a medida.
Componentes centrales y configuración
JobLauncher y TaskExecutor
Para ejecutar un job de Spring Batch se necesita un JobLauncher. Para ejecución síncrona puede usarse el JobLauncher por defecto. Para ejecución asíncrona es recomendable configurar un TaskExecutorJobLauncher, imprescindible para operaciones no bloqueantes en aplicaciones web. La anotación @EnableBatchProcessing habilita las funcionalidades de Spring Batch y configura automáticamente un JobLauncher y otros componentes básicos. TaskExecutorJobLauncher ejecuta jobs de forma asíncrona usando un TaskExecutor. SimpleAsyncTaskExecutor crea un hilo por cada tarea y puede habilitar hilos virtuales con setVirtualThreads(true) para cargas de alta concurrencia y menor peso por hilo.
Tareas simples con Tasklet
No todos los pasos necesitan reader, processor y writer. Para lógica procedural simple como limpieza de ficheros o comandos del sistema es ideal usar un Tasklet. Tasklet es una interfaz funcional con el método execute que devuelve un RepeatStatus. RepeatStatus.CONTINUABLE indica repetir la ejecución, RepeatStatus.FINISHED indica que la tarea terminó. Un Tasklet se asocia a un Step para su ejecución.
Lectura desde múltiples recursos
El manejo de varios ficheros de entrada en un mismo job es común. Spring Batch ofrece componentes potentes: MultiResourceItemReaderBuilder simplifica la lectura desde múltiples archivos, delegando la lectura real a un ResourceAwareItemReaderItemStream. Esta interfaz recibe un recurso único y lo asigna al lector interno, por ejemplo FlatFileItemReader, y gestiona su ciclo de vida mediante open, close y read. FlatFileItemReader es el lector concreto que lee líneas de un único archivo, mantiene su estado en el ExecutionContext para permitir reinicios y requiere un LineMapper para parsear líneas a objetos. El flujo general: MultiResourceItemReader recibe la lista de archivos, delega cada archivo al lector intermedio que fija el recurso en el FlatFileItemReader, este lee y cuando termina pasa al siguiente archivo.
Estado y capacidad de reinicio
ExecutionContext es una tienda clave-valor que guarda información de estado para un Job o Step y es esencial para el reinicio, porque permite almacenar la última posición procesada correctamente. Muchos readers y writers guardan su estado automáticamente en el ExecutionContext. ItemStream define el ciclo de vida de componentes stateful con open(ExecutionContext), update(ExecutionContext) y close(). FlatFileItemReader implementa ItemStream para guardar la última línea leída y permitir reiniciar donde se quedó.
Compartir datos entre steps
Para pasar datos entre steps puede promoverse claves del StepExecutionContext al JobExecutionContext. Promoción manual accediendo a StepExecution.getJobExecution().getExecutionContext() al final de un step. Promoción automática usando ExecutionContextPromotionListener configurado con las claves a promover. En pasos siguientes se puede obtener valor del JobExecutionContext usando inyección con SpEL como #{jobExecutionContext['mi.clave']} en beans con scope StepScope.
Control de ficheros de salida
Para añadir cabeceras o pies personalizados a un fichero plano se usan FlatFileHeaderCallback para la parte superior y FlatFileFooterCallback para la parte inferior en el FlatFileItemWriter.
Ejecución paralela y tolerancia a fallos
Para mejorar rendimiento puede ejecutarse pasos en paralelo usando un SimpleFlow con un TaskExecutor. Defina un SimpleFlow distinto para cada camino paralelo y use FlowBuilder para crear un split que reciba un TaskExecutor y ejecute las flows en paralelo. Spring Batch soporta reinicio automático: si un job falla puede reiniciarse con los mismos parámetros; el framework saltará los steps ya completados y volverá a ejecutar los fallidos. Si se ejecuta con parámetros nuevos se trata como una nueva instancia y todos los steps se ejecutan desde cero. Para forzar la reejecución de un step completado en reinicios use allowStartIfComplete(true), útil para tareas como limpieza que deben ejecutarse siempre.
Skip y Retry
Las capacidades de tolerancia a fallos permiten manejar errores transitorios y no críticos. Skip ignora excepciones específicas y continúa procesando con skip(Exception.class) y skipLimit(n). Retry reintenta el procesamiento de un ítem con retry(Exception.class) y retryLimit(n). Es frecuente combinar ambos en un step con faultTolerant().
Listeners
Los listeners ofrecen hooks en el ciclo de ejecución para lógica adicional como logging o alertas. SkipListener define onSkipInRead, onSkipInWrite y onSkipInProcess. RetryListener define open, close y onError para seguir los intentos de retry.
Buenas prácticas y consideraciones
Use TaskExecutorJobLauncher para cargas asíncronas en aplicaciones web, monitorice el ExecutionContext para garantizar restartabilidad, diseñe pasos idempotentes cuando sea posible, combine skip y retry según la naturaleza del error y aproveche listeners para observabilidad y alertas. Para integración con cloud y despliegues escalables considere adoptar servicios gestionados en AWS o Azure y diseñar la aplicación para ejecución en contenedores.
Sobre Q2BSTUDIO
Q2BSTUDIO es una empresa de desarrollo de software y aplicaciones a medida especializada en soluciones empresariales, inteligencia artificial aplicada, ciberseguridad y servicios cloud. Ofrecemos desarrollo de aplicaciones a medida y software a medida que integran capacidades de inteligencia artificial, agentes IA y automatización de procesos para optimizar operaciones. También proporcionamos servicios de inteligencia artificial para empresas, soluciones de inteligencia de negocio y visualización con Power BI, y consultoría en ciberseguridad y pentesting. Nuestro enfoque combina experiencia técnica y metodologías ágiles para entregar proyectos que escalan y resisten fallos.
Palabras clave
Aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA, power bi, automatización de procesos.