Introducción a Spring AI y Amazon Bedrock
Spring AI es un framework de aplicaciones para ingeniería de inteligencia artificial que aplica principios del ecosistema Spring como portabilidad y diseño modular, promoviendo el uso de POJOs como bloques de construcción de la aplicación. Spring AI ofrece soporte para los principales proveedores de modelos de IA incluyendo Anthropic, OpenAI, Microsoft, Amazon, Google y Ollama, y su lista de funcionalidades crece continuamente. En este artículo describimos el soporte de Spring AI para Amazon Bedrock y cómo integrarlo en una aplicación de búsqueda de conferencias.
Amazon Bedrock es un servicio gestionado que expone modelos base de varios proveedores mediante una API unificada. Spring AI adopta la API Converse de Amazon Bedrock para implementar conversaciones de chat y también soporta modelos de embedding a través de la interfaz EmbeddingModel de Spring AI. Además Spring AI ofrece autoconfiguraciones y boot starters que facilitan iniciar y configurar clientes para modelos Bedrock, simplificando el desarrollo de soluciones con IA para empresas.
Desarrollo de la aplicación de ejemplo
Para el ejemplo creamos un proyecto con Spring Initializr incluyendo las dependencias Spring Web y Spring AI Amazon Bedrock Converse API. En la configuración global de la aplicación se establecen propiedades como el nombre de la aplicación, la región AWS, timeouts y modelo por defecto. Por ejemplo se puede configurar el modelo amazon.nova-lite-v1:0 y opciones como max tokens y timeout a nivel global en application.properties. Estas propiedades se pueden sobrescribir por llamada si es necesario.
En lugar de consumir una API pública para conferencias usamos un fichero JSON local con una lista parcial de conferencias que incluye nombre, temas, enlace a la pagina, fechas de inicio y fin, ciudad y enlace a call for papers. Esa lista es suficiente para experimentar con herramientas y llamadas a modelos y demuestra cómo los modelos pueden combinarse con herramientas locales para acceder a datos específicos de la aplicación.
Modelo de dominio y controlador
La entidad que usamos para representar una conferencia contiene campos como nombre, conjunto de temas, homepage, fecha de inicio, fecha de fin, ciudad y enlace al call for papers. La aplicación se expone mediante un controlador REST que inyecta un ChatClient.Builder de Spring AI para construir un ChatClient con opciones por defecto y asesores de memoria conversacional. La memoria de chat permite mantener contexto entre mensajes usando un repositorio en memoria por defecto u otros repositorios persistentes como JDBC, Cassandra o Neo4j si se requiere.
Concepto de herramientas y uso con ChatClient
Los modelos de lenguaje no conocen los datos internos de la aplicación, por eso Spring AI permite exponer herramientas implementadas en la aplicación y anotadas como Tool. Un ejemplo es All Conference Search Tool que devuelve la lista completa de conferencias. El controlador pasa las herramientas disponibles al ChatClient en cada petición para que el modelo pueda decidir si invoca alguna herramienta y obtener datos concretos de la aplicación.
Uso básico de búsqueda por prompt
Una ruta simple conference search recibe un prompt de usuario y construye la petición al ChatClient invocando métodos de prompt, user y tools para indicar el prompt, las herramientas disponibles y luego stream o call para obtener la respuesta. Usando stream se puede transmitir la respuesta de forma no bloqueante y devolver un flujo de texto; usando call se realiza una llamada bloqueante que devuelve el texto completo como cadena. Esta flexibilidad permite implementar APIs reactivas o tradicionales según las necesidades.
Búsqueda por tema y rango de fechas con herramientas complementarias
Para búsquedas más sofisticadas implementamos una ruta conference search by topic que recibe parámetros topic y number of months. En esta ruta definimos un prompt de sistema parametrizado que limita el dominio de respuesta a conferencias tecnológicas y un prompt de usuario con instrucciones para filtrar por tema y rango de fechas. Como los modelos no conocen la fecha y hora actual por si mismos creamos una herramienta Current Date Time Tool que devuelve la fecha y hora actual y otra Current Time Zone Tool que devuelve la zona horaria local. Al exponer estas herramientas al ChatClient el modelo puede invocarlas para obtener la hora actual y calcular el rango de fechas sumando el numero de meses indicado.
También implementamos una herramienta Conference Search Tool By Topic que acepta el tema y dos fechas de inicio calculadas earliest start date y latest start date y devuelve el conjunto de conferencias que coinciden con el tema y cuyo inicio cae dentro del rango. El flujo típico es que el modelo invoque la herramienta de fecha para obtener la fecha actual, calcule el limite superior sumando meses y luego invoque la herramienta de búsqueda por tema con los parámetros calculados, obteniendo así un resultado preciso.
Ejemplos de ejecución y comportamiento del modelo
Al ejecutar la aplicación localmente y llamar a conference search con un prompt generico el sistema selecciona la herramienta All Conference Search Tool y lista las conferencias disponibles en el JSON. Si se llama a conference search by topic con topic igual a Java y number of months por defecto en muchos casos el modelo invoca primero Current Date Time Tool para obtener la fecha actual, calcula la fecha limite sumando los meses indicados y luego llama a Conference Search Tool By Topic, devolviendo las conferencias que cumplen el criterio.
En algunos casos el modelo puede no elegir la herramienta correcta o no usar ninguna herramienta. En ese escenario conviene probar otros modelos disponibles en Amazon Bedrock como versiones Pro de Nova o modelos de otros proveedores como los modelos Claude de Anthropic para comparar resultados. Para ciertos requisitos adicionales, por ejemplo conocer la zona horaria exacta de una conferencia a partir de la ciudad, es necesario implementar herramientas adicionales que consulten APIs externas como Google Maps para convertir ciudad a coordenadas y luego a zona horaria, y también añadir lógica para definir que significa estar cerca de una zona horaria determinada.
Consideraciones sobre memoria de conversación y advisors
Spring AI permite configurar advisors para interceptar y enriquecer las interacciones con el modelo, encapsulando patrones recurrentes de IA generativa y transformando datos enviados y recibidos. La memoria puede ser en memoria o persistente y se utiliza para mantener contexto entre llamadas, lo cual es especialmente útil cuando se construyen agentes IA conversacionales para casos de uso reales en empresas.
Buenas prácticas de configuración
Es recomendable definir propiedades globales para la integración con Bedrock como region, timeout, modelo por defecto y opciones de chat, y permitir sobreescribirlas por petición cuando se requiera cambiar modelo, temperatura o prompts. También hay que verificar en la consola de Bedrock que el acceso al modelo seleccionado está habilitado para la cuenta y la región en la que se despliega la aplicación.
Extensiones y siguientes pasos
Esta primera versión de la aplicación muestra cómo combinar modelos de lenguaje con herramientas locales para crear búsquedas por lenguaje natural sobre datos de dominio. En una segunda parte se puede desplegar un servidor Model Context Protocol MCP con las herramientas definidas y usar clientes MCP como Model Context Protocol Inspector o plugins tipo Amazon Q Developer en Visual Studio Code para listar herramientas y conversar con la aplicación mediante lenguaje natural. Otras mejoras incluyen integración con APIs externas para geolocalización y zonas horarias, persistencia de memoria de chat en bases de datos, y exposicion de métricas y logs para auditoria y mejora continua.
Sobre Q2BSTUDIO
Q2BSTUDIO es una empresa de desarrollo de software especializada en aplicaciones a medida y software a medida. Ofrecemos servicios profesionales en inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio y soluciones de visualizacion con power bi. Somos especialistas en ia para empresas y desarrollo de agentes IA personalizados que integran modelos conversacionales con herramientas y datos propios de cada cliente. Nuestra experiencia abarca desde la concepcion y desarrollo de aplicaciones a medida hasta la operacion segura en la nube, garantizando cumplimiento y proteccion mediante practicas de ciberseguridad. Si su organización necesita soluciones de inteligencia artificial, agentes IA, integracion con servicios cloud aws y azure, o dashboards con power bi, Q2BSTUDIO puede ayudar a diseñar e implementar una solucion a medida que cumpla objetivos de negocio y rendimiento.
Palabras clave y posicionamiento
En este contenido se incluyen terminos relevantes para posicionamiento como aplicaciones a medida, software a medida, inteligencia artificial, ciberseguridad, servicios cloud aws y azure, servicios inteligencia de negocio, ia para empresas, agentes IA y power bi para mejorar la visibilidad en buscadores y relacionarlo con los servicios ofrecidos por Q2BSTUDIO.
Conclusión
Hemos introducido Spring AI y Amazon Bedrock, construido una aplicacion de ejemplo para buscar conferencias combinando modelos conversacionales y herramientas locales, y mostrado como parametrizar prompts, usar memoria conversacional y exponer herramientas para que el modelo pueda consultar datos concretos. Esta arquitectura es una base sólida para construir agentes IA y aplicaciones a medida que aprovechen modelos avanzados en un entorno controlado y extensible. En la siguiente entrega integraremos MCP y clientes especializados para explorar y controlar las herramientas definidas mediante interfaces de desarrollo.