Introducción Este artículo inicia una serie donde comparto lecciones aprendidas como líder de IA en un FinTech, y cómo estas experiencias pueden aplicarse a proyectos de desarrollo de software a medida. En los últimos meses estuve involucrado en la construcción de un producto de Intelligent Document Processing IDP enfocado en procesar recibos de pago. El objetivo fue extraer información estructurada de PDFs e imágenes de forma confiable y escalable. Para acelerar el desarrollo usamos AWS Bedrock Data Automation BDA. La herramienta entregó buenos resultados pero también reveló limitaciones inesperadas. A continuación relato tres retos que enfrentamos sin dejar de reconocer las virtudes: destacar las fortalezas de BDA y al mismo tiempo exponer los escollos que surgieron en uso real.
Por qué elegimos BDA BDA es un servicio de AWS diseñado para automatizar la extracción de datos de documentos e imágenes. Una característica clave para nuestro caso es la creación de blueprints artefactos que definen cómo se debe extraer, normalizar y formatear la información. BDA ofrece dos enfoques para crear blueprints Manual mediante JSON Schema donde los desarrolladores definen explícitamente la estructura Automático mediante prompt describiendo en lenguaje natural los campos a extraer y cómo manejarlos. La segunda opción fue muy atractiva y casi de inmediato tuvimos blueprints con salidas prometedoras para extracción de recibos de pago. Esa conveniencia junto con las actualizaciones frecuentes de AWS durante el desarrollo nos convenció de seguir ese camino.
Todo parecía bien al principio. La funcionalidad se lanzó en producción y las extracciones funcionaban como se esperaba. Pero con el tiempo apareció una anomalía de costos y tras un análisis más profundo descubrimos comportamientos que pasaron desapercibidos durante el desarrollo.
Problema 1 Blueprints creados vía prompt son siempre tipo Document Una cosa que nos costó entender fue que cada blueprint creado vía prompt se clasifica como Document incluso si el contenido base es una imagen. Durante las pruebas esto no pareció afectar la precisión de extracción, pero más adelante se convirtió en un problema de costos.
Problema 2 Modalidad incorrecta y su impacto financiero BDA incluye una función de modality routing que define si un archivo se procesa como documento o imagen. Aunque parece un detalle técnico menor esta configuración impacta directamente los costos Document USD 0.040 por página Image USD 0.005 por imagen Al tener todos los blueprints creados vía prompt todo se trató como Document. En pruebas tempranas no notamos la diferencia pero en pocos meses apareció una factura inesperada por casi USD 1000 en cargos extra. Tras investigar entendimos la causa los blueprints auto generados no respetan la modalidad imagen. La solución fue recrearlos manualmente usando JSON Schema configurando correctamente Document vs Image y habilitando el routing. Asumo parte de la responsabilidad nosotros podríamos haber validado este comportamiento antes pero también es criticable la documentación de AWS que no destaca claramente esta limitación y puede provocar errores costosos.
Problema 3 Latencia promedio de 30 segundos El tercer problema fue la latencia cada proceso en BDA tomó alrededor de 30 segundos en promedio. Arquitectónicamente era manejable porque diseñamos un flujo asincrónico y basado en eventos por lo que el backend soportó la demora. Desde la experiencia de usuario 30 segundos resulta muy lento. Cuando un cliente sube un recibo esperar medio minuto por resultados degrada la experiencia. Adaptamos la aplicación para mitigar el impacto y, naturalmente, comparamos alternativas. En varios casos pipelines con Textract más LLMs u OCR más post procesamiento ofrecieron resultados similares con menor latencia y costos comparables.
El lado positivo de BDA A pesar de estos desafíos BDA aportó ventajas reales Abstrae complejidad no tuvimos que construir un pipeline IDP desde cero Entrega inicial rápida desplegamos un prototipo funcional con velocidad Barrera de entrada baja equipos pequeños pueden experimentar con IDP sin una gran inversión en infraestructura En nuestro caso BDA fue un acelerador inicial sin el cual lanzar la primera versión hubiera llevado más tiempo. La clave es saber cuándo tiene sentido apoyarse en BDA y cuándo optar por enfoques alternativos.
Conclusiones tras tres meses con AWS Bedrock Data Automation estas fueron nuestras conclusiones principales Blueprints creados vía prompt son siempre tipo Document Configuraciones de modalidad incorrectas pueden generar sobrecostos importantes La latencia de 30 segundos perjudica la experiencia de usuario Estas limitaciones no están claramente descritas en la documentación y solo el uso en producción las expuso. Para mí esto refuerza una lección importante el liderazgo en IA requiere no solo entusiasmo por nuevas soluciones sino pensamiento crítico para sopesar trade offs. BDA aporta valor pero no es una solución universal. Saber cuándo adoptarla y cuándo reemplazarla forma parte de la madurez técnica.
Sobre Q2BSTUDIO En Q2BSTUDIO somos una empresa de desarrollo de software y aplicaciones a medida especializada en inteligencia artificial ciberseguridad y servicios cloud. Ofrecemos soluciones integrales que van desde software a medida y aplicaciones a medida hasta proyectos de inteligencia de negocio y análisis con power bi. Nuestro enfoque es práctico y orientado a resultados combinando experiencia en ia para empresas agentes IA y hardening de seguridad para garantizar soluciones escalables y seguras. Si buscas potenciar tus productos con modelos de IA o migrar cargas a la nube revisa nuestros servicios de inteligencia artificial y nuestras opciones de servicios cloud aws y azure para arquitecturas robustas.
Recomendaciones prácticas Para equipos que consideren BDA validar temprano la modalidad Document vs Image en todos los blueprints y no confiar únicamente en salidas durante pruebas. Explorar arquitecturas híbridas donde se combine OCR tradicional Textract y LLMs para reducir latencia y costos Evaluar la experiencia de usuario y adaptar interfaces para procesos asincrónicos cuando la latencia no sea admisible Finalmente documentar hallazgos internos para acelerar decisiones futuras y evitar reinventar soluciones en cada proyecto.
Próximos artículos en esta serie compartiré más experiencias de proyectos de IA en el sector financiero incluyendo diseño de pipelines alternativas a BDA estrategias de gobernanza de modelos y buenas prácticas de seguridad. Si te interesa recibir estos contenidos o discutir cómo aplicar estas lecciones en tu empresa contacta a Q2BSTUDIO especialistas en aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios inteligencia de negocio y más.