Resumen de la lista de desarrollo de Apache Polaris (1–5 de septiembre de 2025)
Durante la primera semana de septiembre de 2025 la comunidad de desarrollo de Polaris concentró sus esfuerzos en ultimar el candidato de lanzamiento 1.1.0-incubating y en varias mejoras de rendimiento y funcionalidad. A continuación se presentan los hechos más relevantes traducidos y reorganizados para una lectura clara y práctica.
Votación del candidato 1.1.0-incubating
La comunidad se centró en las pruebas y la votación del candidato Polaris 1.1.0-incubating RC0. Jean-Baptiste Onofré compartió el tarball candidato, el ID de commit, el Helm chart, el archivo KEYS y las URL del repositorio Maven, solicitando que todos verificaran firmas, ejecutaran pruebas y votaran en un plazo de 72 horas. Varios contribuidores revisaron scripts de compilación y pruebas de integración. Alexandre Dutra y Pierre Laporte emitieron votos positivos tras verificar checksums, firmas y realizar benchmarks de lectura/escritura. Russell Spitzer encontró inicialmente una falla relacionada con DNS en RestCatalogKeycloakFileIT en macOS; Jean-Baptiste reprodujo el problema y lo consideró un fallo de entorno local más que un bloqueo de lanzamiento, proponiendo un arreglo posterior si fuera necesario. Yufei Gu y Dmitri Bourlatchkov completaron sus propias pruebas, incluyendo smoke tests contra Iceberg, y también votaron a favor. Con varias aprobaciones vinculantes y no vinculantes y sin bloqueadores críticos, la votación siguió adelante con éxito.
Índice JDBC para el metastore
Artur Rakhmatulin propuso añadir un índice idx_entities_lookup al metastore JDBC de Polaris. Explicó que el esquema actual solo indexa claves primarias y foráneas, lo que obliga a escaneos costosos al listar entidades. Su benchmark en PostgreSQL mostró que añadir un índice multicolumna sobre realm namespace name type mejora dramáticamente el rendimiento. Proporcionó el SQL para Postgres y H2 y pidió opinión sobre si incluir el índice por defecto o documentarlo como una opción de optimización de rendimiento.
Métricas operacionales propuestas
Pierre Laporte abrió la discusión para añadir métricas operacionales de Data Lake a Polaris. Propuso crear un componente que agregue métricas de alto nivel como total de ficheros, recuentos de lecturas/escrituras y tiempos de última modificación para tablas y vistas Iceberg. Señaló que solo unas pocas métricas se pueden derivar de las métricas actuales de Iceberg y que el resto requeriría eventos de la próxima Events API. Prashant Singh apoyó la idea recordando que métricas como ScanMetrics son útiles para optimizar el layout de tablas y la compactación y que otros catálogos exponen métricas similares. El grupo coincidió en que capturar y persistir métricas en Polaris facilitaría a los operadores entender el uso de los datos.
Cambios propuestos en respuestas OpenAPI
Adnan Hemani propuso actualizar la especificación OpenAPI de Polaris para que los endpoints create* devuelvan el recurso recién creado en lugar de un cuerpo vacío. Argumentó que devolver el recurso mejora la usabilidad del cliente y facilita la generación de eventos, en línea con buenas prácticas HTTP. La propuesta abarca APIs como createCatalog createPrincipalRole createCatalogRole createNamespace y endpoints de integración y permisos. Adnan invitó a la comunidad a dar feedback y dijo que iniciaría una votación si había consenso.
Mejoras en la UI y onboarding
Jean-Baptiste Onofré reanudó el trabajo en la interfaz de Polaris y la experiencia de onboarding. Compartió que los componentes iniciales ya funcionan contra el backend y planea abrir un pull request en borrador en el repositorio polaris-tools para recabar comentarios. Los colaboradores agradecieron la actualización y esperan iterar sobre la experiencia de usuario.
Propuesta Table Source y Common Table API
Jean-Baptiste y Laurent revisaron su propuesta sobre Polaris Table Source y Common Table API. El diseño permitiría a Polaris registrar fuentes de datos externas tanto estructuradas como no estructuradas y envolverlas en tablas Iceberg aplicando gobernanza. Se discutió la relación con la Generic Table API y se propuso una reunión de seguimiento para aclarar integraciones y detalles técnicos tras la conferencia del Council of Committees.
Preparación del informe del incubador de septiembre
Jean-Baptiste recordó que el informe trimestral del incubador de Polaris vence el 25 de septiembre y compartió la plantilla en ASF Confluence, solicitando actualizaciones sobre lanzamientos, crecimiento de la comunidad y desarrollo en curso para ensamblar el documento a tiempo.
Conclusión y takeaway
En resumen la semana estuvo marcada por la finalización del release candidate 1.1.0 mejoras de rendimiento mediante índices JDBC y el diseño de nuevas capacidades como métricas operacionales y respuestas OpenAPI más ricas. El trabajo en la UI y el onboarding avanzó y se planificaron reuniones para pulir la propuesta Table Source, coordinando acciones alrededor de la conferencia del ASF Council of Committees. Además se inició la preparación del informe del incubador de septiembre.
Sobre Q2BSTUDIO
En Q2BSTUDIO, empresa especializada en desarrollo de software y aplicaciones a medida, transformamos iniciativas como las discutidas en comunidades open source en soluciones empresariales robustas. Ofrecemos servicios de software a medida y aplicaciones a medida adaptadas a necesidades de negocio, con experiencia en inteligencia artificial y ia para empresas, agentes IA y soluciones de inteligencia de negocio. Si busca desarrollar una plataforma que integre gobernanza de datos, métricas operacionales y catálogos compatibles con Iceberg, nuestro equipo puede ayudar desde el diseño hasta la puesta en producción.
Además de desarrollo adaptado, en Q2BSTUDIO contamos con capacidades en ciberseguridad y pentesting para proteger infraestructuras de datos críticas, servicios cloud aws y azure para desplegar soluciones escalables y seguras y herramientas de analítica como power bi para extraer valor de los datos. Para explorar nuestras soluciones de software a medida visite desarrollo de aplicaciones y software multiplataforma y para conocer nuestras ofertas en inteligencia artificial consulte servicios de inteligencia artificial para empresas.
Palabras clave
aplicaciones a medida software a medida inteligencia artificial ciberseguridad servicios cloud aws y azure servicios inteligencia de negocio ia para empresas agentes IA power bi