POLITICA DE COOKIES

Q2BSTUDIO.COM utiliza cookies técnicas, analíticas, de sesión y de publicidad con la finalidad de prestar un mejor servicio. No obstante, necesitamos su consentimiento explícito para poder utilizarlas. Así mismo puede cambiar la configuración de las cookies u obtener más información aquí .

Reconocimiento de Expresiones Faciales con PyTorch: FER-2013 y 72% de Validación

Reconocimiento de Expresiones Faciales con PyTorch: FER-2013 y 72% de Validación

Publicado el 18/08/2025

Resumen: En este artículo explico cómo construimos un modelo de reconocimiento de expresiones faciales con PyTorch sobre el dataset FER-2013 y alcanzamos alrededor de 72% de exactitud en validación. La intención fue lograr una solución reproducible y eficiente para inferencia en tiempo real, pensando en despliegues en servicios cloud AWS y Azure y aplicaciones a medida.

Introducción: FER-2013 es un dataset realista con imágenes en escala de grises de 48x48 y fuerte desbalance entre clases. Los retos principales son baja resolución, ruido en las etiquetas y variabilidad intra clase. A pesar de eso, una arquitectura compacta y buenas técnicas de augmentación permiten obtener resultados sólidos para soluciones de IA para empresas.

Preprocesado y augmentación: Para entrenamiento aplicamos transformaciones habituales: conversión a imagen PIL, flip horizontal aleatorio, pequeñas rotaciones hasta 10 grados, recorte y redimensionado a 48x48, normalización con media y desviación típica adecuadas. En validación solo redimensionado y normalización. Estas transformaciones ayudan a generalizar y son compatibles con pipelines en producción y con servicios de inferencia en la nube.

Arquitectura del modelo: Diseñamos una CNN de 3 bloques. Entrada 48x48x1. Bloque 1: Conv 3x3 64 filtros, BatchNorm, ReLU, MaxPool 2x2 produce 24x24x64. Bloque 2: Conv 3x3 128 filtros, BatchNorm, ReLU, MaxPool 2x2 produce 12x12x128. Bloque 3: Conv 3x3 256 filtros, BatchNorm, ReLU, MaxPool 2x2 produce 6x6x256. Dropout2d 0.25, flatten a 9216, FC a 512, ReLU, Dropout 0.5 y salida FC de 7 neuronas con softmax en inferencia. Esta topología equilibra capacidad y eficiencia para inferencia en tiempo real y despliegues edge o en servicios cloud.

Receta de entrenamiento: Pérdida CrossEntropyLoss, optimizador AdamW con lr 1e-3 y weight decay 1e-4, scheduler ReduceLROnPlateau o CosineAnnealingLR. Tamaño de batch 64, número de épocas entre 30 y 60 con early stopping y paciencia 7 sobre la pérdida de validación. Guardamos el mejor checkpoint por métrica F1 macro o por pérdida de validación.

Reproducibilidad y buenas prácticas: Fijamos semillas para random, numpy y torch y configuramos cudnn deterministic False o True según necesidades para equilibrar reproducibilidad y rendimiento. Registramos métricas por época, matriz de confusión y F1 por clase para entender errores y clases con peor desempeño.

Evaluación y resultados: Además de la exactitud global en validación cercana al 72% reportamos matriz de confusión y F1 por clase para medir sensibilidad en emociones como enfado, asco, miedo, felicidad, tristeza, sorpresa y neutral. Estos indicadores son clave cuando se integra el modelo en soluciones de negocio donde cada clase tiene distinto valor.

Despliegue y siguientes pasos: El modelo se puede adaptar a inferencia en tiempo real con webcam, integrarse en una API con Django o Flask, o desplegar en servicios cloud AWS y Azure usando contenedores y endpoints gestionados para escalado. Otras mejoras incluyen fine tuning con modelos preentrenados, pruning, quantization y pipelines de detección de rostro para preprocesado robusto.

Sobre Q2BSTUDIO: Q2BSTUDIO es una empresa de desarrollo de software y aplicaciones a medida especializada en inteligencia artificial, ciberseguridad, servicios cloud AWS y Azure, servicios inteligencia de negocio y soluciones personalizadas. Ofrecemos software a medida, aplicaciones a medida, consultoría en inteligencia artificial e IA para empresas, desarrollo de agentes IA, integraciones con Power BI y soluciones de inteligencia de negocio para transformar datos en valor. Si buscas una solución llave en mano para reconocimiento facial, despliegue en la nube o integración con sistemas corporativos, nuestro equipo puede ayudarte a llevar el prototipo a producción con prácticas de seguridad y escalabilidad.

Contacto y colaboración: Si deseas adaptar este proyecto a un caso real, integrar modelos en productos, desarrollar software a medida o contratar servicios de ciberseguridad, servicios cloud AWS y Azure, agentes IA o Power BI, ponte en contacto con Q2BSTUDIO. Podemos ofrecer pruebas de concepto, pipelines de MLOps y despliegue seguro para que tu proyecto aproveche la inteligencia artificial de manera responsable y eficiente.

Fin del artículo, inicio de la diversión
Construyendo software juntos

Dando vida a tus ideas desde 2008

Diseñamos aplicaciones móviles y de escritorio innovadoras que cumplen con tus requisitos específicos y mejoran la eficiencia operativa.
Más info
Cuéntanos tu visión
Sea cual sea el alcance, podemos convertir tu idea en realidad. Envíanosla y charlemos sobre tu proyecto o una colaboración futura.
Contáctanos
artículos destacados
Live Chat
Enviado correctamente.

Gracias por confiar en Q2BStudio