Reconocimiento facial y COVID19
Una de las tecnologías clave que ayudará a hacer del mundo post-COVID19 un lugar más seguro es el reconocimiento facial. Por lo general, las personas tienen miedo de exponerse a los sistemas de reconocimiento de rostros y piensan que son una especie de Gran Hermano malicioso que los observa. Nada más lejos de la verdad. Sin embargo, son una tecnología biométrica de alta precisión que permite, entre otras aplicaciones, el control de acceso sin contacto y distante a lugares de trabajo, infraestructuras críticas, transportes o eventos. Con el reconocimiento facial, no es necesario manipular las tarjetas de seguridad de acceso, acercarse o poner el dedo en ningún dispositivo compartido por cientos de personas, lo que ayuda a controlar la propagación de la pandemia. En cambio, existe un desafío principal para la tecnología de reconocimiento facial en esta nueva normalidad: el uso común de máscaras médicas que ocluyen la mitad de la cara. Idealmente, los individuos no deberían tener que exponerse a sí mismos y a otros al virus quitándose sus máscaras en los controles de acceso, pero la gran mayoría de los algoritmos actuales de reconocimiento facial aún no son lo suficientemente sólidos como para lidiar con oclusiones faciales tan grandes.
De hecho, los humanos nos enfrentamos al mismo desafío. El seguimiento ocular y los trabajos psicológicos han estudiado ampliamente los mecanismos de atención visual humana que tienen lugar cuando se enfrentan a la tarea de identificar a las personas1. Demuestran que nos fijamos de manera innata y sistemática la región de la cara triangular formada por los dos ojos y la boca. Por lo tanto, si una máscara ocluye un vértice de este triángulo, nuestros mecanismos de reconocimiento facial adquiridos a largo plazo encontrarán dificultades, perderán robustez y tomarán tiempo para adaptarse a la nueva configuración facial. Al igual que los humanos, los algoritmos de reconocimiento facial también deberán adaptarse a la estructura de las caras enmascaradas.
Deep learning en acción
Los algoritmos de reconocimiento facial existentes se basan en la Inteligencia Artificial (IA), particularmente en las técnicas de Aprendizaje automático y Aprendizaje profundo. Esto significa que aprenden automáticamente una estrategia de identificación a partir de un conjunto de datos de millones de imágenes faciales utilizadas para su entrenamiento. Hasta ahora, los conjuntos de datos de entrenamiento facial han variado en términos de condiciones de iluminación, poses de la cabeza o fondos; También han presentado ciertas oclusiones faciales en forma de gafas, gorras, bufandas o barbas. ¡Pero casi nunca han contenido caras con máscara facial!
Una posible solución para hacer que los modelos de reconocimiento facial puedan identificar a las personas con máscaras consiste en recopilar nuevas imágenes de entrenamiento para ese propósito. Pero hay otros enfoques alternativos más orientados al algoritmo. Recientemente, los trabajos académicos de vanguardia han introducido mecanismos de atención visual para las redes neuronales profundas, de modo que se les puede enseñar a centrar su atención en regiones específicas de la imagen durante el entrenamiento. Estos mecanismos podrían aplicarse para enseñar a los modelos de reconocimiento facial a desviar su atención hacia la región de la cara superior sin máscara. En cualquier caso, los sistemas de reconocimiento facial deben ser capaces de reconocer a los usuarios de máscaras y a las personas sin máscara. Por lo tanto, otra forma interesante de abordar el problema podría ser construir un detector de máscara y luego, dependiendo de si la máscara está presente o no, y aplicar diferentes estrategias de reconocimiento facial adaptadas.
Herta ha estado trabajando en solucionar el reto de fuertes oclusiones durante los últimos meses y actualmente está aportando todas estas soluciones a sus productos para liderar la era de la «nueva normalidad» del reconocimiento facial.
1 Remitimos al lector a este interesante artículo científico de Blais et al. www.ncbi.nlm.nih.gov
Escrito por: Isabelle Hupont