estudia con nosotros

estudia-con-nosotros

estudia-con-nosotros

Listado de Noticias

El Teniente Primero Iván Pizarro culminó su programa de postgrado en el Departamento de Informática con la investigación "Una Arquitectura Basada en Atención para Clasificación Jerárquica con Redes Neuronales Convolucionales".

Se ha vuelto cada vez más popular el uso de Redes Neuronales Convolucionales (CNN) para tratar con problemas de clasificación donde las etiquetas forman una jerarquía. Sin embargo, la consistencia de la clasificación sigue siendo un problema, ya que las clases predichas en diferentes niveles a menudo no respetan las restricciones de clase-subclase codificadas. Por ejemplo, un celular Nokia, se puede clasificar como un celular, como un equipo electrónico y así con una jerarquía hacia arriba que pueden ser pocos consistentes. Han surgido en la literatura distintos modelos que agregan subredes denominadas "ramas" a las CNN, además se han propuesto distintos patrones de conectividad entre éstas para tratar las inconsistencias. 

A partir del contexto anterior, el exalumno del Magíster en Ciencias de la Ingeniería Informática, propuso un enfoque más simple y flexible consistente en dejar que la red neuronal decida cómo se deben conectar dichas ramas. Lo anterior, se logró formulando un mecanismo atencional que determina dinámicamente cómo las ramas se influencian entre ellas durante el entrenamiento e inferencia para que las predicciones sean más consistentes. Un modelo que mejore el rendimiento.

"Nuestra hipótesis, junto al profesor Ricardo Ñanculef y Carlos Valle, fue que la introducción de un mecanismo atencional para combinar representaciones intermedias extraídas de distintas profundidades de una red convolucional, permitirá mejorar el desempeño del modelo en problemas de clasificación jerárquica con respecto a modelos presentes en el estado del arte. Los experimentos realizados con datasets ampliamente utilizados para clasificación de imágenes, demostraron que el modelo propuesto puede superar el estado del arte en términos de métricas de rendimiento jerárquicas y consistencia. Además, pese a que lo anterior genera en algunos casos un rendimiento ligeramente inferior en el nivel más profundo de la jerarquía, el modelo predice con mucha más precisión la relación entre un concepto y sus ancestros. Este resultado sugiere que el modelo no solo aprende las pertenencias a clases locales, sino también las dependencias jerárquicas entre conceptos, lo que confirmó la hipótesis estudiada", detalla Iván. 

La comisión de su examen estuvo compuesta por los profesores Dr. Ricardo Ñanculef, director de Tesis; Dr. Carlos Valle, co-director de Tesis; PhD. Hernán Astudillo, correferente interno y presidente comisión y PhD. Ignacio Araya, correferente externo. Su trabajo fue aceptado y publicado en marzo por la revista IEEE Xplore, donde se puede ver el código asociado a su investigación y reproducir los resultados (ver aquí).

Experiencia en el Magíster

Fue a partir de una necesidad de la Armada de Chile, de formar oficiales para desempeñarse en el área de ciberseguridad, que el Teniente Primero Iván Pizarro cursó el Magíster en Ciencias de la Ingeniería Informática. En búsqueda de esta formación, la institución llegó al Departamento de Informática, ya que la especialidad no existe en la Armada.

"Yo postulé a esta oportunidad que brindó la institución, ya que soy de base Ingeniero Civil Electrónico, entonces esta área me llamaba mucho la atención y fue un experiencia muy enriquecedora. Comencé el magíster en plena pandemia, con muchas clases online, y casi al final del proceso retomamos la presencialidad; no obstante, pese a que se estaba comenzando con la virtualidad fue una experiencia grata y, desde la informática, incluso provechoso", comenta Iván.