estudia con nosotros

estudia-con-nosotros

estudia-con-nosotros

Listado de Noticias

En el marco de su reciente examen de magíster presentó cómo, a través del modelado de temas (Topic Modeling), usuarios no expertos pueden identificar y comparar datos de gran volumen. La investigación fue evaluada con la nota máxima de 100.

En febrero de 2018 presentó su tesis de pregrado de Ingeniería Civil Informática y en marzo del mismo año se unió al programa de Magíster en Ciencias de la Ingeniería Informática, un programa del cual destaca la posibilidad de presentar trabajos en conferencias de distintas partes del mundo, haber tenido la posibilidad de realizar una pasantía de investigación en Dalhousie University, Halifax, Canadá (mismo país en el que está su universidad actual de doctorado: University of British Columbia, Vancouver, Canadá) y la excelente relación entre profesores y alumnos.

Fue el constante aumento en el volumen de datos de tipo texto, lo que motivó la elección de su tema de tesis, titulada “Topicvisexplorer:  Supporting Multi-Corpora Comparison Through Visual Exploration of Topic Modeling”, mediante la cual busca desarrollar herramientas de visualización para que usuarios no expertos puedan identificar y comparar los temas más importantes en un conjunto grande de datos. 

“Una solución prometedora al constante aumento de datos es el modelado de temas (en inglés conocido como "Topic Modeling"), un enfoque estadístico para identificar temas/tópicos en un alto volumen de datos. Los humanos que interactúan e interpretan directamente el resultado de estos algoritmos pueden usar herramientas de visualización para interpretar mejor los resultados, sin embargo, estas herramientas todavía tienen importantes limitaciones que afectan su rendimiento”, explica Felipe.

Para abordar dicha problemática, en su tesis propuso TopicVisExplorer, un conjunto de visualizaciones interactivas que soporta algoritmos de Topic Modeling, que con innovaciones claves permitiría ayudar a usuarios no expertos a mejorar los resultados del algoritmo y a comparar temas de uno o dos conjuntos de datos. 

Felipe cuenta que su estudio fue con 95 usuarios no expertos para evaluar las funcionalidades de TopicVisExplorer, cuyos resultados muestran que los participantes pueden identificar los temas que necesitan mejorar su calidad y la mayoría de ellos mejoraron los resultados del algoritmo tras unir o dividir temas. 

Además, los participantes pudieron identificar temas similares entre dos conjuntos de datos. Aquellos que utilizaron la métrica de similitud propuesta en TopicVisExplorer cometieron menos errores que aquellos que usaron una métrica del estado del arte. 

“Topicvisexplorer acerca los algoritmos de natural language processing (procesamiento de lenguaje natural) a las personas. Sin tener experiencia previa en este dominio, podrán de todas formas realizar análisis de grandes conjuntos de datos”, precisa el exalumno.

La comisión evaluadora de su tesis compuesta por Claudia López, Directora de Tesis; Marcelo Mendoza, Correferente Interno; Evangelos Milios, Correferente Externo (Dalhousie University, Canadá) y Marcelo Mendoza, Presidente Comité Evaluador, se manifestaron muy felices por su investigación calificando su presentación oral y escrita con nota máxima 100.

Cabe destacar que TopicVisExplorer sirve para analizar, por ejemplo, millones de publicaciones en redes sociales y evaluar similitudes y diferencias en la discusión de dos grupos, y se puede interactuar con esta herramienta mediante dos enlaces: Para análisis de un conjunto de datos: http://topicvisexplorer.tk/singlecorpus y para la comparación de dos conjuntos de datos: http://topicvisexplorer.tk/multicorpora.

Para conocer más de su investigación, te invitamos a revivir su presentación aquí.