vinculacion

vinculacion

vinculacion

Diploma en Data Science

Calendario 2024: 15 de abril al 30 de agosto.

Contacto y consultas: Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo. - (+569) 44053325 

Descargar Brochure

Solicitar más información


Descripción

En la actualidad es de gran interés en los ambientes industriales, organizacionales y académicos el uso de herramientas interdisciplinarias para el tratamiento de datos de forma tal que permita descubrir la información valiosa que allí pueda ser conseguida y que apoye a la toma de decisiones de forma inteligente. Así, la Ciencia de datos (Data Science) emerge como esa combinación exitosa de métodos y técnicas que incluyen herramientas matemáticas, estadísticas, computacionales, inteligencia artificial y comportamientos sociales y organizacionales que han brindado soluciones de gran valor en los entornos desarrollados.

Plan de Estudios

El Diploma se estructura tres ciclos (Fundamentos, Intermedio y Especialización) con un total de 120 horas, a través de 10 módulos de 12 horas cada uno. 

El Ciclo de fundamentos está constituido por tres módulos (Introducción a Data Science, Análisis Exploratorio de Datos y Visualización de Datos).  El Ciclo Intermedio incluye tres módulos (Machine Learning, Big Data y Deep Learning) El Ciclo de Especialización considera cuatro módulos adicionales (Text Mining y NLP, Análisis de Redes Sociales, Ciencia de Datos, Emprendimiento y Organizaciones y Talleres de Integración de Contenidos).  Los talleres se irán modificando en cada oportunidad que se realice el Diploma. 

Ciclo Fundamentos

Módulo I: Introducción a Data Science (12 horas)

  • Introducción a la Ciencia de Datos, Problemática y Perspectivas.
  • Tipos de Datos. Datos estructurados y no estructurados.
  • Veracidad de datos, privacidad y seguridad.
  • Aspectos éticos y sociales.
  • Discusión de casos.
  • Ejemplos en Jupyter Notebooks.

 

dulo II: Análisis Exploratorio de Datos (12 horas)

  • Medidas de Similaridad y Distancia.
  • Elementos de Teoría de Probabilidades.
  • Análisis de Datos Univariados. Medidas de Tendencia y Dispersión.
  • Detección de Datos Atípicos.
  • Análisis de Datos Multivariados. Matriz de Correlaciones.
  • Análisis de Varianza Intra e Varianza Inter.
  • Estimación Paramétrica Clásica.
  • Regresión Lineal.

 

Módulo III: Visualización de Datos (12 horas)

  • Visualización de datos y su relación a la cognición humana. 
  • Qué, por qué y cómo visualizar.
  • Elementos gráficos y canales visuales.
  • Herramientas de visualización de datos.
  • Métodos centrados en usuarios para diseño, prototipado y evaluación.
  • Revisión de casos prácticos. 

Ciclo Intermedio

Módulo IV: Machine Learning (12 horas)

  • Introducción al Aprendizaje Supervisado.
  • Árboles de Clasificación y Regresión
  • Máquinas de Vectores de Soporte (SVMs).
  • Ensamblados: Bagging, Boosting, Random Forest.
  • Métodos de Evaluación y Selección de Modelos.
  • Introducción al Aprendizaje No-Supervisado.

 

Módulo V: Big Data (12 horas)

  • Introducción a la computación distribuida y sistemas para Big Data
  • Sistemas de archivos distribuidos para Big Data (BigTable, Cassandra, MongoDB).
  • Sistemas de procesamiento para Big Data (Map-reduce, Storm, Spark).
  • Sistemas de comunicación para Big Data (Kafka).

 

Módulo VI: Deep Learning (12 horas)

  • Introducción y Redes Feed-forward.
  • Entrenamiento de Redes Profundas: Backpropagation y Dropout.
  • Redes Neuronales Convolucionales.
  • Redes Neuronales Recurrentes.
  • Entrenamiento No-supervisado de Redes Neuronales. 

Ciclo Especialización

Módulo VII: Text Mining y NLP (12 horas)

  • Extracción de Información (Keywords, Collocations, Entidades Nombradas).
  • Recuperación de Información Clásica (TF-IDF, BM25).
  • Representaciones de Texto (BOW, Word2Vec, CBOW, GloVE, Doc2Vec).
  • Aplicaciones: Neural IR, Clasificación de Contenidos, Detección de Tópicos, Sentiment Analysis, Traducción.

 

Módulo VIII: Análisis de Redes Sociales (12 horas)

  • Modelos de Redes Sociales
  • Medidas de Centralidad, Influencia y Robustez.
  • Scrapping de Redes Sociales
  • Evolución de Redes Sociales

 

Módulo IX: Ciencia de Datos, Emprendimiento y Organizaciones (12 horas)

  • Rol de la Ciencia de Datos para las Organizaciones.
  • Ciencia de Datos y Emprendimiento.
  • Discusión de Casos de éxito.

 

Módulo X: Seminario de ejemplos y aplicaciones de Inteligencia Artificial (12 horas)

  • Taller de Aplicaciones I. Ejemplo: Análisis de Sentimiento en Tweets.
  • Taller de Aplicaciones II. Ejemplo: Sistema Recomendador en Facebook.

Dirección Académica del Programa

Dr. Ricardo Ñanculef Alegría, UTFSM, Chile (Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.)

Coordinación Ejecutiva del Programa

Dr. Francklin Rivas Echeverría, UTFSM, Chile (Esta dirección de correo electrónico está siendo protegida contra los robots de spam. Necesita tener JavaScript habilitado para poder verlo.)