Aprobadas por CONEAU
Entrevista a la directora Dra. Ana Haedo
Para formalizar la inscripción el aspirante deberá presentar en la Subsecretaría de Posgrado la siguiente documentación:
- Título de grado (fotocopia y original)
- Copia de DNI (ambos lados)
- Currículum Vitae
- 2 fotos carnet
- Ficha de inscripción carrera
- Copia Partida de Nacimiento Legalizada y actualizada (hasta un año de antigüedad).
- Pago de inscripción y primera cuota (los pagos se pueden realizar en efectivo en tesorería o vía transferencia a la cuenta de UTN Paraná)
Podrán inscribirse a las carreras de posgrado en Minería de Datos quienes posean título superior de grado de ingeniero, licenciado o equivalente, otorgado por Universidad reconocida.
La Dirección de la carrera y el Comité Académico realizará una evaluación de los antecedentes de los candidatos a ingresar al programa para determinar el grado de correspondencia entre su formación, trayectoria y los requisitos de la carrera.
El plazo máximo para cumplir con todas las obligaciones del plan de estudios es de 3 años en la Especialización y de 4 años en la Maestría, incluida la defensa del trabajo final en el primer caso o tesis en el segundo. En la eventualidad que este período sea vencido, el estudiante podrá solicitar una prórroga de 1 año.
- Aprobar la totalidad de los cursos del Plan de Estudio
- Aprobar una prueba de suficiencia de idioma inglés
- Aprobar la defensa del trabajo final integrador en la Especialización o de la tesis en la Maestría
- Culminar los estudios en el tiempo máximo fijado por el Reglamento de Posgrado
- En la Maestría además de lo anterior se deberá acreditar 160 hs. destinadas a actividades de elaboración de la tesis y complementarias.
Especialización: consta de 10 cursos de carácter obligatorio que cubren un total de 480 horas de cursado.
Maestría: consta de catorce 14 cursos que cubren un total de 648 horas de cursado. 12 de los cursos son de carácter obligatorio y 2 de carácter optativo.
CURSO | Carrera | Carga horaria |
(Horas) | ||
Algoritmos | Maestría | 24 |
Estadística | Especialización y Maestría | 40 |
Base de Datos | Especialización y Maestría | 40 |
Introducción al Software R | Especialización | 40 |
Minería de Datos | Especialización y Maestría | 64 |
Aprendizaje Automático | Especialización y Maestría | 64 |
Análisis Inteligente de Datos | Especialización y Maestría | 64 |
Aplicaciones de Minería de Datos a Economía y Finanzas | Especialización y Maestría | 48 |
Aplicaciones de Minería de Datos a Ciencia y Tecnología | Especialización y Maestría | 48 |
Enfoque Estadístico del Aprendizaje | Especialización y Maestría | 48 |
Seminario de Trabajo Final Integrador | Especialización | 24 |
Visualización de la Información | Maestría | 48 |
Taller de Tesis I | Maestría | 48 |
Optativa 1 | Maestría | 48 |
Optativa 2 | Maestría | 48 |
Taller de Tesis II | Maestría | 48 |
CURSOS OBLIGATORIOS
Se propone brindar conocimiento de programación y algunos algoritmos típicos para buscar, ordenar o clasificar elementos, así como representar datos vía un lenguaje de especificación o de programación.
Contenidos mínimos:
Conceptos básicos de programación. Tipos de datos: primitivos. El tipo de datos lista, arboles, grafos – Funciones sobre listas. Conceptos básicos de los programas imperativos. Estructuras de control – variables. Funciones y procedimientos – pasaje de parámetros. Conceptos de complejidad algorítmica. Recursión.
Proveer los conocimientos básicos de probabilidad, distribuciones y métodos gráficos exploratorios para comprender y abordar los temas de Análisis Inteligente de datos y Enfoque Estadístico del aprendizaje
Contenidos mínimos:
Etapas de una investigación. Estadística Descriptiva. Definiciones: Población, muestra, Variable, Valor de una variable, Dato, Observación o Medición, Caso. Gráficos: Histograma: construcción y análisis de posibles formas. Medidas de Resumen: Medidas de Posición o Centrado: Promedio o Media Muestral, Mediana Muestral, Media α- Podada. Medidas de Dispersión o Variabilidad: Rango Muestral, Varianza Muestral. Desvío Estándar Muestral, Coeficiente de Variación, Distancia Intercuartil, Distancia entre Cuartos, Desvío Absoluto Mediano. Box-Plots. Construcción y análisis. Outliers. QQ-plot. Inferencia estadística: Método de momentos. Intervalos de Confianza. Construcción e interpretación. Intervalos de confianza para los parámetros de una distribución normal. Método general para obtener intervalos de confianza. Intervalos de confianza de nivel asintótico. Tests de hipótesis. Construcción e interpretación. P-valor. Error tipo I y II. Nivel de significación del test. Tests de hipótesis de nivel α para los parámetros de la distribución normal. Región de rechazo. Tests de hipótesis asintótico para la media de una distribución cualquiera. Relación entre tests de hipótesis bilaterales e intervalos de confianza.
Se espera que los alumnos puedan trabajar con diferentes tipos de datos y convertir entre varios formatos de bases de datos, importar y exportar tablas en diferentes formatos (Microsoft Excel, Fuentes de datos ODBC, Archivos separados por comas y tabuladores, Reconocer los caracteres especiales). Manejo básico de SQL. Manejo básico de consultas a bases de datos.
Contenidos mínimos:
Qué es una base de datos. Diferencia entre bases de datos y almacenamiento en archivos. Distintos tipos de DBMS (database management systems). Modelos de Datos. Modelos semánticos. Modelo Entidad/Relación. Diseño de una base de datos. Casos de estudio. Diferencias con UML. Modelos lógicos. Modelo relacional. Equivalencias entre modelos. Pasaje del modelo E/R al relacional. Lenguajes de Consulta. Álgebra Relacional. Operadores básicos: Selección, Proyección, Producto Cartesiano, Unión, Diferencia. Operadores complejos: Junta Natural, Cociente, Intersección. SQL como Lenguaje de Consulta. Transformación de AR a SQL. Cláusulas SELECT, FROM, WHERE, GROUP BY. Operadores avanzados. Diseño Relacional. Normalización. Tercera Forma Normal, Forma Normal de Óbice-Codd. Descomposición sin pérdida de información. Dependencias funcionales. Axiomas de Armstrong.
Objetivos:
Que el alumno, al finalizar el curso, sea capaz de:
- utilizar el software libre R.
- ejecutar e interpretar gráficas.
- desarrollar funciones de estructuras y controles de secuencia.
Contenidos Mínimos:
- Instalación y ayuda en R.
- Listas, data frames, arreglos y matrices.
- Visualización de datos.
- Funciones en R.
El objetivo del dictado de esta materia es que el alumnado adquiera los conocimientos generales y prácticos del estado del arte en Aprendizaje Automático para su aplicación en la práctica profesional en Minería de Datos. Por medio del curso el alumno deberá:
Adquirir los conceptos básicos del aprendizaje computacional, sus fundamentos teóricos y una aproximación a sus bases formales;
Conocer los principales modelos y algoritmos de aprendizaje computacional;
Conocer metodologías que permitan seleccionar el modelo apropiado a los casos prácticos que se le presenten;
Internalizar los conceptos por medio de la práctica con herramientas de libre disponibilidad establecidas en el mundo académico
Contenidos mínimos:
Introducción conceptual al aprendizaje automático. Introducción inductiva al procesamiento no tradicional de datos. Estructura de sistemas de aprendizaje y notación estándar. Métodos inferenciales no deductivos, generalización y noción de orden parcial. Algoritmos: Espacio de Versiones, FIND-S y Eliminación de Candidatos. Inducción de árboles de decisión. Algoritmo ID3 y derivados. Sesgo, ruido, sobre-especificación, sobre-generalización y poda. Aprendizaje como búsqueda heurística. Algoritmo STAR. Indicadores de performance y error. Aprendizaje basado en instancias y aprendizaje Bayesiano. Aprendizaje no supervisado. Clustering. Algoritmos aglomerativos y de partición. Introducción al Text Mining, aproximaciones NLP y ML. Combinación de múltiples modelos: Votación, Bagging, Boosting. Otros modelos de aprendizaje: SVM, Vere, Genéticos, Redes Neuronales, Analíticos, con teorías de dominio, basados en explicaciones, etc. Nuevas tendencias en Aprendizaje Automático.
Conocimiento previo requerido: Algoritmos
Los Métodos del Análisis Exploratorio de Datos tienen por objetivo proveer una síntesis global de un conjunto de datos sin hipótesis previas. El principio que guía este curso es introducir a los estudiantes en técnicas estadísticas multivariadas, y familiarizarlos con el software que se utiliza en sus aplicaciones y en la resolución de problemas diversos.
Contenidos mínimos:
Análisis exploratorio y confirmatorio. Reseña histórica. Revisión de métodos exploratorios; tablas, gráficos, diagramas de tallo y hoja, box-plot, análisis de normalidad. Técnicas descriptivas multidimensionales. Análisis en componentes principales. Análisis factorial de correspondencias. Métodos de clasificación y agrupamiento. Clasificación Jerárquica. K-medias. Caras de Chernov. Gráficos de estrellas. Gráficos de Rayos Sol. Gráficos de Andrews. Relación entre Análisis factorial y Clasificación. Árboles de decisión. Métodos de segmentación. Análisis discriminante. Análisis de datos.
Conocimiento previo requerido: Estadística
La materia estará orientada a conseguir que el alumno sea capaz de identificar los problemas que se producen en el cruce de información al importar datos provenientes de distintas fuentes y tomar decisiones tendientes a mitigar los efectos de esos problemas.
Explicar el funcionamiento de los algoritmos de reglas de asociación y sequential patterns
Analizar las mejoras / variantes propuestas a los algoritmos de reglas de asociación / sequential patterns. Resolver problemas de data Mining aplicando reglas de asociación/sequential patterns
Contenidos mínimos:
Presentación General de todos los algoritmos de minería de datos. Proceso de Descubrimiento del Conocimiento. Tipos de datos. Mecanismos de limpieza de los mismos. Reglas de asociación. Patrones secuenciales. Aspectos temporales de las reglas de asociación. Otras aplicaciones de las reglas de asociación.
Conocimiento previo requerido: Base de Datos
Que los alumnos aprendan a desarrollar análisis de data mining que sean competitivos con los de nivel profesional existentes en el mercado argentino.Contenidos mínimos:
Metodologías CRISP, Six sigma y SEMMA. Comparación de modelos. Nociones de Database Marketing. DataSets desbalanceados. Overfitting.
Conocimiento previo requerido: Minería de Datos y Análisis Inteligente de Datos.
Que los alumnos aprendan a desarrollar análisis de data mining que sean competitivos con los de nivel profesional existentes en el mercado argentino.
Contenidos mínimos:
Metodologías CRISP, Six sigma y SEMMA. Comparación de modelos. Nociones de Database Marketing. DataSets desbalanceados. Overfitting.
Conocimiento previo requerido: Minería de Datos y Análisis Inteligente de Datos
Se pretende que el alumno adquiera conocimientos que le permitan construir modelos predictivos mediante métodos de regresión múltiple y logística. Que adquiera nociones de estimación bayesiana y por máxima verosimilitud y pueda seleccionar los modelos adecuados para el tratamiento y solución correcta de los problemas tratados.
Contenidos mínimos:
Enfoques de la inferencia estadística. Estimación por Máxima Verosimilitud. Inferencia Bayesiana. Regresión lineal simple y múltiple. Estimación de mínimos cuadrados. Análisis de supuestos del modelo. Inferencia. Diagnósticos de Influencia. Multicolinealidad. Transformaciones. Variables dummies. Interacción. Métodos de selección de variables. Odds y Riesgo Relativo. Regresión logística binaria. Logits. Estimación MV. Inferencia en el modelo. Pruebas de ajuste de Hosmer y Lemeshow. Métodos de selección de variables.Medidas diagnósticas. Clasificación con Regresión logística. Regresión logística multinomial y ordinal.
Comparación de modelos y algoritmos. Evaluación y selección de modelos. LRT y devianza. Indicadores de ajuste y comparación más utilizados: AIC, BIC, RMSEA, KS, medidas de parsimonia, AUC, etc. Métodos gráficos: curvas ROC, gráficos lift, gráficos de ganancia, gráficos de riesgo, etc. Factor Bayes.
Redes bayesianas. Condición de Markov. Distribuciones asociadas a una RB. Aprendizajes en una RB. Propagación de la evidencia. Aprendizaje paramétrico: MV versus Bayesiano. Redes para clasificación. Naive Bayes. Algunos tópicos a desarrollar en los trabajos de intensificación: Nociones de muestreo y remuestreo. Validación cruzada. Bootstrap, Jacknife, y métodos relacionados.
Gibbs Samping: aplicaciones. Regresión Ridge y Lasso. Regresión por mínimos cuadrados parciales (PLSR). Tratamiento de datos faltantes.
Conocimiento previo requerido: Estadística
El objetivo consiste en impartir conocimientos conceptuales y prácticos ligados a la visualización de la información, utilizando los conocimientos ya adquiridos por los estudiantes de la Maestría en cuatrimestres anteriores. La formación y experiencia adquiridas en el curso permitirá a los alumnos estar preparados para el diseño, la implementación y la evaluación de visualizaciones interactivas o infografías.
Contenidos mínimos:
Técnicas de visualización de datos. Visualización de la Información vs. Visualización Científica. Ejemplos históricos. Modelos y marcos conceptuales: Tipos de datos (nominales, ordinales, cuantitativos, vectoriales, etc.). Datos uni- y multivaluados y multivariados. Datos no estructurados. Uso del color. Teoría del color. Aplicaciones en visualización de información. Percepción y visualización. El problema de la presentación, Foco y contexto, acercamiento semántico. Conectividad y conexiones. Visualización de grafos, redes, árboles. Aplicaciones en redes sociales. Mapas Temáticos, Galaxias, Galaxias de Noticias, Mapas de Kohonen. Sistemas de Información Geográfica. Visualización Geospacial.
Este Seminario tiene dos partes diferenciadas:
Preparación y concreción del plan de trabajo:
La primera parte está orientada a que los estudiantes reflexionen sobre el TFI, a partir de la revisión de los aspectos que componen la actividad y de herramientas de búsqueda bibliográfica.
Aporte de herramientas para la redacción del Trabajo Final Integrador:
La segunda parte está orientada a que los estudiantes adquieran conceptos de redacción científica, caracterizando los diversos aspectos que conforman un TFI. Sus objetivos específicos son:
Proporcionar elementos de organización y escritura de TFI.
Examinar la construcción de elementos discursivos específicos: introducción, metodología, resultados y discusión.
Discutir formatos de presentación de datos: tablas, figuras y textos.
Analizar el proceso de preparación y presentación de TFI.
Revisar el proceso de presentación del TFI: entrega, referato, correcciones y defensa.
Contenidos Mínimos:
Artículo científico y de TFI. Sentido y características de un TFI. Introducción. Objetivos. Metodología. Conceptos básicos de redacción. Búsqueda bibliográfica. Presentación de resultados. Discusión. Referencias. Entrega y correcciones del TFI
El taller está orientado a que las personas participantes reflexionen sobre su tema de tesis (o lo definan en caso de carecer de él), con revisión de aspectos de originalidad, factibilidad, coherencia, aplicabilidad, dimensión temporal, geográfica y de volumen del trabajo propuesto. Se trabajarán todos los pasos necesarios para la obtención de un proyecto o plan de tesis.
Contenidos mínimos:
Objeto de la tesis. Plan o proyecto de tesis. Criterios de evaluación del plan. Introducción, marco teórico, estado del arte. Factibilidad. Impacto. Objetivos. Hipótesis. Metodología. Equipo de dirección. Búsqueda bibliográfica. Conceptos de investigación científica.
Adquisición de conceptos de escritura científica, pasando revista a los diversos aspectos que conforman esta actividad.
Contenidos mínimos:
Objetivos y conceptos básicos. Etapas en la preparación de documentos. Metodología. Hallazgos o Resultados. Tablas. Figuras. Introducción, marco teórico y objetivos. Discusión y conclusiones. Referencias bibliográficas. Título y palabras clave. Resumen y Agradecimientos. Corrección y apreciación del manuscrito. Autoría. Criterios de elección de las revistas. Indización. Preparación y envío del manuscrito. Evaluación del manuscrito. Otros documentos académicos o científicos. Tesis de Posgrado. Ética y fraude científico. Presentaciones orales y en posters.
CURSOS OPTATIVOS
El objetivo central de este curso es la presentación de las arquitecturas clásicas de Redes Neuronales aplicadas en el área de la Minería de Datos. El énfasis está puesto en la resolución de problemas de clasificación y predicción.
Tradicionalmente, las estrategias de entrenamiento han sido la herramienta más utilizada para realizar el proceso de aprendizaje de la información disponible y por tal motivo, se dedica la primera mitad del curso a este enfoque. Esto implica establecer a priori un conjunto de características referidas a la red neuronal a utilizar que condicionan la eficacia y eficiencia de su funcionamiento. Como solución a este problema, la segunda mitad del curso analiza la incorporación de estrategias evolutivas aplicables al proceso de adaptación de las redes neuronales.
Contenidos mínimos:
Inspiración biológica. Modelo de neurona. Perceptrón simple y multicapa (MLP): arquitectura, formulación matemática del algoritmo de retropropagación. Inicialización. Redes neuronales con funciones de base radial (RBF): arquitectura, fronteras de decisión, algoritmos de entrenamiento. Mapas auto-organizativos SOM y GSOM. Cuantización vectorial con aprendizaje. Algoritmos Evolutivos. Algoritmos Genéticos. Operadores. Métodos para evolución de pesos y estructura.
Presentar los fundamentos de la minería de texto, sean provenientes de la Web o de otro tipo de fuentes de información textual. Los alumnos estarán capacitados para comprender, utilizar y modificar los sistemas de “crawling”, indexación, categorización y extracción de información.
Contenidos mínimos:
Introducción a Minería de Texto. Información textual. Fuentes estructuradas, semi-estructuradas y texto libre. Características de la Web. Crawling. Protocolos. Robots de navegación de la “web” (“Arañas”). Indexación y recuperación de información en la web. El modelo del Espacio Vectorial (‘Vector Space Model’). Esquemas de asignación de pesos. El esquema ‘tf-idf’. Asignación de un valor (‘score’) a los documentos. Medidas de Precisión, Recuperación y “F”. Extracción de Información. Búsqueda parametrizada o por dominios. Zonas de documentos. Wrappers/Scrappers. Procesamiento de XML. Ranking basado en conducta y en ‘links’. Análisis de ‘links’. Pagerank, pagerank por tópico. ‘hubs’ y autoridades, Spam. HITS. Comunidades. Clustering y Clasificación. Clasificación de textos y Métodos. Agrupamiento (“Clustering”) y sus Métodos. item Minado de Opiniones, afecto o subjetividad. Web Mining: Uso. Pre-procesamiento. Análisis de logs. Análisis de hits. Análisis de visitas. Análisis de conductas.
Conocer el problema estadístico de las múltiples comparaciones identificándolo como la verdadera y única causa del sobreajuste en la inferencia estadística (overfitting), aprender a identificarlo en los algoritmos de modelos predictivos, proveer soluciones al mismo de modo de obtener modelos no sesgados y sin sobreajuste por diseño. Aplicar dichas soluciones a las librerías existentes de árboles de decisión y gradient boosting.
Conocer y utilizar efectivamente las técnicas “estado del arte” de algoritmos y librerías de última generación de modelado predictivo sobre datos estructurados (XGBoost, LightGBM, CatBoost) y técnicas de explicación de modelos predictivos complejos como ser los valores Shapley
Aplicar en forma práctica a un problema concreto con datos y dimensiones reales las metodologías anteriores.
Contenidos Mínimos:
Comparación de Modelos Predictivos. Gradient Boosting Machines. Método de Walk Forward Optimization. Interpretación de modelos predictivos complejos.
Desarrollar los fundamentos básicos sobre los Sistemas de Data Warehousing. Se presentarán conceptos y técnicas de diseño utilizadas en estos sistemas para resolver aplicaciones relativas a la toma de decisiones. Mediante talleres se realizarán prácticas con herramientas de software que ofrecen soluciones a componentes de dichos sistemas.
Contenidos mínimos:
Sistemas de Data Warehouse. Conceptos Generales y Proceso de Diseño. Diseño Conceptual a partir de requerimientos o a partir de bases fuentes. Diseño Lógico Relacional. Procesos de Carga y Actualización. Técnicas de limpieza de datos. Arquitecturas de Sistemas de DW. Tecnologías de DBMS.
El objetivo de este curso es introducir al alumno en las herramientas de los SIG, junto a otras que los SIG requieren como lo son los software de SIG y algunas técnicas de teledetección.
Contenidos mínimos:
Elementos de un SIG: Software, Datos, Usuarios, Información. Sistemas de coordenadas terrestres: Geoide, Elipsoide, Proyecciones. Modelos de datos de un SIG: Raster, Vector y bases de datos relacionales. Entidades espaciales: Punto, Línea, Polígono. Raster. Georreferenciación, clasificación. Modelo Digital de Elevacione s. Modelización de datos espaciales y Modelos Cartográficos.
Introducir al maestrando en los principales métodos de análisis de series temporales, tanto desde la teoría cómo con ejemplos prácticos de aplicación
Contenidos mínimos:
Definición y representación de series temporales. Representación en los dominios del tiempo y la frecuencia. Métodos de preprocesamiento: representación, indización, segmentación, visualización y medidas de similaridad. Minería de series temporales: clustering, minería de patrones, clasificación, reglas de descubrimiento, predicciones. Aplicaciones biomédicas, en negocios y economía.
DIRECTORA ACADÉMICA
HAEDO, Ana Silvia
Doctora en Estadísticas Matemáticas – Université‚ Pierre et Marie Curie-Paris
Especialista en Estadística Matemática – Université‚ Pierre et Marie Curie-Paris
Profesora de Matemática – Facultad de Ciencias Exactas y Naturales
VICEDIRECTOR ACADÉMICO
CALZOLARI, Aldo
Doctor en Ciencias Biológicas – Universidad Nacional de Río Cuarto
Licenciado en Microbiología – Universidad Nacional de Río Cuarto
COMITÉ ACADÉMICO
KLIMOVSKY, Ernesto
Doctor en Tecnología Química – Universidad Nacional del Litoral
Ingeniero en Electrónica – UTN, Facultad Regional Paraná
DELRIEUX, Claudio Augusto
Doctor en Ciencias de la Computación – Universidad Nacional del Sur
Magister en Ciencias de la Computación – Universidad Nacional del Sur
Ingeniero Electrónico – Universidad Nacional del Sur
BURGOS, Enrique Sergio
Técnico Universitario en Electrónica – UTN, Facultad Regional Paraná
Ingeniero Electrónico – UTN, Facultad Regional Paraná
Magíster en Ingeniería en Sistemas de Información – UTN, Facultad Regional Santa Fé
DENICOLAY PACHECO, Gustavo Fernando
Magister en Dirección de Empresas – Centro de Estudios Macroeconómicos de Argentina
Ingeniero en Computación – Universidad de la República Oriental del Uruguay
Licenciado en Informática – Escuela Superior Latino Americana de Informática, ESLAI
LANZARINI Laura Cristina
Doctora en Ciencias Informática – Facultad de Informática. UNLP.
Licenciada en Informática – Facultad de Ciencias Exactas. UNLP.
Calculista Científico – Facultad de Ciencias Exactas. UNLP.
MINGO Graciela Laura
Magister en Metodología de la Investigación Científica y Tecnológica – Universidad Nacional de Entre Ríos.
Especialista en Política y Gerencia Social para las provincias del Centro – Universidad Nacional de Córdoba.
Especialista en Metodología de la Investigación Científica – Universidad Nacional de Entre Ríos.
Licenciada en Ciencia Política – Universidad Nacional de Rosario.
Facultad Regional Paraná. Subsecretaría de Posgrado y Capacitación Continua.
Av. Almafuerte 1033 Planta Alta.
Canales para Consultas:
Email: posgrado@frp.utn.edu.ar
Telefónica: (0343) 424-3054/3694 int.137
Presencial: Subsecretaria de Posgrado. UTN Facultad Regional Paraná. Almafuerte 1033 – 1er. Piso.
Horarios de atención: Lunes a viernes de 16:00 hs. a 20:00 hs.