Especialización en Minería de Datos

Aprobada por Consejo Superior Ordenanza CS 1759
Acreditada por CONEAU como carrera nueva. Dictamen en Acta 538

PREINSCRIPCIÓN
PREINSCRIPCIÓN ABIERTA a través del siguiente formulario:

FORMULARIO DE PREINSCRIPCIÓN

INSCRIPCIÓN

Para formalizar la inscripción el aspirante deberá presentar en la Subsecretaría de Posgrado la siguiente documentación:

CONDICIONES DE INGRESO

Podrán ser inscriptos en la Especialización en Minería de Datos aquellos profesionales que posean título superior de grado, licenciado o equivalente, otorgado por Universidad reconocida.
En todos los casos se realizará una evaluación de los candidatos al ingresar al programa para determinar el grado de correspondencia entre su formación, trayectoria y los requisitos de la carrera. La evaluación se realizará a través del análisis de antecedentes, entrevistas, y eventualmente, de otros elementos de juicio solicitados por el Director de la carrera y Comité Académico
COSTOS

Inscripción: $4.000
18 Cuotas: $8.500 (costo a marzo 2021)
El valor de la cuota se revisa semestralmente pudiendo tener ajustes en función de aumentos hora docente.
Descuentos para graduados y docentes de la UTN Paraná:
Graduados: 10%
Docentes: 25%
Además para docentes se otorgan becas por el 100% a través del departamento correspondiente.
DURACIÓN

Los cursos que integran el plan de estudio se desarrollan en 1,5 a 2 años.
El plazo máximo para cumplir con todas las obligaciones del Plan de es de 3 años a partir de la primera unidad curricular rendida.
REQUISITOS DE GRADUACIÓN

  1. Cumplir con la carga horaria fijada en el presente Plan de Estudios
  2. Aprobar la totalidad de los espacios curriculares correspondientes a la Especialización.
  3. Aprobar una prueba de suficiencia de idioma Inglés.
  4. Culminar los estudios en el tiempo máximo fijado por el Reglamento de Posgrado.
  5. Aprobar el Trabajo Final Integrador (TFI).

El TFI es de carácter individual y consiste en el desarrollo de un trabajo teórico-práctico sobre alguna problemática, área o tema desarrollado en la carrera. La integración se puede realizar a través de dos modalidades:

      • Un trabajo de proyecto o desarrollo innovador. Se trata del desarrollo de un proyecto o producto, que resulte de la aplicación de los saberes en la carrera o a la resolución de un problema del ámbito de la práctica profesional.
      • Un trabajo de investigación documental sobre alguna cuestión de interés en la temática de la carrera que constituya una instancia de reelaboración y síntesis. Consistirá en un trabajo de indagación sobre aspectos del tema seleccionado de modo integrador y desde una visión crítica.

PLAN DE ESTUDIO
La carrera consta de 9 cursos y 1 seminario de carácter obligatorio que cubren un total de 480 horas de cursado. Las horas reloj que corresponden a cada espacio curricular son teórico-prácticas.

Espacios Curriculares

Horas

Teóricas

Prácticas

Totales

Introducción al Software R

28

12

40

Estadística

28

12

40

Base de Datos

28

12

40

Minería de Datos

42

22

64

Aprendizaje Automático

42

22

64

Análisis Inteligente de Datos

42

22

64

Aplicaciones de Minería de Datos a Economía y Finanzas

30

18

48

Aplicaciones de Minería de Datos a Ciencia y Tecnología

30

18

48

Enfoque Estadístico del Aprendizaje

32

16

48

Seminario Integrador

18

6

24

TOTAL

320

160

480

CURSOS: Contenidos, días y horarios de cursado

CURSOS OBLIGATORIOS

Introducción al Software R
Objetivos:
Que el alumno, al finalizar el curso, sea capaz de:

      • utilizar el software libre R.
      • ejecutar e interpretar gráficas.
      • desarrollar funciones de estructuras y controles de secuencia.

Contenidos Mínimos:

      • Instalación y ayuda en R.
      • Listas, data frames, arreglos y matrices.
      • Visualización de datos.
      • Funciones en R.

Carga horaria: 40 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 17 hs.

Estadística
Objetivos:
Proveer los conocimientos básicos de probabilidad, distribuciones y métodos gráficos exploratorios para comprender y abordar los temas de Análisis Inteligente de datos y Enfoque Estadístico del aprendizaje
Contenidos mínimos:
Estadística Descriptiva: Medidas de Posición. Medidas de Dispersión o Variabilidad. Gráficos. Box-Plots. Construcción y análisis. Outliers. Inferencia estadística: Intervalos de confianza para los parámetros de una distribución normal. Intervalos de confianza de nivel asintótico. Test de hipótesis. Error tipo I y II. Test de hipótesis de nivel α para los parámetros de la distribución normal. Región de rechazo.
Carga horaria: 40 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 13 hs.
Base de Datos
Objetivos:
Se espera que los alumnos puedan trabajar con diferentes tipos de datos y convertir entre varios formatos de bases de datos, importar y exportar tablas en diferentes formatos (Microsoft Excel, Fuentes de datos ODBC, Archivos separados por comas y tabuladores, Reconocer los caracteres especiales). Manejo básico de SQL. Manejo básico de consultas a bases de datos.
Contenidos mínimos:
Base de datos. Características. Diseño. Independencia de datos. Modelos: Entidad-Relación, Conceptual, Lógico. Transformación del modelo Entidad-Relación al modelo relacional. Álgebra Relacional. Operadores básicos. Operadores complejos. SQL como Lenguaje de Consulta. Cláusulas SQL. Operadores avanzados. El estándar SQL 2011. Diseño Relacional. Normalización. Formas Normales. Dependencias funcionales. Axiomas de Armstrong. Importar y exportar datos con diferentes formatos a tablas de la base de datos relacional. Conexión a la base de datos.
Carga horaria: 40 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 13 hs.
Aprendizaje automático
Objetivos:
El objetivo del dictado de esta materia es que el alumnado adquiera los conocimientos generales y prácticos del estado del arte en Aprendizaje Automático para su aplicación en la práctica profesional en Minería de Datos. Por medio del curso el alumno deberá:
Adquirir los conceptos básicos del aprendizaje computacional, sus fundamentos teóricos y una aproximación a sus bases formales;
Conocer los principales modelos y algoritmos de aprendizaje computacional;
Conocer metodologías que permitan seleccionar el modelo apropiado a los casos prácticos que se le presenten;
Internalizar los conceptos por medio de la práctica con herramientas de libre disponibilidad establecidas en el mundo académico
Contenidos mínimos:
Introducción conceptual al aprendizaje automático. Introducción inductiva al procesamiento no tradicional de datos. Estructura de sistemas de aprendizaje y notación estándar. Métodos inferenciales no deductivos, generalización y noción de orden parcial. Algoritmos: Espacio de Versiones, FIND-S y Eliminación de Candidatos. Inducción de árboles de decisión. Algoritmo ID3 y derivados. Sesgo, ruido, sobre-especificación, sobre-generalización y poda. Aprendizaje como búsqueda heurística. Algoritmo STAR. Indicadores de performance y error. Aprendizaje basado en instancias y aprendizaje Bayesiano. Aprendizaje no supervisado. Clustering. Algoritmos aglomerativos y de partición. Introducción al Text Mining, aproximaciones NLP y ML. Combinación de múltiples modelos: Votación, Bagging, Boosting. Otros modelos de aprendizaje: SVM, Vere, Genéticos, Redes Neuronales, Analíticos, con teorías de dominio, basados en explicaciones, etc. Nuevas tendencias en Aprendizaje Automático.
Conocimiento previo requerido: Algoritmos
Carga horaria: 64 hs
Días y horarios cursado: se cursa en 2 semana intensivas (4ta. Semana de julio y 3era.de setiembre) Lunes a viernes de 18 a 23 hs y sábados de 09 a 17 hs.
Análisis Inteligente de datos
Objetivos:
Los Métodos del Análisis Exploratorio de Datos tienen por objetivo proveer una síntesis global de un conjunto de datos sin hipótesis previas. El principio que guía este curso es introducir a los estudiantes en técnicas estadísticas multivariadas, y familiarizarlos con el software que se utiliza en sus aplicaciones y en la resolución de problemas diversos.
Contenidos mínimos:
Análisis exploratorio y confirmatorio. Reseña histórica. Revisión de métodos exploratorios; tablas, gráficos, diagramas de tallo y hoja, box-plot, análisis de normalidad. Técnicas descriptivas multidimensionales. Análisis en componentes principales. Análisis factorial de correspondencias. Métodos de clasificación y agrupamiento. Clasificación Jerárquica. K-medias. Caras de Chernov. Gráficos de estrellas. Gráficos de Rayos Sol. Gráficos de Andrews. Relación entre Análisis factorial y Clasificación. Árboles de decisión. Métodos de segmentación. Análisis discriminante. Análisis de datos.
Conocimiento previo requerido: Estadística
Carga horaria: 64 hs
Días y horarios cursado: jueves y viernes de 18 a 23 hs y sábados de 09 a 17 hs.
Minería de Datos
Objetivos:
La materia estará orientada a conseguir que el alumno sea capaz de identificar los problemas que se producen en el cruce de información al importar datos provenientes de distintas fuentes y tomar decisiones tendientes a mitigar los efectos de esos problemas.
Explicar el funcionamiento de los algoritmos de reglas de asociación y sequential patterns
Analizar las mejoras / variantes propuestas a los algoritmos de reglas de asociación / sequential patterns. Resolver problemas de data Mining aplicando reglas de asociación/sequential patterns

Contenidos mínimos:
Presentación General de todos los algoritmos de minería de datos. Proceso de Descubrimiento del Conocimiento. Tipos de datos. Mecanismos de limpieza de los mismos. Reglas de asociación. Patrones secuenciales. Aspectos temporales de las reglas de asociación. Otras aplicaciones de las reglas de asociación.
Conocimiento previo requerido: Base de Datos
Carga horaria: 64 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 17 hs.

Aplicaciones de Minería de Datos a la Economía y Finanzas
Objetivos:
Que los alumnos aprendan a desarrollar análisis de data mining que sean competitivos con los de nivel profesional existentes en el mercado argentino.
Contenidos mínimos:
Metodologías CRISP, Six sigma y SEMMA. Comparación de modelos. Nociones de Database Marketing. DataSets desbalanceados. Overfitting.
Conocimiento previo requerido: Minería de Datos y Análisis Inteligente de Datos
Carga horaria: 48 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 17 hs.
Aplicaciones de Minería de Datos a la Ciencia y la Tecnología
Objetivos:
Que los alumnos aprendan a desarrollar análisis de data mining que sean competitivos con los de nivel profesional existentes en el mercado argentino.
Contenidos mínimos:
Metodologías CRISP, Six sigma y SEMMA. Comparación de modelos. Nociones de Database Marketing. DataSets desbalanceados. Overfitting.
Conocimiento previo requerido: Minería de Datos y Análisis Inteligente de Datos
Carga horaria: 48 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 17 hs.
Enfoque Estadístico del Aprendizaje
Objetivos:
Se pretende que el alumno adquiera conocimientos que le permitan construir modelos predictivos mediante métodos de regresión múltiple y logística. Que adquiera nociones de estimación bayesiana y por máxima verosimilitud y pueda seleccionar los modelos adecuados para el tratamiento y solución correcta de los problemas tratados.
Contenidos mínimos:
Enfoques de la inferencia estadística. Estimación por Máxima Verosimilitud. Inferencia Bayesiana. Regresión lineal simple y múltiple. Estimación de mínimos cuadrados. Análisis de supuestos del modelo. Inferencia. Diagnósticos de Influencia. Multicolinealidad. Transformaciones. Variables dummies. Interacción. Métodos de selección de variables. Odds y Riesgo Relativo. Regresión logística binaria. Logits. Estimación MV. Inferencia en el modelo. Pruebas de ajuste de Hosmer y Lemeshow. Métodos de selección de variables.Medidas diagnósticas. Clasificación con Regresión logística. Regresión logística multinomial y ordinal.
Comparación de modelos y algoritmos. Evaluación y selección de modelos. LRT y devianza. Indicadores de ajuste y comparación más utilizados: AIC, BIC, RMSEA, KS, medidas de parsimonia, AUC, etc. Métodos gráficos: curvas ROC, gráficos lift, gráficos de ganancia, gráficos de riesgo, etc. Factor Bayes.
Redes bayesianas. Condición de Markov. Distribuciones asociadas a una RB. Aprendizajes en una RB. Propagación de la evidencia. Aprendizaje paramétrico: MV versus Bayesiano. Redes para clasificación. Naive Bayes. Algunos tópicos a desarrollar en los trabajos de intensificación: Nociones de muestreo y remuestreo. Validación cruzada. Bootstrap, Jacknife, y métodos relacionados.
Gibbs Samping: aplicaciones. Regresión Ridge y Lasso. Regresión por mínimos cuadrados parciales (PLSR). Tratamiento de datos faltantes.
Conocimiento previo requerido: Estadística
Carga horaria: 48 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 17 hs.
Seminario Integrador
Objetivos:
Este Seminario tiene dos partes diferenciadas:

      • Preparación y concreción del plan de trabajo:

La primera parte está orientada a que los estudiantes reflexionen sobre el TFI, a partir de la revisión de los aspectos que componen la actividad y de herramientas de búsqueda bibliográfica.

      • Aporte de herramientas para la redacción del Trabajo Final Integrador:

La segunda parte está orientada a que los estudiantes adquieran conceptos de redacción científica, caracterizando los diversos aspectos que conforman un TFI. Sus objetivos específicos son:

      • Proporcionar elementos de organización y escritura de TFI.
      • Examinar la construcción de elementos discursivos específicos: introducción, metodología, resultados y discusión.
      • Discutir formatos de presentación de datos: tablas, figuras y textos.
      • Analizar el proceso de preparación y presentación de TFI.
      • Revisar el proceso de presentación del TFI: entrega, referato, correcciones y defensa.

Contenidos Mínimos:
Artículo científico y de TFI. Sentido y características de un TFI. Introducción. Objetivos. Metodología. Conceptos básicos de redacción. Búsqueda bibliográfica. Presentación de resultados. Discusión. Referencias. Entrega y correcciones del TFI
Carga horaria: 24 hs
Días y horarios cursado: viernes de 18 a 22 hs y sábados de 09 a 13 hs.

DIRECCIÓN Y COMITÉ ACADÉMICO

DIRECTORA ACADÉMICA


HAEDO, Ana Silvia
Doctora en Estadísticas Matemáticas – Université‚ Pierre et Marie Curie-Paris
Especialista en Estadística Matemática – Université‚ Pierre et Marie Curie-Paris
Profesora de Matemática – Facultad de Ciencias Exactas y Naturales

COMITÉ ACADÉMICO


KLIMOVSKY, Ernesto
Doctor en Tecnología Química – Universidad Nacional del Litoral
Ingeniero en Electrónica – UTN, Facultad Regional Paraná
DELRIEUX, Claudio Augusto
Doctor en Ciencias de la Computación – Universidad Nacional del Sur
Magister en Ciencias de la Computación – Universidad Nacional del Sur
Ingeniero Electrónico – Universidad Nacional del Sur
BURGOS, Enrique Sergio
Técnico Universitario en Electrónica – UTN, Facultad Regional Paraná
Ingeniero Electrónico – UTN, Facultad Regional Paraná
Magíster en Ingeniería en Sistemas de Información – UTN, Facultad Regional Santa Fé
DENICOLAY PACHECO, Gustavo Fernando
Magister en Dirección de Empresas – Centro de Estudios Macroeconómicos de Argentina
Ingeniero en Computación – Universidad de la República Oriental del Uruguay
Licenciado en Informática – Escuela Superior Latino Americana de Informática, ESLAI
LANZARINI Laura Cristina
Doctora en Ciencias Informática – Facultad de Informática. UNLP.
Licenciada en Informática – Facultad de Ciencias Exactas. UNLP.
Calculista Científico – Facultad de Ciencias Exactas. UNLP.
MINGO Graciela Laura
Magister en Metodología de la Investigación Científica y Tecnológica – Universidad Nacional de Entre Ríos.
Especialista en Política y Gerencia Social para las provincias del Centro – Universidad Nacional de Córdoba.
Especialista en Metodología de la Investigación Científica – Universidad Nacional de Entre Ríos.
Licenciada en Ciencia Política – Universidad Nacional de Rosario.

CUERPO DOCENTE

INTRODUCCIÓN AL SOFTWARE R


CASTRO KURISS, Claudia Adriana
Magister en Estadística Matemática – Facultad Ciencias Exactas. Universidad de Buenos Aires.
Especialista en Estadística Matemática – Facultad Ciencias Exactas. Universidad de Buenos Aires.
Lic. Ciencias Matemáticas – Facultad Ciencias Exactas. Universidad de Buenos Aires.

ESTADÍSTICA


RAMÍREZ, Roxana Guadalupe Doctora en Ingeniería con Mención en Ciencias Agropecuarias – Universidad Nacional de Entre Ríos Facultad de Ciencias Agropecuarias
Máster en Estadística Aplicada – Universidad Nacional de España – Facultad de Ciencias Económicas y Empresariales.
Máster en Educación – Universidad Nacional de Entre Ríos – Facultad de Ciencias de la Educación.
Ingeniera Civil – Universidad Tecnológica Nacional – Facultad Regional Paraná
Profesora de Matemática, Física y Cosmografía – Instituto Nacional de Enseñanza Superior del Profesorado – Paraná

BASE DE DATOS


GOLOBISKY María Fernanda Doctora en Ingeniería, mención en Ingeniería en Sistemas de Información. Universidad Tecnológica Nacional – Facultad Regional Santa Fe
Licenciada en Sistemas – Facultad de Ciencias Exactas y Naturales y Agrimensura de la Universidad Nacional del Nordeste – Corrientes
BURGOS, Enrique Sergio
Técnico Universitario en Electrónica – UTN, Facultad Regional Paraná
Ingeniero Electrónico – UTN, Facultad Regional Paraná
Master en Ingeniería en Sistemas de Información – UTN, Facultad Regional Santa Fe

MINERÍA DE DATOS


RUBIOLO, Mariano Doctor en Ingeniería. Mención en Sistemas de Información. Universidad Tecnológica Nacional, Facultad Regional Santa Fe.
Ingeniero en Sistemas de Información. Universidad Tecnológica Nacional – Facultad Regional Santa Fe.
DÓMINA, María Cecilia
Especialista en Explotación de Datos y Descubrimiento del Conocimiento – Universidad Nacional del Sur
Licenciada en Ciencias de la Computación – Colegio Hispano Argentino

APRENDIZAJE AUTOMÁTICO


RONCHETTI, Franco
Doctor en Ciencias Informáticas – Universidad Nacional de La Plata
Analista Programador Universitario – Universidad Nacional de La Plata
Licenciado en Informática – Universidad Nacional de La Plata

ANÁLISIS INTELIGENTE DE DATOS


CHAN, Débora
Especialista en Docencia Universitaria. Universidad Tecnológica Nacional. Facultad Regional Buenos Aires.
Especialista en Estadística Matemática Universidad de Buenos Aires. Facultad de Ciencias Exactas y Naturales. Instituto de Cálculo.
RAMÍREZ, Roxana Guadalupe
Doctora en Ingeniería con Mención en Ciencias Agropecuarias – Universidad Nacional de Entre Ríos Facultad de Ciencias Agropecuarias
Máster en Estadística Aplicada – Universidad Nacional de España – Facultad de Ciencias Económicas y Empresariales.
Máster en Educación – Universidad Nacional de Entre Ríos – Facultad de Ciencias de la Educación.
Ingeniera Civil – Universidad Tecnológica Nacional – Facultad Regional Paraná
Profesora de Matemática, Física y Cosmografía – Instituto Nacional de Enseñanza Superior del Profesorado – Paraná

APLICACIONES DE MINERÍA DE DATOS A ECONOMÍA Y FINANZAS


DENICOLAY PACHECO, Gustavo Fernando
Magister en Dirección de Empresas – Centro de Estudios Macroeconómicos de Argentina
Ingeniero en Computación – Universidad de la República Oriental del Uruguay
Licenciado en Informática – Escuela Superior Latino Americana de Informática, ESLAI

APLICACIONES DE MINERÍA DE DATOS A CIENCIA Y TECNOLOGÍA


POLONI, Pablo Magister en Explotación de Datos y Descubrimiento del Conocimiento. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires.
Especialista en Explotación de Datos y Descubrimiento del Conocimiento. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires.
Licenciado en Informática. Facultad de Ingeniería y Ciencias Exactas, Universidad Argentina de la Empresa
BUTTI, Matías
Magister en Explotación de Datos y Descubrimiento del Conocimiento. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires.
Especialista en Explotación de Datos y Descubrimiento del Conocimiento. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires.
Licenciado en Informática. Facultad de Informática. Universidad Nacional de La Plata
Analista de Computación. Facultad de Informática. Universidad Nacional de La Plata.
BAYLE, Federico
Magister en Explotación de Datos y Descubrimiento del Conocimiento. Facultad de Ciencias Exactas y Naturales. Universidad de Buenos Aires.
Licenciado en Economía. Universidad de Buenos Aires.

ENFOQUE ESTADÍSTICO DEL APRENDIZAJE


PEREZ Silvia Noemí
Magister Scientiae en Biometría y Mejoramiento, con orientación en Estadística. Escuela Para Graduados de la Facultad de Agronomía. Universidad de Buenos Aires.
Licenciada en Ciencias Matemáticas. Facultad de Ciencias Exactas y Naturales. Universidad Nacional del Nordeste.
RAMÍREZ, Roxana Guadalupe
Doctora en Ingeniería con Mención en Ciencias Agropecuarias – Universidad Nacional de Entre Ríos Facultad de Ciencias Agropecuarias
Máster en Estadística Aplicada – Universidad Nacional de España – Facultad de Ciencias Económicas y Empresariales.
Máster en Educación – Universidad Nacional de Entre Ríos – Facultad de Ciencias de la Educación.
Ingeniera Civil – Universidad Tecnológica Nacional – Facultad Regional Paraná
Profesora de Matemática, Física y Cosmografía – Instituto Nacional de Enseñanza Superior del Profesorado – Paraná

SEMINARIO INTEGRADOR


CALZOLARI, Aldo
Doctor en Ciencias Biológicas – Universidad Nacional de Río Cuarto
Licenciado en Microbiología – Universidad Nacional de Río Cuarto


Facultad Regional Paraná. Subsecretaría de Posgrado y Capacitación Continua.
Av. Almafuerte 1033 Planta Alta.

Canales para Consultas:
Email: posgrado@frp.utn.edu.ar
Telefónica: (0343) 424-3054/3694 int.137
Presencial: Subsecretaria de Posgrado. UTN Facultad Regional Paraná. Almafuerte 1033 – 1er. Piso.
Horarios de atención: Lunes a viernes de 16:00 hs. a 20:00 hs.