DMI – Data Mining aplicado a la Ingeniería Descubriendo conocimiento a partir de los datos de la organización
Curso de Posgrado On-line Del 18 de mayo al 14 de agosto de 2015 El conocimiento es el activo de mayor valor en los negocios ingenieriles, pues permite diferenciarse de la competidores y gestionar efectivamente el resto de los activos de la organización. El conocimiento existe en todos las funciones del negocio, incluyendo compras, marketing, diseño, manufactura, producción, mantenimiento y distribución, pero es de difícil identificación, captura y gestión. El uso de las tecnologías de bases de datos y las técnicas estadísticas son bien conocidas en las áreas de ingeniería. Las primeras aplicaciones de inteligencia artificial en ingeniería datan de los ´80. Sin embargo el avance de las tecnologías de la información, los sistemas de adquisición de datos y las técnicas de aprendizaje automático han llevado a desarrollos que permiten descubrir conocimiento de las bases de datos (KDD - Knowledge Data Discovery). Los datos de casi todos los procesos de una organización, tales como el diseño de productos y procesos, la planificación de la producción, el control, el mantenimiento de activos, etc., son monitoreados y almacenados. Estos reservorios de datos son una fuente de alto potencial de nuevo conocimiento para la organización, y es aquí donde el Data Mining puede realizar un aporte muy importante. El conocimiento extractado puede utilizarse para modelar, clasificar, y hacer predicciones para numerosas aplicaciones. El uso de data mining aplicado a procesos de manufactura comenzó en los ´90 y está gradualmente expandiéndose al resto de las actividades de la ingeniería. El uso actual abarca tareas como: mantenimiento predictivo, detección de fallas, diseño, producción, aseguramiento de la calidad, planificación, y sistemas de soporte de decisión. El curso de posgrado de Data Mining aplicado a la Ingeniería (DMI) que ofrece el Área de Posgrado de la Facultad de Ciencias Fisicomatemáticas e Ingeniería de la Universidad Católica Argentina le brinda al participante información y práctica suficiente para implementar aplicaciones de descubrimiento de conocimiento a partir de los datos recolectados y almacenados en su organización. La implementación de la modalidad on-line permite que los alumnos que se encuentran alejados de la ciudad de Buenos Aires puedan realizar el curso en forma virtual por medio de una plataforma de elearning interactiva, en el horario y días que cada uno determine y a un ritmo semanal. La formación virtual se complementa con una clase optativa presencial en Buenos Aires, para lo cual se requiere de un único viaje de traslado. En la misma se vivencia una aplicación real y se discuten los trabajos de aplicación realizados por los diversos grupos de participantes.
CURSO DE POSGRADO ON-LINE | DATA MINING APLICADO A LA INGENIERÍA – 2015
Participantes El curso se dirige a profesionales de la ingeniería y técnicos que participan de los procesos relacionados con el diseño de productos y procesos, la planificación de la producción, el control, el mantenimiento de activos, la gestión ambiental, así como todas aquellas actividades del negocio factibles de identificar, capturar y gestionar conocimiento, a profesionales de áreas staff relacionados con las anteriores y consultores de empresas.
Objetivos del curso 1. Presentar de manera sistemática las técnicas y herramientas que permiten analizar grandes cantidades de datos y descubrir relaciones ocultas pero presentes en ellos de manera de contribuir con nueva información al proceso de toma de decisiones y predicción de fenómenos futuros. 2. Capacitar en la aplicación y el uso de las técnicas y herramientas necesarias para desarrollar modelos de minería de datos de manera que el participante, luego de haber terminado el curso, esté en condiciones de aplicarlos en su tarea diaria. 3. Aplicar los contenidos aprendidos en casos de aplicación relacionados con las disciplinas de la ingeniería de cada participante o en casos simulados presentados por el docente: producción, mantenimiento, medioambiente, logística, diseño industrial, desarrollo de software, marketing.
Cronograma MÓDULO
MODALIDAD
CARGA HORARIA
Introducción a la minería de datos
7
Selección y pre-procesamiento de datos
5
Clasificación
ON-LINE
20
Clustering
18/5 al 9/8/15
5
Métodos avanzados
10
Casos de aplicación
10
Demostración MicroStrategy y presentación de trabajos finales.
PRESENCIAL 14/8/15
8 65 Horas
Contenido de las Asignaturas Módulo 1: Introducción a la minería de datos ¿Qué es y qué no es Data Mining?. Aplicaciones de ingeniería de la minería de datos: producción, mantenimiento, medioambiente, logística, marketing. Introducción a las herramientas de minería de datos: métodos predictivos y descriptivos. Tareas de Data Mining: clasificación, agrupamiento (clustering), descubrimiento de reglas de asociación, descubrimiento de patrones secuenciales, regresión, detección de anomalías. Módulo 2: Selección y pre-procesamiento de datos Introducción a los proyectos de inteligencia de negocios (Business Intelligence). Manejo de datos e información. Bases de datos (Data Warehousing). Selección e integración de datos. CURSO DE POSGRADO ON-LINE | DATA MINING APLICADO A LA INGENIERÍA – 2015
Pre-procesamiento de datos: limpieza, integración, transformación, reducción, y discretización de datos. Módulo 3: Clasificación Ejemplos de problemas de clasificación. Clasificadores perezosos (eager learners) y ansiosos (lazy learners o instance learners). Árboles de decisión. Clasificadores basados en reglas. Métodos bayesianos: Naïve Bayes y Redes Bayesianas. Modelos lineales: regresión, regresión logística. Máquinas de soporte vectorial (Support Vector Machines). Redes Neuronales: perceptrón multicapa. Vecinos más cercanos. Implementación de clasificadores con paquete de software libre WEKA (Universidad de Waikato, Nueva Zelandia). Aspectos prácticos al implementar clasificadores: sobreajuste, subajuste, valores faltantes, expresividad, evaluación y comparación de modelos (métricas y métodos). Análisis de casos. Módulo 4: Clustering Aplicaciones del análisis de clustering: descriptiva y sumarización. Clasificación de de clusters: jerárquico/particional, exclusivos/no-exclusivos, fuzzy/no-fuzzy, parcial/completo, heterogéneo/homogéneo. Tipo de clusters: bien separados, basados en centros, contiguos, basados en densidad, conceptuales, descritos por una función objetivo. Medidas de similaridad. Algoritmos de clustering: vecinos más cercanos, clustering jerárquico y basado en densidad. Análisis de casos. Módulo 5: Métodos avanzados Reducción de la dimensionalidad. Análisis de componentes principales. Análisis de componentes independientes. Redes neuronales aplicadas a la reducción de la dimensión. Análisis de casos. Clasificadores de ensamble. Clasificadores basados en las técnicas de boosting, bagging, stacking, y aleatoriedad. Módulo 6: Casos de aplicación Introducción a los métodos de regresión múltiple y aplicación de la regresión LASSO en la producción de azúcar a partir de la caña de azúcar. Las redes neuronales aplicadas a un proceso de envoltura de caramelos. Determinación de la causa del desprendimiento de las camisas de los pistones en una fábrica de motores de explosión empleando la metodología de Clustering. Aplicación de la reducción de dimensionalidad en un proceso de pasteurización de leche. Módulo 7: Trabajo final El trabajo final se realiza en forma grupal y tiene como finalidad que los participantes apliquen los conocimientos adquiridos durante el curso en la resolución de problemas de casos reales en sus organizaciones.
CURSO DE POSGRADO ON-LINE | DATA MINING APLICADO A LA INGENIERÍA – 2015
Desarrollo La modalidad del desarrollo del curso consiste de 16 clases semanales de régimen “on-line” y 1 clase presencial “optativa” en la sede de la UCA (Ciudad de Buenos Aires) en el horario de 9.00 a 18.00 hs. El curso tiene una duración total de 65 horas. MODALIDAD “ON-LINE” Las clases virtuales se cursan vía Internet y requieren de una dedicación semanal de aproximadamente 2,5 horas en Internet (no continuas) y 2,5 horas off-line en el día y horario que el alumno “determine” y a un ritmo de “una” clase por semana. Se requiere de una PC con conexión a Internet y placa de sonido. La metodología empleada incluye el acceso on-line del material didáctico y la recepción diferida de las clases en formato de voz/texto junto a las diapositivas empleadas por el docente. Las clases poseen una serie de actividades individuales asociadas (ejercicios, análisis de casos y desarrollo de trabajos prácticos). Al completar cada módulo se evalúan los conocimientos adquiridos, lo cual habilita al participante a continuar con la cursada del siguiente módulo. Los participantes tienen la posibilidad de participar en foros de discusión con otros participantes, foros y chat con los integrantes de su grupo y consultas personales con el coordinador del curso y con el profesor correspondiente. La plataforma de e-learning interactiva empleada (Distance Educational Network), les da la posibilidad de comunicarse en tiempo real y en diferido con textos, audio, video y gráficos.
AULA VIRTUAL
Le aconsejamos acceder a la siguiente DEMOSTRACIÓN para conocer la dinámica del curso: http://www.dednet.net/institucion/uca/fi/demo.html
Certificación Certificado de Asistencia: deberán completar la cursada de la modalidad “on-line”. Certificado de Aprobación: los alumnos que cumplan el requisito de asistencia y aprueben el Trabajo Final grupal pueden acceder al certificado de aprobación del curso.
Admisión Graduados universitarios, graduados de carreras terciarias, idóneos o ejecutivos previa comprobación de conocimientos necesarios. Lectura de material en idioma inglés. Documentación a enviar por E-mail para la inscripción:
Copia legalizada del Título universitario (de corresponder) Currículo Vitae Copia del DNI (argentinos) o Documento de Identidad vigente (extranjeros) Foto carnet (formato JPG o similar)
Aranceles Para residentes en la Argentina Matrícula: $ 2.600.- (mayo) y 2 cuotas de: $ 2.600.- (junio y julio)
CURSO DE POSGRADO ON-LINE | DATA MINING APLICADO A LA INGENIERÍA – 2015
Pago total al contado (hasta la 1ra. semana de curso inclusive): $ 7.020.Los aranceles están expresado en Pesos de la República Argentina ($ AR).
Para residentes fuera de la Argentina Arancel total: USD 1.000.El arancel está expresado en Dólares Estadounidenses (USD) e incluye gastos de envío.
Cuerpo Académico Director Ing. Pedro UNIVASO Doctorando en Ingeniería, UBA. Ingeniero Electromecánico orientación “Electrónica”, UBA. Programa de Desarrollo Directivo, IAE Business School, Universidad Austral. Consultor en Capacitación Empresarial & E-learning. Instructor externo en Tenaris University. Director General del Instituto Madero – Formación y Perfeccionamiento Directivo. Investigador invitado del Laboratorio de Investigaciones Sensoriales, UBA-CONICET. Coordinador de Curso y docente de cursos de posgrado en la Facultad de Ciencias Fisicoquímicas e Ingeniería, UCA. Cuerpo Docente C.C. Esteban ALONSO Computador Científico, UBA. Maestría en Tecnología Informática Aplicada a la Educación, UNLP. Profesor en la Maestría en Data Mining, en la Especialización para la Planificación y Gestión de las Tecnología de la Información y en la Diplomatura Gestión Estratégica de Procesos con Tecnología de la Información, en la Universidad Austral. Profesor invitado de Marketing Avanzado en UCEMA. Fue profesor titular en la Maestría de Data Mining & Knowledge Discovery, UBA. Instructor de Business Intelligence en la Universidad Telecom y Tenaris University. Socio Fundador SWAP Argentina. Previamente Socio Fundador de Qualisys y Socio en Grant Thornton Argentina. MSc Ing. Lic. Daniel FIRKA Ingeniero Industrial, ITBA Instituto Tecnológico de Bs.As. Licenciado en Sociología, Universidad del Salvador. MSc Ingeniería Biomédica, Universidad Favaloro. MSc Statistics, University of Toronto. PhD Candidate en Industrial and Mechanical Engineering, University of Toronto. Arquitecto principal y desarrollador en DRUIDA Software & Consulting. Integrante del Consejo Directivo del Instituto Argentino para la Calidad (IAPC). Miembro de la Asociación Americana para la Calidad (ASQ) con las siguientes certificaciones: CQE: Certified Quality Engineer, CSQE: Certified Software Quality Engineer, CRE: Certified Reliability Engineer, CCT: Certified Calibration Technician, CMQ/OE: Certified Manager of Quality/Organizational Excellence. Docente en la UCA, Instituto Argentino para la Calidad, Universidad Nacional de General Sarmiento, y Universidad Arcor. Ing. Pedro UNIVASO Director.
Informes e Inscripción Secretaría Cursos de Posgrado Facultad de Ciencias Fisicomatemáticas e Ingeniería - Universidad Católica Argentina Av. Alicia M. de Justo 1600 - (1107) Puerto Madero - Ciudad de Buenos Aires - Argentina Tel: (54-11) 4338-0756 / 0757 / 0758.
[email protected] // www.uca.edu.ar
CURSO DE POSGRADO ON-LINE | DATA MINING APLICADO A LA INGENIERÍA – 2015