Para cursar esta materia es aconsejable haber cursado los módulos de Formación Básica (Módulo I) y el módulo Común a la Rama de Informática (Módulo II).
Esta asignatura se apoya en las competencias y los conocimientos adquiridos en las asignaturas:
- Lógica
- Estadística
- Diseño de Algoritmos
- Sistemas inteligentes
- Sistemas Basados en el Conocimiento
La asignatura se ubica en la intensificación de Computación, en el ámbito de las asignaturas de la Inteligencia Artificial. La Minería de datos, y el aprendizaje automático en general, están ligados al campo de la estadística y de la algorítmica, y abordan las técnicas para la extracción de conocimiento implícito en conjuntos de datos. En los últimos años, estas disciplinas están ganando importancia debido al incremento en la producción de datos -propiciado por fenómenos como por ejemplo el auge de internet o las redes sociales - o el desarrollo de nuevas técnicas para la obtención de información genética. Desde el punto de vista profesional, cada vez existe una mayor demanda de analistas de datos en ámbitos tan diversos como el márketing, el análisis de mercados, la seguridad, o la biología.
Competencias propias de la asignatura | |
---|---|
Código | Descripción |
CM05 | Capacidad para adquirir, obtener, formalizar y representar el conocimiento humano en una forma computable para la resolución de problemas mediante un sistema informático en cualquier ámbito de aplicación, particularmente los relacionados con aspectos de computación, percepción y actuación en ambientes o entornos inteligentes. |
CM07 | Capacidad para conocer y desarrollar técnicas de aprendizaje computacional y diseñar e implementar aplicaciones y sistemas que las utilicen, incluyendo las dedicadas a extracción automática de información y conocimiento a partir de grandes volúmenes de datos. |
INS05 | Capacidad para argumentar y justificar lógicamente las decisiones tomadas y las opiniones. |
UCLM03 | Correcta comunicación oral y escrita. |
Resultados de aprendizaje propios de la asignatura | |
---|---|
Descripción | |
Conocer y desarrollar técnicas de aprendizaje computacional, tanto supervisado como no supervisado, y diseñar e implementar aplicaciones y sistemas que las utilicen. | |
Desarrollar e implementar un sistema de recuperación de la información de tamaño pequeño a mediano. | |
Describir y aplicar las distintas fases del proceso de descubrimiento de extracción del conocimiento a partir de grandes volúmenes de datos. | |
Resultados adicionales | |
Descripción | |
Obtener resultados concluyentes fruto del proceso de extracción del conocimiento y ser capaz de presentarlos y justificarlos |
Actividad formativa | Metodología | Competencias relacionadas | ECTS | Horas | Ev | Ob | Descripción | |
Enseñanza presencial (Teoría) [PRESENCIAL] | Método expositivo/Lección magistral | CM05 CM07 INS05 | 1.26 | 31.5 | N | N | Se usará para introducir los principales conceptos de cada tema. | |
Prueba final [PRESENCIAL] | Pruebas de evaluación | CM05 CM07 INS05 UCLM03 | 0.1 | 2.5 | S | S | Corresponde al examen oficial de la asignatura. De carácter individual. | |
Talleres o seminarios [PRESENCIAL] | Método expositivo/Lección magistral | CM05 CM07 INS05 | 0.08 | 2 | N | N | Se realizará un seminario en laboratorio de las herramientas/APIs usadas para la implementación de las prácticas e ilustración de los casos de estudio (Python, Weka, etc). Corresponde a la práctica 0. | |
Enseñanza presencial (Prácticas) [PRESENCIAL] | Método expositivo/Lección magistral | CM05 CM07 INS05 | 0.06 | 1.5 | N | N | Se usará la primera media hora de la primera sesión correspondiente a cada una de las tres prácticas obligatorias para describir el trabajo a realizar, el material disponible y el entregable a presentar. | |
Prácticas en aulas de ordenadores [PRESENCIAL] | Trabajo dirigido o tutorizado | CM05 CM07 INS05 | 0.66 | 16.5 | S | S | Trabajo del alumno con supervisión del profesor en las prácticas de la asignatura. | |
Resolución de problemas o casos [PRESENCIAL] | Resolución de ejercicios y problemas | CM05 CM07 INS05 | 0.24 | 6 | N | N | Resolución en clase de problemas y casos de estudio relacionados con los distintos temas estudiados. | |
Estudio o preparación de pruebas [AUTÓNOMA] | Trabajo autónomo | CM05 CM07 INS05 | 1.56 | 39 | N | N | Se estima que el alumno dedicará aproximadamente 1.3 horas de estudio autónomo por cada hora de lección magistral recibida. Esto incluye la búsqueda y lectura de material adicional. | |
Otra actividad no presencial [AUTÓNOMA] | Prácticas | CM05 CM07 INS05 | 0.84 | 21 | N | N | Horas adicionales a las presenciales para completar las prácticas/proyectos de programación. | |
Elaboración de memorias de Prácticas [AUTÓNOMA] | Trabajo autónomo | CM05 CM07 INS05 UCLM03 | 0.42 | 10.5 | S | S | Los alumnos han de plasmar en una memoria el trabajo realizado en la práctica, presentar de forma coherente los resultados y obtener las conclusiones de acuerdo a los objetivos inicialmente fijados. En caso de no superar la práctica en evaluación continua, se podrá recuperar en la entrega correspondiente a la convocatoria ordinaria, si bien, el enunciado podrá ser ligeramente diferente. Las prácticas se diseñan para ser realizadas y defendidas por parejas. No obstante en situaciones particulares y pactadas de antemano con el profesor, podrán realizarse de forma individual. | |
Elaboración de informes o trabajos [AUTÓNOMA] | Aprendizaje basado en problemas (ABP) | CM05 CM07 INS05 UCLM03 | 0.78 | 19.5 | S | N | Se facilitarán casos de estudio o ejercicios seleccionados, que el alumno debe completar y que serán evaluados mediante la entrega de tareas o cuestionarios en campus virtual. Este actiividad es de carácter individual y lleva asociada la evaluación por pares. | |
Total: | 6 | 150 | ||||||
Créditos totales de trabajo presencial: 2.4 | Horas totales de trabajo presencial: 60 | |||||||
Créditos totales de trabajo autónomo: 3.6 | Horas totales de trabajo autónomo: 90 |
Ev: Actividad formativa evaluable Ob: Actividad formativa de superación obligatoria (Será imprescindible su superación tanto en evaluación continua como no continua)
Sistema de evaluación | Evaluacion continua | Evaluación no continua * | Descripción |
Resolución de problemas o casos | 15.00% | 15.00% | (ESC) Este 15% de la nota se dividirá entre los casos de estudio/ejercicios proporcionados, en función de la complejidad de las mismas y de la corrección de los ejercicios entregados. Entrega individual. Esta actividad no es obligatoria ni tiene mínimo. Debe entregarse en las fechas de la evaluación continua. |
Elaboración de memorias de prácticas | 15.00% | 15.00% | (INF) Es obligatoria la entrega de las tres memorias de prácticas. Se abrirá plazo de entrega específico para la evaluación no continua. |
Realización de prácticas en laboratorio | 15.00% | 15.00% | (LAB) Se supervisará la eficiencia y eficacia del código generado para las tres prácticas planteadas. Entrega por grupo de prácticas. Se abrirá plazo de entrega específico para la evaluación no continua. |
Otro sistema de evaluación | 15.00% | 15.00% | (PRES) Cada grupo de prácticas deberá presentar su práctica al profesor y responder a las preguntas realizadas. Entrevista por grupo de prácticas, con preguntas individuales. Se abrirá plazo de entrega específico para la evaluación no continua. |
Prueba final | 40.00% | 40.00% | (ESC) En la convocatoria ordinaria esta prueba tendrá un valor del 40% de la nota final de la asignatura. Entrega individual. Prueba común en evalución continua y no continua. |
Total: | 100.00% | 100.00% |
No asignables a temas | |
---|---|
Horas | Suma horas |
Prueba final [PRESENCIAL][Pruebas de evaluación] | 2.5 |
Talleres o seminarios [PRESENCIAL][Método expositivo/Lección magistral] | 1.5 |
Enseñanza presencial (Prácticas) [PRESENCIAL][Método expositivo/Lección magistral] | 1.5 |
Prácticas en aulas de ordenadores [PRESENCIAL][Trabajo dirigido o tutorizado] | 16.5 |
Resolución de problemas o casos [PRESENCIAL][Resolución de ejercicios y problemas] | 7.5 |
Otra actividad no presencial [AUTÓNOMA][Prácticas] | 21 |
Elaboración de memorias de Prácticas [AUTÓNOMA][Trabajo autónomo] | 9 |
Elaboración de informes o trabajos [AUTÓNOMA][Aprendizaje basado en problemas (ABP)] | 19 |
Tema 1 (de 13): Introducción a la minería de datos | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 1.5 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 1.3 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Se introducirá en que consiste al minería de datos y sus principales aplicaciones. |
Tema 2 (de 13): Proceso de descubrimiento de conocimiento a partir de datos. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 1.5 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Se describirá el proceso completo de extracción de conocimiento a partir de bases de datos. Se comentará la metodología CRISP-DM, en particular algunas tareas de preprocesamiento como la discretización o la imputación de valores perdidos. |
Tema 3 (de 13): Validación y evaluación de modelos. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Se introducirán las principales técnicas de validación y medidas de error. Se usarán clasificadores ya estudiados para ilustrar los conceptos. Se introducirán problemas particulares para ilustrar la necesidad de otras medidas de evaluación, p.e. problemas con desequilibrio entre clases para introducir el análisis ROC. |
Tema 4 (de 13): Métodos basados en analogía (kNN) | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 3.9 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se estudiará el método de los vecinos más cercanos. Se verán las aplicaciones a clasificación y regresión. |
Tema 5 (de 13): Predicción numérica: regresión. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 2 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 3.9 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Introducción a la predicción numérica. Técnicas basadas en análisis de regresión. Método de optimización basado en gradiente. |
Tema 6 (de 13): Árboles: clasificación y regresión. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 2 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Se repasarán los árboles de clasificación (id3-c4.5) y se estudiará su adaptación a los árboles de regresión y de modelos de regresión. |
Tema 7 (de 13): Clasificadores probabilísticos | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 3.9 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se revisará el modelo de clasificación probabilística Naive Bayes y se estudiará la regresión logística y modelos de tipo semi-naive Bayes como TAN o KDB. |
Tema 8 (de 13): Reducción de la dimensionalidad. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 2 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Se estudiarán técnicas de reducción de la dimensionalidad (variables) mediante la transformación y selección de variables. Estas técnicas son genéricas pero de especial interés para los métodos probabilísticos (naive Bayes, regresión logística, TAN, AODE, etc...). |
Tema 9 (de 13): Multiclasificadores (ensembles) | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 3.9 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se verá como el uso de múltiples modelos y su posterior combinación/agregación suele mejorar la eficacia/acierto en el aprendizaje supervisado. |
Tema 10 (de 13): Redes neuronales. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3.5 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: Explicaremos un modelo de carácter bio-inspirado con aplicación a clasificación, regresión y con ciertas modificaciones a clustering. |
Tema 11 (de 13): Clustering: Técnicas de agrupamiento/segmentación. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 3 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se estudian los paradigmas de clustering y segmentación, sin duda los de mayor uso en aprendizaje no supervisado. Se trata de extraer patrones entre los registros o instancias del conjunto de datos. |
Tema 12 (de 13): Reglas de asociación. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 2 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 3.9 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se estudia uno de los paradigmas considerados en principio como de minería de datos: el descubrimiento de reglas de asociación. Ahora se trata de aprender relaciones (reglas) entre las variables a partir de amplias colecciones de transacciones. |
Tema 13 (de 13): Detección de anomalías. | |
---|---|
Actividades formativas | Horas |
Enseñanza presencial (Teoría) [PRESENCIAL][Método expositivo/Lección magistral] | 2 |
Estudio o preparación de pruebas [AUTÓNOMA][Trabajo autónomo] | 2.6 |
Grupo 15: | |
Inicio del tema: 21-09-2020 | Fin del tema: 22-12-2020 |
Comentario: En este tema se aborda como detectar anomalías o patrones extraños mediante el aprendizaje de modelos que representan la mayoría de los patrones, y clasificando como anomalías aquellos datos que pertenecen con escasa probabilidad al modelo aprendido. |
Actividad global | |
---|---|
Actividades formativas | Suma horas |
Comentarios generales sobre la planificación: | Esta planificación es ORIENTATIVA, pudiendo variar a lo largo del periodo lectivo en función de las necesidades docentes, festividades, o por cualquier otra causa imprevista. La planificación semanal de la asignatura podrá encontrarse de forma detallada y actualizada en la plataforma Campus Virtual (Moodle). Las actividades presenciales se organizan en tres clases de 1.5 horas por semana. Las clases concretas a usar para cubrir los 6 créditos (60 horas presenciales) se anunciarán oportunamente en CampusVirtual. |