Teaching plan for the course unit

 

Close imatge de maquetació

 

Print

 

General information

 

Course unit name: Agile Data Science

Course unit code: 572665

Academic year: 2018-2019

Coordinator: Eloi Puertas Prats

Department: Department of Mathematics and Computer Science

Credits: 6

Single program: S

 

 

Estimated learning time

Total number of hours 150

 

Face-to-face learning activities

60

 

-  Lecture with practical component

 

60

Independent learning

90

 

 

Competences to be gained during study

 

CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación

 

CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio

 

CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios

 

CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan¿ a públicos especializados y no especializados de un modo claro y sin ambigüedades

 

CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.

 

CG1 - Que los estudiantes sepan aplicar los conocimientos y habilidades adquiridas planificando el tiempo y los recursos disponibles.

 

CG2 - Que los estudiantes sean capaces de acceder a las bases de datos bibliográficas especializadas utilizando las nuevas tecnologías.

 

CG3 - Que los estudiantes sepan recopilar la información necesaria para abordar un problema y sintetizarlo.

 

CG4 - Que los estudiantes sean capaces de trabajar en equipo.

 

CE1 - Que los estudiantes sepan entender el proceso de valorización de los datos y su papel en la toma de decisiones.

 

CE2 - Que los estudiantes sepan recoger, extraer información y datos de fuentes de información estructuradas y no estructuradas.

 

CE3 - Que los estudiantes sepan limpiar y corregir datos con el objetivo de crear un conjunto de datos informativo y manejable.

 

CE4 - Que los estudiantes sepan desenvolverse con tecnologías de almacenaje, recuperación y procesado de datos con el objetivo de poder acceder a ellos – especialmente a grandes volumenes (big data) – de forma rápida y fiable.

 

CE5 - Que los estudiantes sepan plantear hipótesis y desarrollar la intuición sobre un conjunto de datos usando técnicas de análisis exploratorio.

 

CE6 - Que los estudiantes sepan aplicar de forma efectiva herramientas analíticas y predictivas de aprendizaje automático.

 

CE7 - Que los estudiantes sepan entender, desarrollar y modificar los algoritmos analíticos y exploratorios que trabajan sobre conjuntos de datos. y aplicar el pensamiento crítico en estas tareas.

 

CE8 - Que los estudiantes sepan verificar y precisar la validez de hipótesis a través de la análitica de datos.

 

CE9 - Que los estudiantes sepan comunicar los resultados de un análisis mediante técnicas de comunicación y visualización de datos adecuadas e interpretables.

 

CE10 - Que los estudiantes conozcan la legislación referente a la protección y privacidad de datos y el código deontológico en el ejercicio de la profesión.

 

[C11] Trabajar en equipo con metodologias de desarrollo ágiles.

 

 

 

 

Learning objectives

 

Referring to knowledge

Learn about agile methodologies for software developing.

 

Learn about what it’s like to be a data scientist.

 

 Learn about infrastructures for data science.

 

Learn about ethics and data privacy.

 

 

Teaching blocks

 

1. Software Engineering for Data Scientists

*  

  • Agile Methodologies
    •      Kanban
    • Scrum 
  • Version Control
    • GIT   
  • Test Driven Development
    • Unit Cases       
  •  Software Deployment
    •  Software as a Service 
    • Containers: Docker     


 

2. Data Science Workflow

*  

  • Preparation
    •    Acquire data
    •  Reformatting and cleaning data
  • Analysis  (Machine Learning)
  •  Dissemination (Visualisation & Presentation)

3. Infrastructure for Data Science

*  

  • No-SQL Databases. 
  • Message Queues.
  • Platform as a Service

4. Ethics and Data Privacy

 

 

Teaching methods and general organization

 

The first 4 weeks I will teach the basic concepts about data science and agile methodologies to build up sufficient background and foundation. 

After that, we will go through a Data Science project, following each step of the data science workflow. The project will be done by teams between 5 and 7 students.

The classes will be divided into two parts: (1)  Review of previous material and introduction of any new material necessary to solve the current step in the project. (2) Work in team for solving and implement a solution for the current step in the project.

Finally, there be 3 sessions about fundamental aspects from Ethics and Data Privacy in the data science context.

 

 

Official assessment of learning outcomes

 

90 % Data Science Project
   
10 % Attendance / Participation


Pass the Data Science Project is mandatory. 

If the final mark of the team is below 5, then all the team can attend to a reappraisal.

 

Examination-based assessment

100 %
Data Science Project
   


Pass the Data Science Project is mandatory. 

If the final mark of the team is below 5, then all the team can attend to a reappraisal.