General information |
Course unit name: Agile Data Science
Course unit code: 572665
Academic year: 2018-2019
Coordinator: Eloi Puertas Prats
Department: Department of Mathematics and Computer Science
Credits: 6
Single program: S
Estimated learning time |
Total number of hours 150 |
Face-to-face learning activities |
60 |
- Lecture with practical component |
60 |
Independent learning |
90 |
Competences to be gained during study |
CB6 - Poseer y comprender conocimientos que aporten una base u oportunidad de ser originales en el desarrollo y/o aplicación de ideas, a menudo en un contexto de investigación
|
CB7 - Que los estudiantes sepan aplicar los conocimientos adquiridos y su capacidad de resolución de problemas en entornos nuevos o poco conocidos dentro de contextos más amplios (o multidisciplinares) relacionados con su área de estudio
|
CB8 - Que los estudiantes sean capaces de integrar conocimientos y enfrentarse a la complejidad de formular juicios a partir de una información que, siendo incompleta o limitada, incluya reflexiones sobre las responsabilidades sociales y éticas vinculadas a la aplicación de sus conocimientos y juicios
|
CB9 - Que los estudiantes sepan comunicar sus conclusiones y los conocimientos y razones últimas que las sustentan¿ a públicos especializados y no especializados de un modo claro y sin ambigüedades
|
CB10 - Que los estudiantes posean las habilidades de aprendizaje que les permitan continuar estudiando de un modo que habrá de ser en gran medida autodirigido o autónomo.
|
CG1 - Que los estudiantes sepan aplicar los conocimientos y habilidades adquiridas planificando el tiempo y los recursos disponibles.
|
CG2 - Que los estudiantes sean capaces de acceder a las bases de datos bibliográficas especializadas utilizando las nuevas tecnologías.
|
CG3 - Que los estudiantes sepan recopilar la información necesaria para abordar un problema y sintetizarlo.
|
CG4 - Que los estudiantes sean capaces de trabajar en equipo.
|
CE1 - Que los estudiantes sepan entender el proceso de valorización de los datos y su papel en la toma de decisiones.
|
CE2 - Que los estudiantes sepan recoger, extraer información y datos de fuentes de información estructuradas y no estructuradas.
|
CE3 - Que los estudiantes sepan limpiar y corregir datos con el objetivo de crear un conjunto de datos informativo y manejable.
|
CE4 - Que los estudiantes sepan desenvolverse con tecnologías de almacenaje, recuperación y procesado de datos con el objetivo de poder acceder a ellos – especialmente a grandes volumenes (big data) – de forma rápida y fiable.
|
CE5 - Que los estudiantes sepan plantear hipótesis y desarrollar la intuición sobre un conjunto de datos usando técnicas de análisis exploratorio.
|
CE6 - Que los estudiantes sepan aplicar de forma efectiva herramientas analíticas y predictivas de aprendizaje automático.
|
CE7 - Que los estudiantes sepan entender, desarrollar y modificar los algoritmos analíticos y exploratorios que trabajan sobre conjuntos de datos. y aplicar el pensamiento crítico en estas tareas.
|
CE8 - Que los estudiantes sepan verificar y precisar la validez de hipótesis a través de la análitica de datos.
|
CE9 - Que los estudiantes sepan comunicar los resultados de un análisis mediante técnicas de comunicación y visualización de datos adecuadas e interpretables.
|
CE10 - Que los estudiantes conozcan la legislación referente a la protección y privacidad de datos y el código deontológico en el ejercicio de la profesión.
|
[C11] Trabajar en equipo con metodologias de desarrollo ágiles.
|
Learning objectives |
Referring to knowledge Learn about agile methodologies for software developing.
Learn about what it’s like to be a data scientist.
Learn about infrastructures for data science.
Learn about ethics and data privacy. |
Teaching blocks |
1. Software Engineering for Data Scientists
*
- Agile Methodologies
- Kanban
- Scrum
- Version Control
- GIT
- Test Driven Development
- Unit Cases
- Software Deployment
- Software as a Service
- Containers: Docker
2. Data Science Workflow
*
- Preparation
- Acquire data
- Reformatting and cleaning data
- Analysis (Machine Learning)
- Dissemination (Visualisation & Presentation)
3. Infrastructure for Data Science
*
- No-SQL Databases.
- Message Queues.
- Platform as a Service
4. Ethics and Data Privacy
Teaching methods and general organization |
The first 4 weeks I will teach the basic concepts about data science and agile methodologies to build up sufficient background and foundation.
|
Official assessment of learning outcomes |
Pass the Data Science Project is mandatory. If the final mark of the team is below 5, then all the team can attend to a reappraisal.
Examination-based assessment
Pass the Data Science Project is mandatory. If the final mark of the team is below 5, then all the team can attend to a reappraisal. |
Reading and study resources |
Consulteu la disponibilitat a CERCABIB
Book
McKinney, W. Python for data analysis. Farnham : O’Reilly, 2012.