Departamento de Informática (UM)

Página de Unidade Curricular 🇬🇧

DesignaçãoCódigoCursoRegimeRegente

Ciência de Dados em Grande Escala

15969 [L306N2]

Licenciatura em Ciência de Dados [CDADOS]

S2

Orlando Manuel Oliveira Belo

Objetivos

A UC tem como objetivo desenvolver competências para utilização eficaz de sistemas de dados em grande escala como suporte a tarefas de ciência de dados. Este objetivo de utilização de sistemas de dados em grande escala está a mudar a forma como as empresas operam. Assim pretende-se que com esta nova escala de recolha de dados que fornece níveis massivos de informações, os alunos percebam como agora podem analisar e recolher conhecimento dos dados para apoio à tomada decisões com qualidade acrescida.

Programa

- Conceitos de sistemas de dados em larga escala.
- Conceitos fundamentais de programação, incluindo abstração de dados, armazenamento e estruturas.
- Resolução de problemas orientados a dados e desenho de algoritmos para sistemas de dados em grande escala.
- Interpretação da representação dos sistemas e análise de dados em larga escala.
- Ferramentas analíticas, R e Java.

Bibliografia

Chen, H., Mao, S., & Liu,Y. (2014) Big Data: a survey. Springer Science Business, New York.
Kimball et al. (1998) The Data Warehouse Lifecycle Toolkit, Wiley.
Beysolow II, T. (2017) Introduction to deep learning using R: A step-by-step guide to learning and implementing deep learning models using R.
Charabaldis, Y., Zuiderwijk, A., Alexopoulos, C., Janssen, M., Lampoltshammer, T., & Ferro, E..(2018) The world of open data: Concepts, methods, and tools. Springer.
Kimball et al (1998) The Data Warehouse Lifecycle Toolkit, Wiley.

Resultados da aprendizagem

- Identificar e comparar diferentes sistemas de dados em larga escala.
- Aplicar conceitos fundamentais de programação, pensamento computacional e técnicas de análise de dados para resolver problemas de ciência de dados.
- Identificar os principais conceitos do pensamento computacional e como recolher, limpar e consolidar conjuntos de dados em grande escala.
- Utilizar ferramentas e técnicas analíticas essenciais, incluindo mineração de dados e algoritmos de “machine learning”.
- Aplicar as principais tecnologias e técnicas, incluindo R, para analisar conjuntos de dados em grande escala.

Método de avaliação

Metodologia de avaliação:
- Avaliação individual sob a forma de um teste escrito: 50%.
- Avaliação contínua centrada em atividades realizadas em grupo ao longo do semestre: 50%.


Funcionamento

Turno: T 1; Docente: Orlando Manuel Oliveira Belo; Dep.: DI; Horas: 30.
Turno: PL 1; Docente: António Jorge Monteiro Chaves; Dep.: DI; Horas: 30.

[ Outras UCs do Departamento ]