Departamento de Informática (UM)

Página de Unidade Curricular 🇬🇧

DesignaçãoCódigoCursoRegimeRegente

Extração de Conhecimento de Dados Biológicos

15886 [ME37ME3700007141]

Mestrado em Bioinformática [MBINF]

S2

Miguel Francisco Almeida Pereira Rocha

Objetivos

A unidade curricular pretende dotar os alunos de competências e conhecimentos na análise de dados, e mais especificamente dados biológicos, usando métodos e ferramentas das áreas da análise multivariada, mineração de dados e aprendizagem máquina. Assim, os conteúdos programáticos focam quer a componente nuclear ao nível destas tecnologias (objetivos 1 e 2) e suas aplicações (objetivo 3), quer as ferramentas de análise de dados incluindo sistemas de computação científica (objetivo 4), quer a sua aplicação em dados biológicos (objetivo 5).

Programa

- Métodos para análise exploratória, pré-processamento e sumarização de dados;
- Métodos para análise multivariada de dados não supervisionada: redução de dimensionalidade e clustering;
- Mineração de Dados e Aprendizagem Máquina: conceitos e algoritmos;
- Modelos e algoritmos de classificação e regressão; árvores e regras, aprendizagem baseada em instâncias, modelos bayesianos, modelos funcionais, redes neuronais, máquinas de vectores de suporte;
- Avaliação e comparação de modelos e algoritmos de aprendizagem máquina;
- Aplicações na análise e mineração de dados biológicos: análise de dados ómicos, entre outros;
- Sistemas de computação científica, em particular o R e suas bibliotecas, e sua utilização para análise e mineração de dados

Bibliografia

M. Rocha, P. Ferreira; Análise e Exploração de Dados com R; FCA, 2017.
M. Rocha, P. Cortez, J. Neves; Análise Inteligente de Dados – Algoritmos e Implementação em Java; FCA; 2008.
I. Witten, E. Frank, M. Hall. Data Mining: Practical Machine Learning Tools and Techniques, Morgan-Kaufmann, 3rd edition, 2011.
T. Michell, “Machine Learning”, McGraw Hill, 1997.
T. Hastie, R. Tibshirani, J. Friedman; The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition; Springer, 2009.
J. Maindonald, J. Braun. Data Analysis and Graphics Using R – An example based approach, 2nd ed, Cambridge Press, 2006.

Resultados da aprendizagem

Esta unidade curricular pretende promover a aquisição de conhecimentos e competências básicas sobre os processos e ferramentas de análise de dados, mineração de dados e aprendizagem máquina e suas aplicações na Bioinformática.
Os objetivos de aprendizagem da UC são os seguintes:
- Compreender os principais conceitos e métodos relacionados com a análise estatística multivariada de dados;
- Compreender os principais conceitos e algoritmos relacionados com a aprendizagem máquina e a mineração de dados;
- Selecionar as metodologias e ferramentas apropriadas para a resolução de problemas ao nível da análise e mineração de dados/ aprendizagem máquina;
- Implementar scripts de análise e mineração de dados/ aprendizagem máquina usando sistemas de computação científica;
- Aplicar as metodologias e ferramentas de análise e mineração de dados no caso específico de dados biológicos, em particular dados ómicos.

Método de avaliação

Os alunos serão avaliados pelos dois elementos seguintes com pesos idênticos:
(i) teste escrito;
(ii) trabalhos práticos de análise de dados biológicos realizados em grupo


Funcionamento

Turno: T 1; Docente: Miguel Francisco Almeida Pereira Rocha; Dep.: DI; Horas: 30.
Turno: PL 1; Docente: Miguel Francisco Almeida Pereira Rocha; Dep.: DI; Horas: 15.

[ Outras UCs do Departamento ]