Objetivos | A unidade curricular pretende dotar os alunos de competências e conhecimentos na análise de dados, e mais especificamente dados biológicos, usando métodos e ferramentas das áreas da análise multivariada, mineração de dados e aprendizagem máquina. Assim, os conteúdos programáticos focam quer a componente nuclear ao nível destas tecnologias (objetivos 1 e 2) e suas aplicações (objetivo 3), quer as ferramentas de análise de dados incluindo sistemas de computação científica (objetivo 4), quer a sua aplicação em dados biológicos (objetivo 5). |
Programa | - Métodos para análise exploratória, pré-processamento e sumarização de dados; - Métodos para análise multivariada de dados não supervisionada: redução de dimensionalidade e clustering; - Mineração de Dados e Aprendizagem Máquina: conceitos e algoritmos; - Modelos e algoritmos de classificação e regressão; árvores e regras, aprendizagem baseada em instâncias, modelos bayesianos, modelos funcionais, redes neuronais, máquinas de vectores de suporte; - Avaliação e comparação de modelos e algoritmos de aprendizagem máquina; - Aplicações na análise e mineração de dados biológicos: análise de dados ómicos, entre outros; - Sistemas de computação científica, em particular o R e suas bibliotecas, e sua utilização para análise e mineração de dados
|
Bibliografia | M. Rocha, P. Ferreira; Análise e Exploração de Dados com R; FCA, 2017. M. Rocha, P. Cortez, J. Neves; Análise Inteligente de Dados – Algoritmos e Implementação em Java; FCA; 2008. I. Witten, E. Frank, M. Hall. Data Mining: Practical Machine Learning Tools and Techniques, Morgan-Kaufmann, 3rd edition, 2011. T. Michell, “Machine Learning”, McGraw Hill, 1997. T. Hastie, R. Tibshirani, J. Friedman; The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd edition; Springer, 2009. J. Maindonald, J. Braun. Data Analysis and Graphics Using R – An example based approach, 2nd ed, Cambridge Press, 2006.
|
Resultados da aprendizagem | Esta unidade curricular pretende promover a aquisição de conhecimentos e competências básicas sobre os processos e ferramentas de análise de dados, mineração de dados e aprendizagem máquina e suas aplicações na Bioinformática. Os objetivos de aprendizagem da UC são os seguintes: - Compreender os principais conceitos e métodos relacionados com a análise estatística multivariada de dados; - Compreender os principais conceitos e algoritmos relacionados com a aprendizagem máquina e a mineração de dados; - Selecionar as metodologias e ferramentas apropriadas para a resolução de problemas ao nível da análise e mineração de dados/ aprendizagem máquina; - Implementar scripts de análise e mineração de dados/ aprendizagem máquina usando sistemas de computação científica; - Aplicar as metodologias e ferramentas de análise e mineração de dados no caso específico de dados biológicos, em particular dados ómicos.
|