O curso "Inteligência Artificial na prática: machine learning", ministrado pelo cientista de dados no TCU Erick Muzart Fonseca dos Santos e pelo analista de informática legislativa Fernando Melo, tem como objetivo ensinar membros e servidores do MPU a utilizarem ferramentas e princípios de Machine Learning para melhorar processos, produtos e serviços a partir de dados. Para um melhor aproveitamento dessa capacitação é necessário ter conhecimento e prática com desenvolvimento de sistemas, uma vez que o foco é na parte técnica e prática para implementação de soluções no MPU baseadas em machine learning.
Orientador pedagógico: Leonardo Da Costa Lopes
AULA 1 (03/05/2023)
Temas:
1. Visão geral do que é machine learning (ML) e diferenças com programação explícita. Principais conceitos. Tipos de ML. Aplicações.
2. Identificando oportunidades de uso de ML na Administração. Pré-requisitos. Disponibilidade de dados. Problemas bem formulados
PARTE 1
PARTE 2
AULA 2 (05/05/2023)
Temas:
3. Desafio: estimativa de preço de imóveis em função de suas características. Entendendo um problema de modelagem preditiva. Possíveis abordagens e soluções.
4. Aplicação de regressão linear.
AULA 3 (08/05/2023)
Temas:
5. Regressão linear: intuição, cenários de uso. Preparação de dados para modelização.
6. Uso da biblioteca python scikit-learn.
AULA 4 (10/05/2023)
Temas:
7. Conceitos gerais de ML, aplicados ao caso básico de regressão linear: particionamento dos dados em treinamento/teste/validação; Over e under fitting;
8. Determinantes de desempenho: mais dados, controle de complexidade do modelo, regularização, data augmentation; otimização e gradiente descendente.
AULA 5 (12/05/2023)
Temas:
9. Regressão logística: Extensão da regressão linear como primeiro classificador.
10. Aplicando classificação para prever sobreviventes do Titanic
AULA 6 (15/05/2023)
Temas:
11. Árvore de decisão: Construção e interpretação.
12. Aplicação de árvore de decisão: Titanic e Enem.
AULA 7 (17/05/2023)
Temas:
13. Extensão de árvore de decisão para Random Forest: aplicação sistemática em tarefas de previsão.
14. Aplicação de Random Forest.
AULA 8 (19/05/2023)
Temas:
15. Random Forest: interpretação de resultados e desempenho.
16. Aplicação em datasets já explorados, regressão e classificação; comparação de desempenho; novo dataset
AULA 9 (22/05/2023)
Temas:
17. Bases de Processamento de Linguagem Natural (NLP)
18. Pré-processamento, tokenização, bag of words, tf-idf. Aplicações em classificação.
AULA 10 (29/05/2023)
Temas:
19. Apresentação dos projetos dos participantes. Feedback do instrutor e discussão com a turma: metodologia, experimentos, fonte de dados, oportunidades de extensão e adaptação