Tópico | Início | Fim | |
---|---|---|---|
1 | Abertura da disciplina | 10/03/25 | 17/03/25 |
2 | Ciência de dados | 19/03/25 | 24/03/25 |
3 | Fundamentos de Python | 26/03/25 | 26/03/25 |
4 | Python em computação científica | 31/03/25 | 31/03/25 |
5 | Bases de dados | 07/04/25 | 07/04/25 |
6 | Descoberta de dados | 09/04/25 | 09/04/25 |
7 | Acompanhamento do trabalho | 14/04/25 | 23/04/25 |
8 | Primeira avaliação | 28/04/25 | 30/04/25 |
9 | Manipulação de dados | 07/05/25 | 07/05/25 |
10 | Amostragem de dados | 12/05/25 | 12/05/25 |
11 | Estatística descritiva | 19/05/25 | 19/05/25 |
12 | Visualização de dados | 21/05/25 | 21/05/25 |
13 | Qualidade de dados | 26/05/25 | 26/05/25 |
14 | Transformação de dados | 28/05/25 | 28/05/25 |
15 | Segunda avaliação | 02/06/25 | 04/06/25 |
16 | Aprendizado de máquina | 09/06/25 | 09/06/25 |
17 | Modelagem de dados | 11/06/25 | 11/06/25 |
18 | Avaliação de modelos | 16/06/25 | 16/06/25 |
19 | Outros tópicos | 18/06/25 | 18/06/25 |
20 | Terceira avaliação | 23/06/25 | 25/06/25 |
21 | Encerramento da disciplina | 30/06/25 | 09/07/25 |
Calendário
Agenda de tópicos para as datas de aula disponíveis.
Aulas
As aulas iniciam em 10/03/25 e podem se estender até 09/07/25. O calendário de aulas para o plano atual se encontra na Tabela 1.
Mais detalhes sobre cada encontro são apresentados nas subseções abaixo.
Aula 1: Abertura da disciplina
Unidade 1: Apresentações; plano de ensino; ambiente de desenvolvimento; próximas aulas.
Data(s) prevista(s): 10/03/2025, 12/03/2025, 17/03/2025.
Recurso(s) associado(s):
- Recurso – Apresentação
Aula 2: Ciência de dados
Unidade 1: Histórico; definições; KDD e CRISP-DM; Big Data; Data mining; processos de desenvolvimento.
Principais tópicos abordados: 1. Introdução à ciência de dados, 2. Áreas e termos relacionados, 3. Processos de desenvolvimento.
Data(s) prevista(s): 19/03/2025, 24/03/2025.
Recurso(s) associado(s):
Referência – Capítulos: (Carvalho, Menezes, e Bonidia 2024, cap. 1–2)
Recurso – Definição
Recurso – Relacionados
Recurso – Processos
Aula 3: Fundamentos de Python
Unidade 1: Revisão da linguagem; entrada e saída; ambientes virtuais; interoperabilidade.
Principais tópicos abordados: 1. Linguagem Python, 2. Ambientes virtuais.
Data(s) prevista(s): 26/03/2025.
Recurso(s) associado(s):
Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 3)
Referência – Capítulo: (Grus 2016, cap. 2)
Recurso – Ferramentas
Aula 4: Python em computação científica
Unidade 1: Fundamentos; IPython; Jupyter notebooks.
Principais tópicos abordados: 1. Ambiente de desenvolvimento, 2. IPython, 3. Jupyter Notebooks.
Data(s) prevista(s): 31/03/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (VanderPlas 2016, cap. 1)
Aula 5: Bases de dados
Unidade 1: Tipos de dados; formatos e arquivos; armazenamento; bancos de dados; dados tabulares.
Principais tópicos abordados: 1. Tipos de dados, 2. Fontes de dados, 3. Estrutura de dados.
Data(s) prevista(s): 07/04/2025.
Recurso(s) associado(s):
Referência – Seções: (Carvalho, Menezes, e Bonidia 2024, sec. 1.2–1.3)
Referência – Capítulo: (Verri 2024, cap. 4)
Aula 6: Descoberta de dados
Unidade 1: Seleção; web crawling ou scraping; Requests; BeautifulSoup.
Principais tópicos abordados: 1. Seleção de dados, 2. Web scraping, 3. Biblioteca BeautifulSoup.
Data(s) prevista(s): 09/04/2025.
Recurso(s) associado(s):
- Referência – Seções: (Carvalho, Menezes, e Bonidia 2024, sec. 13.2.1, 13.3.1)
Aula 7: Acompanhamento do trabalho
Unidade 1: Intervalo reservado à resolução de dúvidas e conclusão do trabalho da primeira avaliação.
Data(s) prevista(s): 14/04/2025, 16/04/2025, 23/04/2025.
Aula 8: Primeira avaliação
Unidade 1: Apresentações de bases de dados.
Data(s) prevista(s): 28/04/2025, 30/04/2025.
Recurso(s) associado(s):
Detalhes: Trabalho em grupo. Cada grupo deve gerar e apresentar uma base de dados inédita.
Critérios de avaliação:
- Volume e variedade
- Procedimentos de coleta
- Conhecimento esperado
- Criatividade
- Organização e compartilhamento
Aula 9: Manipulação de dados
Unidade 1: Dados tabulares; Pandas; DataFrames.
Principais tópicos abordados: 1. Dados tabulares, 2. Biblioteca Pandas, 3. Planilhas e DataFrame.
Data(s) prevista(s): 07/05/2025.
Recurso(s) associado(s):
Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 4)
Referência – Capítulo: (VanderPlas 2016, cap. 3)
Referência – Capítulo: (Verri 2024, cap. 5)
Aula 10: Amostragem de dados
Unidade 2: População; amostra; representatividade; variabilidade; inferência dedutiva e indutiva.
Principais tópicos abordados: 1. População e amostra, 2. Representatividade, 3. Tipos de inferência.
Data(s) prevista(s): 12/05/2025.
Recurso(s) associado(s):
- Referência – Seção: (Carvalho, Menezes, e Bonidia 2024, sec. 10.1)
Aula 11: Estatística descritiva
Unidade 2: Fundamentos; escalas de medida; medidas descritivas: tendência e dispersão; coeficiente de variação; NumPy.
Principais tópicos abordados: 1. Escalas de medida, 2. Medições descritivas, 3. Biblioteca NumPy.
Data(s) prevista(s): 19/05/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 5)
Aula 12: Visualização de dados
Unidade 2: Gráficos; Matplotlib; Seaborn; análise exploratória de dados (EAD).
Principais tópicos abordados: 1. Análise exploratória de dados, 2. Gráficos estatísticos, 3. Biblioteca Matplotlib, 4. Biblioteca Seaborn.
Data(s) prevista(s): 21/05/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 6)
Aula 13: Qualidade de dados
Unidade 2: Ausências; ruídos; outliers; limpeza.
Principais tópicos abordados: 1. Dados faltantes, 2. Dados ruidosos, 3. Pontos fora da curva, 4. Dados enviesados, 5. Limpeza de dados.
Data(s) prevista(s): 26/05/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 7)
Aula 14: Transformação de dados
Unidade 2: Conversão de valores; normalização; padronização.
Principais tópicos abordados: 1. Conversão de dados, 2. Normalização, 3. Padronização.
Data(s) prevista(s): 28/05/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 8)
Aula 15: Segunda avaliação
Unidade 2: Prova objetiva sobre os assuntos abordados nas unidades I e II.
Data(s) prevista(s): 02/06/2025, 04/06/2025.
Aula 16: Aprendizado de máquina
Unidade 3: Definições; treinamento.
Principais tópicos abordados: 1. Modelagem estatística, 2. Tipos de aprendizado, 3. Tarefas de modelagem.
Data(s) prevista(s): 09/06/2025.
Recurso(s) associado(s):
- Referência – Seção: (Carvalho, Menezes, e Bonidia 2024, sec. 11.1)
Aula 17: Modelagem de dados
Unidade 3: Regressão linear; classificação; agrupamento; algoritmos; SciKit Learn.
Principais tópicos abordados: 1. Regressão linear, 2. Classificação, 3. Agrupamento, 4. SciKit Learn.
Data(s) prevista(s): 11/06/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 11)
Aula 18: Avaliação de modelos
Unidade 3: Métricas de resultados; hiperparâmetros; hipóteses; SciPy.
Principais tópicos abordados: 1. Métricas avaliativas, 2. Teste de hipóteses, 3. SciPy.
Data(s) prevista(s): 16/06/2025.
Recurso(s) associado(s):
- Referência – Capítulo: (Carvalho, Menezes, e Bonidia 2024, cap. 12)
Aula 19: Outros tópicos
Unidade 3: Algoritmos bioinspirados; dados não estruturados; ética.
Principais tópicos abordados: 1. Algoritmos bioinspirados, 2. Hiperparâmetros, 3. Dados não estruturados, 4. Ética.
Data(s) prevista(s): 18/06/2025.
Recurso(s) associado(s):
- Referência – Capítulos: (Carvalho, Menezes, e Bonidia 2024, cap. 13–14)
Aula 20: Terceira avaliação
Unidade 3: Apresentações dos projetos finais.
Data(s) prevista(s): 23/06/2025, 25/06/2025.
Aula 21: Encerramento da disciplina
Unidade 3: Recuperação e exame final.
Data(s) prevista(s): 30/06/2025, 02/07/2025, 07/07/2025, 09/07/2025.