As habilidades essenciais de um cientista de dados serão apresentadas na prática através da execução de um projeto de machine learning utilizando modelos de árvores de decisão.
Neste curso, serão utilizados o programa Anaconda com a linguagem de programação Python.
CONTEÚDO PROGRAMÁTICO:
• Apresentando a ciência de dados e suas aplicações;
• Conhecendo a linguagem de programação python;
• Aplicação prática: prevendo preços de carros a partir de suas características utilizando árvores de decisão.
• Tratamento de dados utilizando a biblioteca pandas: upload dos dados, limpeza, tratamento de dados categóricos, visualizações e análises iniciais;
• Treinamento e aplicação de modelos de machine learning utilizando a biblioteca scikit-learn: treinamento, validação e aplicação de modelos de árvores de decisão;