Machine Learning com Spark e Pyspark: o Curso Completo

Domine a Criação e Tunning de Modelos de Machine Learning Utilizando Spark e Python!

Ratings 4.38 / 5.00

Machine Learning com Spark e Pyspark: o Curso Completo

What You Will Learn!

Aprenda Otimização de Hiper Parâmetros de Modelos
Saiba Criar Pipelines de Machine Learning
Domine Técnicas de Pré-Processamento de dados
Veja na Prática a Criação de Modelos de Regressão, Classificação e Clusters
Produza Assobiadores Robustos
Avalie a Performance de Modelos
Importe Dados
Persista Modelos
Utilize Técnicas como MultiLayer Perceptron, Random Forest e Regressão Logística

Description

Faça uma super imersão em Machine Learning com Spark utilizando bibliotecas nativas!

Na era "Big Data" o Spark se tornou a principal ferramenta de processamento de dados no mundo devido a sua capacidade de processar volumes massivos de dados com alta performance, se tornando uma ferramenta essencial para Cientistas e Engenheiros de Dados. Sua arquitetura distribuída permite processar dados utilizando paralelismo e memória, persistindo dados quando necessário. Além disso o Spark é capaz de importar dados de praticamente qualquer fonte, bem como também exportar dados processados para os principais formatos e bancos de dados utilizados.

Do ponto de vista profissional, conhecer Spark é uma das habilidades mais importantes ao lado de Machine Learning e Python. E o melhor disso é o que Spark já traz tudo isso. Você pode utilizar Spark com Python, através do Pyspark, e você pode criar modelos de Machine Learning utilizando as próprias bibliotecas do Spark.

Neste curso prático, você vai dominar o uso do Spark para Machine Learning:

Aprenda os conceitos gerais de Machine Learning
Conheça o Processo de Importação de Dados
Domine técnicas de pré-processamento, como substituição de valores faltantes
Aprenda técnicas de engenharia de atributos, como normalização de dados e codificação de categorias
Crie modelos de Regressão e Classificação, utilizando Redes Neurais, Random Forest e outras
Avalie a performance de seus modelos
Crie Clusters e avalia a performance
Produza regras de associação com itens frequentes
Faça o tunning de Hiper Parâmetros de Modelos
Cria fluxos de processamento de Machine Learning utilizando Pipelines
e muito mais!