Data Cleaning avec Pandas pour le Machine Learning [Python]

Passez à la vitesse supérieure dans votre travail de Machine Learning / Data Science avec Python et Pandas

Ratings 4.73 / 5.00
Data Cleaning avec Pandas pour le Machine Learning [Python]

What You Will Learn!

  • Maîtriser l'outil le plus utile pour faire de la Data Science ou du Machine Learning en Python : la librairie PANDAS
  • La méthode Pas à Pas afin de préparer vos Datasets pour faire du Machine Learning en Python
  • Les 5 choses à faire directement après avoir importé votre Dataset avec Pandas
  • Ne plus tomber dans le piège qui fait perdre des heures chaque jours aux Data Scientists inexpérimenté·e·s
  • Les méthodes adéquates pour extraire de l'information des types de données les plus fréquents ULTRA-RAPIDEMENT (même les Dates)
  • Les 3 différentes manières de gérer les "Missing Values" pour que vous puissiez faire face à toutes les situations
  • Ce que sont les "Dummy Variables", "One-Hot Encoding" et "N-1 Encoding" ainsi que comment les faire vous même
  • Comment corriger les erreurs de code comme des pros
  • Et bien plus encore,

Description

Est-ce que tu t’es déjà demandé ce qui permettait à certains apprentis Data Scientist de progresser ULTRA-VITE alors que le domaine est ULTRA-DUR ?


La dure réalité, c’est que tous les moyens d’apprendre la Data Science ne sont pas égaux.


Le pire scénario serait de passer tout son temps à apprendre la théorie et les maths derrière les algos de Machine Learning sans jamais passer à la pratique.


La première erreur que commettent beaucoup de gens, c’est de se concentrer sur la partie évidente du Machine Learning et de la Data Science sans jamais réaliser que 80% du travail de Data Scientist consiste à préparer et à nettoyer les données. Le vrai problème c’est donc de ne pouvoir être bon/très bon qu'à 20% car on n'a en fait pas appris à devenir efficace sur ces 80% du travail.


Si les apprenti·e·s Data Scientists et les Data Scientists juniors veulent devenir meilleurs dans leur activité alors ils doivent nécessairement devenir efficaces dans la préparation et le nettoyage des données.


La librairie Python Pandas a été créée afin de pouvoir effectuer ULTRA-SIMPLEMENT des manipulations complexes de préparation et de nettoyage de données.


À la fin de ce cours, tu seras capable d'effectuer les 80% les plus importants de ton travail de Data Scientist 10 fois plus rapidement, ce qui améliorera ton confort de travail immédiatement.


Par exemple, lors d'un cours de Machine Learning ou d'un bootcamp Data Science, plutôt que d'être perdu dans la documentation de Pandas et Stack Overflow, tu pourras passer plus de temps à te concentrer la partie Machine Learning et donc à progresser en Data Science.


Ou bien imagine que tu passes un entretien où l'on te demande de coder pour prouver tes compétences. Au lieu de passer la plupart de ton temps à te battre pour rendre tes données "clean", tu pourras réaliser des analyses plus détaillées et passer plus de temps à peaufiner les résultats de tes modèles, ce qui impressionnera tes recruteurs.


Dans une vision long terme également, ce cours pose des fondations solides grâce auxquelles tu pourras continuer à t'améliorer en autonomie en Pandas et en Python.


Le vrai challenge c'est que Pandas est une librairie très intimidante quand on débute, et beaucoup de Data Scientist débutant·e·s décident de n'apprendre que les utilisations les plus basiques. Il s'agit là de la seconde erreur que commettent beaucoup de gens.


La réalité est simple : Pandas est un outil et le meilleur moyen pour maîtriser un outil c'est de s'en servir !


Durant plus de 10 heures de vidéo où je code sous tes yeux, tu auras l'occasion d'apprendre le processus de nettoyage de données pas à pas et je te montrerai les pièges à éviter ainsi que des astuces méconnues mais terriblement efficaces.


J'y ai aussi inclus plus de 3 heures d'exercices corrigés afin que tu puisses t'entraîner à ton rythme !


Si tu es un·e débutant·e, alors ce cours est fait pour toi et te permettra d'accélérer grandement ton apprentissage de ce domaine passionnant, le seul prérequis étant que tu connaisses les bases de Python.


Mais ce cours te conviendra aussi si tu as déjà commencé ton premier stage / emploi de Data Scientist et que tu constates que tu passes beaucoup de temps à te gratter la tête en essayant de nettoyer tes données ; en effet, dans ce cours nous couvrirons bien plus que les bases.


On parle ici d'une vraie méthodologie pour nettoyer les données ainsi que d'un éventail de techniques de nettoyage pour te préparer aux situations les plus courantes que tu rencontreras sur le terrain.


Si tu as plusieurs années d'expérience et/ou que tu recherches un cours Pandas pour manipuler des Time-Series alors ce cours ne sera probablement pas pour toi.


Ce cours n'est pas non plus un cours de théorie du Machine Learning ou de Data Science, donc si c'est ce que tu recherches tout de suite, alors ce cours-ci n'est pas pour toi (mais un autre à venir sûrement !).


Dans tous les cas, tu peux toujours jeter un oeil aux vidéos disponibles en aperçu gratuitement pour avoir une idée plus détaillée du contenu du cours.


Si après ça tu te demandes encore si ce cours est fait pour toi, le plus simple reste tout simplement d'essayer: Udemy et moi sommes heureux de t'offrir un remboursement inconditionnel de 30 jours si le cours ne te satisfait pas pleinement. Comme ça, aucun risque pour toi et tu as tout à y gagner !


Who Should Attend!

  • Tout·e·s les débutant·e·s motivé·e·s en Data Science, Machine Learning & Intelligence Artificielle qui veulent accélerer leur progression
  • Toutes les personnes qui ont compris que la préparation des données représente plus de 80% du métier de Data Scientist

TAKE THIS COURSE

Tags

  • Machine Learning
  • Python
  • Pandas
  • Data Preprocessing

Subscribers

647

Lectures

38

TAKE THIS COURSE



Related Courses