Si tous les professeurs étaient comme toi, la terre serait un paradis. J'ai appris de toi ce que je n'ai pas appris de mes professeurs dans mon master d'apprentissage automatique. Merci beaucoup Monsieur et bonne continuation.
@@arsenedydykouadio1520 oui il faut regarder dans la playlist en entrant complètement dans sa chaine youtube et tu verras la suite au numéro 18/30 puisque si tu regardes bien le titre de la vidéo c'est 17/30 où nous sommes.
Aucun mot ne peut exprimer ma gratitude envers vous, vos vidéos sont très pédagogiques, votre démarche est très généreuse et ça répond exactement à mon besoin (Je fais un master Big Data) maintenant je Like avant de regarder la vidéo. Mille mercis
Etant en reconversion, votre série de vidéos sur le ML et plus particulièrement Python me sont très utiles, elles sont très accessibles et faciles à comprendre. Merci
C'est vraiment un travail de dingue ce que tu fais tu ajoutes plein de contenu à chaque nouvelle vidéo, tu es disponible pour tout le monde malgré la communauté qui se veut toujours plus importante franchement chapeau!
Merci beaucoup, ta reconnaissance fait tres plaisir :) Parfois je loupe un ou 2 commentaire, mais c'est rare j'essaie vraiment de repondre a tout le monde.
je suis étudiante en master "digital text analysis". Je viens d'avoir un bootcamp d'introduction à python ponctué d'un examen que j'ai raté allègrement (notamment) parce que je n'avais rien compris du tout à "pandas", sur lequel la plupart de l'examen portait. Nous avons travaillé sur ces données du Titanic en classe mais je n'avais pas compris une seule ligne de code. J'ai acheté une adhésion à DataCamp pour m'aider mais rien n'y a fait. Et puis je viens de tomber sur votre chaîne! Vous êtes un excellent professeur! Je m'apprête à regarder chacune de vos vidéos excellement expliquées! Merci infiniment.
Je suis navré que vous n'ayez pas réussi votre premier examen, mais ne vous en faite pas, vous aurez l'occasion de vous rattraper ! C'est super si a présent vous avez bien compris tout ca ! :) Si le machine learning vous intéresse également, vous pouvez télécharger mon livre gratuit sur mon site Internet (le lien est dans la description) Allez, gardez la motivation et bon courage dans vos études ! :D
Bonjour, j'ai connu votre chaîne moins d'un mois de cela et je me las pas de vos video... J'apprends le machine learning à travers vos vidéo...vraiment très pratique et jespere qu'à la fin de la 30iem vidéo je serai un expert du domaine Hahaaa...vraiment courage à vous !
Bonjour et bravo d'avoir fait tout ce chemin en moins d'UN mois ! Félicitations ! Le chemin pour devenir data scientist est long mais je me donne comme mission que les gens qui me suivent atteignent TOUS leurs objectifs un jour !
@@MachineLearnia c'est ça l'objectif ! En plus j'apprends facilement avec vous...vos explication sont compréhensives. Et je suis plus que déterminé pour devenir un data scientist.
Hello, Merci pour cette superbe chaîne. Toutes les informations sont super bien expliquées et bien détaillées. Merci encore et surtout t'arrêtes pas :)
Bonjour et merci pour votre travail! Actuellement en reconversion professionnelle dans le domaine de la data et de l'IA, je ne peux que recommander vos vidéos! Pour ceux qui ont eu du mal à charger le dataset malgré le fait de le mettre dans le même dossier que votre notebook. Il m'est arrivé la même chose ! Cela peut être dû a JupyterLab qui est moins stable que Jupyter Notebook. J'ai fermé JupyterLab puis j'ai ouvert sur Jupyter Notebook et problême résolu! Retourner sur JupyterLab et là même en relançant votre kernel, surprise le dataset se charge correctement! Voilà 1er jour et 1ère participation ^^ A plus
Bonjour prof, je suis immensément content de votre formation et je suis très reconnaissant pour cela. Je me suis à fin mis sur des projets de machine learning qui me semblaient compliqués avant. Si possible, vous possible de faire une vidéo sur comment traiter de données sonores (sons de pluie) et de les convertir en dataFrame ? Et aussi sûr l'importance de la Densité Spectral de Puissance d'une signal. Merci beaucoup d'avance 🙇♂️
Bravo et merci pour ces tutos, même si dans mon cas c'est plus la découverte et la curiosité car a 70ans et retraité, je n'ai pas d'application concrète à développer ! Mais c'est très intéressant et sa complète mon expérience en python.
Je me demandais quel était l'intérêt de Pandas vs une base de données, même en ram genre SQLite. Là, je crois cerner l'intérêt en voyant qu'on peut y faire des slices, des masques, bref, bien plus pythonesque et concis si j'ai bien compris. Je viens du vieux monde, merci pour cette encore excellente vidéo !
Bonjour, Superbe collection de vidéo . Elles sont très pédagogiques; Avez-vous fait ou ferez-vous une vidéo expliquant comment créer un dataset à partir de ses propres images par exemple dans le cadre d' une classification? Merci encore
Excellent ! Cependant, pourquoi à 15:02 on a 3 lignes qui sortent alors qu'on a écrit data.loc[0 : 2 , ['age','sex'] ] ? Nous devrions avoir que les lignes d'index 0 et 1 non ?
Excellente vidéo et super intéressante merci encore, j'ai une question si on supprime tout les valeurs NAN du dataset avec dropna() ça risque de biaiser notre modèle d'apprentissage après ? merci
Merci :) Oui... et non. Tout dépend ! Si les données qui sont supprimées sont distribuées normalement a travers les classes du Dataset, alors le risque de biais est faible. Si en revanche les données NaN sont toutes liées a une situation particuliere , alors le modele sera en effet "biaisé" (ce n'est pas le vrai terme pour parler de ca) car il n'aura jamais vu des données correspondant a une situation particuliere.
Bonjour, merci pour la richesse et clarté de vos tutoriels. A la fin de la vidéo quand vous expliquez les méthodes de mask puis de boolean indexing je rencontre une erreur avec la ligne '
Aaah Kaggle, je compte faire BEAUCOUP de vidéos dessus, mais pas dans l'immédiat (je vais poursuivre la série Python pour les prochaines semaines) :D Stay tuned !
Merci beaucoup pour vos vidéos (TOP DU TOP). Dans un DataFrame déjà constitué et rempli, est-il possible d'inclure ( copier/coller) des colonnes d'un autre tableau (provenant d'Excel, par exemple )? Merci d'avance.
Bonjour, vous pourrez trouver de l'aide sur notre discord. A titre personnel je peux aussi vous aider, mais mon temps est limité car je recois beaucoup de demande et j'ai également un travail a temps plein.
@@MachineLearnia d'accord je suis déjà sur discorde et je discute avec des gens mais j'aurais besoin de votre aide aussi est-ce que je peux avoir votre mail
Salut Guillaume, quel bonheur tes vidéos!! Idéal et nettement plus "user friendly" que de se plonger dans les docs officielles ;-). Je me demandais s'il était possible d'accéder à des "chapitres" précis de la vidéo sans avoir besoin de la parcourir complètement pour pouvoir revenir sur certaines fonctions... Est-ce qu'il y a un descriptif de tes vidéos? Un grand merci à toi. De716
Hello et merci a toi. Alors pour info je suis en train de préparer un petit livre qui résume toutes les fonctions qu'on a vu dans cette série de vidéos. Et sinon au bas de chaque vidéo il y a dans la description la timeline pour accéder plus rapidement aux différents cahpitres.
@@MachineLearnia Salut Guillaume, j'ai une question au sujet des masques : est-il possible d'utliser un dataframe comme masque d'un dataframe plus grand? J'ai en fait une base de questions, avec en index le nom des objectifs et pour chaque objectif correspondent des questions avec un niveau de taxonomie spécifique... Le template pour faire l'exam est un tableau avec une partie de ces mêmes objectifs et des niveaux de taxonomie. J'aimerais donc utiliser ce template pour aller sélectionner directement toutes les questions correspondantes à ces objectifs et taxonomies... Est-ce faisable? Mille merci encore pour tes vidéos.de716
Je suis vos séries, et vraiment j'avance bien avec vous, du coup je vous demande de nous faire une vidéo d'analyse de base de données " Chicago crime" Merci
Très bonne vidéo comme d'habitude. Petite question : à 0:00 ou 9:20 quand on groupby le sexe et classe, on voit que 96% des femmes en classe 1 survivent VS 89% de celles en classe 2. Y'a-t-il un moyen de voir s'il y a une différence significative entre ces deux catégories et les autres à l'aide d'une ANOVA, t-test ? Le module scipy.stats propose quelques fonctionnalités mais y'a-t-il un moyen pour grouper les catégories non significativement différentes entre elles et hiérarchiser ces groupes ? Exemple : %survie des femmes 1 et 2 > %survie femmes 3 > %survie hommes 1 > %survie hommes 2 et 3
Oui tout a fait ! il faut pour cela calculer la crosstab avec les variables sex, pcass, et survived (utilisez pd.crosstab()) puis il faut effectuer un test de chi2 avec la fonction de scipy chi2_contigency. Cela vous retourne la statistique chi2, la p_value, et le tableau des valeurs attendus, et vous pouvez avec rejeter votre hypothese H0 si p_value < 0.02 (ou tout autre valeur alpha que vous aurez choisie) :)
Bonjour Guillaume, Merci beaucoup encore une fois pour la qualité de tes vidéos elles sont vraiment excellentes. j'ai une question concernant groupby est ce possible de grouper par une fonction (mise en forme de valeurs) ou uniquement par colonne? Pour illustrer mon propos, j'ai une colonne avec des code insee et je voudrais grouper par département, donc les 2 premiers caractères du code insee. Je n'ai pas trouvé d'information sur le site pandas...merci d'avance j'ai essayé sans succès : in[19] df.groupby(['entite',df['code_insee'].astype(str).str[0:2]).sum() in[20] dept = df['code_insee'].astype(str).str[0:2] df.groupby(['entite',dept).sum() :x
Merci beaucoup. Dans cette situation, je créerai tout simplement une colonne temporaire qui contient les 2 premiers caractères sur code insee pour ensuite effectuer cette opération de groupby.
@@MachineLearniaje tiens à vous remercier pour votre réponse. Oui, je souhaiterai réaliser une carte 2D de terrain et par après un modèle 3D. Merci de votre aimable compréhension 😀
Merci pour toutes ces superbes vidéos. Néanmoins j'ai un PB avec le fichier xls titanic3. Quand je fais le read_excel ça renvoie une erreur, je pense que c'est lié au changement de configuration régionale de l'ordinateur, le mien est configuré en FR. Séparation virgule ou point-virgule ? UTF-8 ?
Juste pour info et si j'ai bien compris la session iloc (et loc par la même occasion). Quand on a data.iloc[1, 2], le chiffre 2 fait que la deuxième colonne est prise. Quand on a data.iloc[1:2, 0:2], le chiffre 2 fait que la première colonne est prise mais pas la deuxième colonne. Merci Pandas...
C'est une chose commune a beaucoup d'outils de Slicing, et a la base on retrouve ca dans Numpy, et dans les listes (on l'a vu au début de la série). Attention aussi l'index 2 réfère a la 3ieme colonne ! (mais ca je pense que tu l'as compris ^^ )
Bonjour, Je vous félicite pour le travail si important que vous faites à but non lucratif. je suis nouveau en python, je veux faire des analyses statistiques en python. j'applique vos mêmes démarches utilisées dans les vidéos. cela m'affiche toujours des erreurs. Votre aide en ce sens me serait très utile afin d'appliquer vos explications sur mes propres jeux de données.
Bonjour et merci beaucoup. Nous pourrons plus facilement vous aider sur le serveur discord (lien dans la description) car nous pourrons échanger du code ensemble
@@MachineLearnia j,'utilise jupiter notebook. Voila comment je procède Import numpy as np Important pandas as pd Import matplotlib.pyplot as plt. Df = pd.read_csv("data.csv") prinint(Df)
Bonjour, je viens de (re)decouvrir la fonction cut qui permet de repondre à moitié a l'exercice: le code si dessous marche mais coupe en 4 catégories d'age de longueur équivalente, appelés des quartiles par les statisticiens: data['age']=pd.cut(data['age'],bins=4,labels=(1,2,3,4)) on peu aussi mettre data['cat_age']= cela va recréer une colonne a la fin avec les 4 catégories 1,2,3,4 tout en préservant la colonne âge.
Bonjour, super vidéo ! Petite question, est-il possible pour l'exercice d'ajouter un champ au lieu de recalculer le tout dans le champ âge ? Et, est-il possible de faire un undo après une fausse manœuvre ou il faut tout recommencer du début ? Sinon peut-on faire une copie du dataframe avant ? Merci !
pour faire un nouveua champ, il suffit de créer une autre colonne en effet. Et oui pour faire un retour en arriere, il faut faire une copie de votre DF.
Bonjour. Je suis bloquée dès la première étape. En effet, dès que j'essaie d'importer le fichier, ce message d'erreur s'affiche : FileNotFoundError. Je n'ai aucune solutions. Que faire ? Merci d'avance.
Salut, super série. Merci pour ton partage. Y a un petit typo à 2:28, un point traine sur df.['column'].value_counts() entre df et ['column']. Merci encore.
Bonsoir Excellent cours tres bien detaillé tres bien organisé Je souhaite savoir comment je peux charger les donnees train et test avec la biblio sk learn? merci
Hello, merci pour ta vidéo, encore du super boulot. Je n'arrive pas à utiliser la plus part de tes fonctions avec mes fichiers csv, en effet, il y a trois ligne utilisé pour décrire chaque colonne. Du coup Python ne comprends pas quand j'appelle seulement l'une d'elle avec le nom d'un des trois lignes. Je peux t'envoyer un des fichier csv que j'ai à traiter. Je m'en sors en passant par le module csv et en suppriment les ligne qui m'intéresse pas mais bon je suis sûr qu'il y a plus simple. J'ai une autre question. J'ai un tableau de deux dimensions avec une première ligne qui contient le nom des colonnes. Quand je crée un DataFrame de ce tableau, je me retrouve avec des index ( 0, 1, 2 ...) pour les colonnes aussi ... Tu sais comment je peux changer l'indexation des colonnes par la ligne avec le nom des colonnes ? Merci d'avance !
Bonjour, Pour le premier point, tu peux nous envoyer ton code et ton document sur discord, on pourra t'aider. Pour le second point, tu peux renomer les colonnes comme cela : df.columns = df.iloc[0, :] ce qui aura pour effet de renommer les colonnes avec les éléments de la premiere ligne (ligne 0). Ensuite, tu peux drop cette ligne. Ou alors tu peux tout simplement commencer la lecture de ton fichier csv une ligne suivante : pd.read_csv(....., skiprows=1)
Merci infiniment , rien ne peut exprimer la joie que j'ai d'avoir tomber sur cette formation qui m'aide beaucoup dans ma carrière de Data scientiste
Si tous les professeurs étaient comme toi, la terre serait un paradis. J'ai appris de toi ce que je n'ai pas appris de mes professeurs dans mon master d'apprentissage automatique.
Merci beaucoup Monsieur et bonne continuation.
svp la suite de cette video existe?
@@arsenedydykouadio1520 oui il faut regarder dans la playlist en entrant complètement dans sa chaine youtube et tu verras la suite au numéro 18/30 puisque si tu regardes bien le titre de la vidéo c'est 17/30 où nous sommes.
Aucun mot ne peut exprimer ma gratitude envers vous, vos vidéos sont très pédagogiques, votre démarche est très généreuse et ça répond exactement à mon besoin (Je fais un master Big Data) maintenant je Like avant de regarder la vidéo. Mille mercis
C'est un bonheur de pouvoir vous aider Nadia ! Bravo et bon courage pour votre Master ! :)
Très utile l'ajout des timecodes depuis les dernières vidéos. Cette chaîne c'est comme le vin, ça se bonifie avec temps !!!
Merci beaucoup !
Tout simplement le meilleur cours de Pandas que j'ai vu sur internet !
Vidéo très pédagogique. Tu vas vraiment à l'essentiel sans faire des bavardages inutiles. Merci et courage pour ton travail.
Je suis honoré de l'apprendre, merci !
Un immense bravo pour vos qualités pédagogiques !!!!
Etant en reconversion, votre série de vidéos sur le ML et plus particulièrement Python me sont très utiles, elles sont très accessibles et faciles à comprendre. Merci
De rien, merci a vous :)
C'est vraiment un travail de dingue ce que tu fais tu ajoutes plein de contenu à chaque nouvelle vidéo, tu es disponible pour tout le monde malgré la communauté qui se veut toujours plus importante franchement chapeau!
Merci beaucoup, ta reconnaissance fait tres plaisir :) Parfois je loupe un ou 2 commentaire, mais c'est rare j'essaie vraiment de repondre a tout le monde.
C'est la première vidéo que j'ai vue de votre chaîne. Merci pour votre travail et votre altruisme
Merci beaucoup, bienvenue dans notre communauté ! :)
je suis étudiante en master "digital text analysis". Je viens d'avoir un bootcamp d'introduction à python ponctué d'un examen que j'ai raté allègrement (notamment) parce que je n'avais rien compris du tout à "pandas", sur lequel la plupart de l'examen portait. Nous avons travaillé sur ces données du Titanic en classe mais je n'avais pas compris une seule ligne de code. J'ai acheté une adhésion à DataCamp pour m'aider mais rien n'y a fait.
Et puis je viens de tomber sur votre chaîne! Vous êtes un excellent professeur! Je m'apprête à regarder chacune de vos vidéos excellement expliquées! Merci infiniment.
Je suis navré que vous n'ayez pas réussi votre premier examen, mais ne vous en faite pas, vous aurez l'occasion de vous rattraper ! C'est super si a présent vous avez bien compris tout ca ! :) Si le machine learning vous intéresse également, vous pouvez télécharger mon livre gratuit sur mon site Internet (le lien est dans la description)
Allez, gardez la motivation et bon courage dans vos études ! :D
@@MachineLearnia merci de me répondre! :) J'ai déjà téléchargé votre livre. Je suis sûre qu'il m'aidera! :)
J'aurais aimé avoir un prof comme vous impossible de qualifier vos contenus tellement que c'est clair et riche
Merci a vous !
La vidéo est vraiment de qualité ! Bien plus explicite que des cours sur Udemy ! Un grand merci !
Merci beaucoup, ca fait plaisir :)
On était 1000 abonnés en Octobre 2019 et on est plus de 6000 en Janvier 2020 , c'est un résultat de vos vidéos hyper jolies Merci beaucoup à vous !
Merci ! C'est aussi grace a vous qui étiez présent avant les 1000 abonés et qui etes encore la aujourd'hui !
et plus de 150K en 2024 !!!
je cherche à me former en BI.... Un grand merci, c'est tout à fait le genre de vidéo que je recherche !!! très clair à comprendre
Merci ! J'ens suis tres content ! :)
Bonjour, j'ai connu votre chaîne moins d'un mois de cela et je me las pas de vos video... J'apprends le machine learning à travers vos vidéo...vraiment très pratique et jespere qu'à la fin de la 30iem vidéo je serai un expert du domaine Hahaaa...vraiment courage à vous !
Bonjour et bravo d'avoir fait tout ce chemin en moins d'UN mois ! Félicitations ! Le chemin pour devenir data scientist est long mais je me donne comme mission que les gens qui me suivent atteignent TOUS leurs objectifs un jour !
@@MachineLearnia c'est ça l'objectif ! En plus j'apprends facilement avec vous...vos explication sont compréhensives. Et je suis plus que déterminé pour devenir un data scientist.
Pandas ouvre les yeux sur un univers infini de possibilités c'est génial bravo Guillaume cette vidéo est magnifique
Merci beaucoup. Vive Pandas !
Que de temps gagné grace à cette chaine. Merci
Ça me fait très plaisir de l'apprendre, merci ! :)
merci bq, ils m'ont invité pour une journée le wagon live, au bout de 3 hours on a rien fait en comparant avec cette vidéo, merci a vous.
Merci beaucoup pour votre retour et bon courage pour la suite :)
Hello,
Merci pour cette superbe chaîne. Toutes les informations sont super bien expliquées et bien détaillées.
Merci encore et surtout t'arrêtes pas :)
Merci beaucoup !
je veux vous remercier pour cette excellente formation vraiment m a beaucoup aider dans mes etudes.
Bonjour et merci pour votre travail!
Actuellement en reconversion professionnelle dans le domaine de la data et de l'IA, je ne peux que recommander vos vidéos!
Pour ceux qui ont eu du mal à charger le dataset malgré le fait de le mettre dans le même dossier que votre notebook. Il m'est arrivé la même chose !
Cela peut être dû a JupyterLab qui est moins stable que Jupyter Notebook.
J'ai fermé JupyterLab puis j'ai ouvert sur Jupyter Notebook et problême résolu!
Retourner sur JupyterLab et là même en relançant votre kernel, surprise le dataset se charge correctement!
Voilà 1er jour et 1ère participation ^^
A plus
Merci beaucoup Vincent ! Et merci d'avoir partager ton astuce !
Très bon travail, bien organisé, bien clair.
Un grand merci Guillaume, c'est rare de trouver un travail de cette qualité. Tu me sauves mon ami ;)
Mais de rien :)
Le meilleure professeur 😅, merci infiniment
C'est absolument excellent tes tutos. Merci beaucoup !
Merci beaucoup et de rien :)
C'est toujours un vrai régal. Merci
Merci beaucoup :)
Même en 2024 cette vidéo m'est toujours utile. Merci infiniment ❤
oui je confirme a l'instant même
je confirme
Toujours au top.Je sens que je vas basculer de R vers Python =D. Bravo et nous te soutenons !
Merci beaucoup pour le soutien ! :)
Video très clair, facile à suivre et riche d'informations. Merci !
Merci ! C'est un plaisir :)
Franchement une master Class. Merci prof
Bonjour prof, je suis immensément content de votre formation et je suis très reconnaissant pour cela. Je me suis à fin mis sur des projets de machine learning qui me semblaient compliqués avant. Si possible, vous possible de faire une vidéo sur comment traiter de données sonores (sons de pluie) et de les convertir en dataFrame ? Et aussi sûr l'importance de la Densité Spectral de Puissance d'une signal. Merci beaucoup d'avance 🙇♂️
Bravo et merci pour ces tutos, même si dans mon cas c'est plus la découverte et la curiosité car a 70ans et retraité, je n'ai pas d'application concrète à développer ! Mais c'est très intéressant et sa complète mon expérience en python.
Merci a vous ! Je suis tres heureux de pouvoir proposer mon contenu a des gens curieux comme vous :)
Super introduction ! Merci pour cette vidéo :)
Merci beaucoup :)
un grand merci, tu m'as sauvé la vie
Carrément !? Que ce passe-t-il ? un projet a rendre en urgence ?
Ca me fait plaisir :)
@@MachineLearnia vous m'avez aidé à préparer un cours. encore une fois merci
Très bonne vidéos, t'as sauvé mon cours d'exploitation de base de donnée
Je suis heureux de l'apprendre ! merci a toi :)
MERCI BRO , C'EST TRES INTERESSANT LE CONTENU , UNE FOIS DE PLUS MERCI, JE SUIS NOUVEAU SUR LA CHAINE
Bienvenue a toi alors :)
Je me demandais quel était l'intérêt de Pandas vs une base de données, même en ram genre SQLite. Là, je crois cerner l'intérêt en voyant qu'on peut y faire des slices, des masques, bref, bien plus pythonesque et concis si j'ai bien compris. Je viens du vieux monde, merci pour cette encore excellente vidéo !
Merci pour le commentaire. Oui Pandas est vraiment puissant et pratique. Il a été développé par des organisme de l'industrie Financière.
Franchement tes vidéos sont vraiment au top du top
merci !
Très bonne vidéo encore, continue comme ça. Merci
Merci :)
rien n'a dire . Merci beaucoup pour toutes ces explications .
vraiment c´est merveilleux. je dirai la suite...
Vraiment très explicite. Merci un cour suivie et j'arrive à avancer sur mon projet.
Merci beaucoup ca me fait très plaisir comme retour ;)
Encore une excellente vidéo qui me permet de faire le lien avec Excel que j'utilise au quotidien
Je suis content que cela vous aide :)
Merci pour cette vidéo,j'ai vraiment aimé
Merci beaucoup
Un merci du fond du coeur
Salut Guillaume belle vidéo comme d'habitude puissance force courage à toi merci pour le lien
Merci beaucoup ! Que la force soit avec toi également :)
ta vidéo est géniale, merci je comprends beaucoup mieux les bases de pandas :)
Ca fait tres plaisir de pouvoir aider !
C'est vraiment formidable 🙏🏽🙏🏽
merci infiniment pour votre effort
Bonjour
Nous serons très heureux que vous venez sur les fonctions discriminantes dans la reconnaissance des formes
je vais le faire, merci ! :)
merci infiniment Guillaume génial
Merci :)
@@MachineLearnia je vous en prie
Merci pour ces tutos.
Ca me fait plaisir ! Merci de les suivre :)
Bonjour,
Superbe collection de vidéo . Elles sont très pédagogiques;
Avez-vous fait ou ferez-vous une vidéo expliquant comment créer un dataset à partir de ses propres images par exemple dans le cadre d' une classification?
Merci encore
Bonjour et merci beaucoup ! Oui je compte faire plusieurs vidéos pour faire de la vision par ordinateur sur vos propres images (d'ici quelques mois)
J'ai vraiment aimé cette vidéo
Merci infiniment, c'était claire !!
Eh bien c'est tout simplement génial pour débuter. Merci beaucoup :)
De rien :)
T'es le meilleur Guillaume :)
Merci :)
@@MachineLearnia Mais tu n'a pas repondu concernant mon probleme de jupyter
Excellent !
Cependant, pourquoi à 15:02 on a 3 lignes qui sortent alors qu'on a écrit data.loc[0 : 2 , ['age','sex'] ] ? Nous devrions avoir que les lignes d'index 0 et 1 non ?
Il est possible que j'ai executé une cellule, puis changé le code, et que j'ai oublié d’exécuter la cellule... Mais en effet tu as raison
Excellente explication. Merci
Je vous en prie.
super tuto simple à comprendre, merci
Je vous en prie !
j'adore. C'est très explicite
Merci !
Excellente vidéo et super intéressante merci encore, j'ai une question si on supprime tout les valeurs NAN du dataset avec dropna() ça risque de biaiser notre modèle d'apprentissage après ? merci
Merci :)
Oui... et non. Tout dépend ! Si les données qui sont supprimées sont distribuées normalement a travers les classes du Dataset, alors le risque de biais est faible. Si en revanche les données NaN sont toutes liées a une situation particuliere , alors le modele sera en effet "biaisé" (ce n'est pas le vrai terme pour parler de ca) car il n'aura jamais vu des données correspondant a une situation particuliere.
@@MachineLearnia merci bcp
@@90fazoti de rien, c'était une bonne question qui méritait une réponse adéquate ! :)
Bonjour, merci pour la richesse et clarté de vos tutoriels. A la fin de la vidéo quand vous expliquez les méthodes de mask puis de boolean indexing je rencontre une erreur avec la ligne '
Pour etre sur de votre erreur, il faudrait venir sur notre discord pour partager votre erreur dans les détails.
Je vois kaggle arriver au loin x)
Pour mon plus grand plaisir.
Aaah Kaggle, je compte faire BEAUCOUP de vidéos dessus, mais pas dans l'immédiat (je vais poursuivre la série Python pour les prochaines semaines) :D
Stay tuned !
Un grand merci
Merci beaucoup pour vos vidéos (TOP DU TOP). Dans un DataFrame déjà constitué et rempli, est-il possible d'inclure ( copier/coller) des colonnes d'un autre tableau (provenant d'Excel, par exemple )? Merci d'avance.
super la vidéo ! merci
Merci
Belle vidéo très bien expliquer je m'abonne !
Merci beaucoup :)
Merci beaucoup pour la formation.
Actuellement j'ai un projet de mémoire sur le machine learning et j'aimerais avoir vos ton aide
Bonjour, vous pourrez trouver de l'aide sur notre discord. A titre personnel je peux aussi vous aider, mais mon temps est limité car je recois beaucoup de demande et j'ai également un travail a temps plein.
@@MachineLearnia d'accord je suis déjà sur discorde et je discute avec des gens mais j'aurais besoin de votre aide aussi
est-ce que je peux avoir votre mail
merci de m'envoyer un message privé sur discord alors, Mon email est donné sur la page youtube
merci pour cette vidéo
Super, comme d'hab !
Merci beaucoup :)
Salut Guillaume, quel bonheur tes vidéos!! Idéal et nettement plus "user friendly" que de se plonger dans les docs officielles ;-). Je me demandais s'il était possible d'accéder à des "chapitres" précis de la vidéo sans avoir besoin de la parcourir complètement pour pouvoir revenir sur certaines fonctions... Est-ce qu'il y a un descriptif de tes vidéos? Un grand merci à toi.
De716
Hello et merci a toi. Alors pour info je suis en train de préparer un petit livre qui résume toutes les fonctions qu'on a vu dans cette série de vidéos.
Et sinon au bas de chaque vidéo il y a dans la description la timeline pour accéder plus rapidement aux différents cahpitres.
Ah super j’avais pas vu. Et c’est top pour le livre, encore merci pour ce partage de tes connaissances ça aide beaucoup la communauté !!
@@MachineLearnia Salut Guillaume, j'ai une question au sujet des masques : est-il possible d'utliser un dataframe comme masque d'un dataframe plus grand? J'ai en fait une base de questions, avec en index le nom des objectifs et pour chaque objectif correspondent des questions avec un niveau de taxonomie spécifique... Le template pour faire l'exam est un tableau avec une partie de ces mêmes objectifs et des niveaux de taxonomie. J'aimerais donc utiliser ce template pour aller sélectionner directement toutes les questions correspondantes à ces objectifs et taxonomies... Est-ce faisable? Mille merci encore pour tes vidéos.de716
Super vidéo merci ❤️❤️❤️
De rien ! :)
vraiment mercii beaucoup
C'est un plaisir de produire ces vidéos. merci !
Merci , svp des autres projets
il y en a pleins d'autres sur la chaine
vidéo clair, facile à suivre
Merci pour votre réponse.
Quand je t'appe le code:
Pd.read_excel('hh.xls')
Le fichier ne télécharge pas ??
Je suis vos séries, et vraiment j'avance bien avec vous, du coup je vous demande de nous faire une vidéo d'analyse de base de données " Chicago crime"
Merci
J'ai prévu de le faire en 2021, c'est parfait ! ^^
@@MachineLearnia merci infiniment , j'attends avec impatience
Slt Guillaume ! du coup le fichier excel doit-être importé dans le Jupyter ou pas? Merci d'avance
Salut, oui il faut importer le fichier Excel dans ton dossier de travail dans Jupyter
@@MachineLearnia merci Guillaume c'est très gentil... les cours sont vraiment magnifique
merci infiniment
Je vous en prie, merci beaucoup !
Très bonne vidéo comme d'habitude.
Petite question : à 0:00 ou 9:20 quand on groupby le sexe et classe, on voit que 96% des femmes en classe 1 survivent VS 89% de celles en classe 2. Y'a-t-il un moyen de voir s'il y a une différence significative entre ces deux catégories et les autres à l'aide d'une ANOVA, t-test ? Le module scipy.stats propose quelques fonctionnalités mais y'a-t-il un moyen pour grouper les catégories non significativement différentes entre elles et hiérarchiser ces groupes ?
Exemple : %survie des femmes 1 et 2 > %survie femmes 3 > %survie hommes 1 > %survie hommes 2 et 3
Oui tout a fait ! il faut pour cela calculer la crosstab avec les variables sex, pcass, et survived (utilisez pd.crosstab())
puis il faut effectuer un test de chi2 avec la fonction de scipy chi2_contigency. Cela vous retourne la statistique chi2, la p_value, et le tableau des valeurs attendus, et vous pouvez avec rejeter votre hypothese H0 si p_value < 0.02 (ou tout autre valeur alpha que vous aurez choisie) :)
Bonjour depuis la Mauritanie.
excellente vidéo.
je voudrais savoir la différence entre utilisation de raw et celui de data sur pandas
Raw c'est pour les données brutes, data c'est les données pré-traitées. En général.
Bonjour Guillaume,
Merci beaucoup encore une fois pour la qualité de tes vidéos elles sont vraiment excellentes.
j'ai une question concernant groupby est ce possible de grouper par une fonction (mise en forme de valeurs) ou uniquement par colonne?
Pour illustrer mon propos, j'ai une colonne avec des code insee et je voudrais grouper par département, donc les 2 premiers caractères du code insee. Je n'ai pas trouvé d'information sur le site pandas...merci d'avance
j'ai essayé sans succès :
in[19]
df.groupby(['entite',df['code_insee'].astype(str).str[0:2]).sum()
in[20]
dept = df['code_insee'].astype(str).str[0:2]
df.groupby(['entite',dept).sum()
:x
Merci beaucoup. Dans cette situation, je créerai tout simplement une colonne temporaire qui contient les 2 premiers caractères sur code insee pour ensuite effectuer cette opération de groupby.
@@MachineLearnia Merci beaucoup, tes vidéos sont vraiment très enrichissantes et poussent à aller plus loin. Bravo !
Merci pour ta video. S'il te plait, peux tu faire une video sur la representation spatiale d'un modele numerique de terrain?
Bonjour et merci :)
Vous voulez parlez de créer un terrain en 3D ?
@@MachineLearniaje tiens à vous remercier pour votre réponse. Oui, je souhaiterai réaliser une carte 2D de terrain et par après un modèle 3D.
Merci de votre aimable compréhension 😀
Merci pour toutes ces superbes vidéos. Néanmoins j'ai un PB avec le fichier xls titanic3. Quand je fais le read_excel ça renvoie une erreur, je pense que c'est lié au changement de configuration régionale de l'ordinateur, le mien est configuré en FR. Séparation virgule ou point-virgule ? UTF-8 ?
Juste pour info et si j'ai bien compris la session iloc (et loc par la même occasion).
Quand on a data.iloc[1, 2], le chiffre 2 fait que la deuxième colonne est prise.
Quand on a data.iloc[1:2, 0:2], le chiffre 2 fait que la première colonne est prise mais pas la deuxième colonne.
Merci Pandas...
C'est une chose commune a beaucoup d'outils de Slicing, et a la base on retrouve ca dans Numpy, et dans les listes (on l'a vu au début de la série).
Attention aussi l'index 2 réfère a la 3ieme colonne ! (mais ca je pense que tu l'as compris ^^ )
Bonjour,
Je vous félicite pour le travail si important que vous faites à but non lucratif. je suis nouveau en python, je veux faire des analyses statistiques en python. j'applique vos mêmes démarches utilisées dans les vidéos. cela m'affiche toujours des erreurs.
Votre aide en ce sens me serait très utile afin d'appliquer vos explications sur mes propres jeux de données.
Bonjour et merci beaucoup. Nous pourrons plus facilement vous aider sur le serveur discord (lien dans la description) car nous pourrons échanger du code ensemble
@@MachineLearnia j,'utilise jupiter notebook.
Voila comment je procède
Import numpy as np
Important pandas as pd
Import matplotlib.pyplot as plt.
Df = pd.read_csv("data.csv")
prinint(Df)
Bonjour, je viens de (re)decouvrir la fonction cut qui permet de repondre à moitié a l'exercice:
le code si dessous marche mais coupe en 4 catégories d'age de longueur équivalente, appelés des quartiles par les statisticiens:
data['age']=pd.cut(data['age'],bins=4,labels=(1,2,3,4))
on peu aussi mettre data['cat_age']= cela va recréer une colonne a la fin avec les 4 catégories 1,2,3,4 tout en préservant la colonne âge.
Bien joué !
époustouflant
Merci
Bonjour, super vidéo ! Petite question, est-il possible pour l'exercice d'ajouter un champ au lieu de recalculer le tout dans le champ âge ? Et, est-il possible de faire un undo après une fausse manœuvre ou il faut tout recommencer du début ? Sinon peut-on faire une copie du dataframe avant ? Merci !
pour faire un nouveua champ, il suffit de créer une autre colonne en effet. Et oui pour faire un retour en arriere, il faut faire une copie de votre DF.
Bonjour. Je suis bloquée dès la première étape. En effet, dès que j'essaie d'importer le fichier, ce message d'erreur s'affiche : FileNotFoundError. Je n'ai aucune solutions. Que faire ?
Merci d'avance.
Merci !
Merci beaucoup. Peut on faire sur pandas des états, des formulaires ? Peut on retrouver les formules comme sur excel ?
Bonjour, j'ai du mal a comprendre votre question désolé
merci beaucoup
est que vous pouvez faire des vidés sur le deep learning ??
et bonne continuation :)
Bonjour et merci. Je vais sortir une série sur le Deep Learning qui commence dans quelques jours :)
@@MachineLearnia super!! merci bcp :)
Salut, super série. Merci pour ton partage.
Y a un petit typo à 2:28, un point traine sur df.['column'].value_counts() entre df et ['column'].
Merci encore.
Merci beaucoup pour avoir remarquer cela ! :)
Bonsoir
Excellent cours tres bien detaillé tres bien organisé
Je souhaite savoir comment je peux charger les donnees train et test avec la biblio sk learn? merci
En général on charge nos données depuis pandas, puis on découpe X, y pour les fournir a sklearn (je détaille cela dans la video 20/30)
@@MachineLearnia bonjour j ai bien regardé cette video mais vraiment je suis bloquée
merci beaucoup
Merci pour la vidéo
Peut tu nous faire une ainsi concernent le réseau U-Net et la bibliothèque Keras?
Bonjour Guillaume, Merci pour ces videos
comment supprimer une ligne normale?
merci bcp
woooowww très cool. Merci infiniment
Merci content de savoir que la vidéo vous a plu !
Hello, merci pour ta vidéo, encore du super boulot. Je n'arrive pas à utiliser la plus part de tes fonctions avec mes fichiers csv, en effet, il y a trois ligne utilisé pour décrire chaque colonne. Du coup Python ne comprends pas quand j'appelle seulement l'une d'elle avec le nom d'un des trois lignes. Je peux t'envoyer un des fichier csv que j'ai à traiter.
Je m'en sors en passant par le module csv et en suppriment les ligne qui m'intéresse pas mais bon je suis sûr qu'il y a plus simple.
J'ai une autre question. J'ai un tableau de deux dimensions avec une première ligne qui contient le nom des colonnes. Quand je crée un DataFrame de ce tableau, je me retrouve avec des index ( 0, 1, 2 ...) pour les colonnes aussi ... Tu sais comment je peux changer l'indexation des colonnes par la ligne avec le nom des colonnes ?
Merci d'avance !
Bonjour,
Pour le premier point, tu peux nous envoyer ton code et ton document sur discord, on pourra t'aider.
Pour le second point, tu peux renomer les colonnes comme cela : df.columns = df.iloc[0, :] ce qui aura pour effet de renommer les colonnes avec les éléments de la premiere ligne (ligne 0). Ensuite, tu peux drop cette ligne. Ou alors tu peux tout simplement commencer la lecture de ton fichier csv une ligne suivante : pd.read_csv(....., skiprows=1)