Комментарии •

  • @MachineLearnia
    @MachineLearnia 3 года назад +42

    IMPORTANT ! UPDATE DE SKLEARN :
    - pour RFE : min_features_to_select n'existe plus et l'algorithme a légerement changé : il faut maintenant définir le nombre de variable que l'on veut atteindre avec n_features_to_select et l'algorithme élimine au fur et a mesure les variables en suivant le processus que j'ai mentionné dans la vidéo
    - Pour SelectFromModel, je dis dans la vidéo que les variables sont séléctionnées a partir de la moyenne des coefficients. En fait je fais la une "simplification" mais en réalité les variables séléctionnées sont celles pour lesquelle la Norme des coefficient est supérieure a la moyenne des normes. Ci-dessous un code :
    selector = SelectFromModel(SGDClassifier(), threshold='mean')
    selector.fit(X, y)
    importances = np.linalg.norm(selector.estimator_.coef_, axis=0, ord=1)
    mean = np.mean(importances)
    print(selector.get_support())
    print(importances > mean)

  • @essaidelhaji6844
    @essaidelhaji6844 4 года назад +22

    Merci pour vos efforts. Vous êtes parmi les rares qui ont décidé de fournir des formations de qualités gratuitement! un contenu progressif, une pédagogie intéressante et des montages très illustratifs. Je recommande cette chaîne pour toute personne désirant faire son pas dans la monde de machine Learning. Bravo cher Guillaume.

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci beaucoup, ca me fait tres plaisir :)

  • @cyrilww3750
    @cyrilww3750 3 года назад +2

    Quel régal ! Ca fait 2 semaines que je suis les vidéos avec mon Jupyter Notebook, tout marche, le prof est clair, c'est que du bonheur !

    • @MachineLearnia
      @MachineLearnia 3 года назад +2

      Que du bonheur pour moi aussi, merci :)

  • @sabnina1920
    @sabnina1920 4 года назад +7

    waouh quelle vidéo! c'est tellement bien expliqué!! merci du fond du coeur pour toutes ces informations!

  • @pulsorion
    @pulsorion 4 года назад +19

    Un sujet pas des plus simples mais pourtant très bien expliqué ✔ 😉

  • @joshanambungu8222
    @joshanambungu8222 6 месяцев назад

    Encore une magnifique vidéo de votre part. J'ai particulièrement apprécié la manière dont vous avez simplifié l'explication du SelectFromModel avec le threshold = mean.
    J'espère qu'il y a une vidéo qui parle des modules avec la sélection basée sur le pvalue que je trouve plus rigoureux qu'une valeur de seuil arbitraire.
    En passant, l'attribut grid_scores ne fait plus partie de la classe RFECV et est remplacée par cv_results_ qui donne encore plus de détails (merci Chatgpt 😁).
    Encore Merci pour ce que vous faites !

  • @GasherProdStudio
    @GasherProdStudio Год назад +2

    Bonjour Guillaume, merci pour cette precieuse video sur la feature selection, en python, avec ScikitLearn !

  • @tarluck
    @tarluck 4 года назад +4

    Bonjour et encore une fois Merci Guillaume pour toutes ces videos, on ne sait vraiment pas comment vous remercier ???!!!!,

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci beaucoup. Vous venez de me remercier avec ce commentaire de remerciement ! ^^
      (vous pouvez aussi me soutenir sur Tipeee, si vous le désirez)

  • @angesamuel7139
    @angesamuel7139 4 года назад +1

    Merci bcp pour ton temps que tu nous accordes. Tes vidéos m'aident énormément dans la compréhension de tous ces termes liés au ML qui me paraissaient compliqués bien avant que je ne tombe sur ta chaîne.

  • @moussabamba6216
    @moussabamba6216 4 года назад +1

    Waouh tout est clair et simple à comprendre vraiment merci ,avec toi le machine learning est simple à comprendre et en plus passionnant .merci infiniment,merci

  • @Science3D
    @Science3D Год назад

    j'écoute chaque video de ta chaine et je n'ai que du positif à leur sujets. tu es un formateur de très haut calibre! J'avais acheté une formation sur udemy mais la manière que tu explique les concepts dépasse largement la formation. Merci ! Merci !!!

  • @amadoufall3841
    @amadoufall3841 2 года назад

    Vraiment un grand merci à vous pour tous les efforts que vous faites. J'ai suivi vos enseignements avec admiration à travers votre chaine. Je vous souhaite beaucoup de succès dans vos projets.

  • @eyazouaghi7938
    @eyazouaghi7938 3 года назад

    c'est tellement bien expliqué!! merci du fond du coeur pour toutes ces informations!

  • @aboubacardiaw6812
    @aboubacardiaw6812 4 года назад

    Merci beaucoup pour ces vidéos. elles sont vraiment compréhensibles. Grace à toi j'ai beaucoup appris!!!

  • @amyd.2840
    @amyd.2840 4 года назад +1

    Super vidéo comme toujours, merci ! :)

  • @donellessame9194
    @donellessame9194 3 года назад +3

    J'ai remarqué en avançant dans cette série de vidéo, qui tu avais tendance à faire des simplifications de certaines notions. Au début, je ne saisissais pas trop et je pensais que tu te trompais parfois. Et ensuite je me suis rendu compte que tu simplifiais, car les notions que tu partages dans cette série de vidéo son des notions assez complexes et vastes pour certaines et que pour les rendre accessible il est nécessaire parfois de prendre certains raccourcis. Je te félicite, car de cette façon des gens comme moi qui n'avons pas étudier le ML à la fac ou nulle part ailleurs on peut se former quand même sans avoir forcément énormément de prérequis. Et ça, c'est beau.

    • @MachineLearnia
      @MachineLearnia 3 года назад +8

      Merci, tu as tout a fait compris ma démarche et ca me fait vraiment plaisir, car cela demande beaucoup de travail (des dizaines d'heures, voire des centaines, pour faire les scripts, les animations, trouver les bons mots, bien vulgariser) J'écris parfois 5 a 10 brouillons pour expliquer un concept que je connais déjà bien, juste pour trouver l'explication accessible a tous.

  • @IhebGMAR
    @IhebGMAR Год назад +1

    Hey Guillaume, la vidéo ne va pas vite pour certains au contraire 😉 J'en profite pour te laisser un GRAND MERCI pour tout ce contenu el les efforts fournis afin d'avoir des cours de cette qualité 🤩🤩 Un GRAND MERCI pour toutes ces explications minutieuses et franchement BRAVO pour toutes tes vidéos 💙💙💙💙

  • @kamalelbo5116
    @kamalelbo5116 3 года назад +1

    Merci beaucoup Guillaume pour ce cours très bien expliqué comme d'habitude, je te souhaite plein de succès ;)

  • @anassariss5153
    @anassariss5153 4 года назад

    Très Bonne explication, je vous souhaite une meilleur continuation. Je kiffe tous vos vidéo franchement.

  • @amid7757
    @amid7757 2 года назад

    merci pour tout Guillaume!
    Vos vidéos sont de très haute qualité

  • @mohammed_yazidcherifi9816
    @mohammed_yazidcherifi9816 4 года назад +1

    Vraiment au top comme toujours,
    Merci beaucoup, vous m'aidez beaucoup pour mon apprentissage, dommage étant étudiant donc je n'ai pas d’expérience , j'ai jamais codé un programmes de ML mais grâce à vous je commence à voir mieux ce métier, son principe et comment ça marche à l’intérieur, j'attends avec impatience les prochaine vidéos.
    En fait je trouve que SKlrearn est très riche pour le preprocessing, et beh c'est un peu problématique, je m'explique, on a appris avec vous beaucoup de choses sur le pré traitement du dataset, du la partition du dataset, et de la cross validation etc.., nettoyage des données, choix de la metric, sélection de variable, le choix du modèles, le choix de la cv, les pipeline , et j'aimerais savoir comment avoir une méthodologie ou un ordre à suivre pour appliquer tous ces pré traitement,et comment à chaque fois choisir la meilleure méthodes du prétraitement pour avoir la meilleur performance possible,
    J'attends avec impatience la suite, surtout les vidéos où on étudie vraiment la pratique et suivre pas à pas votre démarche de résolution de problème.
    Vous méritez que votre chaîne soit connue d'avantage car elle est très très très bien et croyez moi c'est assez rare de voir un travail de bonne qualité.
    Merci pour vos efforts immenses, merci de trouver à chaque fois du temps pour nous .
    Merci beaucoup,
    bon courage.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Merci beaucoup pour votre message ! Oui je comprends qu'il y ait beaucoup d'information ! C'est normal d’être un peu perdu et c'est la raison pour laquelle les 5 dernières vidéos de cette série portent sur la méthodologie et la pratique de projets ! Une fois la série terminée, je ferai beaucoup de vidéos de projets également !

    • @mohammed_yazidcherifi9816
      @mohammed_yazidcherifi9816 4 года назад

      @@MachineLearnia merci infiniment pour vos efforts envers nous, bon courage.

  • @yousseffellous8153
    @yousseffellous8153 4 года назад +1

    Vraiment vos vidéo c'est le top du top, un grande merci ;)

  • @Safadiallo
    @Safadiallo 2 года назад

    Merci Monsieur pour cette belle contribution à la vulgarisation du machine learning

  • @nabihamaraoui7082
    @nabihamaraoui7082 4 года назад +1

    Pas de problème quant à la rapidité , non ce n'est pas trop rapide et c'est très bien expliqué. C'est très intéressant car c'est très similaire
    à l'économétrie, vu de manière plus simple mais l'architecture est semblable. Merci pour cette vidéo limpide et consistante.

  • @houssam814
    @houssam814 2 года назад

    Nice work mate, you are a real hero.

  • @giuseppepresti2859
    @giuseppepresti2859 4 года назад +1

    Encore un grand merci pour tout Guillaume. Vous êtes super avec tout ce que vous avez créé (Vos vidéo super explicite , votre livre sur le ml , comunauté discord , Tipeee etc). Par contre , j'aurais une petite question. Est ce que vous parlerez un jour d'interface graphique (pas tkinter car trop simpliste et ce n'est pas très beau)? Je parle d'un interface graphique qui s'ouvre sur une page web afin de vraiment manipuler facilement les choses et de ne plus devoir aller dans le code python pour chipoter (avoir une bonne visibilité==> exemple un onglet qui permet de sélectionner le type de régression que l'on veut faire). D’ailleurs si vous avez un petit lien sur un truc qui permettrai de créer une interface graphique web généré depuis le code python ça m'intéresserait :)
    Encore un grand merci pour tout , vous êtes incroyable.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Je ne suis pas un expert en interface graphique. En milieu professionnel, les data scientists et Data Engineer n'ont pas pour rôle de développer des interfaces. A la place, nous utilisons les APIs fournies par des outils comme ceux du Cloud etc.

  • @theor5677
    @theor5677 4 года назад +3

    Au top Guillaume ! Comme d'habitude

  • @LaurentD90
    @LaurentD90 3 года назад +1

    Encore un coup de Maître ! Merci pour cette superbe vidéo.

  • @jord-aeleon1887
    @jord-aeleon1887 4 года назад

    Excellente idée cette petite pause, c'était coton ce passage sur les matrices (même si je pense avoir compris le principe). Encore merci pour cette vidéo ;)

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Merci beaucoup ! Je suis content si tu as pu comprendre le passage avec les matrices

  • @THLEx2
    @THLEx2 2 года назад

    Super vidéo pour reconstruire les bases ! Merci

  • @zahrazemam1347
    @zahrazemam1347 4 года назад

    super bien explique j'adore tes video, merci du fond du coeur

  • @jimdelsol1941
    @jimdelsol1941 4 года назад +3

    Merci beaucoup pour cette vidéo ! :)

  • @bienvenumoutouama5672
    @bienvenumoutouama5672 4 года назад

    Vraiment vous étes le meilleur.Merci encore pour vos videos.

  • @azizrajim363
    @azizrajim363 2 года назад

    Génial, bravo.

  • @tamervuranok
    @tamervuranok 9 месяцев назад

    Bonjour Guillaume. Tout d'abord, je dis: WOUW. Tu es le meilleur. J'ai jamais vu une formation aussi bien structurée et expliquée. Un énorme merci à toi.
    Et une question, stp: Doit-on vraiment appliquer un modèle ML qui fait une sélection des features pour développer un modèle ML avec SelectFromModel ou RFE ? Càd, si on applique directement un modèle (sans faire SelectFromModel ou RFE), le modèle risque de donner un moins bon résultat ?
    Je m'attends à ce que l'algorithme du modèle élimine de toute facon les features inutiles dans sa phase de training..

  • @papamatardieng6816
    @papamatardieng6816 2 года назад

    merci beaucoup pour vos videoes 👍👍👍

  • @DiizouFR
    @DiizouFR 4 года назад +1

    Au top merci Guillaume !

  • @mamadoudiedhiou4997
    @mamadoudiedhiou4997 4 года назад

    Excellent travail M.Machine Merci beaucoup

  • @sandjakkhaled4492
    @sandjakkhaled4492 2 года назад

    Merci vidéo très utile

  • @Hufoodie
    @Hufoodie 3 года назад +1

    I'm still at the 6th minute but felt the urge to thank you for sharing this !!!!! Merci infiniment

  • @idrisseahamadiabdallah7669
    @idrisseahamadiabdallah7669 2 года назад

    nice videos, well explained

  • @sebastienm2037
    @sebastienm2037 3 года назад

    Excellent, merci beaucoup !

  • @mahdouibrahim2022
    @mahdouibrahim2022 2 месяца назад

    t est vraiment genial. merci beaucou p

  • @jean-luctrocello1139
    @jean-luctrocello1139 4 года назад

    Merci pour cette vidéo et votre travail

  • @aichaelfilali4361
    @aichaelfilali4361 4 года назад +1

    Très bien expliqué Merci bqqqq

  • @imadsaddik
    @imadsaddik 4 месяца назад

    Merci beaucoup mon ami

  • @IngDAOUDI
    @IngDAOUDI 4 года назад

    Bonjour,
    Merci bcp pour ces vidéos que je trouve très utile.
    Je viens de terminer toute les vidéos et le problème c'est qu'on je suis à la fin je me souviens plus de toute les notions présentées dans les premières vidéos.
    C'est clair que ça demande bcp de pratique pour les approprier mais je ne sais pas si vous pouvez nous préparer une vidéo dont vous présentez une application de toute les notions fondamentales et souvent utilisées dans le ML.
    Sinon je te félicite pour les vidéos qui sont vraiment magnifique

    • @9raytibook
      @9raytibook Год назад

      l9iti akhouya chi solution ?

  • @antoinetiyadjowe1955
    @antoinetiyadjowe1955 3 года назад

    Merci infiniment pour cette vidéo

  • @valdimayima9414
    @valdimayima9414 3 года назад

    Super vidéo

  • @touzrimohamedhelmi2332
    @touzrimohamedhelmi2332 2 года назад

    bravo, et encore... bravo

  • @koueviayiselom3225
    @koueviayiselom3225 4 года назад

    Votre formation est vraiment géniale. Vous expliquez les choses de manière simple et vous êtes un bon pédagogue. Le petit souci que j'ai eu est dû au langage utilisé parce que je suis un peu plus familiarisé avec R

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Je suis heureux de pouvoir vous aider ! :) Que pensez-vous de Python vs R alors ? Je ne maitrise pas R donc je serais curieux de connaitre votre avis :)

  • @jawadboujida271
    @jawadboujida271 3 года назад

    Merci, excellente vidéo.

  • @martrom0
    @martrom0 3 года назад

    Je fais rarement de commentaires mais là .. Tu es le meilleur !! Bravo pour tes cours !! Merci !!

    • @MachineLearnia
      @MachineLearnia 3 года назад

      Merci beaucoup pour ton commentaire alors ! Je le prends comme un honneur ! :D

  • @abdelazizfeddaoui1993
    @abdelazizfeddaoui1993 4 года назад

    Un grand merci.

  • @Bwaaz
    @Bwaaz 3 года назад

    Très clair, merci :)

  • @Patchi246
    @Patchi246 4 года назад +2

    Bonjour et merci pour ces explications . Je pense que le rythme des vidéos est très satisfaisant, c'est vraiment compréhensible
    .
    Est-il judicieux d'utiliser ces méthodes de sélection de variables pour des data set assez large, par exemple 150-200 variables?

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci beaucoup. C'est justement dans ces cas qu'il faut utiliser des méthodes de sélection de variables et de réduction de dimension (algorithme PCA que l'on verra dans la prochaine video)

  • @hananeslimani6513
    @hananeslimani6513 9 месяцев назад

    Merc beaucoup pour la vidéo 🙂 très utile et surtout très bien expliqué !
    J'ai une question j'aimerais utiliser les estimateurs à partir des coefficients pour un réseau de neurones mais c'est un réseau implimenté sur torch ( j'utilise une fonction de train implimenté a la main) et je n'utilise pas .fit() pour entraîner le model.
    Ma question peut-on utiliser les estimateurs à partir des modèles appris dans le cas d'un CNN implimenté sur torch ?
    Merci encore une fois pour la vidéo ça m'était très utile 👌

  • @karlbina9665
    @karlbina9665 3 года назад

    Vraiment un grand Merci :-)

  • @kouleyengouffomartial2903
    @kouleyengouffomartial2903 3 года назад

    merci pour les efforts car tes vidéos sont très passionnantes. moi personnellement je ne saurai m'enlace

  • @adelesouleymanova2172
    @adelesouleymanova2172 3 года назад

    Merci infiniment!!!

  • @jonathanblandiaux7502
    @jonathanblandiaux7502 3 года назад +2

    Super vidéo merci beaucoup Guillaume !
    J'ai une petite question quand on utilise SGDClassifier avec le threshold="mean" pour déterminer les coéfficients à garder. Pourquoi regarde t-on les coéfficients supérieurs à la moyenne seulement ? Un grand coefficient négatif montre également une grande relation entre x et y, non ?
    Merci encore pour cette série de vidéos vraiment au top 😍

    • @MachineLearnia
      @MachineLearnia 3 года назад +2

      Bonjour Jonathan ! Oui oui c'est correct. J'ai juste utilisé "mean" dans cette vidéo pour expliquer le principe, mais ca n'est pas forcément celui que j'utiliserai pour un SGDClassifier !

  • @moussabamba6216
    @moussabamba6216 4 года назад +2

    bonjour et merci pour tes vidéo j'aimerais savoir si à la fin vous feriez une vidéo dans laquelle vous montreriez les étapes à suivre dans un projet de machine learning .merci d'avance

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Merci ! je vais en faire plusieurs ! (ca commence a la vidéo 26)

  • @ulrichkarlodjo1457
    @ulrichkarlodjo1457 4 года назад +1

    AHAH sa fesait longtemps la tablette pour faire des maths! Bon les vidéos je les trouves pas trop rapide meme celle-ci n'était pas rapide juste la partie ou t'est rentré dans les mathématiques c'était un peu speed mais bon pas exagéré non plus han! Sinon à part sa super vidéo sa me permet de compléter mes outils de features selection et pour l'ACP je m'attendais à la voir mais on ne l'a pas aborder!

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Merci Ulrich ! l'ACP nous allons la voir dans la prochaine vidéo, car ce n'est pas une technique de sélection de variables, mais de projection de variables (grosse nuance)

  • @chainonsmanquants1630
    @chainonsmanquants1630 3 года назад

    merci

  • @rvstats_ES
    @rvstats_ES 4 года назад

    J'apprends le francais et le feature selection en meme temp ;) . Thanks!

  • @sandrasandji6620
    @sandrasandji6620 3 года назад

    great!!!! thanks

  • @JeromeVachet
    @JeromeVachet 3 года назад +1

    Déjà Grand Bravo pour les vidéos. Dans un cours de DataMining, pour travailler la réduction de variables, on utilisait les ACP. Est-ce que l'on peut utiliser les 2 méthodes ou est-ce l'un ou l'autre ?

    • @MachineLearnia
      @MachineLearnia 3 года назад

      Parfois l'une marche mieux que l'autre, il faut tester les 2 :)

  • @allalzaid1872
    @allalzaid1872 2 года назад

    des videos tres utiles, or pas de regression .
    merci

  • @request_scudling
    @request_scudling 4 месяца назад

    Merci pour vos efforts et le partage , j'apprends beaucoup avec vous (je suis dans le secteur télécom) , j'ai une petite remarque : à partir de la minute 24:44 vous dites que le score 80% est obtenu si l'estimateur prends les 4 variable (toutes les variables) en considération et le score 84,66% si on élimine une variable et 77,33% si on élimine deuxième variable , j'ai changé le min_features_to_select de 1 à 4 et j'ai constaté que le dernier score 77,33% est obtenu si l'estimateur prends les 4 variable (toutes les variables), le score 84,66% si on élimine une variable, le score 80% si on élimine la deuxième variable et le score 87,33% si on élimine la troisième variable, je pense qu'il faut lire de droite à gauche et non pas l'inverse , merci monsieur

  • @mackas33
    @mackas33 4 года назад +2

    Bonjour, un grand merci d’abord.
    Sinon j’aimerais bien savoir pourquoi vous utilisez SGDClassifier (c’est quel genre de modèle de classification SVP).

    • @MachineLearnia
      @MachineLearnia 4 года назад +4

      Bonjour, c'est un algorithme de classification trers simple qui repose sur la déscente de gradient stochastique. J'aime bien l'utiliser pour les exemples car c'est un algorithme très représentatif du Machine Learning et c'est un des plus simples a comprendre mathématiquement.
      Je vais bientot lancer une série qui explique la différence entre tous ces algorithmes

  • @bernylong4995
    @bernylong4995 4 года назад +1

    Bonjour,
    Encore bravo pour le fond et la forme. Peut on utiliser ce mécanisme également avec des données qui ont été encodées ?... Dans votre exemple, on exploite des données numériques mais qu'en est il lorsqu'il s'agit de données qualitatives ? après encodage, on peut également sélectionner les variables intéressantes ? Merci de votre retour.

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci ! Oui il est possible d'utiliser tous les concepts de cette vidéo pour les variables qualitatives, mais il faut au préalables les encoder en valeur numériques (car sinon les tests de dépendance et autres techniques ne fonctionnent pas, c'est juste mathématique). Donc il faut faire de l'encodage onehot ou encodage ordinale pour les valeurs qui ne sont pas des nombres, pour ensuite utiliser SelectKbest, SelectFromModel, etc.

  • @aydiamine1213
    @aydiamine1213 4 года назад +1

    tout d'abord merci beaucoup pour votre effort
    vos videos sont très utiles et faciles à comprendre
    autre
    Je travaille actuellement sur un projet qui gère le système de recrutement en utilisant l'apprentissage automatique qui va utiliser des CV et essayer de les classer en fonction de leurs compétences
    je me demandais quel algo est le mieux pour cette situation
    je pense à kBest et chi2
    toutes les suggestions sont les bienvenues
    mercii

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Bonjour, pour faire une bonne étude de CV, il faut surement utiliser un modele de traitement du langage naturel avec LSTM. Vous pouvez aussi créer un Bag of Words des CV analyser et trier les CV qui contiennent le plus certains mots que vous cherchez, mais attention a ne pas trouver les CV spams, je ne suis pas recruteur mais je pense que les bons candidats ne sont pas trouvés a travers le CV

    • @aydiamine1213
      @aydiamine1213 4 года назад

      @@MachineLearnia Merci pour votre réponse rapide
      oui, je pensais utiliser nltk pour nlp
      puis extraire les informations importantes dans des segments tels que: informations personnelles, compétences, projets etc. ça va aussi être une sélection basée sur la description de poste ou les exigences de l'entreprise.
      extraire les compétences, l'université en utilisant des dictionnaires, puis leur donner un poids en fonction de leur importance et de leurs besoins. puis transférez toutes ces données dans des vecteurs afin que je puisse les utiliser dans l'apprentissage automatique, mais je ne sais pas quoi faire après cela :(
      pour le rendre plus intelligent, je peux importer des informations github et LinkedIn en utilisant Api
      je suis désolé d'avoir perdu votre temps. c'est juste mon premier projet d'apprentissage automatique, donc je suis confronté à beaucoup de difficultés et votre chainne m'aide beaucoup

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Pas de soucis ! Votre démarche est bonne, c'est un bon début, je vous conseille de commencer par mettre en place des modèles simples avec une structure pour évaluer de façon cohérente tous les modèles que vous entraînez. C'est une des astuces les plus importantes en Data Science : Commencez par tester beaucoup d'idées simples et rapide a mettre en place, pour retenir les meilleurs idées et les améliorer avec d'autres idées simples et rapides a mettre en place.

  • @zinemoussa6863
    @zinemoussa6863 4 года назад

    Le contenue est très condenser c est vrai, mais tant qu il y a l option pause et retour sur RUclips, alors il y a pas de problèmes. Parfois je reste 2 - 3 heures sur une seule vidéo pour en tirer le maximum.
    Merci de nous faire part de ton savoir.

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci beaucoup et bravo pour votre motivation et votre travail, vous irez loin ! :)

  • @abdellatifkraiem2058
    @abdellatifkraiem2058 4 года назад +2

    Bonjour Monsieur!
    Bravo, c'est manifique ,
    D'abord je vous remercis pour tous les efforts que vous êtes entrain de fournir pour nous produire des vidéos extrêmement intéressant , en effet je vous demande si c'est possible de m'envoyer des documents à propos l'apprentissage non supervisé ( le problème de régression si j'ai une base non labellisée comment va être résolu) .

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Ma prochaine vidéo porte sur l'apprentissage non-supervisé, je pense que ça répondra a certaines de vos questions !

    • @abdellatifkraiem2058
      @abdellatifkraiem2058 4 года назад

      Merci monsieur

  • @henridu31
    @henridu31 3 года назад

    Salut Guillaume, super vidéo encore une fois ! j'ai toutefois une question, lors de la feature selection, pourquoi on ne dois pas spliter le dataset en train, test ?

    • @MachineLearnia
      @MachineLearnia 3 года назад

      Bonjour. Si si on doit séparer le dataset avant de faire de la sélection de variable. (mais ici je ne le fait pas pour en venir aux faits, et que le tuto avance vite)

  • @PaulG-xp9lb
    @PaulG-xp9lb 4 года назад +1

    Merci pour cette vidéo !
    you are very pedagogue ;)

    • @PaulG-xp9lb
      @PaulG-xp9lb 4 года назад

      En revanche, lorsque j'applique la technique RFECV je n'obtiens pas toujours les mêmes résultats quand je relance plusieurs fois le test c'est normal ?

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Merci beaucoup ! :)

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Oui il faut initialiser votre estimateur avec un générateur aléatoire random_state fixer a une valeur précise, par exemple random_state=0

    • @PaulG-xp9lb
      @PaulG-xp9lb 4 года назад

      @@MachineLearnia ah oui merci !

  • @pouriaforouzesh5349
    @pouriaforouzesh5349 2 года назад

    👍

  • @djibrildiouf9191
    @djibrildiouf9191 3 года назад

    super

  • @karimmajdi7012
    @karimmajdi7012 4 года назад

    D'abord je vous remercie pour ces cours très bien expliquer. quelle methode choisir la methode de feature selection ou le PCA? est ce que ta envisager de faire des videos sur les algo arbre de décision, random forest, lasso, ...

    • @MachineLearnia
      @MachineLearnia 4 года назад

      je vais faire toute ces vidéos bientot, et elles seront géniales ! :)
      Je conseille PCA uniquement pour réduire le temps de travail de la machine si elle travaille sur des milliers de variables et que ce sont des données non-structurée (par exemple des images et leur différents pixels)
      Sinon, pour les problemes aux données structurées (type tableau excel) avec en général un nombre petit de variables (

  • @Alpha-zf1tw
    @Alpha-zf1tw 3 года назад

    23/30, très claire as always...

  • @jmbdeblois
    @jmbdeblois 4 года назад +1

    Super vidéo très pédago comme d'habitude (on va s'habituer hein !!). Pour le coup, ça vaudrait peut-être la peine, pour compléter, de mettre quelques liens intéressants sur test du Khi2 et d'Anova.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Je suis d'accord avec toi pour les liens, je vais les rajouter bientôt, en attendant de produire moi-même des vidéos a ce sujet.

    • @jmbdeblois
      @jmbdeblois 4 года назад

      @@MachineLearnia qui seront plutôt des vidéos "matheuses" ou toujours orientées ML ? Car ce qui fait ta valeur ajoutée, ce sont les explications et liens avec le ML. Il existe suffisamment de références (très bonnes) sur les stats. Mais ce n'est que mon avis !

    • @MachineLearnia
      @MachineLearnia 4 года назад

      @@jmbdeblois Je suis d'accord et ma réponse est simple : Je ferai ce que la communauté me demande, donc merci a toi de me communiquer tes réflexions, elles sont vitales !

    • @jmbdeblois
      @jmbdeblois 4 года назад

      @@MachineLearnia je comprends ! pour moi, ton exploration des immenses possibilités de scikit-learn est géniale. Je me sens à l'aise en maths et en stats donc je n'ai pas besoin de ce genre de vidéos. Et puis après scikit, il y a tensorflow ! et puis il y a pytorch !! Ainsi, une incursion dans le PCA pourrait avantageusement éclairé cette vidéo sur les feature selection tout en parlant (gentiment) d'analyse multivariée

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Je vais parler de la PCA dans la prochaine video (apprentissage non-supervisé) car ca n'est pas vraiment de la séléction de variables, mais de la projection de variables dans des espaces de sous-dimension. Mais oui comme tu l'a indiqué mon but est d'expliquer les algos de façon ML/pragmatique sans faire des maths pures et dures, car sinon il y a juste Wikipédia pour les maths, et les définitions

  • @laconispe06
    @laconispe06 4 года назад

    Super vidéo !
    Une question sur la sélection de variables : faut-il normaliser avant d’utiliser les transformers ou les tests d’indépendance comme vu dans la vidéo du preprocessing ?
    En effet, admettons deux variables X1 = [1, 2, 3] et X2 = [1000, 2000, 3000].
    La variance de X1 sera de 0.666 contre 666,666 pour X2. Cela pourrait-il donc toujours avoir des répercussions sur les tests de dépendance ou bien cela dépend-il des cas ?
    Un grand merci pour cette série de vidéos.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      En effet si l'on effectue un test de student (t-test) ou bien ANOVA, alors il est nécessaire d'avoir des variances égales ou similaire, donc de normaliser les données. Sinon, pour un test d'indépendance chi2, ca n'est pas applicable (car on compare des fréquences entre catégories)

  • @stephaneperriot7845
    @stephaneperriot7845 4 года назад

    Bonjour,
    Merci encore pour la qualité et clarté de vos vidéos :)
    Est ce que dans le cas d'un SelectFromModel, il ne faudrait pas une moyenne des valeurs absolues pour tenir compte des corrélations négatives ?
    Pour la sélection de variable par variance, une feature pourrait présenter une faible variance et pourtant cette variance serait beaucoup plus impactante qu'une autre feature très variable. Par exemple le nombre de pièce dans un appartement contre le nombre de tableaux (décoration) pour estimer le prix d'un appartement.
    Dans l'ensemble mon commentaire porte sur les critères d'utilisation d'un sélecteur plutôt qu'un autre et le risque que les tests de dépendances ou mesures statistiques utilisées (moyenne, variance) cachent des informations. J'espère être clair ^^
    Pour ma part les vidéos ne vont pas trop vite car chaque point est correctement expliqué sur les bases précédemment acquise. Je mets souvent la vidéo sur pause pour prendre des notes, assimiler ou faire des recherches à coté et parfois je revisionne un passage pour être sur d'avoir bien saisi. En gros, je gère mon rythme :) En général il me faut le double de temps pour visionner une vidéo. Je suis très satisfait de cette méthode, en relisant mes notes plus tard je valide les connaissances acquises.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Je n'ai pas compris ta question sur SelectFromModel. Pour les variances, on utilise surtout cela pour éliminer les variance tres proches de zero (auquel cas, il est rare qu'elle soit bien corrélée a la cible y). A titre personnel, Je ne dépends jamais d'une méthode toute seule et j'essaie d'en utiliser plusieurs pour voir les résultats les plus intéressants.

    • @stephaneperriot7845
      @stephaneperriot7845 4 года назад

      @@MachineLearnia Merci de voter réponse, je ne suis pas très sur de mes questions. L'idée générale porte sur la possibilité de faire une mauvaise sélection en se basant sur des indicateurs peu pertinents. Tester plusieurs méthodes pour en analyser les résultats me semble une bonne manière de pas tomber dans ce piège.

  • @quentinuhart6687
    @quentinuhart6687 4 года назад

    Est ce que tu vas vite dans tes vidéos? Ouiiii ! Mais c'est l'intérêt d'une vidéo, on peut mettre sur pause pour prendre des notes. Il y a tellement d'informations à donner en 30 vidéos que je ne vois pas comment tu pourrais réduire... Encore bravo et un grand merci pour cette formation de qualité !

  • @laurambia8831
    @laurambia8831 4 года назад

    bonjour, merci pour cette vidéo. J'ai une préocupation, la sélection des variables interviennent avant ou après la standardisation et la labelisation des variables catégorielles?

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Ca dépend de quelle opération de sélection il s'agit, mais en général on sélectionne les variables avant de les standardiser. (et apres avoir convertit les variables catégorielles)

  • @thallhos7461
    @thallhos7461 4 года назад

    Salut Guillaume, merci pour cette vidéo comme d'hab au top,
    J'ai une question concernant l'apprentissage de ton modèle et l'optimisation des variables :
    - (ça serait super si tu pouvais nous faire plus tard une vidéo avec les meilleures méthodes mathématiques à appliquer dans tel ou tel cas par exemple Qi2 etc)
    - Concernant l'apprentissage des données, je me demande si la machine en te donnant la meilleure performance et en se débarrassant des variables qui ont le moins de corrélation, est-ce que dans certain cas on risque pas de s'éloigner de la réalité ?
    Je n'ai pas d'exemple en tête, mais s'il est facile de comprendre que la corrélation entre le prix d'un appartement et la peinture du hall d'entrée est très faible, j'imagine que dans certain cas ca doit être plus tricky que ca non ?
    Je sais pas si je suis très clair, en fait j'imagine qu'on doit toujours contrôler quelle variable est sélectionnée ou abandonnée par le modèle ?

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Salut et merci :)
      - Oui je compte faire des vidéos qui expliquent quels tests statistiques utiliser dans différentes situations
      - Bonne question ! La "réalité" n'est représentée que par des observations X->y. Le but du ML est d'approcher au mieux cette représentation (en faisant le moins d'erreurs possibles dans les prédictions versus y). Pour ca, on teste sur les données du testset (qui sont sensées représenter la réalité) je suis sur que tu es déja au courant. Le mieux est de tester différents modeles (avec différentes combinaisons de variables) pour retenir celui qui s'approche le plus de la "réalité", meme si cela implique d'éliminer certaines variables. Ce qui compte, ce sont les résultats, les faits.
      - La corrélation n'est en effet qu'un signe de tendance similaires, c'est un élément nécessaire, mais pas suffisant au développement d'un bon modele
      - Il n'est pas nécessaire de controler toutes les variables séléctionnée par le modele, d'autant plus qu'il est parfois tres difficile d'interpréter ces variables (dans le cas d'expansion polynomiales) Mais c'est sur que c'est un grand plus de comprendre quelle variables jouent un role important pour le modele (car ca nous permet d'améliorer sa performance, de discuter avec les spécialistes, et d'affiner notre stratégie)

    • @thallhos7461
      @thallhos7461 4 года назад

      @@MachineLearnia Super, merci de tes explications !

  • @noreddinektn9414
    @noreddinektn9414 Год назад

    Bonjour , j'ai une question a vous poser , si on veut tester notre model avec un échantillon externe (ne fait partie ni du train ni du test ) comment appliquer feature selection pour cet echantillon? merci

  • @darkiche3689
    @darkiche3689 3 года назад

    Super vidéo ! Je me pose une question quant au RFE, lorsque vous abordez les scores à chaque itération, vous dites que "l'algo" s’arrête car il constate une décroissance du score, mais cette technique dépend alors de l'ordre dans lequel sont donnée les features ? Car en s'arrêtant, il n'essaye pas d'enlever les features suivantes qui pourrait être inutiles ? Ou alors je passe à coté de qql chose ;)

    • @MachineLearnia
      @MachineLearnia 3 года назад

      Oui c'est correct, c'est une des limitations de l'algorithme, je n'ai pas dit qu'il était parfait ^^
      Maintenant peut-etre qu'il va évoluer (et son implémentation dans sklearn) pour s'améliorer, mais c'est un peu comme les arbres de décision : quand on les construits avec la méthode id3, on n'obtient jamais le meilleur modele (c'est un probleme NP).

    • @MachineLearnia
      @MachineLearnia 3 года назад

      Alors je viens de consulter la documentation est on dirait qu'ils ont en effet modifié le modele RFE : On ne trouve plus de min_features_to_select, mais dorénavant n_features_to_select. Donc la procédure est répétée jusqu'a atteindre le but que l'on a fixé.

  • @alexiscarlier2773
    @alexiscarlier2773 4 года назад

    Super vidéo encore :) Le REFCV correspond à un backward sélection? Existe il aussi le stepwise selection sur scikit learn?

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Que voulez-vous exactement dire par backward selection ?

    • @alexiscarlier2773
      @alexiscarlier2773 4 года назад

      @@MachineLearnia C'est une technique de sélection de variable pour régression multiple par exemple. Il existe la forward également. La forward commence avec 1 variable puis ajoute à chaque boucle une variable et recalcule le score. Elle garde une variable si celle-ci a un impact significatif sur le score. La backward est l'inverse: elle commence avec toutes les variables puis en élimine au fur et à mesure.

    • @MachineLearnia
      @MachineLearnia 4 года назад

      @@alexiscarlier2773 On est d'accord, je voulais jute etre sur qu'on parlait de la meme chose. Personnellement je n'utilise pas de méthode forward avec sklearn, obligé de faire ca a la main

  • @pierreesteves2691
    @pierreesteves2691 4 года назад

    Hey ! superbe video ! j'imagine qu'il y a moyen de choisir un treshold different ? Je ne trouve pas d'informations sur internet.
    Pierre

  • @jipy3220
    @jipy3220 3 года назад

    Bonjour Guillaume! Merci pour tes vidéos, j'ai une questions: faut il optimiser les paramètres du modèle avant la sélection des variables ou après? Merci

    • @MachineLearnia
      @MachineLearnia 3 года назад +1

      les 2 approches sont possibles, ca dépend de votre méthode de travail. Optimiser les hyper-params sur tous les modeles possibles peut prendre beaucoup de temps (c'est le soucis) Mais ca reste le mieux.

    • @jipy3220
      @jipy3220 3 года назад

      @@MachineLearnia merci!!

  • @amirakorteby6097
    @amirakorteby6097 4 года назад +1

    D'abord je vous remercie pour ces cours très bien expliquer, vous m'aider vraiment a mieux comprendre les notions du machine learning ....
    mais j'ai tjrs un problem avec la programmation en général pas juste en Machine Learning , je comprend tjrs les bases des langages (java,python.) mais je n'arrive encore pas a programmer correctement ou a avoir des solution pour mes exercices , je veux vraiment apprendre plus de ce domaine mais je ne sais pas comment,
    Si vous pouvez me conseiller une méthode ou des cours précis pour améliorer mon niveau , je serai vraiment reconnaissant :)
    Merciii encore une fois pour tes efforts.

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      Merci beaucoup.
      Pour progresser je vous conseille d'écrire vous-meme un petit programme comme ce que je fais dans la vidéo. Essayer de visualiser les données des fleurs d'iris et de construire différents modeles (KNN, etc) en jouant avec les hyper-parametres. Arrivez-vous a faire ca pour commencer ?

    • @amirakorteby6097
      @amirakorteby6097 4 года назад +1

      D'accord, Mercii Beaucoup je vais essayer avec l'exemple des fleurs d'iris , Normalement je y'arriverai :D

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      @@amirakorteby6097 Je suis sur que tu vas y arriver ! :D Go !

  • @lyndahadjemi8606
    @lyndahadjemi8606 2 года назад

    Bonjour Guillaume,
    Je vous remercie pour ce trésor,
    Ça me permet de comprendre beaucoup mieux,.
    Je viens de découvrir votre chaîne RUclips, vraiment magnifique, j'ai adoré vos explications, trop bien ,super merci beaucoup.
    Je vous demande si c'est possible de faire des exemple de data set comme celui de covid19, pour prendre la main surtout les arbres décisionnel, et SMOTE.
    Je vous remercie par avance

    • @MachineLearnia
      @MachineLearnia 2 года назад

      Merci et bienvenue dans la communauté. J'ai sorti un tutoriel SMOTE sur ma page Tipeee

    • @lyndahadjemi8606
      @lyndahadjemi8606 2 года назад

      @@MachineLearnia Merci beaucoup ,je vais regarder

  • @zinebbaroudi8350
    @zinebbaroudi8350 3 года назад

    Bonjour, d'abord merci pour tes vidéos, ils sont super intéressants. J'ai une question svp. Si on a un problème de classification par example et je veux faire une feature selection en utilisant le test qui 2 est ce que je doit appliquer ce test que sur les features qualitatives et enlever ceux qui sont quantitatives ou c possible d'appliquer qui2 sur tout le dataset ? Et la même question pour la matrice de correlation qui normalement dans python se base sur la correlation de pearson et sachant que cette correlation ne s'applique que sur les variables quantitatifs est ce que c possible de l'appliquer sur tout le dataset ?

  • @moussabamba6216
    @moussabamba6216 4 года назад

    bonsoir guillaume j'aimerais savoir est ce que la technique de FEATURE SELECTION joue le même rôle que la technique de ACP ou du LDA merci d'avance

    • @MachineLearnia
      @MachineLearnia 4 года назад

      Bonsoir, Les deux se ressemblent un peu, mais sont réellement très différent. La PCA est utilisée pour réduire le nombre de dimension dans le but d'accélérer l'apprentissage de la machine (c'est le but premier) tandis que la sélection de variable a pour but d'améliorer le score de notre modèle en lui donnant les variables utiles uniquement.

  • @loicverbeke216
    @loicverbeke216 4 года назад

    Merci pour ta video!
    Est ce que tu pourrais conseiller un algorithme python permettant de relever les relations "cachées" qu'il pourrait y avoir entre une/des feature et la target ? Par exemple, pour savoir si la target a une plus grande dépendance avec le sinus ou le cube d'une feature que de la feature en elle même. Un algorithme qui pourrait déterminé donc de nouvelles features sur base de celles qu'on a déjà. Je pensais a "Symbolic Regression" mais je me demande comment correctement l'appliquer.
    Un tout grand merci pour tes vidéos en tout cas!

    • @MachineLearnia
      @MachineLearnia 4 года назад +2

      Salut. Une façon simple de procéder est d'utiliser Polynomial Features puis de calculer la corrélation ou covariance entre chaque variable et la target, c'est tres efficace et ca fait exactement ce dont tu parles

    • @loicverbeke216
      @loicverbeke216 4 года назад

      Top merci!

  • @korosife
    @korosife 4 года назад +1

    Top, mais je comprend pas elle étais upload hier ? Sa change rien super boulots👍🏿👌🏿
    Question con mais quand, est il possible de rentrer des teste unitaire dans un programme de ml ?

    • @MachineLearnia
      @MachineLearnia 4 года назад +2

      Merci a toi ! La vidéo de hier a eu un petit soucis de qualité (un texte important ne s'affichait pas) je l'ai donc corrigée et remise en ligne !
      Je ne suis pas sur de totalement comprendre ta question, peux-tu la reformuler stp ?

    • @korosife
      @korosife 4 года назад +1

      Dac je comprend mieux, dommage je peut pas comparer a celle d'hier 😂 bref en tout cas merci pour tes cours, grâce à eux je suis entrain de monter mon entreprise, donc si je flippe et que je dort pas c'est ta faute 😂 merci mille fois🙏🏿
      Ma question est, quand je code un projet je met toujours des teste unitaire pour savoir si le code est pas cassé, ou qu'il a bien migré etc... ( c'est peut être très con mais c'est comme sa que j'ai appris et j'aime bien, " 'c'est pratique")
      Est il possible de faire la même chose dans un code de ml ? Je vois pas comment aborder le problème pour être sur que rien à casser...
      Merci encore

    • @MachineLearnia
      @MachineLearnia 4 года назад +2

      Aah oui si je vois tres bien de quoi tu parles. Oui bien sur, je fais tout le temps ca dans mes programmes, il faut mettre en place des tests pour valider ses fonctions, je ferai peut-etre une vidéo a ce sujet a l'avenir, mais c'est plus dans le cadre de la programmation classique que du ML

    • @korosife
      @korosife 4 года назад +1

      @@MachineLearnia topissime😊 tant qu'il y a des vidéos moi sa me vas

  • @sylvainhansen7463
    @sylvainhansen7463 2 года назад

    Bonjour Guillaume, merci encore pour ces vidéos. Sais-tu si c'est possible de faire une interval PLS pour la sélection de variable avec python? Merci

    • @MachineLearnia
      @MachineLearnia 2 года назад

      Il y a sklearn.cross_decomposition.PLSRegression

  • @YassoMaso
    @YassoMaso 4 года назад

    Bonjour et Bravo pour tes superbes vidéos. Une question d'ordre mathématique, dans le passage 18:00 où tu expliques qu'on veut que notre matrice X(150,4) passe à une matrice Y(150,3), du coup on a une matrice de coeffs Theta(4,3). Mais je ne comprends pas pourquoi on passe de 4 classes à 3 ? Je m'attendais à ce qu'on passe de X (150,4) à Y(150,) tout court.peut être j'ai loupé quelques choses dans tes explications :)

    • @MachineLearnia
      @MachineLearnia 4 года назад +1

      X contient 4 features, ce qui n'a rien a voir avec le nombre de classe que l'on cherche a prédire (3 classes). (premier point a comprendre)
      Ensuite, les 3 classes de y sont comprise dans un vecteur de dimension (150,1) (en effet) mais au momement d'utiliser l'algorithme SGDClassifier, la machine coupe (150,1) en colonnes (comme s'il faisait du One-Hot Encoding) car l'algorithme SGDClassifier ne permet que de faire des classification binnaires. Donc il prédit dans chaque colonne s'il s'agit d'un 1 ou d'un 0 (pour chaque classe)
      Est-ce-que mon explication est plus claire a présent ? :)

    • @YassoMaso
      @YassoMaso 4 года назад

      @@MachineLearnia perfect :)

  • @soelreza1430
    @soelreza1430 2 года назад

    Quel prestance monsieur !
    Vos vidéos sont mieux expliquées que tous mes profs réunies 😂
    Je voulais vous posé une question par rapport à ces variables .
    Si j’ai 6 variables X qui sont dans l’ordre précis pour avoir Mon target Y et qui sont aussi dépendants dois je rester sur une régression linéaire simple pu basculer sur la régression linéaire multiple?

    • @MachineLearnia
      @MachineLearnia 2 года назад

      Bonjour, c'est alors une régression linéaire multiple, mais c'est la meme chose qu'une régression linéaire "simple".

    • @soelreza1430
      @soelreza1430 2 года назад

      @@MachineLearnia très bien merci beaucoup pour vos vidéos et de votre réponse