Pour une vidéo d'introduction, déjà beaucoup de choses très instructives, puis la prise en main de docker est vraiment très conviviale. Cela encourage vraiment à regarder la suite! Encore merci!
Bonjour. Merci pour votre présentation. Ma question est relative à votre slide 91. J'imagine que comme dans le cas de la régression, la "loss function" est calculée à partir de l'ensemble des observations que contient le dataset (i.e. le nuage de points). Et l'algorithme de descente de gradient (la recherche d'un minimum local) est ensuite appliqué à la loss function résultante. En d'autres termes, sur la slide 91, X est un vecteur de vecteurs de dimension m (le nombre de features) x n (le nombre d'éléments par feature) et la loss function résulte du passage de l'ensemble des données dans le réseau. Dans votre représentation, on a l'impression que la descente de gradient est appliquée pour chaque i E [1, m]. J'imagine que c'est pour cette raison que l'apprentissage est très lourd d'un point de vue computationnel car à chaque itération, on effectue des calculs sur l'ensemble des données. Est-ce que cette interprétation est correcte ? Merci d'avance de votre retour.
Bonjour Eric, désolé de cette réponse tardive... L'apprentissage est bien effectué sur l'ensemble du dataset d'apprentissage (une partie des données étant conservée pour la validation). Par contre, on va traiter les données par lots (batch), chaque batch sera passé dans le modèle, conduira à une descente de gradient et à une rétropropagation (mise à jour des poids). Le passage de l'ensemble des batchs est appelé une époque et l'on effectuera plusieurs époques.
La meilleure formation FR sur l'intelligence artificielle, c'est juste incroyable ! Vous devriez regarder ce qui se fait aux US en matière d'enseignement en ligne, je pense surtout au cours CS50 du professeur David Malan à Harvard, ça pourrait vous donner des idées en termes d'interface et d'interactivité si vous voulez encore améliorer ce cours
Pour avoir une vue complète de l'IA aujourd'hui, nous vous renvoyons vers "Artificial Intelligence: A Modern Approach, 4th Global ed." (2021) aima.cs.berkeley.edu/ Les chapitres II, III et IV parlent de d'IA qui n'est pas du Machine Learning et les chapitres V et VI parlent de Machine Learning / Deep Learning. La Version française du livre est disponible. Par contre en nombre de publications le Deep Learning domine très largement aujourd'hui comme indiqué dans notre présentation.
On utilise les mêmes paramètres de "normalisation" pour toutes les données et les données de tests ne doivent pas intervenir dans le processus d'apprentissage. On calcul donc les mean et std sur les seules données connues/utilisables : les données train.
Oui, tout à fait. Jupyter lab est juste une interface permettant de travailler avec des notebooks. Lorsque les codes deviennent importants, il est toutefois conseillé de modulariser le code, mais la "glue" peut rester dans des notebooks.
Pour une vidéo d'introduction, déjà beaucoup de choses très instructives, puis la prise en main de docker est vraiment très conviviale. Cela encourage vraiment à regarder la suite! Encore merci!
Merci beaucoup pour votre retour... et bonne continuation ! ;-)
Quel plaisir de suivre cette formation, super contenu et en plus dans la bonne humeur ! :) Hâte de voir les prochaines vidéos !
Merci beaucoup, rendez-vous jeudi, 14h !
Bonjour. Merci pour votre présentation. Ma question est relative à votre slide 91. J'imagine que comme dans le cas de la régression, la "loss function" est calculée à partir de l'ensemble des observations que contient le dataset (i.e. le nuage de points). Et l'algorithme de descente de gradient (la recherche d'un minimum local) est ensuite appliqué à la loss function résultante. En d'autres termes, sur la slide 91, X est un vecteur de vecteurs de dimension m (le nombre de features) x n (le nombre d'éléments par feature) et la loss function résulte du passage de l'ensemble des données dans le réseau. Dans votre représentation, on a l'impression que la descente de gradient est appliquée pour chaque i E [1, m]. J'imagine que c'est pour cette raison que l'apprentissage est très lourd d'un point de vue computationnel car à chaque itération, on effectue des calculs sur l'ensemble des données. Est-ce que cette interprétation est correcte ? Merci d'avance de votre retour.
Bonjour Eric, désolé de cette réponse tardive...
L'apprentissage est bien effectué sur l'ensemble du dataset d'apprentissage (une partie des données étant conservée pour la validation).
Par contre, on va traiter les données par lots (batch), chaque batch sera passé dans le modèle, conduira à une descente de gradient et à une rétropropagation (mise à jour des poids). Le passage de l'ensemble des batchs est appelé une époque et l'on effectuera plusieurs époques.
La meilleure formation FR sur l'intelligence artificielle, c'est juste incroyable !
Vous devriez regarder ce qui se fait aux US en matière d'enseignement en ligne, je pense surtout au cours CS50 du professeur David Malan à Harvard, ça pourrait vous donner des idées en termes d'interface et d'interactivité si vous voulez encore améliorer ce cours
J'apprécie l'approche au quel notre manière de traité l'information se formera dans l'avenir de tout à chacun.
Merci beaucoup !
Pour avoir une vue complète de l'IA aujourd'hui, nous vous renvoyons vers "Artificial Intelligence:
A Modern Approach, 4th Global ed." (2021)
aima.cs.berkeley.edu/
Les chapitres II, III et IV parlent de d'IA qui n'est pas du Machine Learning et les chapitres V et VI parlent de Machine Learning / Deep Learning.
La Version française du livre est disponible.
Par contre en nombre de publications le Deep Learning domine très largement aujourd'hui comme indiqué dans notre présentation.
C'est vraiment top!
Merci beaucoup pour votre retour !
Bravo et merci ! Je découvre Fidl un peu en retard, je vais essayer de rattraper la phase 1 d'ici le démarrage de la phase 2 en janvier !
Grand merci!
Merci :-)
Bonjour, je n'ai pas trouvé le visa pour l'attestation. Dispo ici ?
Les attestations de suivi ne peuvent être délivrées que durant les lives...
Nous ne pouvons pas en établir pour les visionnages en replay.. désolé.
Dans la partie normalisation, vous avez normalisé x_test avec mean et std de x_train ! je peux comprendre pourquoi ? Merci
On utilise les mêmes paramètres de "normalisation" pour toutes les données et les données de tests ne doivent pas intervenir dans le processus d'apprentissage. On calcul donc les mean et std sur les seules données connues/utilisables : les données train.
ESt-ce qu'on peut tout faire directement sur Jupyter?
Oui, tout à fait. Jupyter lab est juste une interface permettant de travailler avec des notebooks. Lorsque les codes deviennent importants, il est toutefois conseillé de modulariser le code, mais la "glue" peut rester dans des notebooks.
Je ne suis pas Européen puis-je accéder a GENCI ?
Oui, bien sûr, à condition d'être rattaché à un laboratoire ou une entreprise française et sous couvert que votre dossier soit validé :-)