merci. J'attendais une vidéo sur le sujet en français depuis longtemps et je suis d'autant plus heureux que ce soit toi qui la traite, car tu es un excellent pédagogue.
Cette vidéo et le live coding que tu as fais sont de grande qualité et m'ont permis de comprendre cette architecture et la façon dont on peut coder ce genre de choses ! Merci beaucoup :)
Merci beaucoup pour ces explications claires 👏 Les propositions d’une séance de live coding ou une autre vidéo qui rentrerait dans les détails d’autres applications sont aussi intéressantes l’une que l’autre donc l’idéal serait de faire les 2 😬😇😷
Superbe vidéo d'introduction aux transfomers. Je suis très intéressé pas le live coding d'un transfomers en keras. Et aussi très intéressé par l'explication d'application de transformer a d'autres domaines
Bonjour, Merci pour la qualité de la présentation et de clarté dans vos explications. Est -ce que le transformer peut être utilisé pour enregistrer et distribuer des données (codes imei et imsi)? Pourrai-je si possible avoir ce papier?
salut Thibault , est-ce que tu aurais un schéma où on retrouve en terme simplifié cette suite d'opérations : prompt - token - vecteur - tête d'attention - décodeur ?
Je ne comprends pas un truc. A quoi sert réellement le FFN dans l'encoder et le decoder ? Chaque token va passer dans un réseau de neurones mais je ne vois pas ce que ça apporte au modèle. Quel impact ces réseaux ont sur l'information?
une question qui me hante : la masked self attention ne devrait intervenir UNIQUEMENT que lors de l'entrainement, car on place en input de decoder une séquence contenant la réponse (les tokens futurs). donc, en quoi la masked self attention intervient durant un processus de génération (une fois le modèle entrainé), puisque les tokens encore non générés n'existent tout simplement pas ? Merci de tout éclairage !
Je cherche des livres ou ressources approfondies (en français ou en anglais) pour maîtriser les Transformers en IA. J’ai déjà des bases en IA et en maths, et je souhaite acquérir une compréhension détaillée, en partant des fondamentaux jusqu’aux architectures modernes et avancées. Idéalement, je cherche des ouvrages que je peux suivre progressivement, me permettant de monter en difficulté au fil de l’apprentissage. Si vous avez des références solides couvrant ces aspects, je suis preneur ! Merci d’avance !
Salut ! Tes vidéos sont super ! Merci beaucoup Dis moi est ce que le mécanisme d’attention peut être utilisé non pas pour le traitement de language mais pour prédire des variables numériques continue comme par exemple pour prédire le kwh d’un compteur électrique qui change toutes les 10s
Les documents d'origine sont en anglais et ce sont des concepts relativement nouveaux. Que voulez-vous qu'il fasse? Commencer par faire du boulot de traduction avant celui d'explication? On aurait bien aimé que les papers d'origine soit en français. Pour l'heure, souffrons de ce mélange.
Quel plaisir de revoir une vidéo de ta part sur RUclips !
En espérant que ce soit le début d'une longue série de vidéo :D.
En manque bq tes vedio machine learnia
nous aimerions aussi que tu fasses une video sur le sujet, ta pedagogie et tes animations sont vraiment utile Machine Learnia. Merci
You deserve more views and more subscribers, I am in love with your channel !!
merci. J'attendais une vidéo sur le sujet en français depuis longtemps et je suis d'autant plus heureux que ce soit toi qui la traite, car tu es un excellent pédagogue.
Cette vidéo et le live coding que tu as fais sont de grande qualité et m'ont permis de comprendre cette architecture et la façon dont on peut coder ce genre de choses ! Merci beaucoup :)
Excellent Thibault !
I'm learning french and deep learning at the same time with you :D Thank you very much, well explained.
c'est si clair, bien dans les détails en expliquant bien des notions complexes, gg
Content de revoir des vidéos ... et le son est super bon.
Super vidéo et bien expliquée , merci pour ce tuto , on attend le TP
Bon retour Thibault.
Content de te revoir !!
Merci pour cette vidéo 🙏. C’est super bien expliqué.
Ce que tu fais est supe, continue c'est tres bien detaillé
Merci Monsieur pour tout ce que vous rendez accessible
Amazing video, thanks for the explanation
13:17 : ASMR pour penser à nous hydrater ; merci 🥰
Sujet très intéressant , super vidéo
Très bon travail !! Effectivement un TP pratique serait le bienvenu =)
Très bien expliqué !
Merci pour cette vidéo
Super vidéo, sujet très intéressant !
Merci pour ces explications
Hello, merci pour cette video. Un exemple avec keras (ou Pytorch) serait top :-)
merci pour cette videos tres instructive bro !
Merci beaucoup pour ces explications claires 👏 Les propositions d’une séance de live coding ou une autre vidéo qui rentrerait dans les détails d’autres applications sont aussi intéressantes l’une que l’autre donc l’idéal serait de faire les 2 😬😇😷
Heureux de te revoir TN 😏
Superbe vidéo d'introduction aux transfomers. Je suis très intéressé pas le live coding d'un transfomers en keras. Et aussi très intéressé par l'explication d'application de transformer a d'autres domaines
merci beaucoup vraiment 🤍🤍🤍
BRAVO ! Vidéo TOP !
Le mec explique mieux que mes profs au MIT 💀
Parfait 😍😍 merci bq
Merci infiniment😍😍😍
Oui l'application des transformers serait très intéressant
Bonjour,
Merci pour la qualité de la présentation et de clarté dans vos explications. Est -ce que le transformer peut être utilisé pour enregistrer et distribuer des données (codes imei et imsi)?
Pourrai-je si possible avoir ce papier?
salut Thibault , est-ce que tu aurais un schéma où on retrouve en terme simplifié cette suite d'opérations : prompt - token - vecteur - tête d'attention - décodeur ?
Merci ..
Je ne comprends pas un truc. A quoi sert réellement le FFN dans l'encoder et le decoder ? Chaque token va passer dans un réseau de neurones mais je ne vois pas ce que ça apporte au modèle. Quel impact ces réseaux ont sur l'information?
Je comprends pas pourquoi on a 8 têtes d'attention à 32:35 ?
Merci pour la vidéo
Merci
une question qui me hante : la masked self attention ne devrait intervenir UNIQUEMENT que lors de l'entrainement, car on place en input de decoder une séquence contenant la réponse (les tokens futurs). donc, en quoi la masked self attention intervient durant un processus de génération (une fois le modèle entrainé), puisque les tokens encore non générés n'existent tout simplement pas ? Merci de tout éclairage !
En effet, seulement utile a l'entrainement
@@ThibaultNeveu merci je me sens moins seul maintenant 🤣
Je cherche des livres ou ressources approfondies (en français ou en anglais) pour maîtriser les Transformers en IA. J’ai déjà des bases en IA et en maths, et je souhaite acquérir une compréhension détaillée, en partant des fondamentaux jusqu’aux architectures modernes et avancées.
Idéalement, je cherche des ouvrages que je peux suivre progressivement, me permettant de monter en difficulté au fil de l’apprentissage.
Si vous avez des références solides couvrant ces aspects, je suis preneur !
Merci d’avance !
Salut ! Tes vidéos sont super ! Merci beaucoup
Dis moi est ce que le mécanisme d’attention peut être utilisé non pas pour le traitement de language mais pour prédire des variables numériques continue comme par exemple pour prédire le kwh d’un compteur électrique qui change toutes les 10s
J'adore le premier Transformers. Michael Bay is all you need.
excellent
nice
Et aussi il faut L'implémentation svp
il a donné toutes les informations pour coder. Pas besoin de plus.
rien compris
Affreux melange du français et de l'anglais !
Les documents d'origine sont en anglais et ce sont des concepts relativement nouveaux. Que voulez-vous qu'il fasse? Commencer par faire du boulot de traduction avant celui d'explication?
On aurait bien aimé que les papers d'origine soit en français.
Pour l'heure, souffrons de ce mélange.
Merci