Data From Scratch - Willis
Data From Scratch - Willis
  • Видео 82
  • Просмотров 452 140
Data Engineer vs Analytics Engineer vs Data Analyst : Quel métier choisir en 2025 ?
Dans cette nouvelle vidéo, je te parle de "Data Engineer vs Analytics Engineer vs Data Analyst"
✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1
🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Data Analyst) : shorturl.at/kHZ37
🚀 Inscris-toi à mon bootcamp : calendly.com/willis-nana
🔥 QUI SUIS-JE ? 🔥
Je m’appelle Willis, Sr Data Engineer et Coach en Data Engineering, habitant au Canada 🇨🇦 (Montréal).
Bienvenue sur ma chaine ! Je parle de Data Engineering, de carrière en Tech et de voyage ! 🖥️✈️
🧪 Travaillant dans le monde de la data depuis plus de 10 ans, je t&...
Просмотров: 896

Видео

7 astuces pour réussir en data en tant que freelance
Просмотров 1,3 тыс.Месяц назад
Dans cette nouvelle vidéo, je te parle de "7 astuces pour réussir en data en tant que freelance" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Data Analyst) : shorturl.at/kHZ37 🚀 Mon programme accompagnement ...
14 Stratégies pour booster ta Data Platform
Просмотров 922Месяц назад
Dans cette nouvelle vidéo, je te parle des "14 Stratégies pour booster ta Data Platform" 🚀 Lien pour t'inscrire au bootcamp : tally.so/r/mBZAbe ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Data Analyst) : sh...
Comment créer une architecture Data avec Databricks ? (Data Engineer System design interview)
Просмотров 2 тыс.2 месяца назад
Dans cette nouvelle vidéo, je te parle de "Créer une architecture Data avec Databricks ?" 🚀 Lien pour t'inscrire au bootcamp : www.datamentoring.io/waitinglist ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Da...
De Débutant à Senior Data Engineer : Les 10 secrets pour transformer ta carrière
Просмотров 1,3 тыс.2 месяца назад
Dans cette nouvelle vidéo, je te parle des "De Débutant à Senior Data Engineer : Les 10 secrets clés pour transformer ta carrière" 🚀 Lien pour t'inscrire au bootcamp : www.datamentoring.io/waitinglist ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de l...
7 Concepts Data Engineering pour passer au niveau Expert
Просмотров 1,3 тыс.2 месяца назад
Dans cette nouvelle vidéo, je te parle de "7 Concepts Data Engineering pour passer au niveau Expert" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Data Analyst) : shorturl.at/kHZ37 00:00 Intro 01:15 - Normali...
Opportunités Tech au Canada en 2024 : On fait le point (Data, Backend, Frontend, FullStack, DevOps)
Просмотров 29 тыс.3 месяца назад
Dans cette nouvelle vidéo, je te parle des "Opportunités Tech au Canada" 🚀 Lien pour t'inscrire au bootcamp : www.datamentoring.io/waitinglist ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer, Data Scientist, Data Analyst) : sho...
Data Engineer JUNIOR : Tout ce que tu devrais savoir
Просмотров 2,4 тыс.3 месяца назад
Dans cette nouvelle vidéo, je te parle de "Data Engineer JUNIOR : Tout ce que les devraient savoir" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour tr...
Qu'est-ce que le Data Engineering ? Pourquoi est-ce la clé d'un projet Data ?
Просмотров 2,1 тыс.4 месяца назад
Dans cette nouvelle vidéo, je te parle de "Qu'est-ce que le Data Engineering ?" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le mon...
Le lexique des Data Engineers : les termes à absolument connaître !
Просмотров 1,8 тыс.4 месяца назад
Dans cette nouvelle vidéo, je te parle du lexique des Data Engineers ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la da...
Comment booster ton code et tes données ? (en quelques étapes simples)
Просмотров 8375 месяцев назад
Dans cette nouvelle vidéo, je te parle de "Comment améliorer ton code et des données" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans ...
Docker pour Data Engineer : Tout ce que tu dois connaitre
Просмотров 1,5 тыс.5 месяцев назад
Dans cette nouvelle vidéo, je te parle de "Docker pour Data Engineer" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la d...
DuckDB : Pourquoi cet outil va changer ton quotidien ?
Просмотров 2,1 тыс.5 месяцев назад
Dans cette nouvelle vidéo, je te parle de "DuckDB" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data (Data Engineer,...
Polars : Le MEILLEUR outil Python pour créer tes Data Pipelines ?
Просмотров 1,8 тыс.6 месяцев назад
Dans cette nouvelle vidéo, je te parle de la library Python Polars ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes les compétences pour travailler dans le monde de la data...
Lakehouse vs Datawarehouse vs Datalake vs Base de données - Pourquoi est-ce important ?
Просмотров 3,1 тыс.6 месяцев назад
Dans cette nouvelle vidéo, je te parle de la différence entre "Lakehouse vs Datawarehouse vs Datalake vs Base de données" ✅ Abonne-toi en cliquant ici : www.youtube.com/@DataFromScratchWillis?sub_confirmation=1 🚀 Inscris-toi à la waiting-list de mon Bootcamp Data Engineering pour être averti en premier : www.datamentoring.io/waitinglist 🎁 Cadeau gratuit - Résumé de toute cette vidéo et toutes l...
Mon entretien chez Meta/Facebook (Data Engineer interview)
Просмотров 12 тыс.6 месяцев назад
Mon entretien chez Meta/Facebook (Data Engineer interview)
Comment bâtir une équipe Data efficace ? Data Engineering Principles (partie 1)
Просмотров 1,3 тыс.7 месяцев назад
Comment bâtir une équipe Data efficace ? Data Engineering Principles (partie 1)
Travailler en data au Canada : meilleure ou pire décision de ma vie ?
Просмотров 3,3 тыс.7 месяцев назад
Travailler en data au Canada : meilleure ou pire décision de ma vie ?
Comment design une architecture Data avec Snowflake/DBT ? (Data Engineer System design interview)
Просмотров 3,4 тыс.8 месяцев назад
Comment design une architecture Data avec Snowflake/DBT ? (Data Engineer System design interview)
Comment dépasser ta peur de Git ?
Просмотров 1,6 тыс.8 месяцев назад
Comment dépasser ta peur de Git ?
DataOps - Mais qu’est-ce que c'est ?
Просмотров 2,3 тыс.9 месяцев назад
DataOps - Mais qu’est-ce que c'est ?
La fin des Data Scientists ?
Просмотров 12 тыс.9 месяцев назад
La fin des Data Scientists ?
Devenir Data Engineer en 2024 : Un bon choix de carrière ?
Просмотров 8 тыс.10 месяцев назад
Devenir Data Engineer en 2024 : Un bon choix de carrière ?
Passer de Data Scientist à Data Engineer - Ce que tu dois savoir !
Просмотров 1,9 тыс.11 месяцев назад
Passer de Data Scientist à Data Engineer - Ce que tu dois savoir !
La VÉRITÉ sur le salaire des DÉVELOPPEURS aux USA et au Canada 🇺🇸🇨🇦
Просмотров 27 тыс.11 месяцев назад
La VÉRITÉ sur le salaire des DÉVELOPPEURS aux USA et au Canada 🇺🇸🇨🇦
Comment Devenir Developpeur Freelance au Canada 🇨🇦 (dev à 700$/j)
Просмотров 13 тыс.11 месяцев назад
Comment Devenir Developpeur Freelance au Canada 🇨🇦 (dev à 700$/j)
Le futur du Data Engineering dévoilé en 5 tendances clés (AI, MLops, Real-Time, etc…) 🔮
Просмотров 1,9 тыс.Год назад
Le futur du Data Engineering dévoilé en 5 tendances clés (AI, MLops, Real-Time, etc…) 🔮
Les outils Python indispensables pour Data Engineer
Просмотров 2,1 тыс.Год назад
Les outils Python indispensables pour Data Engineer
J'analyse des offres d'emplois de Data Engineer 🇺🇸🇫🇷🇨🇦
Просмотров 3,4 тыс.Год назад
J'analyse des offres d'emplois de Data Engineer 🇺🇸🇫🇷🇨🇦
7 anti-patterns pour Data Engineer - les erreurs fatales que font les débutants
Просмотров 1,6 тыс.Год назад
7 anti-patterns pour Data Engineer - les erreurs fatales que font les débutants

Комментарии

  • @beullele2783
    @beullele2783 2 дня назад

    Très intéressant, merci Willis 👍 C’est plus clair maintenant, ça confirme mon choix de reconversion !

  • @wolfheart2591
    @wolfheart2591 3 дня назад

    Salut ! Content de te revoir je viens de finir ma formation de Data Engineer, et tu as contribué à me lancer dans l'aventure de la reconversion. Donc un grand merci !!!

    • @luckysaid9493
      @luckysaid9493 3 дня назад

      Moi aussi j'ai fini ma formation en Data engineering et il a contribué à mon lancement. Maintenant il faut trouver la première mission.

    • @DataFromScratchWillis
      @DataFromScratchWillis День назад

      Super, je suis heureux de t'avoir aidé, bonne chance dans ta reconversion !

  • @SalomonPambou
    @SalomonPambou 3 дня назад

    Thank you Mr Willis, 😊

  • @asaphdefo7974
    @asaphdefo7974 3 дня назад

    Tres belle video willis. Je viens de finir mon cegep et je travail dans le domaine du genie civil au canada, par contre je souhaiterais continuer a l`universiter vu mon jeune age et j`aimerais me ré-orienter vers la data (surtout le data engineering). Ma crainte est plus au niveau du marche d`emploi dans ce domaine la au canada. Pense tu que ca sera toujours une bonne carriere dans les 5 prochaines année? Merci

  • @ixokia7814
    @ixokia7814 3 дня назад

    Salut ! Je voudrais devenir Data Analyst, je me renseigne sur ce métier depuis maintenant plusieurs mois et c'est ce que je souhaite faire. Mais je n'ai aucun diplômes. Même pas niveau BAC et aucune expériences dans le numérique non plus. Comment puis-je faire pour atteindre cet objectif ? Merci à vous pour vos réponses.

  • @mamadoucissokho9508
    @mamadoucissokho9508 7 дней назад

    Je confirme 😂 C’est pas tout le temps vrai et souvent faux ici 2:01

  • @kidam901
    @kidam901 16 дней назад

    Mais si tu utilises Kafka pour l’ingestion, tu risques de stocker des données sales dans Snowflake, non ?

    • @DataFromScratchWillis
      @DataFromScratchWillis 16 дней назад

      Oui, tu stockes les données sur du S3 ou/et Snowflake pour la transformation

    • @kidam901
      @kidam901 16 дней назад

      @DataFromScratchWillis ah OK à ce stade même si le données sont brut c'est pas grave puisque c'est après que l'on peut faire la transformation. Merci 👌💪

  • @tardiloufouma2209
    @tardiloufouma2209 18 дней назад

    Bonjour et merci pour la vidéo mais j'ai toujours du mal à saisir la nuance entre une database et une datawarehouse. Parce qu'avec une database aussi je peux stocker de la donner et en extraire de l'information. Quelqu'un veut-il bien m'expliquer la nuance ?

    • @DataFromScratchWillis
      @DataFromScratchWillis 16 дней назад

      Un datawarehouse est une database spécialisée pour les données analytiques, c'est-à-dire pour les données sur lesquelles tu peux faire des calculs et des agrégations complexes.

    • @tardiloufouma2209
      @tardiloufouma2209 16 дней назад

      @DataFromScratchWillis ah d'accord je vois merci

  • @alphonsekoivogui5961
    @alphonsekoivogui5961 21 день назад

    Très bonne explication. C'est ma première fois de te suivre, mais je suis satisfait. Bonne continuation.❤❤

  • @yallys
    @yallys 24 дня назад

    Je suis totalement en phase avec toi! Je rajouterais que le réseau est super important. A titre personnel, je travaille en priorité avec les personnes que je connais, et qui connaissent ma valeur également. C'est certes à travers une ESN, mais je sais que si ma mission se termine, mon contact va essayer de me placer sur une autre mission : jackpot. Bien entendu, entretenir d'autres relations en // c'est indispensable, il ne faut pas tout miser. Enfin, j'ai remarqué que c'était utile de connaitre les stacks des entreprises sur les technos/langages qui vous intéresse et sur lesquels vous êtes compétent. Par exemple, je sais que Rolex utilise la même stack que mon client actuel donc c'est une entreprise que je peux viser. Et je ne me suis pas trompé, ça fait 1 an qu'ils me contactent régulièrement.

  • @kevinstevedongmotemfack3433
    @kevinstevedongmotemfack3433 28 дней назад

    N'oublie pas les questions de types Leadership

  • @lespenseesdejawade
    @lespenseesdejawade 29 дней назад

    Salut Willis, où puis-je te contacter par mail ?

  • @EddyRazanajatovo
    @EddyRazanajatovo Месяц назад

    Merci Willis pour cette vidéo. je pense que tu as bien souligné sur l'importance de chaque rôle dans l'équipe

  • @druzicka2010
    @druzicka2010 Месяц назад

    Willis. La certification que je suis actuellement se fait via le site coursera. C'est en assistant à des webinaires via France Travail que je me suis lancé. Comme vous citez d'autres organismes je vais aller voir. Au fait, est-ce un métier que l'on peut exercer en free-lance ? Merci pour ces infos. 🙂

    • @DataFromScratchWillis
      @DataFromScratchWillis 5 дней назад

      Oui il est tout à fait possible de l'exercer en freelance

    • @druzicka2010
      @druzicka2010 5 дней назад

      @DataFromScratchWillis Bsr. Merci pour votre retour. 🙂

  • @druzicka2010
    @druzicka2010 Месяц назад

    Comme recommandé, je viens de visionner celle-ci. Je comprends le bilan. J'ai passé un bac technique il y a une trentaine, suivi d'un bts et une prépa en un an puis une spécialisation en alternance. Il y avait évidemment des statistiques au programme de maths dès le bts. Pour le bac je ne suis pas sûr. Une fois en entreprise, on utilise des logiciels pour calculer et rien à voir avec des stats. Le temps utilisé est pour l'analyse des résultats et prise de décision sans parler des rapports. Les maths comme au lycée je n'en ai pas fait depuis tout ce temps. Il n'y a que récemment pour un projet personnel. Pas facile de s'y remettre. Sur cette partie je reste donc autodidact. En tous cas pour le moment. La certification évoquée à la chance d'être reconnue par plusieurs entreprises sur le territoire alors je pense que ce qui y est enseigné doit correspondre au niveau junior attendu. Merci pour ce comparatif. Je vais me renseigner aussi. 🙂

  • @diluman
    @diluman Месяц назад

    Excellente video!!

  • @druzicka2010
    @druzicka2010 Месяц назад

    Bjr Willis. Votre témoignage m'a bien intéressé d'autant plus que je passe une certification google pour devenir data analyst pour essayer une reconversion après une vingtaine d'années en bureau d'études dans le secteur industriel. En fait, ce qui me motive essentiellement c'est la recherche de ce que peuvent dévoiler les données. L'aspect technique n'est que secondaire. C'est sans doute liée à ma curiosité, mon envie de découvrir et chercher. Connaissez-vous cette certification pour entrer dans le milieu ? Merci encore.

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      Si tu souhaites devenir data analyst, les certificats ne sont pas forcément le meilleur moyen. La plupart du temps, réaliser un projet personnel sur des données aura beaucoup d’intérêt qu’une certification. Faire un bootcamp est aussi un moyen pour accélérer ta transition.

    • @druzicka2010
      @druzicka2010 Месяц назад

      @@DataFromScratchWillis Merci pour la réponse. Je suis à mi parcours déjà. Jusqu'à présent la certification m'a également permi de comprendre le contexte. J'ai également commencé à utiliser des bases de données accessibles depuis des plate-formes spécifiques dont je ne connaissais même pas l'existence sans parler de SQL. J'ai créé quelques projets personnels hors certification. J'ai découvert d'autres fonctionnalités d'Excel. C'est quoi un bootcamp ?

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      Un bootcamp est un programme d'accompagnement technique qui t'aide à réaliser une transition professionnelle. J'ai parle ici : ruclips.net/video/lHEfL3kPlas/видео.html

    • @druzicka2010
      @druzicka2010 Месяц назад

      @@DataFromScratchWillis bjr Willis. Ah OK. Je ne connaissais pas. Ok je vais aller voir ça. Pour le moment je n'ai visionné qu'une seule vidéo de vous mais j'en ai stocké quelques unes, en fonction du titre, à voir prochainement. Merci pour vos infos et le temps accordé pour répondre.

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      @@druzicka2010 Avec plaisir :)

  • @jrbill6622
    @jrbill6622 Месяц назад

    Du MiniO aussi comme data lake

  • @alphacol1956
    @alphacol1956 Месяц назад

    La question que tout le monde se posent en tant que dev freelance: comment trouver des clients concretement ? Et tu survoles la question plus vite qu'un avion de chasse.

  • @imaneaskour5257
    @imaneaskour5257 Месяц назад

    C’est quoi la différence entre un ETL et un data pipeline?

  • @tedjlegrand
    @tedjlegrand Месяц назад

    Instructif ! quel SSIS / ESN conseilles tu pour le marché US/Canada ? Je connais Third Republic

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      Salut à toi, difficile à dire pour le choix des ESN. Regarde plutôt les ESN qui recrutent, soit au profil, soit au projet, car ça va surtout dépendre de ça.

  • @SabrinaChanguiti
    @SabrinaChanguiti Месяц назад

    Le terme **ELT** fait référence à un processus d'intégration de données qui signifie **Extract, Load, Transform** (Extraction, Chargement, Transformation). C'est une approche couramment utilisée pour manipuler et préparer des données dans des environnements comme les *datalakes* et les systèmes d'analyse modernes. Voici ce que cela signifie en détail : 1. **Extract (Extraction)** : Les données sont extraites de leurs sources d'origine (comme des bases de données, des fichiers CSV, des API ou des systèmes ERP). Ces sources peuvent être variées et contenir des données dans différents formats et structures. 2. **Load (Chargement)** : Une fois extraites, les données brutes sont directement chargées dans une destination, souvent un *datalake* ou un *data warehouse*. À ce stade, aucune transformation n’a encore eu lieu, ce qui permet de stocker les données dans leur forme native et de préserver leur intégrité. 3. **Transform (Transformation)** : Les données sont ensuite transformées dans l’environnement où elles sont stockées. Cela peut inclure le nettoyage, l'agrégation, la structuration ou la mise en forme pour répondre aux besoins spécifiques d’analyse ou d’exploitation par les utilisateurs finaux. ### Différence entre **ELT** et **ETL** : - **ELT** charge d’abord les données brutes puis les transforme sur place. Cela est particulièrement utile dans les architectures basées sur le cloud, où la capacité de calcul est élastique et où l’on peut manipuler de gros volumes de données directement après leur chargement. - **ETL** (Extract, Transform, Load) effectue la transformation avant de charger les données dans la destination, ce qui est plus traditionnel mais souvent moins adapté aux environnements big data ou cloud. ### Avantages du ELT : - **Flexibilité** : Les données brutes restent accessibles pour plusieurs utilisations, sans avoir été modifiées de façon permanente. - **Traitement à grande échelle** : Dans les environnements cloud, où les ressources de calcul peuvent être massivement parallélisées, le processus ELT permet de traiter des volumes importants de données plus efficacement. - **Rapidité initiale** : Comme les données ne sont pas transformées avant d'être chargées, elles sont disponibles rapidement dans leur état brut. En résumé, le ELT est une approche moderne, particulièrement adaptée aux environnements massifs de données, qui permet une grande flexibilité et un traitement efficace des données dans des systèmes comme les datalakes ou les solutions cloud.

  • @SabrinaChanguiti
    @SabrinaChanguiti Месяц назад

    Les fichiers CSV (Comma-Separated Values) sont des fichiers texte utilisés pour stocker des données tabulaires de manière simple et accessible. Chaque ligne du fichier représente un enregistrement, et les champs de cet enregistrement sont séparés par des virgules (ou un autre délimiteur, comme le point-virgule). Le CSV est l’un des formats de données les plus largement utilisés pour l’import/export de données entre différents systèmes. Voici à quoi ils servent principalement : 1. Échange de données : Les fichiers CSV sont souvent utilisés pour transférer des données entre des systèmes différents (comme entre une base de données et un tableur) parce qu’ils sont universellement lisibles. 2. Simplicité : Leur structure est très simple, ce qui les rend faciles à créer et à lire, même manuellement ou via des scripts simples. 3. Compatibilité : Ils sont compatibles avec de nombreux logiciels, notamment les tableurs comme Microsoft Excel, Google Sheets ou des bases de données, ainsi que des outils de traitement de données. 4. Stockage de données légères : Ils sont idéaux pour stocker des données de petite ou moyenne taille sans avoir besoin d’une base de données complète. 5. Analyse de données : En data science ou en analyse de données, les fichiers CSV sont souvent utilisés pour stocker des datasets (ensembles de données) avant d’être chargés dans des outils d’analyse ou des scripts. Bien que simples, les fichiers CSV peuvent poser des problèmes si les données contiennent des virgules dans les champs, ce qui nécessite des mécanismes d’échappement (comme l’encadrement des champs par des guillemets) pour éviter des erreurs de lecture.

  • @SabrinaChanguiti
    @SabrinaChanguiti Месяц назад

    Un datalake (ou lac de données) est une solution de stockage qui permet de regrouper de grandes quantités de données brutes, non structurées ou semi-structurées, dans leur format natif. Contrairement aux entrepôts de données (data warehouses) qui organisent et structurent les données, le datalake conserve les données dans leur forme originale jusqu’à ce qu’elles soient prêtes à être utilisées. Voici les principales utilités d’un datalake : 1. Stockage massif et flexible : Il peut accueillir des données de différentes sources, de types variés (fichiers, vidéos, données de capteurs, logs, etc.), sans besoin de transformation immédiate. 2. Faciliter l’analyse big data : Les datalakes sont couramment utilisés pour l’analyse de données massives (big data). Les analystes et les data scientists peuvent exploiter ces données pour des analyses complexes et approfondies à l’aide de technologies comme le machine learning ou des algorithmes d’intelligence artificielle. 3. Réduction des coûts : Stocker les données brutes est moins coûteux que dans un entrepôt de données, car il ne nécessite pas une structuration rigide. 4. Polyvalence des usages : Il permet à différents départements d’une organisation (marketing, ventes, finances, etc.) d’accéder aux mêmes données brutes, mais de les exploiter à des fins différentes. 5. Agilité dans la gestion des données : Les données restent accessibles et peuvent être traitées selon les besoins, laissant la possibilité de s’adapter à des exigences évolutives. En somme, un datalake permet de centraliser et stocker des volumes importants de données diverses, tout en laissant la possibilité de les analyser et de les structurer selon les besoins.

  • @delta_eps8916
    @delta_eps8916 Месяц назад

    Salut Willis, Tu as dit "être capable de guider le client, de lui faire un poc si nécessaire" (3min6s) Qu'est ce qu'un poc ? Merci à toi :)

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      C'est un Proof Of Concept : C'est une réalisation ayant pour but de montrer la faisabilité d'un projet

  • @penteryan9527
    @penteryan9527 Месяц назад

    Est t’il possible d’etre software et data engineer à la fois

  • @nicolashemain8324
    @nicolashemain8324 Месяц назад

    Super clair et intéressant ! Freelance depuis 4 ans (en tant que consultant Lean), cette vidéo résume très bien nos contraintes terrain 🙂 courage à toi !

  • @sundaco9906
    @sundaco9906 Месяц назад

    Salut je suis freelance en région parisienne. Le Canada m'intéresse fortement !! Comment tu as fais pour booser a Montréal ? 🫡

  • @benim1917
    @benim1917 Месяц назад

    Encore bien dit 🎉 comme d’habitude Courte vidéo mais riche d’infos intéressantes

  • @lamine-_-8808
    @lamine-_-8808 Месяц назад

    Il faut avoir un diplôme d'ingénieur en informatique ou bien même avec un diplôme de petits formation Du moment que on est doué pour ce que on fait

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      Le mieux c'est d'avoir un diplôme d'ingénieur en informatique + bien de former sur la technique

  • @juniorkudra7598
    @juniorkudra7598 Месяц назад

    C'est super intéressant. Est-ce qu'on peut dire que databricks et le concurrent de BigQuery avec GCP ?

  • @serge_amon
    @serge_amon Месяц назад

    Salut, Comment le data engineer utilise Python et SQL en comparaison du data analyst et data scientist ? Disons que j'obtiens mon diplôme en informatique concentration big data au Canada, comment devenir data engineering plutôt que data analyst ?

    • @DataFromScratchWillis
      @DataFromScratchWillis Месяц назад

      Salut à toi, Ça dépend ce que tu aimes faire, car tu peux être DA ou DE avec ce genre de diplôme, mais seul toi à la réponse.

  • @kidam901
    @kidam901 Месяц назад

    Génial la présentation d'outils !