Problema básico de Ingenieria de Datos (para Jrs)

Поделиться
HTML-код
  • Опубликовано: 6 сен 2024
  • Ejercicio de la vida real que le puede ocurrir a cualquiera, incluso a TI!
    Sumate al discord sumate: / discord
    Cafecitos internacionales por Paypal! paypal.me/ericrish
    Todas mis redes :)
    linktr.ee/codineric

Комментарии • 67

  • @jorgeruiz7146
    @jorgeruiz7146 2 года назад +38

    Me parece que poner de descripción que es una tarea Jr. Puede ser frustrante para muchos, son conceptos y tecnologías que lleva mucho tiempo dominarlas y haber estado en varios proyectos usandolas. Un Sr o experto del área es quien realmente puede más o menos saber como optimizar esto, a lo mucho ayudar al Jr brindándole que pasos seguir para que lo ayude en alguna etapa de este proceso.

    • @danielmendieta2666
      @danielmendieta2666 2 года назад +9

      Tu comentario me consuela!. Gracias

    • @user-un8ey7ct7n
      @user-un8ey7ct7n Год назад +1

      Y eso, que para la realización de esos proyectos se usan bibliotecas en python, quiero decir, que aparte de aprender lo básico de python, se debe aprender a trabajar con estas bibliotecas lo cual no es fácil, por lo tanto hay que entrar a documentaciones o ver videos para ciertos proyectos personales también que realizamos.

    • @israeldamian7383
      @israeldamian7383 Год назад +1

      De ser asi entonces CodinEric es un fraude! quiere asustarnos para disminuir la competencia en su campo!

  • @nicolasrosso3800
    @nicolasrosso3800 Год назад +8

    Hola Eric, soy nuevo en tu canal. Soy un analista de datos con intención de cambiar a ing. de datos con lo cual tus videos me estan resultando bastante educativos.
    Estaría bueno si armas algún video (así bien para bobos) en donde muestres como crear un ambiente (así a modo de sandbox) como para probar cosillas e ir adquiriendo cancha.
    Desde ya, te dejo ese buen like.
    Abrazo!

    • @Yayowz3
      @Yayowz3 Год назад +2

      Apoyo la ideaaaa Eric! Nos ayudaria muchisimo!

    • @brandotcom6942
      @brandotcom6942 Год назад +1

      Analista a ingeniero, cual seria la diferencia a grandes rasgos

    • @gerardorosales7775
      @gerardorosales7775 7 месяцев назад +1

      @@brandotcom6942 un ingeniero de datos prepara los datos (ETL), que pueden provenir de muchas fuentes, para que un analista los presente de manera más amigable y práctica para llegar a conclusiones sobre los mismos.

  • @GordoCantaPosta
    @GordoCantaPosta 9 месяцев назад +2

    yo estoy trabajando de data analyst y practico con estos videos pero me pasa que a los meses me olvido de todo, ahora voy a hacer un esfuerzo fuerte para cambiarme a data engineering, ya casi voy 2.5 años de data analyst, supongo que es momento de que me tomen en serio, ya hago muchas cosas con SQL y azure data factory pero en python nada y me olvido

  • @razewow
    @razewow 2 года назад +4

    Dale @CodinEri que crack!! Queremos ver más de airflow yo soy de los que sufre con chrontab jajaja!! con docker!! crack!!

  • @sebaszb4123
    @sebaszb4123 2 года назад +8

    Por favor, Eric. Enseñanos con airflow y con/sin docker compose

    • @CodinEric
      @CodinEric  2 года назад +1

      Ya viste la serie que tengo?

  • @miguelbriones6255
    @miguelbriones6255 2 года назад +3

    Primero que nada, gracias por compartir y excelente contenido. Me voy a animar a aprender bien Python. He trabajado con bases de datos relacionales por más de 4 años, y siempre he puesto peros a aprender algún lenguaje de programación bien, pero esto si está interesante!!

  • @EmilianoEmanuelSosa
    @EmilianoEmanuelSosa 11 месяцев назад

    Yo creo que mas alla de las cuestiones de automatizacion, partir de las bases de el procesamiento es lo mejor. Es decir, obviar procesos incesarios como el crontab

  • @danielreyes7507
    @danielreyes7507 2 года назад

    buenardo! Justo aprendía los fundamentos de AWS para data engineer y que suerte tuve de encontrarme este video y conocer este canal!!
    Excelente contenido y comentarios!!

  • @edwightdelgado2939
    @edwightdelgado2939 2 года назад

    Viendo vídeo súper útiles de codinEric. Se me ocurre seguir el cambio de un producto

  • @AprendeEmprendiendoHoy
    @AprendeEmprendiendoHoy Год назад +1

    Hola Eric recién te descubro, termine un cursito en RUclips de Python y estoy haciendo muchos ejercidos, todos los días. Pero al mirar este video encuentro el camino mucho mas largo de lo que pensaba. si bien logro entender ,mucho del código, entiendo que no se nada.. que camino me sugerís que recorra para obtener mas conocimiento?

    • @CodinEric
      @CodinEric  Год назад

      Primero tenés que decidirte hacia donde querés ir. Si no tenes experiencia investiga sobre desarrollo web, front end, back end. El mundo de data. BI, científico de datos, ingeniero de datos. También devops, QA, seguridad.
      Una vez que tengas en claro que camino te llama búscate rutas de aprendizaje :)

  • @erickfana4466
    @erickfana4466 2 месяца назад

    Ya soy programador, trabajo de web developer, pero hace un tiempo me viene llamando la atencion este campo de la Ingenieria de Datos. Para nosotros como latinoamericanos, es factible dedicarse a este rol?

  • @Chris-fy7mz
    @Chris-fy7mz 2 года назад +1

    Excelente video, creá mas de estos porfavor!!
    Saludos desde Colombia 😁👍

    • @CodinEric
      @CodinEric  2 года назад +2

      Yeay! Acordate de la me gusteada y la compartida ❤

  • @MartinoxxHD
    @MartinoxxHD 2 года назад +1

    Acabo de descubrir tu canal, encontré oro! Ahora a esperar el vídeo con Docker Compose 😉. Un saludo!

  • @mariaeugeniaescobar2389
    @mariaeugeniaescobar2389 2 года назад

    Hola Eric del presente, gracias por existir :)

  • @leonidascarranza7893
    @leonidascarranza7893 4 месяца назад

    me gusto esa palabra "automagicamente"

  • @SergioAdonis
    @SergioAdonis Год назад

    Puedes ejecutarlo en paralelo con threading.Thread

  • @davidmolinagarrido2330
    @davidmolinagarrido2330 Год назад

    buenísimo, crack!

  • @devgabi1525
    @devgabi1525 2 года назад +1

    Hola Vengo a decir: Por favor Eric mostrame como se hace con Airflow y docke compose!!. Gracias , muy buen video.
    Consulta: cuando decís "paralelizar por usuarios en Airflow", que cantidad correrían al mismo tiempo?

    • @CodinEric
      @CodinEric  2 года назад

      Está en el backlog, pronto vendrá

  • @nico30994
    @nico30994 2 года назад

    Gracias por el video.
    Casi siempre el objetivo de mejora inmediata es: +Paralelización = -Tiempo ?
    En otro caso real (y mas grande), hay que preocuparse por excederse en la paralelización consumiendo recursos demás ?
    En este caso, otra forma de paralelizar (sin airflow) puede ser crear un batch de X usuarios por país y a medida que ejecute el ETL y consiga 10 usuarios, con otro .py, ejecute el get_movements() con el batch (buscando que se ejecute varias veces con varios batchs al mismo tiempo y evitando esperar que termine el load para empezar a ejecutar)? o no se vería mejora en ese caso
    Muchas preguntas para responder gratis? jajaj

    • @CodinEric
      @CodinEric  2 года назад +3

      Podemos estar semanas hablando de optimización. Está bien escrito el código? Tiene sentido paralelizar o capaz que dandole un poco mas de ram/cpu se arregla y el costo capaz que es minimo contra hacer todo un refactor.
      Lo que decis de los usuarios es correcto. Hace un tiempo habia hecho una charla de optimización para un etl de mas de 5 mil tareas que debian correr a la vez, tal vez saque un video del tema en un futuro lejano 😅

  • @iwearbeard
    @iwearbeard 2 года назад +1

    Que haces Eric, todo bien?
    Cuando decis de hacerlo por ID de usuario te referis a un dynamic task que corra en paralelo cada uno de ellos? Saludos y buen video!!

    • @CodinEric
      @CodinEric  2 года назад +2

      Existe el concepto de Dynamic Dags, Dynamic Tasks en airflow. Nunca lo hice a nivel task, se me ocurrio mientras grababa y no estoy 100% seguro que la implementación sea feliz pero haciendo un google rápido hay articulos sobre el tema asi que podria ser un interesante video 😏

    • @iwearbeard
      @iwearbeard 2 года назад

      @@CodinEric Exacto, a eso me refería. Desconozco si funciona de la misma manera cuando se le pega a un API, pero por lo menos a nivel de variables de entorno va perfecto. Saludos!

    • @CodinEric
      @CodinEric  2 года назад +1

      @@iwearbeard Con la API no hay problema, a lo sumo es problema del que la creo que se aguante las 70k request de una pero incluso no es tanto

  • @indianameregone
    @indianameregone 2 года назад

    soy nuevo, pero mucho y estos videos me ayudan mucho

    • @CodinEric
      @CodinEric  2 года назад

      me alegro que te sirvan 🥰

  • @Daviidscovers
    @Daviidscovers Год назад

    Se podria incluir multiprocessing de python... que opinas?

  • @rguez2332
    @rguez2332 Год назад

    Este proceso se podria realizar o agilizar con airbyte?

  • @glaciarsoylent4859
    @glaciarsoylent4859 2 года назад

    Vengo del mundo de Power BI + SQL, haciendo cursos de Data Science con Python donde consumi apis, etc.. tentado y dubitativo sobre entrar a data eng o seguir con data science.
    No entendí nada del video xD

  • @facundolahittette9065
    @facundolahittette9065 2 года назад

    Codin, podrá ser algún video de Hadoop Hive y Spark?

    • @CodinEric
      @CodinEric  2 года назад

      Hadoop se pide pero no es algo que creo que sea tan interesante como Hive y Spark. Spark lo tengo en el backlog 😏

  • @nanmargudino3073
    @nanmargudino3073 Год назад

    buscando q es airflow porq ni idea de q es eso

  • @alejandroalfaro6344
    @alejandroalfaro6344 Год назад

    Pregunta Eric, tenes la continuacion de esto haciendolo con airflow? No la encuentro en tu canal je.

    • @CodinEric
      @CodinEric  Год назад

      Creo que no lo hice pero hice muchos otros vídeos con Airflow y cositas lindas :)

  • @pablomoyano7741
    @pablomoyano7741 6 месяцев назад

    el discord ya no funciona

    • @CodinEric
      @CodinEric  6 месяцев назад

      En mi computadora andaba 🫣
      El link anda, sino fíjate el último link pero creo que te va a llevar al mismo invite

  • @albertusortiz
    @albertusortiz 2 года назад

    Pregunta, entiendo que en un principio tomaba 8 horas en terminar este proceso. Pero ahora con esta nueva funcionalidad optimizada toma 1 hora en terminar el proceso. Asumo que el tiempo se reduce con el mismo poder de computo, es correcto?

    • @CodinEric
      @CodinEric  2 года назад +1

      El secreto está en como se optimiza haciendo el proceso en paralelo

    • @albertusortiz
      @albertusortiz 2 года назад

      @@CodinEric 🤯
      Revele esos secretos de magia negra a nosotros los terrenales, gran maestro.

  • @raphanicaise
    @raphanicaise Месяц назад

    Entiendo todo pero no entiendo nada

  • @danielgarcia-oj9yz
    @danielgarcia-oj9yz 2 года назад +2

    esto es para jr? :(

    • @CodinEric
      @CodinEric  2 года назад +3

      Seria una buena entrevista técnica aunque le faltaria un poco de sql

    • @jorgeruiz7146
      @jorgeruiz7146 2 года назад +2

      Me parece que es para Sr. Muchas de estas tecnologías se aprenden en en el mundo profesional, son varios años dominar bien python, consumo de APIs, entender entorno cloud y flujos de trabajo.

  • @hersanmartin
    @hersanmartin Год назад

    Se puede ver el código?

  • @xmagcx1
    @xmagcx1 2 года назад

    con multiprocessing

  • @pablobandeira5461
    @pablobandeira5461 Год назад

    Jajajajajaja

  • @pw4645
    @pw4645 2 года назад

    Buen video pero esto No es para un JR, es para personas que ya tengan conocimientos avanzados y ya con experiencia.

  • @hassanmuhieddine2049
    @hassanmuhieddine2049 2 года назад

    primer comentario...!! XD

  • @jorgeeg2668
    @jorgeeg2668 Год назад

    La vrd me frustre un poco :( será como motivación para seguir esforzándome

  • @danielguardia5780
    @danielguardia5780 Месяц назад

    Qué tal ego que tienes tío

  • @albertomillan9761
    @albertomillan9761 2 года назад

    Por favor, Eric. Enseñanos con airflow y con/sin docker compose

    • @xmagcx1
      @xmagcx1 2 года назад

      ya hay videos anteriores de airflow