¿Qué es una red LSTM?

Codificando Bits

Просмотров 42 тыс.

Добавить в
- Мой плейлист
- Посмотреть позже
Поделиться

HTML-код

Размер видео:

Показать панель управления

Автовоспроизведение

Автоповтор

Опубликовано: 27 ноя 2024

Комментарии • 113

@codificandobits 3 года назад ⁺¹
🔥🔥Academia Online: codificandobits.com 🔥🔥
🔥🔥Asesorías y formación personalizada: codificandobits.com/servicios 🔥🔥
@zanemalik1772 3 года назад
I know I'm kinda randomly asking but do anybody know a good website to stream newly released movies online ?
@darrenalexis3488 3 года назад
@Zane Malik meh I watch on flixportal. just search on google for it=) -darren
@zanemalik1772 3 года назад
@Darren Alexis Thanks, I signed up and it seems like a nice service :D I really appreciate it !
@darrenalexis3488 3 года назад
@Zane Malik you are welcome :D
@master_laverdadsobre443 4 года назад ⁺⁵⁰
Este man es un monstruo de la explicación, tiene un talento de síntesis de otro nivel, que mago, MIl gracias!!
@codificandobits 4 года назад ⁺¹²
Wow gracias por tu comentario. Realmente el tema de las redes LSTM es denso, y no he visto ningún video en RUclips que lo explique de una manera relativamente sencilla. Realmente me costó trabajo sintetizarlo de esta manera. Qué bueno que te haya gustado, un saludo!
@juanjosearin243 4 года назад ⁺⁵
Tu también has sintetizado muy bien la respuesta de muchos sobre este video.
@estefaniafreiretubay2670 4 года назад ⁺¹
Confirmo. Muchisimas gracias de verdad
@liznv1536 2 года назад
@@codificandobits
En función de que parámetro se cuantas celdas LSTM se deben utilizar en un modelo?
@codificandobits 2 года назад
@@liznv1536 La gran ventaja de todos estos modelos de Deep Learning es que lograr resultados impresionantes como por ejemplo con secuencias, como en el caso de las Redes LSTM.
La gran desventaja es que cada modelo se diseña a la medida de los datos. Así que, para responder tu pregunta, no existe un método analítico o matemático o una fórmula que nos permita definir los hiperparámetros del modelo (número de capas, número de celdas, etc.).
La manera de definir estos hiperparámetros es a través de las curvas de entrenamiento/validación, verificando el desempeño del modelo y que no exista under/overfitting. En el canal tengo videos que explican este proceso.
¡Un saludo!
@josemanuelgarciaabreu2973 5 лет назад ⁺²¹
Por fin veo una explicación clara y concisa de las redes LSTM. Muy bien!
@ThePacfull 3 года назад ⁺²
Muchísimas gracias, se nota el amor con el que haces los vídeos, y tu pasión por enseñar, un saludo !
@codificandobits 3 года назад
Gracias por tu comentario Pablo... creo que sí, la pasión por este tema se nota en los videos. Un saludo!
@DiegoABabativa 5 лет назад ⁺⁸
Muy bueno, por fin un video de LSTM bien explicado !
@angelbustillos177 3 года назад ⁺¹
Se ganó un suscriptor, me gustan mucho sus explicaciones y sobre todo me ayudan mucho a comprender los temas de manera más arpida.
@codificandobits 3 года назад
Bienvenido Ángel y un saludo!
@rojassantiagojoshuaisaias8272 5 лет назад ⁺⁷
Te acabo de descubrir! Wow, sigue así y verás cómo crece tu canal, acabas de ganar un suscriptor y gracias por compartir tu conocimiento
@codificandobits 5 лет назад ⁺¹
Gracias por tu comentario Joshua! Y bienvenido al canal!
@nelsongomez8547 4 года назад
Sr. Miguel, muy buenos dias, antes todo permiteme felicitarte, lo haces muy bien. Se entiende perfectamente lo que he visto hasta aqui. Felicitaciones nuevamente.
Vale, aprovecho y te pido una orientacion que me han solicitado en mi trabajo. Actualmente se tienen muchos pdfs, estos pdf pueden contener 5, 6 o 13 hojas. Cada pdf contiene informacion de gran relevancia y el cual la idea es "extraer lo mas relevante". Una forma en como se puede encontra en un parrafo algo como "ANTICIPO 30% antes de IVA, del valor total del contrato suma equivalente a $16.961.724 (DIECISÉIS MILLONES NOVECIENTOS SESENTA Y UN MIL SETECIENTOS VEINTICUATRO" [Anticipo] es un valor de gran importancia y se desea obtener el valor que le sigue, es decir el 30% para asi mostrar esos resultados y no tener que estar leyendo todo las hojas para asi obtener el resultado.
Otro valor de relevancia a tomar es lo que está asociado a la palabara contrato, es decir, $16.961.724
Cabe destacar que las posiciones de estos valores pueden cambiar, es decir, ese parrafo se encuentra en la hoja 2 pero hay casos en donde se encuentra en la hoja 5, 3 entre otras posiciones.
Pienso que es un tema bastante complejo, he estado estudiando, documentandome, pero agradezco toda la orientacion que puedas darme para dar inicio e ir logrando el objetivo que tanto se desea en mi trabajo.
[En una de esos estudios que he tenido, me he encontrado con algo llamado TEXT EXTRACTION "NER" y BIDIRECTIONAL LSTM pero sinceramente como todo novato no se por donde comenzar].
Agradezco tu pronta respuesta y nuevamente, felicitaciones lo haces muy bien.
@stecklerdav 3 года назад ⁺¹
Increíble la capacidad de transmitir conocimiento, saludos.
@codificandobits 3 года назад
Gracias por tu comentario David! Un saludo!
@alexbarnadas 4 года назад ⁺¹
Estoy flipando, muchísimas gracias, tengo exámen en 2h
@codificandobits 4 года назад ⁺¹
ohhh... Espero te sirva de algo!!! Un saludo
@alexbarnadas 3 года назад ⁺¹
@@codificandobits eh aprové gracias a tí y le acabo de enviar el video a un colega que tiene el mismo examen.
@adrianrs79 Год назад
Excelente explicación, saludos desde México!
@maylinmoraga539 4 года назад
Muchas gracias. Por fin una explicación simple y precisa del funcionamiento de las redes LSTM!
@codificandobits 4 года назад
😉
@p._7555 4 года назад
se agradece el empeño puesto en la explicación !
@codificandobits 3 года назад
😉
@julianignaciochia6428 3 года назад
Una genialidad de explicación. Muchas gracias por tu tiempo. Se agradece muchísimo este tipo de explicaciones!
@codificandobits 3 года назад
Gracias por tu comentario Julián. Un saludo!
@dagobertodeleongordillo2754 3 года назад
¡Muchas gracias Miguel!. ¡Es una excelente explicación!
@alexissegovia2006 5 лет назад ⁺¹
Excelente ..... continua mejorando y ampliando la información ..
@codificandobits 5 лет назад
Claro que sí. Un saludo!
@Ricardo11564 5 лет назад ⁺¹
eres muy bueno explicando, gracias por compartir
@codificandobits 5 лет назад
Gracias por tu comentario Ricardo! Un saludo!
@bblancol 4 года назад ⁺¹
Excelente claro y preciso!!! Muchas gracias.
@codificandobits 4 года назад
Gracias por tu comentario Braulio. Saludos! 😀
@cristhian4513 4 года назад ⁺³
es cuestión de tiempo para que tengas muchos seguidores :), buen trabajo Miguel, sigo atento todos tus vídeos :D
@codificandobits 4 года назад
Gracias por tu comentario. Un saludo y esperemos que así sea!
@miguelpradesfarron9384 4 года назад
La mejor explicación que he encontrado de LSTM. Gracias Miguel. Tienes mi like y mi suscribe
@codificandobits 4 года назад
Wow Miguel, gracias por tu comentario. De todos modos quedo abierto a cualquier sugerencia que tengas para mejorar el contenido del canal.
Un saludo!
@miguelpradesfarron9384 4 года назад
@@codificandobits Gracias a ti hombre. Como sugerencia, en mi humilde opinión, una explicación de las GRUs, con tu maestría, haría la serie más completa. Un saludo
@codificandobits 4 года назад
@@miguelpradesfarron9384 Gracias por la sugerencia. Y claro que sí, las GRU son una arquitectura esencial de las redes recurrentes.
Tan pronto pueda haré un video sobre el tema. Saludos!
@miguelpradesfarron9384 4 года назад ⁺¹
@@codificandobitsMuchas gracias por tener en cuenta las sugerencias.
@parraduarte 4 года назад
Mejor no se puede explicar. Muchas gracias, amigo.
@codificandobits 4 года назад
A ti un saludo Antonio y gracias por tu comentario!
@jhonyalexandervelezpineda4217 Год назад
SOS un crack brother gracias por lo enseñado
@juliobarzola6124 4 года назад ⁺²
Muy didactico, muy bien!
@codificandobits 4 года назад
¡Hola Julio y gracias por tu comentario! ¡Un saludo!
@electroglasses 4 года назад
No suelo comentar vídeos de RUclips, pero de verdad, muchas gracias por el contenido
@codificandobits 4 года назад
Gracias a ti Javier por seguir el canal. Y un saludo!
@germangonzalez3063 3 года назад
Muy bueno. Mil gracias
@miguelacosta707 4 года назад ⁺¹
Excelente trabajo
@sniperdaoud 5 лет назад ⁺¹
muy bien explicado :) gracias por tu tiempo
@codificandobits 5 лет назад ⁺¹
Gracias por tu comentario. Un saludo!
@joseluisleonaguirrre2947 4 года назад
Que buena explicación, gracias. Saludos :D
@codificandobits 3 года назад
😉
@samuelcuevalozano2202 4 года назад ⁺¹
Hola Miguel realmente explicas muy bien los temas, sigue así.
Tengo una duda: la manera como entras a LSTM es única y tiene mucha lógica pero ¿por qué no mencionas el desvanecimiento del gradiente?, me refiero a que no necesitas mencionarlo para dar una buena razón para usar LSTM, ¿que relación tiene el desvanecimiento del gradiente con lo que explicas en el vídeo ?
@codificandobits 4 года назад
Hola Samuel gracias por tu comentario y qué buena pregunta. Sí, el desvanecimiento del gradiente es un problema inevitable en todo tipo de arquitectura Deep Learning, especialmente en las redes recurrentes convencionales. Y como tú lo mencionas es un problema en parte resuelto por las redes LSTM.
El tema del desvanecimiento del gradiente lo menciono en este video, cerca del minuto 2:50. Aunque no entro en mucho detalle!!!
Saludos! 😉
@hantondark8876 4 года назад
Samuel aplicaste lstm para predecir texto ?
@progra_kun4331 5 лет назад ⁺¹
excelente explicacion amigo seria bueno que mostraras un ejemplo facil y muuuuuuuy elemental con python
@codificandobits 5 лет назад ⁺¹
Hola Abraham. Gracias por tu comentario y lo tendré en cuenta para un futuro video. Un saludo!
@alonsoamado3723 2 года назад
Cuando planteas la fórmula de la forget gate pones sigmoidal(Wf[at-1,X]+bf). A que te refieres con la coma entre at-1 y x, es multiplicación? Buen video. Muchas gracias.
@gorkamese6493 2 года назад
Muy buen video, me ha ayudado mucho para un trabajo de bachillerato. Pero tengo una pequeña duda de comprensión. Cuando operamos con c_t-1 y c_t que estamos haciendo realmente? f_t es un vector por ejemplo, x_t es un escalar. Pero c_t que es? Un vector o un escalar? O es algo más abstracto o diferente?
P.D. También tengo entendido que el estado oculto (a_t) funciona como un escalar.
@tron_sa 4 года назад
impresionante, mil gracias
@codificandobits 3 года назад
😉
@andresfelipeestradarodrigu301 5 лет назад ⁺¹
excelente video
@ignaciosanchezgendriz1457 2 года назад
Muy bueno!!!!
@andrearobles6620 3 года назад
Buenas tardes ... disculpe este tipo de red se puede utilizar para la clasificación de imágenes??
@fernandavergara2828 4 года назад
Hola!! Muy buen video!! Tengo una duda si, he visto varias LSTM pero todas hacen predicciones de poco tiempo... ¿que tipo de red debo ocupar si necesito predecir un periodo de tiempo mayor (un año por ejemplo)?
@luisjaimeestudioytrabajo7577 4 года назад
Muy buen video, como siempre
@codificandobits 3 года назад
😉
@MarioPerezVaz 4 года назад ⁺¹
Fantástico video!!
@codificandobits 4 года назад ⁺¹
¡Gracias por tu comentario Nicolás! Un saludo!
@sebastiandonetch7173 4 года назад
Excelente video! Gracias!
@codificandobits 3 года назад
😉
@anilupss2011 3 года назад
#Miguel... simplemente genial, muchas gracias. Tienes video sobre clasificación de textos con keras?
@weiccap 4 года назад
Bro. Excelente explicación...
como demore en llegar qui
gracias
@codificandobits 3 года назад
😉
@deeper_soundfy5528 Год назад
Hola muy interesante la manera de enseñar. Sin embargo vengo investigando por varios lados y no consigo obtener respuesta con el siguiente problema.
Tengo una red entrenada con datos de ventas (por poner un ejemplo) diarias, que abarca un historico de enero de 2010 a diciembre de 2019. OK! Ahora bien, se supone que guardo mi modelo. Yo quiero saber, como podria hacer proyecciones o predicciones para febrero de 2020?. supongamos que yo , tengo los datos de ventas de enero de 2020. Pero quiero que, en base a esos datos, mi modelo (ya que se supone que detecta patrones), me haga una proyeccion para el mes de febrero. En otro lado lei que el modelo en produccion si o si necesitara de toooodo el historico para hacer la prediccion, lo cual me parece poco util y costoso computacionalmente, pasarle al modelo que ya esta "listo", un historico de 2010 a enero de 2020... No se si logre hacerme entender.. Saludos!
@luisjaimeestudioytrabajo7577 4 года назад
Muy bueno el video
@codificandobits 3 года назад
😉
@liznv1536 2 года назад
En función de que parámetro se cuantas celdas LSTM se deben utilizar en un modelo?
@paulaandreamontenegrochauc4420 4 года назад ⁺¹
Que bibliografía usas? Simon Haykin?
@Clit0P 4 года назад
gracias por el video
@juanete69 2 года назад
Buena explicación.
Y un detalle, en español no se utiliza "remover" cuando queremos decir "eliminar", es un falso amigo del inglés.
Remover en español es agitar, menear,... para mezclar algo.
@davidbodesa4062 5 месяцев назад
De acuerdo con el diccionario de la RAE, en su acepción número 3, «remover» puede ser un sinónimo de «quitar», «retirar».
@alexgonzalezfuentes5551 5 лет назад ⁺¹
Maestro!
@richardl116 Год назад
el Dios de las explicaciones jaja el unico que le entendi
@JuanMantilla77 4 года назад
Hola. Vi tu video y me quedé con una gran duda. En estos momentos estoy desarrollando un modelo de LSTM para la predicción de valores de series temporales. En la generación del modelo en python, según una documentación, uno puede especificar el número de neuronas (256) deseadas y la función de activación (por defecto trabajo con ReLu), en ese contexto cómo sería la arquitectura de toda la red?
Pd: Excelente explicación de este tipo de redes. Saludos!
@codificandobits 4 года назад ⁺¹
Hola Juan. Para la red que mencionas la arquitectura sería la siguiente:
- CAPA DE ENTRADA: con un tamaño igual al de cada dato de entrenamiento
- RED LSTM: con 256 neuronas (en Keras la creas como "LSTM(units=256, ...)")
- CAPA DE SALIDA: con un tamaño igual a 1, pues supongo que en cada iteración generarás 1 dato a la vez. En Keras la creas como "Dense(units=1)".
Un saludo y me cuentas si te funciona.
@JuanMantilla77 4 года назад
@@codificandobits Hola, muchas gracias por responder, se te aprecia. Una solución que encontré es de la siguiente forma (por si alguien le interesa).
# numNeuronas es una variable de tipo entero
model.add(LSTM(numNeuronas, activation='relu', input_shape=(#ejemplos, #Pasos de tiempo)))
model.add(Dense(1))
@codificandobits 4 года назад ⁺¹
@@JuanMantilla77 Tienes razón, en la misma función "LSTM" se puede agregar el tipo de activación. Un saludo!
@jorgesanchez-net9180 2 года назад
como se manejan hidden y los layers, por ejemplo si tengo 120 neuronas en el hidden y 3 capas eso quiere decir que tengo 120 neuronas repartidas que son las celdas LSTM en las tres capas ..muchas gracias
@codificandobits 2 года назад
Hola Jorge. No, en realidad tendrás:
- Capa de entrada con un número de neuronas igual al número de elementos de cada dato de entrada
- Capa oculta: LSTM con 120 neuronas
- Capa de salida: con un número de neuronas igual al número de categorías que tengas (si estamos hablando de clasificación). Por ejemplo este número de neuronas será igual a 2 si es clasificación binaria.
Un saludo!
@octaviooctavio1548 4 года назад
Por mucho que he buscado, en ningún lugar dicen con un mínimo de claridad, cómo se entrena una red LSTM. ¿Se hace con la regla de la cadena igualmente, aplicada a esta estructura particular?
@codificandobits 4 года назад ⁺¹
Hola Octavio. Usualmente se entrena con los métodos convencionales usados en otro tipo de redes (como las neuronales y las recurrentes): gradiente descendente (o alguna variante) para actualizar los coeficientes de cada neurona, y "backpropagation" para calcular las derivadas que, a su vez, permiten actualizar los valores del gradiente. En este caso, y desde el punto de vista matemático, backpropagation usa precisamente la regla de la cadena.
Un saludo!
@octaviooctavio1548 4 года назад ⁺¹
@@codificandobits Muchas gracias.
Tengo el problema de que mi carrera es de ciencias matemáticas, y para mí las notaciones de diferenciales de los físicos, químicos e ingenieros tienen poco sentido, aunque ya me aclaré lo suficiente, pero no sin sufrimiento. ☺👍
@codificandobits 4 года назад ⁺¹
@@octaviooctavio1548 jajaja!!! Yo soy Ingeniero y sí, a veces me cuesta entender a los matemáticos!!! Es como si "habláramos" lenguajes diferentes. Un saludo!
@octaviooctavio1548 4 года назад
@@codificandobits El problema es que todo esto está escrito por ingenieros, o casi todo, y me cuesta mucho entenderlo. Estaba desesperado cuando te escribí.
Un saludo.
@codificandobits 4 года назад
@@octaviooctavio1548 :) :) :)
@HernanOtta Год назад
necesito una red , para prediciones financieras en el oro , donde puedo buscar repositorios para el entrenamiento ?
@codificandobits Год назад
Hola Hernán. Creo que es arriesgado pensar en hacer trading usando Redes LSTM... El precio de una acción o el precio de un "commodity" (como el oro) depende de muchos factores que no podemos ver tan sólo a través de una serie de tiempo. Por tanto estos precios son muy volátiles y prácticamente imposibles de predecir con un alto grado de certeza...
De hecho, y esto es una opinión personal, creo que este es el gran problema del "trading": la imposibilidad de tener certeza con las predicciones a corto plazo. A veces funcionará, y ganaremos dinero, pero la mayoría de las veces la predicción fallará (sea cual sea el método que usemos).
@marisolrodriguez4471 3 года назад
¿Cómo le doy like otra vez?
@codificandobits 3 года назад
😆😆😆
@error220_33 Год назад
esto queria que hicieran video...
cuesta hallar info en youtube...
por que.......
bueno pueden hacer i.a.
que haga cosas malas XD.
yo si quisiera hacer i.a. en pc bajo recurso si se puede.
@coiladelpinomariafernanda5517 2 месяца назад
Yo viendo esto para mi trabajo de física sobre biomecanoca estudiando medicina:"v 😢😢
@sebasortix 3 года назад ⁺¹
XD jajajajajaja, si se dio cuenta del "Forgate" XD
@codificandobits 3 года назад
ja, ja, ja... No lo había notado!

Следующие

Автовоспроизведение

Underfitting y Overfitting en las Redes Neuronales