Gracias loco por presentarnos todas estas herramientas, hace un tiempo que te empecé a seguir y cada vez estoy más copado con todo lo que explicas. Vamo arriba, saludo desde Uruguay!
Alucino con esto, se podría usar para comerciantes locales idealmente en tiempo real.... cuando ya esté un poco más avanzado, se podría hacer tracking de productos en un almacen de barrio, está buenisimo voy a mirar los repos :3 un saludo
Contame como te anduvo! Proba con el Spaces primero aunque tengas una cola de gente. Puede funcionar en tiempo real pero necesitas una buena GPU. Abrazo.
Machinelearnear te he seguido desde los primeros videos y de los objetivos planteados inicialmente. Què tal si los retomamos? estoy en la fase de recolecciòn de un modelo semantico en español enfocado en la parte legal. Y asi lo vas poniedo en pequeños videos para que la gente vaya aprendiendo.
Gracias Wilfredo, estoy de acuerdo, me frene un poco porque son videos que quiero hacer con mas detalle y es dificil saber que direccion tomar. Por ejemplo, ir a como hacer modelos conversacionales en la parte legal o a aplicaciones que usan LangChain para hacer analisis de documentos legales? Vos que te parece?
@@machinelearnear desde mi punto de vista, generar un modelo que produzca embeddings en un dominio es el primer paso. Porqe es vital para cualquier buscador semantico.
Me interesa conocer los tiempos de respuesta, son a tiempo real? o son procesamientos a videos pregrabados. En el caso de este ultimo, cuanto tiempo oscila en la respuesta?
Si podes mira mi video sobre SAM. Tiene 2 momentos, uno es cuando hace los embeddings de la imagen (0.15 segundos en una A100) y despues la inferencia/segmentacion se hace sobre CPU en tiempo real. Hacer ese tracking que muestro en el video no es en tiempo real, tarda algo asi como 2/3 segundos por cada segundo. Esto igual es analizando a 25 FPS, quizas si se baja a 10 FPS se puede hacer en tiempo real. Abrazo.
@@estebanruiz3254 Básicamente que sea perfecto, actualmente en VFX esto lo hacemos manualmente, es agotador y nos quita mucho tiempo de producción, pero queda bien. Ahora se exploran herramientas como Runway pero siempre funciona regular y eso es equivalente a tener que rehacerlo manualmente. Por ahora la cosa va lento pero quien sabe si en el futuro cambie.
Que buena la experiencia que contas @Juan. Me olvidé de mostrar Runway en el video pero claramente esto compite (o aumenta?) a su propuesta de segmentación. Me imagino que necesita muchisimo post-processing porque las mascaras no son perfectas mas a baja resolucion (yo use 240p en los videos). Abrazo.
Los avances son una locura. El mejor canal para informarse sobre este mundo!!
Gracias!
Gracias loco por presentarnos todas estas herramientas, hace un tiempo que te empecé a seguir y cada vez estoy más copado con todo lo que explicas. Vamo arriba, saludo desde Uruguay!
Gracias locoo, abrazo grande, gran gran pais Uruguay, que ganas de volver!
Muy Interesante, bien resumido y completo, como todos tus videos
Muchas Gracias Por el trabajo
Gracias Guille, abrazo!
Alucino con esto, se podría usar para comerciantes locales idealmente en tiempo real.... cuando ya esté un poco más avanzado, se podría hacer tracking de productos en un almacen de barrio, está buenisimo voy a mirar los repos :3 un saludo
Contame como te anduvo! Proba con el Spaces primero aunque tengas una cola de gente. Puede funcionar en tiempo real pero necesitas una buena GPU. Abrazo.
muchas gracias por este contenido
muuuuchas gracias por este contenidoood
dodod
brutales tus videos :) me encantant, estoy aprendiendo programación y todas estas herramientas prometen grandes propuestas :)
Gracias man! abrazo :)
Machinelearnear te he seguido desde los primeros videos y de los objetivos planteados inicialmente. Què tal si los retomamos? estoy en la fase de recolecciòn de un modelo semantico en español enfocado en la parte legal. Y asi lo vas poniedo en pequeños videos para que la gente vaya aprendiendo.
Gracias Wilfredo, estoy de acuerdo, me frene un poco porque son videos que quiero hacer con mas detalle y es dificil saber que direccion tomar. Por ejemplo, ir a como hacer modelos conversacionales en la parte legal o a aplicaciones que usan LangChain para hacer analisis de documentos legales? Vos que te parece?
@@machinelearnear desde mi punto de vista, generar un modelo que produzca embeddings en un dominio es el primer paso. Porqe es vital para cualquier buscador semantico.
🙌🙌🙌
Esa es la mascara de Terminator 6, el terminator mas inteligente de la saga
Me interesa conocer los tiempos de respuesta, son a tiempo real? o son procesamientos a videos pregrabados. En el caso de este ultimo, cuanto tiempo oscila en la respuesta?
Si podes mira mi video sobre SAM. Tiene 2 momentos, uno es cuando hace los embeddings de la imagen (0.15 segundos en una A100) y despues la inferencia/segmentacion se hace sobre CPU en tiempo real. Hacer ese tracking que muestro en el video no es en tiempo real, tarda algo asi como 2/3 segundos por cada segundo. Esto igual es analizando a 25 FPS, quizas si se baja a 10 FPS se puede hacer en tiempo real. Abrazo.
lo puedo hacer en vivo ?
Si, este te anda mas en tiempo real: github.com/yformer/EfficientSAM. Hay otros que salieron luego tambien. Abrazo.
Esta bien, pero aún le falta mucho para ser utilizada en el mundo profesional. Pero para hacer memes esta bien.
Eso si es verdad, aunque dijimos que podemos usar estos modelos para generar nuevos datsets y entrenar nuevos modelos...
Que crees que le hace falta para ser útil para profesionales?
@@estebanruiz3254 Básicamente que sea perfecto, actualmente en VFX esto lo hacemos manualmente, es agotador y nos quita mucho tiempo de producción, pero queda bien. Ahora se exploran herramientas como Runway pero siempre funciona regular y eso es equivalente a tener que rehacerlo manualmente. Por ahora la cosa va lento pero quien sabe si en el futuro cambie.
Que buena la experiencia que contas @Juan. Me olvidé de mostrar Runway en el video pero claramente esto compite (o aumenta?) a su propuesta de segmentación. Me imagino que necesita muchisimo post-processing porque las mascaras no son perfectas mas a baja resolucion (yo use 240p en los videos). Abrazo.
Yo eché de menos en la demo una opción de cortar la máscara creada.