Hola, consulta. En qué parte se define el porcentaje de datos que se usará como entrenamiento y test? También, cómo haría si quiero cargar mis propios datos luego de haber entrenado al modelo con mis propia info?
Muchas gracias por la explicación, tengo duda sobre los parámetros que ingresas sobre random forest: ¿Cómo saber si se debe aplicar la regresión con random forest, de qué depende? ¿Cómo sabes el número de arboles (en este caso son 19)? ¿cómo se obtiene el random_state = 2016 y el min_samplesleaf=8?
una duda, la matriz de confusión me dice los que fueron bien o mal clasificados pero debe haber alguna forma de saber a detalle la clasificación que recibió cada entrada en el dataset?
9 месяцев назад
Hola. Claro que sí, puedes hacer una predicción individual y compararla con tu valor esperado
Hola Es el primer vid que veo en tu canal y me parece muy bien presentado y de gran ayuda. Por eso me atrevo a preguntar: Porque el dataset se toma como Nx renglones y N columnas?? Digo... cuando hacemos visualización digamos con Pandas... eso se ve al revés, es decir, las caracteristicas se visualizan como columnas y las muestras como renglones. Saludos.
9 месяцев назад
Hola Diego, gracias por tu observación. Habría sido mejor presentarlo como mencionas, gracias, sin embargo, creo que es transparente para la explicación, no supone mayor diferencia. Gracias nuevamente!
Buen Video, ahora como obtengo la ecuacion matematica para predecir los datos nuevos uma vez ya el modelo este probado con con el test? y luego poder consumirlo en una Api o en una web o en mi erp... algo asi como cuando ingresas un formulario de credito y automaticamente te sale aprobado o rechazado.????
Buen día me podría ayudar .. al correr BA_model.fit(X_train, y_train) me generar un error ValueError: Unknown label type: 'continuous'
3 года назад
Hola Byron. Ese error suele aparecer cuando no se tiene claro si la variable es categórica (clasificación) o numérica (regresión). Revisa eso por favor.
excelente video, podrian explicarme para que sirve específicamente la semilla
2 года назад
Gracias! En general en machine learning una semilla normalmente se usa para que un proceso aleatorio se pueda replicar. Es decir, existen procesos aleatorios (como por ejemplo cuando se divide un dataset) que se requieren replicar para efectos de depuraciones. Cuando pones una semilla te aseguras que aunque la naturaleza del proceso es aleatorio, puedas replicarlo cada vez que corres el código.
Está muy bien hecho el video y muy claro. Solo que... El entrenamiento en Random Forest no es como lo señalaste. La creación de cada árbol se hace con una selección ALEATORIA del total de los datos, digamos -el tipico- 2/3 del total (quedando el 1/3 como OOB). Tu estás diciendo al inicio del video que los árboles se construyen con porciones o partes de total de la base de datos (lo cual ciertamente podría ser una posibilidad, ... muy remota). La potencia de RF le viene precisamente de la selección aleatoria de los casos (instancias o muestras) y de la selección también aleatoria de una parte de las características o variables.
De todos los ejemplos q he buscado, este es el q mas me ha ayudado a entender el algoritmo, pero sigo teniendo una duda, una vez q ya tenga entrenado el dataset con 10000 muestras, como hago q me clasifique una tupla nueva??? Como añado un elemento sin el campo de la clasificacion para q el automaticamente me lo clasifique segun lo entrenado??
3 года назад
Hola Jose, Puedes usar el método mimodelo.predict(nuevodatdo) para hacer una nueva predicción. Solamente debes asegurarte que el shape del dato nuevo (nuevodato) sea compatible. Puedes verificar el shape en el código del repositorio, consultando el shape de Xtest.
Genial explicación hermano. Gracias por tomarte el tiempo
Excelente !!!, claro, simple, muy bueno. !!! 💪💪💪
Muchas gracias por el video, seria interesante ver un video de random forest de regresion
Buen video, entendí a la perfección, lo ejecuté sobre un dataset de 70000 muestras y obtuve un accuracy de 96%
Hola Santiago, muchas gracias por comentar!!!
Hola, cómo hiciste para cargar esa data luego de haber entrenado al modelo?
Excelente video. Muy didáctico.
Muy buen viedeo, super recomendado
Excelente explicación
eres genial!!!
Hola, consulta. En qué parte se define el porcentaje de datos que se usará como entrenamiento y test? También, cómo haría si quiero cargar mis propios datos luego de haber entrenado al modelo con mis propia info?
Muchas gracias por la explicación, tengo duda sobre los parámetros que ingresas sobre random forest: ¿Cómo saber si se debe aplicar la regresión con random forest, de qué depende? ¿Cómo sabes el número de arboles (en este caso son 19)? ¿cómo se obtiene el random_state = 2016 y el min_samplesleaf=8?
Hola, antes que nada, gracias por subir este contenido!!!!
¿tal vez tienes un ejemplo de cómo realizar el random forest con regresión en R?
Muchas gracias por el vídeo
Gracias Andrés!
Muchas gracias por tu video. Si quiesiera desarrollar una ecuación ¿cuál sería la forma funcional?
buen video
nuevo suscriptor
gran video
una duda, la matriz de confusión me dice los que fueron bien o mal clasificados pero debe haber alguna forma de saber a detalle la clasificación que recibió cada entrada en el dataset?
Hola. Claro que sí, puedes hacer una predicción individual y compararla con tu valor esperado
Excelente video bro!
Benjamin, gracias!!!
Muy buen video!!, consulta, de cuantas muestras seria considerado un "buen" dataset para realizar un entrenamiento optimo?
Hola Es el primer vid que veo en tu canal y me parece muy bien presentado y de gran ayuda.
Por eso me atrevo a preguntar: Porque el dataset se toma como Nx renglones y N columnas?? Digo... cuando hacemos visualización digamos con Pandas... eso se ve al revés, es decir, las caracteristicas se visualizan como columnas y las muestras como renglones.
Saludos.
Hola Diego, gracias por tu observación. Habría sido mejor presentarlo como mencionas, gracias, sin embargo, creo que es transparente para la explicación, no supone mayor diferencia. Gracias nuevamente!
Buen Video, ahora como obtengo la ecuacion matematica para predecir los datos nuevos uma vez ya el modelo este probado con con el test? y luego poder consumirlo en una Api o en una web o en mi erp... algo asi como cuando ingresas un formulario de credito y automaticamente te sale aprobado o rechazado.????
Up
Buen día me podría ayudar .. al correr BA_model.fit(X_train, y_train) me generar un error ValueError: Unknown label type: 'continuous'
Hola Byron. Ese error suele aparecer cuando no se tiene claro si la variable es categórica (clasificación) o numérica (regresión). Revisa eso por favor.
excelente video, podrian explicarme para que sirve específicamente
la semilla
Gracias!
En general en machine learning una semilla normalmente se usa para que un proceso aleatorio se pueda replicar. Es decir, existen procesos aleatorios (como por ejemplo cuando se divide un dataset) que se requieren replicar para efectos de depuraciones. Cuando pones una semilla te aseguras que aunque la naturaleza del proceso es aleatorio, puedas replicarlo cada vez que corres el código.
@ ufffff muchísimas gracias me salvaste, mañana tengo exposición al respecto excelente canal
Está muy bien hecho el video y muy claro. Solo que... El entrenamiento en Random Forest no es como lo señalaste. La creación de cada árbol se hace con una selección ALEATORIA del total de los datos, digamos -el tipico- 2/3 del total (quedando el 1/3 como OOB). Tu estás diciendo al inicio del video que los árboles se construyen con porciones o partes de total de la base de datos (lo cual ciertamente podría ser una posibilidad, ... muy remota). La potencia de RF le viene precisamente de la selección aleatoria de los casos (instancias o muestras) y de la selección también aleatoria de una parte de las características o variables.
De todos los ejemplos q he buscado, este es el q mas me ha ayudado a entender el algoritmo, pero sigo teniendo una duda, una vez q ya tenga entrenado el dataset con 10000 muestras, como hago q me clasifique una tupla nueva??? Como añado un elemento sin el campo de la clasificacion para q el automaticamente me lo clasifique segun lo entrenado??
Hola Jose,
Puedes usar el método mimodelo.predict(nuevodatdo) para hacer una nueva predicción. Solamente debes asegurarte que el shape del dato nuevo (nuevodato) sea compatible. Puedes verificar el shape en el código del repositorio, consultando el shape de Xtest.
@ muchas gracias
La pregunta principla: Cómo haces para escribir al reves?
Es un flip en la cámara 😁
Chamo no explicaste como interpretar los resultados. Esta fallo el video
Please justify with English language.