- Видео 26
- Просмотров 33 041
RStudio con el profe Toledo
Чили
Добавлен 31 янв 2021
Canal sobre estadística y ciencia de datos aplicada en el software RStudio.
Bienvenidos!!!!
Bienvenidos!!!!
¿Dónde guarda R los archivos por defecto?: Las funciones getwd( ) y setwd( )
En este capítulo de Paréntesis revisaremos la función getwd( ), la cual, nos permiten saber nuestra ruta actual en donde R está guardando nuestros archivos (o carpeta por defecto para abrir archivos) y la función setwd( ) la cual permite cambiar tal ruta.
Visita mi canal sobre estadística y Excel en:
m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw
#estadística #cienciadedatos #analisisdedatos
#datascience #datanalytics #datanalysis #rstudio #statistics
Visita mi canal sobre estadística y Excel en:
m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw
#estadística #cienciadedatos #analisisdedatos
#datascience #datanalytics #datanalysis #rstudio #statistics
Просмотров: 873
Видео
La función data( )
Просмотров 117Год назад
Es este episodio de paréntesis revisamos la función data, la cual, nos proporciona la descripción de los conjuntos de datos (data frames) disponibles en R. Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #datascience #datanalytics #datanalysis #rstudio #statistics
Crea GRÁFICOS de DISPERSIÓN con GGally
Просмотров 446Год назад
GGally es una extensión de ggplot2 que permite la creación de gráficos de dispersión con una sola línea de código. La gracia de GGally es que permite integrar tanto variables cuantitativas como agregar variables cualitativas a modo de observar segmentaciones en las variables cuantitativas. Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística ...
MUCHOS GRÁFICOS en pocos pasos con DATAEXPLORER de R (reporte de datos)
Просмотров 1,1 тыс.Год назад
El paquete DataExplorer de R es una herramienta rápida y simple para la visualización inicial de datos. En una sola línea de comando puedes obtener un reporte en formato html que incluye: estado de las variables de estudio (cantidad de datos y columnas ausentes), gráficos asociados, qqplot, correlaciones y análisis de componentes principales. Visita mi canal sobre estadística y Excel en: m.rucl...
LEER archivos TXT (delimitado por tabulaciones) en RStudio
Просмотров 4 тыс.Год назад
Lectura de archivos .txt utilizando función read.table( ) de RStudio. Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #datascience #datanalytics #datanalysis #rstudio #statistics
LEER ARCHIVOS CSV EN RSTUDIO ES MUY FÁCIL!!
Просмотров 7 тыс.Год назад
Lectura de archivos en formato .csv utilizando la función read.csv de R. Descarga el conjunto de datos cereals.csv acá: github.com/aatoledo41/DataSets/blob/main/cereals.csv Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #datascience #datanalytics #datanalysis #rstudio #statistics
LEER archivos EXCEL (XLSX) en RSTUDIO FÁCIL Y RÁPIDO!!
Просмотров 5 тыс.Год назад
Lectura (ingesta) de datos en formato .xlsx desde la opción "import dataset" del enviroment de RStudio Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #datascience #datanalytics #datanalysis #rstudio #statistics
TEST CHI-CUADRADO de independencia
Просмотров 1852 года назад
Aplicación de la función chisq.test para testear la hipótesis de independencia entre variables cualitativas (o cualificadas) Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #datascience #datanalytics #datanalysis #rstudio #statistics
ANOVA de un factor
Просмотров 1242 года назад
Aplicación de análisis de la varianza (ANOVA) de un factor. Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #anova #datascience #datanalytics #datanalysis #rstudio #statistics
TEST T-Student de MEDIAS para muestras de dos poblaciones independientes
Просмотров 1362 года назад
Test T-Student para media de muestras de dos poblaciones independientes (con y sin homogeneidad de varianzas). Aplicación de prueba de Kolmogorov-Smirnov para probar normalidad. Aplicación de prueba F de Fisher-Snedecor para probar homogeneidad de varianzas. Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos...
TEST DE MEDIAS para muestras pareadas (dos poblaciones dependientes)
Просмотров 1332 года назад
Diagnóstico de normalidad Prueba t para muestras pareadas Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #test #datascience #datanalytics #datanalysis #rstudio #statistics
Paquetes de VISUALIZACIÓN DE DATOS basados en ggplot2 (parte 2 - esquisse)
Просмотров 2252 года назад
Función esquisse para creación de gráficos sin código Acceso a planillas de datos: drive.google.com/drive/folder/1lyxUvzBZ53NCqI_P66BJ7iTEATGI4v2R?usp=sharing Acceso al código: github.com/aatoledo41/Curso_RStudio_2021/blob/main/Paquetes_de_visualización.R Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisisdedatos #d...
Paquetes de VISUALIZACIÓN DE DATOS basados en ggplot2 (parte 1 - GGally)
Просмотров 3352 года назад
Función GGally para gráficos bivariados con estilo ggplot2 (para variables cuantitativas y cualitativas) Acceso a planillas de datos: drive.google.com/drive/folder/1lyxUvzBZ53NCqI_P66BJ7iTEATGI4v2R?usp=sharing Acceso al código: github.com/aatoledo41/Curso_RStudio_2021/blob/main/Paquetes_de_visualización.R Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XW...
ANÁLISIS BIVARIADO: gráfico de dispersión (para dos y más variables) y regresión lineal simple.
Просмотров 5172 года назад
Gráfico de dispersión: concepto y función plot. Gráfico de dispersión utilizando función pairs. Gráfico de varias variables (cruzadas a pares) utilizando función pairs. Regresión lineal simple utilizando la función lm. Acceso al código (script): github.com/aatoledo41/Curso_RStudio_2021/blob/main/Análisis_bivariado.R Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9S...
ANÁLISIS DESCRIPTIVO BIVARIADO: Estadística descriptiva bivariada y gráfico de mosaico.
Просмотров 8952 года назад
Estadística descriptiva bivariada: Tabla de doble entrada (frecuencias absolutas, frecuencias relativas, frecuencias relativas a fila y columna) y gráfico de mosaico. Acceso al código (script): github.com/aatoledo41/Curso_RStudio_2021/blob/main/Análisis_bivariado.R Visita mi canal sobre estadística y Excel en: m.ruclips.net/channel/UC-Kr7yPl9SdryftZOM2XWMw #estadística #cienciadedatos #analisis...
ANÁLISIS DESCRIPTIVO: superposición de gráficos, modificar color de gráficos y boxplot
Просмотров 8132 года назад
ANÁLISIS DESCRIPTIVO: superposición de gráficos, modificar color de gráficos y boxplot
ANÁLISIS DESCRIPTIVO: Tablas, gráficos y cálculo de descriptivos.
Просмотров 3,7 тыс.2 года назад
ANÁLISIS DESCRIPTIVO: Tablas, gráficos y cálculo de descriptivos.
LECTURA DE DATOS en R (parte 2 - archivos .XLSX)
Просмотров 4032 года назад
LECTURA DE DATOS en R (parte 2 - archivos .XLSX)
LECTURA DE DATOS en R (parte 1 - archivos .CSV)
Просмотров 8832 года назад
LECTURA DE DATOS en R (parte 1 - archivos .CSV)
Paréntesis: ¿Para qué sirve la función attach?
Просмотров 6902 года назад
Paréntesis: ¿Para qué sirve la función attach?
Gracias! Me están ayudando estos videos. Saludos.
Me alegra mucho saberlo!! 😀
Ayuda yo tengo Ventura en Mac y no puedo instalar e estudio queda mal instalado
Verifica el tipo de chip (procesador) que tiene tu Mac. Si tiene un procesador M indícame el error que te aparece para ver cómo ayudarte. Si tu procesador en un Intel, suele ocurrir un error de instalación para Ventura que se soluciona descargando es instalando la versión: big-sur-x86_64. Puedes encontrar más info acá: cran.r-project.org/bin/macosx/
Yo no puedo instalar e estudio
Verifica el tipo de chip (procesador) que tiene tu Mac. Si tiene un procesador M indícame el error que te aparece para ver cómo ayudarte. Si tu procesador en un Intel, suele ocurrir un error de instalación para Ventura que se soluciona descargando es instalando la versión: big-sur-x86_64. Puedes encontrar más info acá: cran.r-project.org/bin/macosx/
Muy bueno😊
Muchas gracias!!! 😀
No me aparece run 😭
Si estás trabajando en Windows puedes presionar Ctrl + Enter que equivale a Run en RStudio. Si estás trabando en macOS el equivalente es Cmd + Enter. Espero te sirva. Saludos!
Como puedo hacer un estadistico utilizando solo unas cuantas observaciones (o filas) de Una columna segun una etiqueta que tenga en otra columna? Me explico, en la columna A tendría; 1A, 2A, 3A... y en la columna B numeros; 10, 15, 20, 25... pero quisiera agrupar todos los valores numericos que tengo en B segun la etiqueta 2A por ejemplo, que conectores debería usar?
Para filtrar por una etiqueta específica puedes utilizar corchetes con información del criterio de filtro sobre la variable que quieres filtrar. Por ejemplo, supón que la columna de etiquetas se llama ColumnaA y la de valores ColumnaB, entonces, para filtrar según lo que me indicas podrías hacer: ColumnaB[ColumnaA==“2A”] a esto le puedes aplicar cualquier función para obtener estadísticos, por ejemplo: summary(ColumnaB[ColumnaA==“2A”]) Espero te sirva. Saludos!!
maquina!
No abre aparece esto, Error en scan(file = file, what = what, sep = sep, quote = quote, dec = dec, : line 1 did not have 9 elements---sera por que el txt no tiene encabezados?
Hola! La razón es porque R no detecta la misma cantidad de elementos por fila para cada una de tus variables, quizás porque tienes datos ausentes en el conjunto de datos. Lo que puedes hacer es agregar a la función read.table la instrucción fill=TRUE. Te quedaría algo así: datos<-read.table( file.choose(), header=TRUE, fill=TRUE)
Gracias por el tutorial, muy útil...se podrá compartir la base de datos para replicarlo¿..saludos
Puedes descargar el conjunto de datos acá: github.com/aatoledo41/DataSets/blob/main/cereals.csv
Muchas gracias me sirvió mucho!
Con gusto 😀
Gracias 🤗🤗
De nada 😊
Bro, no se oor que me aparece col.names
Hola, puede ser que tus datos no tienen encabezado (en la primera fila de los datos no vienen los nombres de las variables). En ese caso debes cambiar la parte del código que dice Header=TRUE a Header=FALSE. Con esa opción R asigna los nombres a las variables. Habitualmente las asigna como V1, V2, …Etc. Si ese no era el error, necesitaría más detalles para ayudarte. Saludos!!
@@estadisticaenrstudio si, de hecho ya solucione el problema y es que en un encabezado tenía"año" y al parecer la "ñ" era el problema.
Gracias
muchas gracias!! me ha servido un montón
Excelente!
Hola, importando de esa manera puedo trabajar por ejemplo la regresión lineal en la otra pestaña poniendo attach ?? Gracias por el video :)
Hola! Sí claro. Una vez que usas la función attach el nombre de las variables quedan disponibles para hacer cualquier tipo de análisis. Para el caso de una regresión lineal utilizando la función “lm” y colocando el nombre de las variables deberías obtener el ajuste de la recta de regresión. Saludos!!
muchas gracias, muy util el video.
Muchas gracias!! 😀
Se puede utilizar el paquete dataExplorer desde el programa R (consola)?. Lo intenté, pero me informa un error de pandoc. Que puedo hacer al respecto?. Muchas gracias desde ya.
Hola @oreste1958 para resolverlo debes instalar la biblioteca pandoc en tu computador (probablemente haya que actualizarla). Para esto puedes ingresar a GitHub: github.com/jgm/pandoc/releases/tag/1.15.0.6 y descargar la biblioteca pandoc dependiendo del sistema operativo que estás usando. Una vez instalado no deberías tener problemas en usar DataExplorer en la consola de R. Saludos!!
Graciass por su contenido :)
Muchas gracias por tu comentario Samantha 😀
buens tardes excelente video muy claro, pero se me genero un pequeño problema....tengo unos datos cuantitativos q van de 0.01 a 0.16 y genero la tabla con 5 intervalos.....pero no puedo hacer el histograma, pues si coloco hist(niveles) me sale el grafico por defecto, pero si coloco hist(tab2) donde tab2<-table(cut(niveles,5)) me sale un histograma rarisimo donde en el eje x los valores van de 0 a 25 de 5 en 5 ...ojala me pueda ayudar
Hola Jaime, primero que todo te agradezco te haya gustado el video!! Respecto a tu consulta, lo que ocurre es que la función table(cut()) al ser una función que presenta frecuencias para un determinado número de cortes (cut) generalmente con el fin de realizar un gráficos de barras (gráfico para variable discreta o cualitativa), cuando le pides mostrar un histograma (gráfico para variable continua) lo que hace es graficar la frecuencia de la frecuencia de los cortes y no las frecuencia de los distintos intervalos que quieres representar. Para generar intervalos en un histogramas debes utilizar la opción “breaks” dentro de la función hist(). Te dejo algunos ejemplos que podrías utilizar: Ejemplo1: hist(niveles, breaks=5) # con esta opción generas 5 cortes simétricos en el gráfico. Ejemplo 2: hist(niveles, breaks=c(0,0.4,0.8,0.12,0.16)) # si observas los cortes los puedes crear manualmente con un vector. Espero te sea de ayuda. Saludos!!
hola buenas noches.....tengo el sigueinte problema....en el excel que me dan no me dan los datos en 2 columnas con en tu ejemplo...en mi caso me dan 4 columnas...en cada columna tengo las ventas de cada sucursal...la unica opcion es general un nuevo archivo donde en 1 columna ponga aq sucursal pertenece y en la 2da las ventas? o puedo hacerlo directo como en el excel mismo...ojala me puedas ayudar
Hola @jhernandezav. Tienes varias opciones. La más rápida sería la que indicas, es decir, colocar las 4 columnas en una sola y crear una nueva variable para indicar la sucursal. Esto lo puedes hacer directamente en el Excel (manualmente) La otra opción es en R utilizando la función “cbind” para pegar las 4 columnas en una sola, quedaría algo así: ventas<-cbind(columna1,columna2,columna3,columna4) Nota: columna1 a columna4 debes reemplazarlas por el nombre que tengan tus 4 columnas. Luego, tendrías que generar una variable para la sucursal. Eso podrías hacerlo generando un vector con números del 1 al 4 (por la cantidad de sucursales) pero con tantos números como cantidad de ventas por sucursal, quedaría algo así: Sucursal<-as.factor(c(rep(1,length(columna1)), rep(2,length(columna2)),rep(3,length(columna3)),rep(4,length(columna4)))) El “as.factor” es para que R entienda que las 4 sucursales son un factor (para que puedas hacer el ANOVA). Con cualquier de las dos opciones no deberías tener problemas. Cualquier cosa no dudes en escribirme por acá o a mi correo: alvaro.toledo.sm@gmail.com. Saludos!!!
Profe, por qué no se pega completa mi base de excel en r? me deja fuera 50 observaciones. graxi
Hola! Consulta para poder ayudarte. ¿Eso te ocurre cuando observas las variables con la función View (salida tipo planilla) o cuándo ves las observaciones en la consola de R? Si es la segunda, es porque la consola solo muestra una cantidad limitada de observaciones (muestra 1000 y deja una advertencia). Lo otro, podría ser por el formato de la planilla excel de origen. Siempre debe tenerse en cuenta que el nombre de las variables deben estar en la primera fila de la planilla (idealmente iniciando con la celda A1) y el resto datos. Todos deben estar preferentemente en la primera hoja. Si aún persiste el problema no dudes en escribirme a alvaro.toledo.sm@gmail.com. Saludos!! 😊
porfavooor sigue subiendo jajaj hay gente como yo que necesita explicaciones asi
Muchas gracias por tus palabras Rosario!! Intentaré retomar lo antes posible el canal 😀
Gracias.
muy bien explicado sin complicaciones. felicitaciones
Muy agradecido por tus palabras!!
Gracias profe
Bastante útil la explicación…Muchas Gracias
Me alegra saber que te sirvió. Saludos!!
Muchas gracias. Esto es lo que se me hacía más difícil.
Saludos desde México, he descargado R, pero al descargar Rstudio y abrirlo me sale este mensaje: No se ha podido abrir las siguientes imágenes de disco ............imagen : RStudio-2022.12.0-353.dmg ..... Razón: sistemas de archivos que no pueden montarse ¿ahí que se puede hacer?
Hola Estephani, un motivo puede ser que al descargar RStudio el archivo se dañó. Te recomiendo eliminarlo, descargarlo nuevamente y hacer la instalación. Si esto no funciona otra opción puede ser abrir el programa desde Utilidad del disco: /Aplicaciones/Utilidades/Utilidad del disco Luego, desde el menú, seleccionar Imágenes > Verificar… Aparecerá el cuadro de diálogo “Abrir archivo” y seleccionar el archivo .dmg de RStudio. Coméntame si te funciona alguna de estas opciones o habría que buscar otra. Saludos!!!
@@estadisticaenrstudio mil gracias profe
Agradecido con el de arriba
Hola, quería darle por estos videos explicativos de Rstudio. Tome un curso de introducción a R en la universidad pero va demasiado rápido y tus videos me están ayudando a entender muchísimo más. Así que muchas gracias. 😊
Hola Álvaro!! Muchas gracias por tu comentario. No sabes cuánto me alegro que los videos te estén ayudando. Estaré atento si aparecen consultas durante tu avance. Saludos!!!
Excelentes videos profesor
Muchas gracias!
Excelente! Solo que al abrir el Restudio me aparece un mensaje que está dañado y no puede abrirse😢
Hola Santiago! Realizaste la instalación previa de R? Si deseas me puedes indicar con más detalle lo que dice el mensaje y podemos solucionarlo. Saludos!!
Buenas! Tengo problemas para descargarlo! Aparecen algunos Warning: During startup - Warning messages: 1: Setting LC_CTYPE failed, using "C" 2: Setting LC_COLLATE failed, using "C" 3: Setting LC_TIME failed, using "C" 4: Setting LC_MESSAGES failed, using "C" 5: Setting LC_MONETARY failed, using "C" [R.app GUI 1.79 (8095) x86_64-apple-darwin17.0] WARNING: You're using a non-UTF8 locale, therefore only ASCII characters will work. Please read R for Mac OS X FAQ (see Help) section 9 and adjust your system preferences accordingly. [History restored from /Users/manuelaued/.Rapp.history] Quizás pueden ayudarme a solucionarlo! Muchas gracias
Hola Manuel. Una opción para solucionar ese problema es abrir el terminal de Mac (En el Finder te vas a: aplicaciones/utilidades/Terminal.app) e ingresas lo siguiente: system("defaults write org.R-project.R force.LANG en_US.UTF-8") Espero te sirva!!
@@estadisticaenrstudio Buenas! ¿cuál es la forma correcta de ingresarlo al terminal?
@@lizzblen te recomiendo seguir los siguientes pasos: 1. Abrir el terminal de MacOs 2. Escribir: defaults write org.R-project.R force.LANG en_US.UTF-8 3. Cerrar el terminal y cualquier ventana de R o RStudio abierta 4. Abrir R, si la instrucción se ejecutó correctamente el warning sobre UTF-8 no debería aparecer. Saludos!!! Pd: si no funciona la instrucción del paso 2 puedes ingresarla como: system(“defaults write org.R-project.R force.LANG en_US.UTF-8”)
a mi si me salió )= "WARNING: You're using a non-UTF8 locale, therefore only ASCII characters will work. Please read R for Mac OS X FAQ (see Help) section 9 and adjust your system preferences accordingly."
Hola Marisela. Te podría servir lo siguiente: Abre el terminal de Mac (está en el Finder en aplicaciones/utilidades/Terminal.app) e ingresa: system("defaults write org.R-project.R force.LANG en_US.UTF-8") Esta suele ser la forma más simple para eliminar el warning.
@@estadisticaenrstudio gracias