Estoy aprendiendo " R " y estoy atascada con un ejercicio de un curso que estoy haciendo sobre análisis de datos con R.
Concretamente, debo realizar un marco de datos con la función "filter" con dos variables. Para ello he escrito esta sintaxis:
Lo primero darte las gracias por responder a mi duda.
He realizado lo que me has indicado, aunque el nombre de la columna en la base de dato es " Cocoa Percent", pero me sigue dando error. Concretamente, éste:
Si necesitas ayuda con un data frame específico, necesitamos que nos proporciones un "ejemplo mínimo reproducible" a al menos datos de muestra en un formato amigable con copiar/pegar.
Para ayudarnos a ayudarte, podrías preparar un "Ejemplo Reproducible" (REPREX en ingles) ilustrando tu problema? Un ejemplo reproducible hace que sea mucho más fácil para otros entender tu problema y averiguar como ayudar.
Por favor revisa esta guía para ver como crear uno:
Entonces necesitamos más de su código y algunos datos de muestra. (máquina traductora)
A handy way to supply some sample data is the dput() function. In the case of a large dataset something like dput(head(mydata, 100)) should supply the data we need. Just do dput(mydata) where mydata is your data. Copy the output and paste it here.
Creo que el problema aquí es que has olvidado cargar el paquete dplyr(con library(dplyr)), ya que la función filter() que viene con R (base) tiene una sintaxis diferente a la de dplyr::filter().
Recuerda que los paquetes sólo necesitan ser instalados una vez, pero tienes que cargarlos en cada nueva sesión R en la que quieras usarlos
Hola, buenas tardes.
Estoy trabajando con un conjunto de datos que me descargado de Kaggle, concretamente " Chocolate Bar Ratings".
Les dejo el enlace: Chocolate Bar Ratings | Kaggle.
He cargado el paquete de tidyverse y la librería de tidyverse y dplyr.
Con anterioridad a este marco de datos que estoy intentado crear, he creado un marco de datos con este código, que me ha salido correcto:
Y después he realizado este código, que también me ha funcionado:
trimmed_flavors_df %>%
group_by(Rating)%>%
drop_na()%>%
summarise(max_Rating = max(Rating))
Pero ahora necesito crear otro marco de datos, llamado " best_trimmed_flavors_df " y para ello utilizo el último marco de datos para intentar filtrar las barras de chocolate que contienen al menos 70% de cacao y que tienen una calificación de al menos 3.5 puntos..
Para ello utilizo el código que me está dando problemas.
He realizado lo que me has dicho y me sigue saliendo error:
install.packages("dblyr")
WARNING: Rtools is required to build R packages but is not currently installed. Please download and install the appropriate version of Rtools before proceeding:
https://cran.rstudio.com/bin/windows/Rtools/
Installing package into ‘C:/Users/VICENTE/AppData/Local/R/win-library/4.2’
(as ‘lib’ is unspecified)
Warning in install.packages :
package ‘dblyr’ is not available for this version of R
A version of this package for your version of R might be available elsewhere,
see the ideas at
Ahora que he podido reivsar los datos noto que Cocoa_Percent es de tipo "character" por lo que no puedes aplicar el operador <= directamente, necesitas convertirlo a numerico antes (como hago en el ejemplo que te di)
Eso es exactamente lo que quería hacer.
Yo para cargar la base de datos me he ido directamente a " Import text Data " y le puesto en el apartado " Name " el nombre " flavors_df.
Seguramente por eso no me salía.
Gracias ya he aprendido otra manera de cargar las bases de datos.
Gracias