Assume la seguente tabella:
data <- data.table(dummy=1:10)
So che si possono fare le seguenti cose:
data[dummy < 5, c("test1", "test2") := list("Yes", 1)]
e:
data[, test1 := fcase(dummy < 5, "Yes")]
data[, test2 := fcase(dummy < 5, 1)]
Sto cercando di combinare questi in questo modo:
data[, c("test1", "test2") := fcase(dummy < 5, list("Yes", 1))]
Ma mi dà il seguente errore:
Error in fcase(dummy < 5, list("Yes", 1)) :
Length of output value #2 must either be 1 or length of logical condition.
Ho bisogno di passare attraverso filtri multipli, quindi ha senso per l'uso fcase
. Posso sempre ricorrere a usare la prima soluzione per ogni tipo di filtro, in questo modo:
data[dummy < 5, c("test1", "test2") := list("Yes", 1)]
data[dummy > 7, c("test1", "test2") := list("No", 0)]
data[between(dummy, 5, 7), c("test1", "test2") := list("Maybe", NA)]
ma mi chiedo se non c'è qualcosa di più possibile. C'è anche la soluzione della creazione di una tabella con ogni combinazione di test1
e test2
e unire la tabella con i dati della tabella dopo aver fatto un fcase
solo per test1
in questo modo:
tests <- data.table(test1 = c("Yes", "No", "Maybe"),
test2 = c(1, 0, NA))
data[, test1 := fcase(dummy < 5, "Yes",
dummy > 7, "No",
between(dummy, 5, 7), NA_character_)]
merge(data, tests, by = "test1", all.x = T, sort = F)
Ma questo sembra controproducente per un grande e complesso datatable