Mamy ramkę danych z pliku CSV. Ramka danych DF
zawiera kolumny zawierające zaobserwowane wartości i kolumnę ( VaR2
) zawierającą datę wykonania pomiaru. Jeśli data nie została zarejestrowana, plik CSV zawiera wartość NA
dla brakujących danych.
Var1 Var2
10 2010/01/01
20 NA
30 2010/03/01
Chcielibyśmy użyć polecenia podzestaw, aby zdefiniować nową ramkę danych, new_DF
tak aby zawierała tylko wiersze, które mają NA'
wartość z kolumny ( VaR2
). W podanym przykładzie tylko wiersz 2 będzie zawarty w nowym DF
.
Komenda
new_DF<-subset(DF,DF$Var2=="NA")
nie działa, wynikowa ramka danych nie zawiera wpisów wierszy.
Jeśli w oryginalnym pliku CSV Value NA
są wymieniane NULL
, to samo polecenie wywołuje pożądany efekt: new_DF<-subset(DF,DF$Var2=="NULL")
.
Jak mogę sprawić, by ta metoda działała, jeśli dla ciągu znaków wartość NA
jest podana w oryginalnym pliku CSV?