Używam biblioteki pandas do wczytywania niektórych danych CSV. W moich danych niektóre kolumny zawierają ciągi. Ciąg "nan"
jest możliwą wartością, podobnie jak pusty ciąg. Udało mi się zmusić pandy do odczytywania „nan” jako ciągu znaków, ale nie wiem, jak to zrobić, aby nie odczytywać pustej wartości jako NaN. Oto przykładowe dane i wyniki
One,Two,Three
a,1,one
b,2,two
,3,three
d,4,nan
e,5,five
nan,6,
g,7,seven
>>> pandas.read_csv('test.csv', na_values={'One': [], "Three": []})
One Two Three
0 a 1 one
1 b 2 two
2 NaN 3 three
3 d 4 nan
4 e 5 five
5 nan 6 NaN
6 g 7 seven
To właściwie brzmi „nan” jako strun „nan”, ale nadal odczytuje pustych komórek jak Nan. Próbowałem przekazując str
w converters
argumencie do read_csv (z converters={'One': str})
), ale nadal odczytuje pustych komórek jak Nan.
Zdaję sobie sprawę, że po przeczytaniu mogę wypełnić wartości fillna, ale czy naprawdę nie ma sposobu, aby powiedzieć pandom, że pusta komórka w określonej kolumnie CSV powinna być odczytywana jako pusty ciąg zamiast NaN?
keep_default_na
poniżej.