Próbuję użyć pand do manipulowania plikiem .csv, ale otrzymuję ten błąd:
pandas.parser.CParserError: Błąd tokenizacji danych. Błąd C: Oczekiwano 2 pól w linii 3, patrz 12
Próbowałem czytać dokumenty pand, ale nic nie znalazłem.
Mój kod jest prosty:
path = 'GOOG Key Ratios.csv'
#print(open(path).read())
data = pd.read_csv(path)
Jak mogę to rozwiązać? Czy powinienem użyć csv
modułu lub innego języka?
Plik pochodzi od Morningstar
pd.read_csv("<path>", sep=";")
. Spróbuj . Nie używaj programu Excel do sprawdzania, ponieważ czasami domyślnie umieszcza dane w kolumnach, a zatem usuwa separator.
pandas.to_csv()
, MUSI to być spowodowane tym, że w nazwach kolumn znajduje się „\ r”, w którym to przypadku to_csv () faktycznie zapisze nazwy kolejnych kolumn w pierwszej kolumnie ramki danych, powodując różnica między liczbą kolumn w pierwszych X wierszach. Ta różnica jest jedną z przyczyn błędu C.