Jak mogę czytać w pliku .csv (bez nagłówków) i kiedy chcę tylko podzestawu kolumn (powiedzmy 4 i 7 z 20 kolumn), używając pand? Nie mogę tego zrobićusecols
Jak mogę czytać w pliku .csv (bez nagłówków) i kiedy chcę tylko podzestawu kolumn (powiedzmy 4 i 7 z 20 kolumn), używając pand? Nie mogę tego zrobićusecols
Odpowiedzi:
Poprzednie odpowiedzi były dobre i poprawne, ale moim zdaniem dodatkowy namesparametr sprawi, że będzie idealny, i powinien to być zalecany sposób, szczególnie gdy csv nie ma headers.
usecolsi namesparametrydf = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'])
lub użyj, header=Noneaby wyraźnie powiedzieć ludziom, że csvnie ma nagłówków (w każdym razie obie linie są identyczne )
df = pd.read_csv(file_path, usecols=[3,6], names=['colA', 'colB'], header=None)
Abyś mógł odzyskać swoje dane przez
# with `names` parameter
df['colA']
df['colB']
zamiast
# without `names` parameter
df[0]
df[1]
Na podstawie read_csv , kiedy nameszostaną przekazane jawnie, headerbędą zachowywać się jak Nonezamiast 0, więc można pominąć, header=Nonejeśli namesistnieją.