Aby wybrać ith
wiersz, użyjiloc
:
In [31]: df_test.iloc[0]
Out[31]:
ATime 1.2
X 2.0
Y 15.0
Z 2.0
Btime 1.2
C 12.0
D 25.0
E 12.0
Name: 0, dtype: float64
Aby wybrać i -tą wartość w Btime
kolumnie, możesz użyć:
In [30]: df_test['Btime'].iloc[0]
Out[30]: 1.2
Istnieje różnica między df_test['Btime'].iloc[0]
(zalecanym) a df_test.iloc[0]['Btime']
:
DataFrames przechowują dane w blokach opartych na kolumnach (gdzie każdy blok ma jeden typ). Jeśli wybierzesz najpierw według kolumny, widok może zostać zwrócony (co jest szybsze niż zwrot kopii), a oryginalny typ zostanie zachowany. W przeciwieństwie do tego, jeśli najpierw wybierzesz według wiersza, a ramka danych ma kolumny różnych typów, wówczas Panda kopiuje dane do nowej serii obiektów typu. Tak więc wybieranie kolumn jest nieco szybsze niż wybieranie wierszy. Tak więc, chociaż
df_test.iloc[0]['Btime']
działa, df_test['Btime'].iloc[0]
jest nieco bardziej wydajny.
Istnieje duża różnica między nimi, jeśli chodzi o przypisanie.
df_test['Btime'].iloc[0] = x
wpływa df_test
, ale df_test.iloc[0]['Btime']
może nie. Poniżej wyjaśniono, dlaczego. Ponieważ subtelna różnica w kolejności indeksowania powoduje dużą różnicę w zachowaniu, lepiej jest użyć pojedynczego przypisania indeksowania:
df.iloc[0, df.columns.get_loc('Btime')] = x
df.iloc[0, df.columns.get_loc('Btime')] = x
(Zalecana):
Zalecany sposób , aby przypisać nowe wartości do DataFrame jest uniknąć przykuty indeksowanie , a zamiast tego zastosować metodę przedstawioną przez Andrzeja ,
df.loc[df.index[n], 'Btime'] = x
lub
df.iloc[n, df.columns.get_loc('Btime')] = x
Ta ostatnia metoda jest nieco szybsza, ponieważ df.loc
musi przekonwertować etykiety wierszy i kolumn na indeksy pozycyjne, więc w przypadku użycia df.iloc
zamiast niej konieczna jest nieco mniejsza konwersja
.
df['Btime'].iloc[0] = x
działa, ale nie jest zalecane:
Chociaż to działa, wykorzystuje sposób, w jaki DataFrames są obecnie implementowane. Nie ma gwarancji, że Pandy będą musiały działać w ten sposób w przyszłości. W szczególności wykorzystuje fakt, że (obecnie) df['Btime']
zawsze zwraca widok (a nie kopię), więc df['Btime'].iloc[n] = x
można go użyć do przypisania nowej wartości w n-tym miejscu Btime
kolumny df
.
Ponieważ Pandas nie daje wyraźnych gwarancji, kiedy indeksujący zwracają widok w porównaniu z kopią, przypisania, które używają indeksowania łańcuchowego, generalnie zawsze podnoszą wartość, SettingWithCopyWarning
nawet jeśli w tym przypadku przypisanie udaje się zmodyfikować df
:
In [22]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [24]: df['bar'] = 100
In [25]: df['bar'].iloc[0] = 99
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
self._setitem_with_indexer(indexer, value)
In [26]: df
Out[26]:
foo bar
0 A 99 <-- assignment succeeded
2 B 100
1 C 100
df.iloc[0]['Btime'] = x
nie działa:
Natomiast przypisanie z df.iloc[0]['bar'] = 123
nie działa, ponieważ df.iloc[0]
zwraca kopię:
In [66]: df.iloc[0]['bar'] = 123
/home/unutbu/data/binky/bin/ipython:1: SettingWithCopyWarning:
A value is trying to be set on a copy of a slice from a DataFrame
See the caveats in the documentation: http://pandas.pydata.org/pandas-docs/stable/indexing.html#indexing-view-versus-copy
In [67]: df
Out[67]:
foo bar
0 A 99 <-- assignment failed
2 B 100
1 C 100
Ostrzeżenie : wcześniej zasugerowałem df_test.ix[i, 'Btime']
. Nie gwarantuje to jednak ith
wartości, ponieważ ix
próbuje zaindeksować według etykiety przed próbą indeksowania według pozycji . Więc jeśli DataFrame ma indeks liczb całkowitych, który nie jest posortowany od 0, wówczas użycie ix[i]
zwróci wiersz oznaczony i
zamiast ith
wiersza. Na przykład,
In [1]: df = pd.DataFrame({'foo':list('ABC')}, index=[0,2,1])
In [2]: df
Out[2]:
foo
0 A
2 B
1 C
In [4]: df.ix[1, 'foo']
Out[4]: 'C'
df_test.head(1)
działał, bardziej ogólną formą jest użycieiloc
odpowiedzi udzielonej przez unutbu