Poniższe jest wolniejsze niż w tym przypadku podejścia tutaj , ale możemy obliczyć dodatkową kolumnę na podstawie zawartości więcej niż jednej kolumny, a dla dodatkowej kolumny można obliczyć więcej niż dwie wartości.
Prosty przykład wykorzystujący tylko kolumnę „Ustaw”:
def set_color(row):
if row["Set"] == "Z":
return "red"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Przykład z większą ilością kolorów i większej liczby kolumn branych pod uwagę:
def set_color(row):
if row["Set"] == "Z":
return "red"
elif row["Type"] == "C":
return "blue"
else:
return "green"
df = df.assign(color=df.apply(set_color, axis=1))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C blue
Edycja (21.06.2019): Za pomocą plydata
Możliwe jest również użycie plydata do robienia tego rodzaju rzeczy (wydaje się to nawet wolniejsze niż używanie assign
i apply
, chociaż).
from plydata import define, if_else
Proste if_else
:
df = define(df, color=if_else('Set=="Z"', '"red"', '"green"'))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B green
3 Y C green
Zagnieżdżone if_else
:
df = define(df, color=if_else(
'Set=="Z"',
'"red"',
if_else('Type=="C"', '"green"', '"blue"')))
print(df)
Set Type color
0 Z A red
1 Z B red
2 X B blue
3 Y C green