Załóżmy, że mam ramkę danych z krajami, które są następujące:
cc | temp
US | 37.0
CA | 12.0
US | 35.0
AU | 20.0
Wiem, że istnieje funkcja pd.get_dummies służąca do konwersji krajów na „kodowanie na jeden gorący”. Chciałbym jednak przekonwertować je na indeksy zamiast takich, które otrzymam cc_index = [1,2,1,3]
zamiast tego.
Zakładam, że istnieje szybszy sposób niż użycie get_dummies wraz z klauzulą numpy where, jak pokazano poniżej:
[np.where(x) for x in df.cc.get_dummies().values]
Jest to nieco łatwiejsze do zrobienia w R przy użyciu „czynników”, więc mam nadzieję, że pandy mają coś podobnego.
cc_index = [0,1,0,2]
?