Mam ramkę danych z powtarzającymi się wartościami w kolumnie A. Chcę usunąć duplikaty, zachowując wiersz z najwyższą wartością w kolumnie B.
Więc to:
A B
1 10
1 20
2 30
2 40
3 10
Powinien zmienić się w to:
A B
1 20
2 40
3 10
Wes dodał kilka fajnych funkcji do usuwania duplikatów: http://wesmckinney.com/blog/?p=340 . Ale AFAICT, jest przeznaczony do dokładnych duplikatów, więc nie ma wzmianki o kryteriach wyboru, które wiersze mają zostać zachowane.
Domyślam się, że prawdopodobnie istnieje łatwy sposób na zrobienie tego - może tak prosty jak posortowanie ramki danych przed usunięciem duplikatów - ale nie znam wewnętrznej logiki Groupby na tyle dobrze, aby to rozgryźć. Jakieś sugestie?