Szukam sposobu, aby zrobić odpowiednik SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
Pandy SQL porównanie nie ma nic na temat distinct
.
.unique()
działa tylko dla jednej kolumny, więc przypuszczam, że mógłbym połączyć kolumny lub umieścić je na liście / krotce i porównać w ten sposób, ale wydaje się, że pandy powinny robić coś w bardziej natywny sposób.
Czy brakuje mi czegoś oczywistego, czy nie ma sposobu, aby to zrobić?
df.apply(pd.Series.unique)
ale to nie zadziała, jeśli liczba unikalnych wartości różni się w kolumnach, więc musisz skonstruować dyktowanie nazw kolumn jako kluczy i unikalnych wartości jako wartości