Szukam sposobu, aby zrobić odpowiednik SQL
SELECT DISTINCT col1, col2 FROM dataframe_table
Pandy SQL porównanie nie ma nic na temat distinct.
.unique() działa tylko dla jednej kolumny, więc przypuszczam, że mógłbym połączyć kolumny lub umieścić je na liście / krotce i porównać w ten sposób, ale wydaje się, że pandy powinny robić coś w bardziej natywny sposób.
Czy brakuje mi czegoś oczywistego, czy nie ma sposobu, aby to zrobić?
df.apply(pd.Series.unique)ale to nie zadziała, jeśli liczba unikalnych wartości różni się w kolumnach, więc musisz skonstruować dyktowanie nazw kolumn jako kluczy i unikalnych wartości jako wartości