Próbuję połączyć dwie ramki danych. Każda ramka danych ma dwa poziomy indeksu (data, cusip). Na przykład niektóre kolumny w kolumnach pasują do tych dwóch (waluta, data dostosowania).
Jaki jest najlepszy sposób na scalenie ich według indeksu, ale nie należy brać dwóch kopii waluty i daty dostosowania.
Każda ramka danych ma 90 kolumn, więc staram się unikać pisania wszystkiego ręcznie.
df: currency adj_date data_col1 ...
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45
...
df2: currency adj_date data_col2 ...
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45
...
Jeśli zrobię:
dfNew = merge(df, df2, left_index=True, right_index=True, how='outer')
dostaję
dfNew: currency_x adj_date_x data_col2 ... currency_y adj_date_y
date cusip
2012-01-01 XSDP USD 2012-01-03 0.45 USD 2012-01-03
Dziękuję Ci! ...