Pytania otagowane jako dataframe

Ramka danych jest tabelaryczną strukturą danych. Zwykle zawiera dane, w których wiersze są obserwacjami, a kolumny zmiennymi różnego typu. Chociaż „ramka danych” lub „ramka danych” jest terminem używanym w tej koncepcji w kilku językach (R, Apache Spark, deedle, Maple, biblioteka pand w Pythonie i biblioteka DataFrames w Julii), „tabela” jest terminem używanym w MATLAB i SQL.

6
wybierając spośród pand o wielu indeksach
Mam ramkę danych z wieloma indeksami z kolumnami „A” i „B”. Czy istnieje sposób na wybranie wierszy przez filtrowanie według jednej kolumny z wieloma indeksami bez resetowania indeksu do indeksu jednej kolumny? Na przykład. # has multi-index (A,B) df #can I do this? I know this doesn't work because the …



2
Łączenie ramek danych pandy według nazw kolumn
Mam dwie ramki danych z następującymi nazwami kolumn: frame_1: event_id, date, time, county_ID frame_2: countyid, state Chciałbym uzyskać ramkę danych z następującymi kolumnami, dołączając (po lewej) na county_ID = countyid: joined_dataframe event_id, date, time, county, state Nie wiem, jak to zrobić, jeśli kolumny, do których chcę dołączyć, nie są indeksami. …

5
Konstruuj pandy DataFrame z elementów w zagnieżdżonym słowniku
Załóżmy, że mam zagnieżdżony słownik „user_dict” o strukturze: Poziom 1: UserId (długa liczba całkowita) Poziom 2: Kategoria (ciąg znaków) Poziom 3: różne atrybuty (liczby zmiennoprzecinkowe, liczby wewnętrzne itp.) Na przykład wpis w tym słowniku wyglądałby tak: user_dict[12] = { "Category 1": {"att_1": 1, "att_2": "whatever"}, "Category 2": {"att_1": 23, "att_2": …


5
Zastąp wszystkie określone wartości w ramce danych
Mając ramkę danych, jak mam zastąpić wszystkie określone wartości we wszystkich wierszach i kolumnach. Załóżmy na przykład, że chcę zastąpić wszystkie puste rekordy NAsłowami (bez wpisywania pozycji): df <- data.frame(list(A=c("", "xyz", "jkl"), B=c(12, "", 100))) A B 1 12 2 xyz 3 jkl 100 Spodziewany wynik: A B 1 NA …
89 r  dataframe  replace 

3
Opisuj słupki wartościami na wykresach słupkowych Pandas
Szukałem sposobu na opisanie moich słupków na wykresie słupkowym Pandy za pomocą zaokrąglonych wartości liczbowych z mojej ramki DataFrame. >>> df=pd.DataFrame({'A':np.random.rand(2),'B':np.random.rand(2)},index=['value1','value2'] ) >>> df A B value1 0.440922 0.911800 value2 0.588242 0.797366 Chciałbym dostać coś takiego: Próbowałem z tym przykładem kodu, ale wszystkie adnotacje są wyśrodkowane na znacznikach x: >>> …

13
Porównanie dwóch ramek danych i uzyskanie różnic
Mam dwie ramki danych. Przykłady: df1: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green df2: Date Fruit Num Color 2013-11-24 Banana 22.1 Yellow 2013-11-24 Orange 8.6 Orange 2013-11-24 Apple 7.6 Green 2013-11-24 Celery 10.2 Green 2013-11-25 Apple 22.1 …


5
Spark DataFrame groupBy i sortuj w kolejności malejącej (pyspark)
Używam pyspark (Python 2.7.9 / Spark 1.3.1) i mam Dataframe GroupObject, którą muszę filtrować i sortować w kolejności malejącej. Próbuję to osiągnąć za pomocą tego fragmentu kodu. group_by_dataframe.count().filter("`count` >= 10").sort('count', ascending=False) Ale generuje następujący błąd. sort() got an unexpected keyword argument 'ascending'

5
jak podzielić kolumnę krotek w Dataframe pandy?
Mam ramkę danych pandy (to tylko mały kawałek) >>> d1 y norm test y norm train len(y_train) len(y_test) \ 0 64.904368 116.151232 1645 549 1 70.852681 112.639876 1645 549 SVR RBF \ 0 (35.652207342877873, 22.95533537448393) 1 (39.563683797747622, 27.382483096332511) LCV \ 0 (19.365430594452338, 13.880062435173587) 1 (19.099614489458364, 14.018867136617146) RIDGE CV \ 0 …



5
Przesunąć kolumnę w ramce danych pand o jeden?
Mam ramkę danych pandy. Chcę „opóźnić” jedną z moich kolumn. Oznacza to, na przykład, przesunięcie całej kolumny „gdp” w górę o jeden, a następnie usunięcie wszystkich nadmiarowych danych na dole pozostałych wierszy, tak aby wszystkie kolumny były znowu równej długości. df = y gdp cap 0 1 2 5 1 …

Korzystając z naszej strony potwierdzasz, że przeczytałeś(-aś) i rozumiesz nasze zasady używania plików cookie i zasady ochrony prywatności.
Licensed under cc by-sa 3.0 with attribution required.